Leer archivos PDF en C#
El método PdfDocument.ExtractAllText de la biblioteca PDF IronPDF C# es perfecto para tareas de lectura de texto PDF simples. Este método maneja discrepancias de espacios y codificación dentro de documentos PDF de origen sin ningún problema.
PdfDocument.ExtractTextFromPage lee el texto de páginas específicas de un PDF. En el ejemplo de abajo, lo vemos usado de forma iterativa para recuperar contenido de texto de un rango específico de páginas.
IronPDF también puede extraer imágenes en bruto de PDFs. Para esto, use cualquiera de los métodos de la clase PdfDocument a continuación:
ExtractAllImages: devuelve todas las imágenes incrustadas en un PDF como objetosIron Software.Drawing.AnyBitmap.ExtractAllRawImages: recupera todas las imágenes incrustadas como una lista de bytes en bruto (byte[]).ExtractImagesFromPage: extrae las imágenes contenidas en una página indexada.ExtractImagesFromPages: igual queExtractImagesFromPage, pero para un rango específico de páginas o una lista de páginas individuales.ExtractRawImagesFromPageyExtractRawImagesFromPages: funcionan igual que los dos métodos anteriores, pero devuelven imágenes extraídas como matrices de bytes en lugar de como objetosIron Software.Drawing.AnyBitmap.
Cómo Leer Archivos PDF en C#
- Descargar la librería IronPDF para C#
- Extraer imágenes o texto de un PDF
- Leer y encontrar palabras en documentos específicos
- Ver salida PDF del documento original





