USO DE IRONPDF

Cómo leer archivos PDF en C#

Actualizado febrero 22, a. m.
Compartir:

El procesamiento programático de PDF es crucial en sectores como el financiero, sanitario, jurídico y educativo, donde es necesario procesar, analizar y extraer información crítica de documentos PDF para fines como el análisis de datos, la gestión de documentos y la automatización. A pesar de su importancia, esta tarea puede suponer un reto.

IronPDF: Una biblioteca C# PDF

IronPDF le permite manejar tareas increíblemente difíciles con facilidad. Permite editar texto fácilmente en un documento PDF, de forma similar a como se puede trabajar con archivos de texto en un documento de texto, al tiempo que permite exportar archivos en cualquier sistema operativo. La aplicación IronPDF cubre el proceso completo de visualización, modificación y extracción de contenido de un PDF.

Dé el paso correcto con IronPDF

El texto puede leerse y escribirse en formato de archivo PDF de forma rápida y sencilla utilizando cualquier ordenador con el software IronPDF. La instalación es una tarea sencilla. Esta es la mejor manera de aprender a leer archivos PDF en C#. También puede descargar IronPDF gratuitamente para su desarrollo. Si exploras IronPDF te darás cuenta de que la biblioteca proporciona una amplia funcionalidad que hace que sea muy fácil de usar PDFs. Explora las clases en tu tiempo libre! Existen varios Ejemplos en C disponible para aprender a crear un resultado óptimo de la lectura de PDF.

Leer archivos PDF con IronPDF

Paso 1: Instalar el paquete IronPDF

Para empezar, deberá instalar IronPDF NuGet en su proyecto .NET. Para ello, abra la consola del gestor de paquetes en Visual Studio e introduzca el siguiente comando:

Install-Package IronPdf

Paso 2: Importar la biblioteca IronPDF

A continuación, debe importar la biblioteca IronPDF en su código añadiendo la siguiente declaración en la parte superior de su archivo:

using IronPdf;
using IronPdf;
Imports IronPdf
VB   C#

Paso 3: Cargar el documento PDF

Una vez que haya importado la biblioteca IronPDF, puede cargar un documento PDF en su código utilizando el siguiente código:

PdfDocument pdf = PdfDocument.FromFile(@"C:\dotnet.pdf");
var outputPath = "Example.pdf";
pdf.SaveAs(outputPath);
PdfDocument pdf = PdfDocument.FromFile(@"C:\dotnet.pdf");
var outputPath = "Example.pdf";
pdf.SaveAs(outputPath);
Dim pdf As PdfDocument = PdfDocument.FromFile("C:\dotnet.pdf")
Dim outputPath = "Example.pdf"
pdf.SaveAs(outputPath)
VB   C#

Paso 4: Extraer texto del PDF

IronPDF proporciona una serie de métodos para extraer texto de un archivo PDF existente. Por ejemplo, puede empezar a extraer texto de un PDF e imprimirlo en la consola utilizando el siguiente fragmento de código:

string text = pdf.ExtractText();
Console.Writeline(text);
string text = pdf.ExtractText();
Console.Writeline(text);
Dim text As String = pdf.ExtractText()
Console.Writeline(text)
VB   C#

Utilizando el código anterior, puede extraer texto de un archivo PDF.

Cómo leer archivos PDF en C#, Figura 1: Extracción de texto de un PDF con IronPDF Extracción de texto de un PDF con IronPDF

Paso 5: Rasterizar un PDF en imágenes

Vamos rasterizar el archivo PDF en imágenes utilizando IronPDF. En primer lugar, importe las bibliotecas necesarias:

using System.Linq;
using IronPdf;
using IronSoftware.Drawing;
using System.Linq;
using IronPdf;
using IronSoftware.Drawing;
Imports System.Linq
Imports IronPdf
Imports IronSoftware.Drawing
VB   C#

A continuación, el código utiliza Rasterizar a archivos de imagen para extraer todas las páginas del documento PDF a una carpeta como archivos de imagen. Las imágenes extraídas pueden guardarse como archivos PNG o JPG, y también pueden especificarse las dimensiones y los intervalos de páginas de las imágenes.

// Extract all pages to a folder as image files
pdf.RasterizeToImageFiles(@"C:\image\folder\*.png");
// Dimensions and page ranges may be specified
pdf.RasterizeToImageFiles(@"C:\image\folder\example_pdf_image_*.jpg", 100, 80);
// Extract all pages to a folder as image files
pdf.RasterizeToImageFiles(@"C:\image\folder\*.png");
// Dimensions and page ranges may be specified
pdf.RasterizeToImageFiles(@"C:\image\folder\example_pdf_image_*.jpg", 100, 80);
IRON VB CONVERTER ERROR developers@ironsoftware.com
VB   C#

Por último, el código utiliza la función ToBitmap para extraer todas las páginas del documento PDF como objetos AnyBitmap, que pueden ser procesados y manipulados posteriormente dentro del código.

// Extract all pages as AnyBitmap objects
AnyBitmap [] pdfBitmaps = pdf.ToBitmap();
// Extract all pages as AnyBitmap objects
AnyBitmap [] pdfBitmaps = pdf.ToBitmap();
' Extract all pages as AnyBitmap objects
Dim pdfBitmaps() As AnyBitmap = pdf.ToBitmap()
VB   C#

El código anterior demuestra cómo extraer el contenido de un archivo PDF utilizando IronPDF y guardar los datos extraídos como archivos de imagen u objetos AnyBitmap para su posterior procesamiento.

Paso 7: Manipular páginas PDF

Aprendamos a manipular las páginas de un documento PDF leyendo el archivo PDF mediante IronPDF.

El código elimina primero las páginas dos y tres del documento PDF utilizando la función EliminarPáginas método:

pdf.RemovePages(1, 2);
pdf.RemovePages(1, 2);
pdf.RemovePages(1, 2)
VB   C#

El método RemovePages toma dos argumentos: la página inicial a eliminar (en este caso, la página 2, representada como 1 ya que la numeración de las páginas comienza en 0) y el número de páginas a eliminar (en este caso, 2 páginas).

Paso 6: Guardar el PDF

Por último, puede guardar el archivo PDF en su sistema local utilizando la función Guardar como método. El código para guardar el archivo PDF es el siguiente:

pdf.SaveAs(OutputPath);
pdf.SaveAs(OutputPath);
pdf.SaveAs(OutputPath)
VB   C#

Compatibilidad con IronPDF

IronPDF es altamente compatible con todos los marcos .NET más recientes, incluido .NET 7. También es compatible con .NET Blazor y .NET MAUI, que son las últimas ofertas de Microsoft para el desarrollo web. La compatibilidad de la biblioteca con estos marcos de trabajo permite a los desarrolladores integrar IronPDF en sus aplicaciones y aprovechar sus potentes funciones.

Una de las principales características de IronPDF es su capacidad para leer archivos PDF en .NET Blazor y .NET MAUI. Esta función permite a los desarrolladores leer y extraer datos de archivos PDF de forma rápida y sencilla y utilizarlos en las aplicaciones .NET. Esta capacidad puede ser especialmente útil cuando se trabaja con un gran volumen de datos. Los desarrolladores no necesitan ninguna otra biblioteca para utilizar IronPDF en sus proyectos .NET.

Más información sobre IronPDF trabajando con .NET Blazor y .NET MAUI en el sitio web de IronPDF.

Conclusión

En conclusión, la lectura de archivos PDF mediante programación es crucial en diversos sectores. IronPDF proporciona una solución completa para manejar esta tarea ofreciendo una amplia funcionalidad para leer, modificar y extraer contenido de un archivo PDF. IronPDF es fácil de instalar y utilizar con unos sencillos pasos.

La biblioteca ofrece métodos para extraer texto, rasterizar un PDF en una imagen, manipular páginas y guardar archivos PDF. Tanto si es nuevo en el procesamiento programático de PDF como si es un desarrollador experimentado, IronPDF es la herramienta perfecta para llevar sus habilidades al siguiente nivel.

Si está buscando una solución fiable y eficaz para leer archivos PDF en C#, merece la pena explorar IronPDF, especialmente con su licencia a partir de $749.y un prueba gratuita disponible. Puede ver más planos proporcionados por IronPDF en la imagen inferior. Puede elegir el paquete que mejor se adapte a sus necesidades.

Cómo leer archivos PDF en C#, Figura 2: Precios de licencia de IronPDF Precios de las licencias IronPDF

< ANTERIOR
Cómo convertir Word a PDF en C# (Tutorial)
SIGUIENTE >
¿Debería comprar IronPDF?

¿Listo para empezar? Versión: 2024.8 acaba de salir

Descarga gratuita de NuGet Descargas totales: 10,439,034 Ver licencias >