USO DE IRONPDF

Cómo leer archivos PDF en C#

Actualizado 24 de marzo, 2024

En este artículo se utilizaráIronPDF para .NET, una biblioteca PDF en C# para leer archivos PDF.

Cómo leer archivos PDF con IronPDF

Descargue Visual Studio, si aún no lo ha hecho. Configure el entorno e instale IronPDF Library.
UtilicePdfDocument.FromFile para abrir y cargar el archivo PDF deseado.
Utilice el método ExtractAllText de IronPDF para recuperar el contenido.
Analice o manipule el texto extraído según sea necesario.
Imprime el texto extraído en la Consola de lectura.

IronPDF

IronPDFuna robusta biblioteca de lectura de PDF para C#, permite a los desarrolladores trabajar sin esfuerzo con documentos PDF. Con sus amplias funciones y capacidades, IronPDF simplifica la tarea de manipulación de documentos PDF, permitiendo a los usuarios leer, extraer y manipular contenidos PDF con facilidad. Tanto si está automatizando procesos documentales, extrayendo datos e imágenes para su análisis o creando PDF desde cero, IronPDF le ofrece un completo conjunto de herramientas para agilizar estas tareas.

Este artículo explora el mundo del procesamiento eficaz de PDF en C# utilizandoIronPDFque demuestra su versatilidad y su valor como herramienta esencial para los desarrolladores en su camino hacia el desarrollo de software.

Creación de un nuevo proyecto de Visual Studio

Antes de sumergirnos en el aspecto de la codificación, empecemos por crear una nueva base de datosVisual Studio Proyecto de aplicación de consola C#. Este proyecto servirá de espacio de trabajo dedicado tanto al desarrollo como a los ejemplos prácticos.

Para iniciar este proceso, ejecute Visual Studio y cree un nuevo proyecto accediendo al menú "Archivo" y seleccionando "Nuevo" seguido de "Proyecto".
Navegue hasta el cuadro de diálogo Crear proyecto en Visual Studio
Esta acción hará que aparezca una nueva ventana en la que podrá especificar las plantillas del proyecto. Para simplificar, elija la plantilla "Aplicación de consola" y haga clic en el botón Siguiente, situado en la esquina inferior izquierda de la ventana.
Crea un nuevo proyecto en Visual Studio.
En la ventana siguiente, se le pedirá que designe un nombre para su proyecto y especifique la ubicación deseada del mismo. Una vez introducidos estos datos, haga clic en el botón Siguiente para continuar.
Configurar el proyecto
En este paso, seleccione su marco de destino preferido y concluya el proceso de creación del proyecto pulsando el botón Crear.
Selección del .NET Framework
Con su proyecto ya firmemente establecido, el siguiente paso crítico implica la instalación deIronPDF.

Instalación de IronPDF

IronPDF ofrece multitud de opciones para descargar e instalar la biblioteca PDF. En esta guía, nos centraremos en la instalación de IronPDF mediante el gestor de paquetes NuGet, un método competente y ampliamente adoptado.

En Visual Studio, vaya al menú "Herramientas" y sitúe el cursor sobre la opción "Gestor de paquetes NuGet".
En el menú ampliado, seleccione "Gestor de paquetes NuGet para soluciones".
Navegue hasta el Gestor de paquetes NuGet.
Al seleccionar esta opción, se abrirá una nueva ventana. En esta ventana mejorada, vaya al menú "Examinar" y escriba "IronPDF" en la barra de búsqueda.
A continuación, la pantalla mostrará los paquetes IronPDF disponibles. Para proceder, seleccione el último paquete de la lista y ejecute esta elección haciendo clic en la opción "Instalar".
**Busca e instala el paquete IronPdf en la interfaz de usuario del gestor de paquetes NuGet
Para aquellos que prefieren un enfoque más de línea de comandos, la NuGet Package Manager Console proporciona una vía elegante. Basta con abrir esta consola, introducir el siguiente comando y pulsar "Intro":

Install-Package IronPdf

También tiene la opción de adquirir directamente el paquete desde elSitio web de NuGet enlace.

Leer archivos PDF con IronPDF

Esta sección mostrará cómo puede abrir y leer archivos PDF completos utilizando el lenguaje de programación C# con la ayuda de IronPDF.

using IronPdf;
using System;

IronPdf.License.LicenseKey = "";
//raw text string path
var pdf = PdfDocument.FromFile("document_scaled_compressed.pdf");

string text = pdf.ExtractAllText();

Console.WriteLine(text);

using IronPdf;
using System;

IronPdf.License.LicenseKey = "";
//raw text string path
var pdf = PdfDocument.FromFile("document_scaled_compressed.pdf");

string text = pdf.ExtractAllText();

Console.WriteLine(text);

Imports IronPdf
Imports System

IronPdf.License.LicenseKey = ""
'raw text string path
Dim pdf = PdfDocument.FromFile("document_scaled_compressed.pdf")

Dim text As String = pdf.ExtractAllText()

Console.WriteLine(text)

1. Importación de las bibliotecas necesarias

Para empezar, debe importar los espacios de nombres necesarios. En el ejemplo de código anterior, se importa el espacio de nombres IronPdf, que contiene las funciones esenciales para trabajar con PDFs. Además, el espacio de nombres System también se importa para operaciones generales a nivel de sistema.

using IronPdf;
using System;

using IronPdf;
using System;

Imports IronPdf
Imports System

2. Configuración de la clave de licencia de IronPDF

IronPDF requiere una clave de licencia válida para ser utilizado en un entorno de producción. En el ejemplo de código, hay una línea donde se debe establecer la clave de licencia. Sin embargo, en su código proporcionado, la clave de licencia se deja vacía "". Asegúrese de sustituir la cadena vacía por una clave de licencia válida de IronPDF cuando lo utilice en un entorno de producción.

IronPdf.License.LicenseKey = "Your_License_Key_Here";

IronPdf.License.LicenseKey = "Your_License_Key_Here";

IronPdf.License.LicenseKey = "Your_License_Key_Here"

3. Cargar un documento PDF

El siguiente paso es cargar y analizar el archivo PDF. En el código proporcionado, el método PdfDocument.FromFile se utiliza para cargar un PDF con nombre de archivo "documento_escalado_comprimido.pdf" y asignarlo a la variable pdf. Este archivo PDF se utilizará para la extracción de texto.

var pdf = PdfDocument.FromFile("document_scaled_compressed.pdf");

var pdf = PdfDocument.FromFile("document_scaled_compressed.pdf");

Dim pdf = PdfDocument.FromFile("document_scaled_compressed.pdf")

4. Extracción de texto del documento PDF

IronPDF proporciona una forma sencilla de extraer texto del documento PDF cargado. EnExtraerTodoTexto puede extraer todo el contenido de texto de cada página del PDF y almacenarlo en una variable string llamada text, que funciona como convertir PDF ****to Text.

string text = pdf.ExtractAllText();

string text = pdf.ExtractAllText();

Dim text As String = pdf.ExtractAllText()

5. Visualización del texto extraído

El último paso es mostrar el texto extraído. En el código, Console.WriteLine imprimirá y escribirá el texto extraído en la consola. Se trata de un método útil para depurar o presentar el texto al usuario.

Console.WriteLine(text);

Console.WriteLine(text);

Console.WriteLine(text)

SALIDA Texto extraído del archivo PDF

Cómo leer archivos PDF en C#, Figura 7: El texto extraído del archivo PDF

El texto extraído del archivo PDF

Conclusión

Este artículo ha guiado a los desarrolladores a través del proceso de trabajar eficazmente con archivos PDF en C# utilizando la funciónIronPDF biblioteca. Comenzó ilustrando la configuración de un proyecto dedicado de Visual Studio y continuó con la instalación directa de IronPDF a través del gestor de paquetes NuGet. A continuación, el artículo explicaba paso a paso cómo importar las bibliotecas necesarias, configurar la clave de licencia de IronPDF, cargar un archivo PDF, extraer el contenido de texto y mostrar el texto extraído de todas las páginas. También puede guardar el texto extraído en un archivo TXT utilizando C#.

Gracias a su facilidad de uso y sus completas funciones,IronPDF es una herramienta indispensable para automatizar procesos de documentos, extracción de datos y creación de PDF a partir de HTML, URL e imágenes, lo que la convierte en un activo inestimable para mejorar los proyectos de desarrollo de software que implican la gestión de archivos PDF en C#.

El artículo completo sobre Leer archivos PDF conIronPDF en la siguiente direcciónpágina cómo hacer. El ejemplo de código de la páginaLector de PDF en C# también está disponible. Para ver más ejemplos de código con IronPDF, visite este enlacepágina de ejemplo. IronPDF también ofrece una amplia documentación para responder a las preguntas de todos los desarrolladores y proporcionar un completo soporte práctico. IronPDF ofrece unlicencia de prueba para que los usuarios puedan explorar toda su funcionalidad antes de decidirse a comprar unlicencia perpetua.

Kannapat Udonpant

Ingeniero de software

LinkedIn

Antes de convertirse en ingeniero de software, Kannapat realizó un doctorado en Recursos Medioambientales en la Universidad de Hokkaido (Japón). Mientras cursaba su licenciatura, Kannapat también se convirtió en miembro del Laboratorio de Robótica Vehicular, que forma parte del Departamento de Ingeniería de Bioproducción. En 2022, aprovechó sus conocimientos de C# para unirse al equipo de ingeniería de Iron Software, donde se centra en IronPDF. Kannapat valora su trabajo porque aprende directamente del desarrollador que escribe la mayor parte del código utilizado en IronPDF. Además del aprendizaje entre iguales, Kannapat disfruta del aspecto social de trabajar en Iron Software. Cuando no está escribiendo código o documentación, Kannapat suele jugar con su PS5 o volver a ver The Last of Us.

< ANTERIOR
Cómo añadir PDF Stamper en C#

SIGUIENTE >
Cómo comprimir archivos PDF en la biblioteca .NET

En esta página