C# Leer Archivo PDF: Tutorial Fácil
Si eres desarrollador, probablemente te hayas encontrado con problemas al intentar leer texto de un archivo PDF. Quizás uno o más de los siguientes escenarios se apliquen a ti:
- Estás desarrollando una aplicación que toma dos documentos PDF como entrada y encuentra la similitud entre los documentos.
- Estás desarrollando una aplicación que necesita leer documentos PDF con IronPDF y devolver el recuento de palabras.
- Estás desarrollando una aplicación que extrae datos de un archivo PDF usando IronPDF y los guarda en una base de datos estructurada.
- Estás desarrollando una aplicación que necesita extraer el contenido de texto de un PDF y convertirlo en una cadena.
- Extraer datos de archivos PDF usando C# era una tarea difícil y compleja hasta el desarrollo de IronPDF.
IronPDF Library Overview es una biblioteca que facilita mucho más a los desarrolladores la lectura de archivos PDF.
Puedes explorar más sobre IronPDF y las ofertas Iron Software Suite.
Puedes leer archivos PDF y mostrar los datos en un cuadro de texto de C# usando solo dos líneas de código. Sí, solo dos líneas de código. También puedes extraer todas las imágenes de los PDF. Además, puedes crear otro documento con esas imágenes o mostrarlas en tu aplicación según tus necesidades.
Déjanos mostrarte cómo se hace.
Podemos proceder paso a paso con la aplicación para seleccionar cualquier archivo PDF y luego mostrar su contenido.
Los siguientes pasos te muestran cómo leer archivos PDF en C#:
Los siguientes pasos muestran cómo leer archivos PDF en C#
- Descargar la biblioteca Print to PDF C#
- Elige un archivo PDF de tu computadora
- Selecciona una impresora específica para imprimir y establece la resolución
- Verifica tu salida de PDF desde la impresora
- Sigue tus procesos de impresión usando C#
Conocimientos Prerrequisitos:
- Conocimientos básicos de programación en C#
- Conocimientos básicos de controles GUI en C#
He diseñado este tutorial de tal manera que incluso una persona sin experiencia en programación pueda avanzar.
¿Quién debería leer esto?
Cualquier principiante que esté aprendiendo C# debería saber cómo leer archivos PDF usando IronPDF porque esto es algo que definitivamente vas a usar en tu carrera.
Los desarrolladores profesionales también deberían leer esto para poder entender la biblioteca IronPDF, que nos ayuda a leer, generar y manipular documentos PDF.
Ahora, ¿cómo podemos usar esta biblioteca en nuestro proyecto para leer un archivo PDF?
Estoy usando una aplicación de Windows Forms para la demostración. Puedes usar una aplicación de consola, una aplicación WPF o una aplicación web ASP.NET según tu preferencia.
Otra gran ventaja de la biblioteca IronPDF es que se puede usar tanto con C# como con VB.NET.
Comencemos la demostración sin más demora.
Paso #1: Crear un proyecto de Visual Studio
Abre Visual Studio. Estoy usando Visual Studio 2019.
Haz clic en "Crear Nuevo Proyecto":
Crear Nuevo Proyecto
Ahora, selecciona la aplicación de Windows Forms desde la plantilla, presiona "Siguiente" y aparecerá la siguiente ventana. Ingresa un nombre para el proyecto. He escrito 'Leer Pdf usando IronPDF'.
Configurar proyecto vía Visual Studio
Ahora, haz clic en "Siguiente", y aparecerá la siguiente ventana. Selecciona '.NET Core 3.1' del menú desplegable.
Versión .NET Core 3.1
Haz clic en el botón "Crear", y el proyecto se creará como se muestra a continuación.
Etapa inicial de una nueva aplicación de Windows Forms
Paso #2: Instalar el paquete IronPDF NuGet
Haz clic en el menú Proyecto de la barra de menú y aparecerá una lista desplegable. Selecciona Administrar paquetes NuGet y haz clic en él. Aparecerá la siguiente ventana:
Administrador de Paquetes NuGet
Ahora, haz clic en "Explorar". Aparecerá la siguiente ventana:
IU del Administrador de paquetes NuGet
Escribe IronPDF en el cuadro de búsqueda y presiona "Enter". Aparecerá la siguiente ventana:
Solución NuGet
Selecciona y haz clic en IronPdf. Aparecerá la siguiente ventana:
Instalar IronPdf gratis
Presiona el botón "Instalar" y espera a que se complete la instalación. La siguiente ventana aparecerá después de una instalación exitosa:
IronPdf para .NET
Presiona el botón "Ok", y estás listo para comenzar.
Nota: Hay otras formas de descargar el paquete NuGet. También puedes instalar IronPdf usando la Consola del Administrador de Paquetes; para esto, abre la Consola del Administrador de Paquetes y escribe el siguiente código:
Install-Package IronPdf
También puedes descargarlo en la página del paquete NuGet para IronPDF.
El siguiente archivo Readme.txt se abrirá:
Archivo readme de IronPdf con ejemplos de código
Te sugiero que revises todos los enlaces y explora más ejemplos de código de IronPDF sobre esta biblioteca.
Paso #3: Diseñar una aplicación Windows Forms
Una vez que se ha creado un proyecto y se ha instalado el paquete NuGet, el siguiente paso es diseñar una App de Windows Forms que pedirá al usuario que busque un archivo y muestre su contenido.
Abre el diseño de Formulario 1:
IU del diseño del Formulario 1
Haz clic en la barra de herramientas que está en el lado izquierdo de la ventana:
IU de la Barra de herramientas para Etiqueta y Cuadro de texto
Busca "Etiqueta", y arrástrala y suéltala en el Diseño del Formulario
Nombra la etiqueta. Aquí, lo he nombrado "C# Leer Pdf usando IronPDF".
IU del Formulario 1 con la Etiqueta añadida
A continuación, arrastra y suelta un cuadro de texto (para mostrar la ruta del archivo), tres botones (uno para buscar los archivos, uno para leer archivos PDF usando IronPDF, y el tercer botón para "Borrar los campos de Texto"), y un Cuadro de Texto Enriquecido (para leer y mostrar el contenido del archivo).
Configura la "Propiedad de Solo Lectura" para el Cuadro de Texto y el Cuadro de Texto Enriquecido como "Falso". Esto es para que los usuarios solo puedan leer los contenidos y la ruta del archivo.
Formulario 1 diseñado completamente
Paso #4: Añadir el código back-end para explorar archivos PDF
Haz doble clic en el botón "Buscar", y aparecerá la siguiente ventana:
private void Browse_Click(object sender, EventArgs e)
{
}private void Browse_Click(object sender, EventArgs e)
{
}A continuación, escribe el siguiente código dentro de la función Browse_Click:
private void Browse_Click(object sender, EventArgs e)
{
// Initialize and configure OpenFileDialog
OpenFileDialog browseFile = new OpenFileDialog
{
InitialDirectory = @"D:\",
Title = "Browse Pdf Files",
CheckFileExists = true,
CheckPathExists = true,
DefaultExt = "pdf",
Filter = "pdf files (*.pdf)|*.pdf",
FilterIndex = 2,
RestoreDirectory = true,
ReadOnlyChecked = true,
ShowReadOnly = true
};
// Show the dialog and get result
if (browseFile.ShowDialog() == DialogResult.OK)
{
// Set the text box with the selected file path
FilePath.Text = browseFile.FileName;
}
}private void Browse_Click(object sender, EventArgs e)
{
// Initialize and configure OpenFileDialog
OpenFileDialog browseFile = new OpenFileDialog
{
InitialDirectory = @"D:\",
Title = "Browse Pdf Files",
CheckFileExists = true,
CheckPathExists = true,
DefaultExt = "pdf",
Filter = "pdf files (*.pdf)|*.pdf",
FilterIndex = 2,
RestoreDirectory = true,
ReadOnlyChecked = true,
ShowReadOnly = true
};
// Show the dialog and get result
if (browseFile.ShowDialog() == DialogResult.OK)
{
// Set the text box with the selected file path
FilePath.Text = browseFile.FileName;
}
}OpenFileDialog crea una instancia del control de Diálogo de Archivo de la aplicación de Windows Forms.
He configurado la Ruta Inicial en la unidad D; puedes configurarla en cualquier otra.
He configurado DefaultExt = "pdf" ya que solo tenemos que leer el archivo PDF.
He utilizado un filtro para que el cuadro de diálogo de archivo a buscar solo te muestre el archivo PDF para seleccionar.
Cuando el usuario hace clic en "Ok", mostrará la ruta del archivo en el campo de Ruta del Archivo.
Dejemos que ejecutemos la solución y probemos el botón "Buscar".
Form1 UI
Presiona el botón "Buscar" y aparecerá la siguiente ventana:
Diálogo de Archivo para seleccionar un archivo PDF
Selecciona el archivo (estoy seleccionando IronPDFTest.pdf) y presiona "Abrir". Aparecerá la siguiente ventana.
PDF en C#
Ahora escribamos el código detrás del botón "Leer" para leer el archivo.
Paso #5: Añadir el código back-end para leer documentos PDF usando IronPDF
Podrías estar pensando que el código para leer un archivo PDF sería complejo y difícil de escribir y entender.
No te preocupes. IronPDF ha simplificado las cosas y lo ha hecho todo mucho más fácil. Podemos leer fácilmente el archivo PDF usando solo dos líneas de código.
Ve al diseño del Formulario 1 y "haz doble clic" en el botón "Leer". Aparecerá la siguiente ventana:
private void Read_Click(object sender, EventArgs e)
{
}private void Read_Click(object sender, EventArgs e)
{
}Agrega un espacio de nombres using IronPdf para importar la biblioteca IronPDF:
using System;
using IronPdf;using System;
using IronPdf;Escribe el siguiente código dentro de la función Read_Click:
private void Read_Click(object sender, EventArgs e)
{
// Read the PDF file using IronPdf
using PdfDocument pdf = PdfDocument.FromFile(FilePath.Text);
// Extract and display the text from the PDF
FileContent.Text = pdf.ExtractAllText();
}private void Read_Click(object sender, EventArgs e)
{
// Read the PDF file using IronPdf
using PdfDocument pdf = PdfDocument.FromFile(FilePath.Text);
// Extract and display the text from the PDF
FileContent.Text = pdf.ExtractAllText();
}FilePath es el nombre del campo de texto que muestra la ubicación del documento PDF que queremos leer. Obtendremos la ubicación del archivo dinámicamente.
ExtractAllText con IronPDF es la función de IronPDF que extraerá todos los datos de las páginas PDF. Estos datos se mostrarán en el Cuadro de Texto enriquecido y se nombrarán como "Contenido del Archivo".
A continuación, escribamos el código detrás del "Botón Clear". Este es solo un artículo adicional si deseas borrar la pantalla una vez que hayas leído el documento PDF.
Haz doble clic en el "Botón Clear", y te llevará al siguiente código:
void Clear_Click(object sender, EventArgs e)
{
}void Clear_Click(object sender, EventArgs e)
{
}Escribe el siguiente código dentro de la función Clear_Click:
void Clear_Click(object sender, EventArgs e)
{
// Clear the file path and content display fields
FileContent.Text = "";
FilePath.Text = "";
}void Clear_Click(object sender, EventArgs e)
{
// Clear the file path and content display fields
FileContent.Text = "";
FilePath.Text = "";
}Ejecutar la solución
Haz clic en el botón "Buscar" y selecciona el documento que quieres leer. En mi caso, estoy leyendo el archivo IronPDF.pdf como ejemplo:
Documentos PDF
Presiona el botón "Abrir" y aparecerá la siguiente ventana:
Aplicación con un archivo PDF seleccionado
Presiona el botón "Leer". Leerá el archivo y mostrará el contenido como se muestra a continuación.
Mostrar contenido de texto del PDF
Resumen
Esta es una solución de ejemplo. No importa cuántas páginas, imágenes o textos haya en tus archivos PDF, IronPDF extraerá todos los textos e imágenes para que los uses para cualquier propósito. Simplemente necesitas obtener la licencia para la biblioteca y comenzar a usarla.
Esto completa el tutorial. Espero que hayas entendido todo, y si tienes alguna pregunta, no dudes en publicarla en la sección de comentarios.
Puedes descargar el archivo zip del proyecto. Si deseas comprar el paquete completo de productos de software de Iron, nuestra [oferta especial](Iron Suite) significa que ahora puedes comprar todos ellos por el precio de solo dos licencias Lite.
Preguntas Frecuentes
¿Cómo puedo leer texto de un archivo PDF usando C#?
Puede leer texto de un archivo PDF usando IronPDF mediante el método ExtractAllText, que permite extraer fácilmente todo el contenido de texto de un documento PDF.
¿Cuáles son las ventajas de usar IronPDF para la manipulación de PDFs en C#?
IronPDF ofrece un enfoque sencillo para leer, generar y manipular PDFs en C#. Permite a los desarrolladores llevar a cabo tareas como la extracción de texto y la recuperación de imágenes con un mínimo de líneas de código, mejorando la productividad y la eficiencia.
¿Cómo instalo la biblioteca IronPDF en mi proyecto C#?
Para instalar IronPDF, utilice el Administrador de paquetes NuGet en Visual Studio. Simplemente busque 'IronPdf' en la consola del Gestor de Paquetes y haga clic en 'Instalar' para incluirlo en su proyecto.
¿Puede usarse IronPDF para extraer imágenes de un archivo PDF?
Sí, IronPDF proporciona funcionalidad para extraer imágenes de un archivo PDF, permitiendo a los desarrolladores acceder y manipular todas las imágenes contenidas en el documento.
¿Qué pasos están involucrados en configurar un proyecto de Visual Studio para leer archivos PDF?
Configurar un proyecto implica crear un nuevo proyecto de Visual Studio, instalar el paquete NuGet de IronPDF, diseñar una aplicación Windows Forms y implementar código de back-end para explorar y leer archivos PDF.
¿Cómo puedo asegurarme de que los campos de mi aplicación se limpien después de leer un PDF?
Puede implementar un botón 'Limpiar' en su aplicación, que restablece el contenido del TextBox y RichTextBox a una cadena vacía, asegurando que los campos se limpien después de procesar un PDF.
¿Es posible usar IronPDF con VB.NET?
Sí, IronPDF es compatible con tanto C# como VB.NET, lo que lo convierte en una opción versátil para los desarrolladores que trabajan en diferentes lenguajes .NET.
¿Cuántas líneas de código se requieren para mostrar el contenido de un PDF usando IronPDF?
Puede mostrar el contenido de un PDF con tan solo dos líneas de código usando IronPDF, destacando su capacidad para simplificar las tareas de procesamiento de PDF.
¿Para qué se utiliza el método 'RenderHtmlAsPdf' en IronPDF?
El método RenderHtmlAsPdf en IronPDF se utiliza para convertir cadenas HTML en documentos PDF, permitiendo una integración perfecta de contenido web en archivos PDF.
¿IronPDF es totalmente compatible con .NET 10?
Sí. IronPDF está diseñado para ser totalmente compatible con .NET 10, así como con versiones anteriores como .NET 6-9, .NET Core, .NET Standard y .NET Framework. Admite la instalación mediante NuGet y funciona a la perfección en múltiples plataformas, como Windows, Linux y macOS.






