Pruebe en producción sin marcas de agua.
Funciona donde lo necesite.
Obtén 30 días de producto totalmente funcional.
Ténlo en funcionamiento en minutos.
Acceso completo a nuestro equipo de asistencia técnica durante la prueba del producto
Si es usted desarrollador, probablemente se habrá encontrado con problemas al intentar leer texto de un archivo PDF. Tal vez le ocurra alguna de las siguientes situaciones.
Usted está desarrollando una aplicación que toma dos documentos PDF como entrada y encuentra la similitud entre los documentos.
Está desarrollando una aplicación que necesita leer documentos PDF con IronPDF y devolver el conteo de palabras.
Está desarrollando una aplicación que extrae datos de un archivo PDF usando IronPDF y los coloca en una base de datos estructurada.
Está desarrollando una aplicación que necesita extraer contenido de texto de PDF y convertirlo en una cadena.
Extraer datos de archivos PDF utilizando C# era una tarea difícil y compleja hasta el desarrollo de IronPDF.
Descripción general de la biblioteca IronPDF es una biblioteca que facilita mucho a los desarrolladores la lectura de archivos PDF.
Puedes explorar más sobre IronPDF y las ofertas de Iron Software Suite.
Puede leer archivos PDF y mostrar los datos en un cuadro de texto de C# utilizando sólo dos líneas de código. Sí, sólo dos líneas de código. También puede extraer todas las imágenes de los PDFs. Además, puede crear otro documento con esas imágenes o mostrarlas en su aplicación según sus necesidades.
Déjenos mostrarle cómo se hace.
Podemos proceder paso a paso con la aplicación para seleccionar cualquier archivo PDF y luego mostrar su contenido.
Los siguientes pasos muestran cómo leer archivos PDF en C#:
Conocimientos Prerrequisitos:
Conocimientos básicos de programación en C
Conocimientos básicos de controles GUI en C
He diseñado este tutorial de tal manera que incluso una persona sin conocimientos de programación será capaz de progresar.
Quién debería leer esto
Cualquier recién llegado que esté aprendiendo C# debe saber leer archivos PDF usando IronPDF porque es algo que definitivamente vas a utilizar en tu carrera.
Los desarrolladores profesionales también deberían leer esto para poder entender la biblioteca IronPDF, que nos ayuda a leer, generar y manipular documentos PDF.
Ahora, ¿cómo podemos utilizar esta biblioteca en nuestro proyecto para leer un archivo PDF?
Estoy utilizando una aplicación Windows Forms para la demostración. Puede utilizar una aplicación de consola, una aplicación WPF o una aplicación web ASP.NET según sus preferencias.
Otra gran ventaja de la biblioteca IronPDF es que puede utilizarse tanto con C# como con VB.NET.
Comencemos la manifestación sin más demora.
Abre Visual Studio. Estoy utilizando Visual Studio 2019.
Haga clic en "Crear nuevo proyecto":
Crear Nuevo Proyecto
Ahora, selecciona la Windows Forms App de la plantilla, pulsa "Siguiente", y aparecerá la siguiente ventana. Introduzca el nombre del proyecto. He escrito 'Leer Pdf usando IronPDF'.
Configurar proyecto a través de Visual Studio
Ahora, haga clic en "Siguiente", y aparecerá la siguiente ventana. Seleccione '.NET Core 3.1' en el menú desplegable.
Versión .NET Core 3.1
Haga clic en el botón "Crear" y el proyecto se creará como se muestra a continuación.
Etapa inicial de una nueva aplicación de Windows Forms
Haga clic en el menú Proyecto de la barra de menús y aparecerá una lista desplegable. Seleccione Gestionar paquetes NuGet y haga clic en él. Aparecerá la siguiente ventana:
Administrador de paquetes NuGet
Ahora, haz clic en "Examinar". Aparecerá la siguiente ventana:
Interfaz de usuario del administrador de paquetes NuGet
Escribe IronPdf en el cuadro de búsqueda y pulsa "Intro". Aparecerá la siguiente ventana:
Solución NuGet
Seleccione y haga clic en IronPdf. Aparecerá la siguiente ventana:
Instalar IronPdf Gratis
Pulse el botón "Instalar" y espere a que finalice la instalación. Tras una instalación correcta, aparecerá la siguiente ventana:
IronPdf for .NET
Pulsa el botón "Aceptar" y listo.
Nota: Existen otras formas de descargar el paquete NuGet. También puedes instalar IronPdf
utilizando la Consola del Administrador de Paquetes; Para ello, abra la consola del gestor de paquetes y escriba el siguiente código:
Install-Package IronPdf
También puedes descargarlo en la página del paquete NuGet para IronPDF.
Se abrirá el siguiente archivo Readme.txt:
Archivo readme de IronPdf con ejemplos de código
Te sugiero que revises todos los enlaces y explores más ejemplos de código de IronPDF sobre esta biblioteca.
Una vez creado el proyecto e instalado el paquete NuGet, el siguiente paso es diseñar una aplicación Windows Forms que pida al usuario que busque un archivo y muestre su contenido.
Diseño Open Form1:
Diseño de IU de Form1
Haga clic en la barra de herramientas que se encuentra en la parte izquierda de la ventana:
Interfaz de herramientas para Etiqueta y Cuadro de texto
Busque Etiqueta, y arrástrela y suéltela en el Diseño del formulario
Nombra la etiqueta. Aquí, lo he llamado "C# Read Pdf using IronPDF".
Interfaz de Form1 con etiqueta añadida
A continuación, arrastra y suelta un cuadro de texto (para mostrar la ruta del archivo), tres botones (uno para navegar por los archivos, uno para leer archivos PDF usando IronPDF, y el tercer botón para "Limpiar el Texto"), y un RichTextBox (para leer y mostrar el contenido del archivo).
Establezca la "Propiedad de sólo lectura" de TextBox y RichTextBox en "False". Esto es para que los usuarios sólo puedan leer el contenido y la ruta del archivo.
Form1 completamente diseñado
Haga doble clic en el botón "Examinar" y aparecerá la siguiente ventana:
private void Browse_Click(object sender, EventArgs e)
{
}
private void Browse_Click(object sender, EventArgs e)
{
}
Private Sub Browse_Click(ByVal sender As Object, ByVal e As EventArgs)
End Sub
A continuación, escriba el siguiente código dentro de la función Browse_Click:
private void Browse_Click(object sender, EventArgs e)
{
OpenFileDialog browseFile = new OpenFileDialog
{
InitialDirectory = @"D:\",
Title = "Browse Pdf Files",
CheckFileExists = true,
CheckPathExists = true,
DefaultExt = "pdf",
Filter = "pdf files (*.pdf)
*.pdf",
FilterIndex = 2,
RestoreDirectory = true,
ReadOnlyChecked = true,
ShowReadOnly = true
};
if (browseFile.ShowDialog() == DialogResult.OK)
{
FilePath.Text = browseFile.FileName;
}
}
private void Browse_Click(object sender, EventArgs e)
{
OpenFileDialog browseFile = new OpenFileDialog
{
InitialDirectory = @"D:\",
Title = "Browse Pdf Files",
CheckFileExists = true,
CheckPathExists = true,
DefaultExt = "pdf",
Filter = "pdf files (*.pdf)
*.pdf",
FilterIndex = 2,
RestoreDirectory = true,
ReadOnlyChecked = true,
ShowReadOnly = true
};
if (browseFile.ShowDialog() == DialogResult.OK)
{
FilePath.Text = browseFile.FileName;
}
}
Private Sub Browse_Click(ByVal sender As Object, ByVal e As EventArgs)
Dim browseFile As New OpenFileDialog With {
.InitialDirectory = "D:\",
.Title = "Browse Pdf Files",
.CheckFileExists = True,
.CheckPathExists = True,
.DefaultExt = "pdf",
.Filter = "pdf files (*.pdf) *.pdf",
.FilterIndex = 2,
.RestoreDirectory = True,
.ReadOnlyChecked = True,
.ShowReadOnly = True
}
If browseFile.ShowDialog() = DialogResult.OK Then
FilePath.Text = browseFile.FileName
End If
End Sub
OpenFileDialogue
creará la instancia del control de diálogo de archivos de la aplicación Windows Forms.
He establecido la ruta inicial en la unidad D, pero puede establecerla en cualquiera.
He establecido DefaultExt = "pdf"
ya que solo tenemos que leer el archivo PDF.
He utilizado un filtro para que el cuadro de diálogo Examinar archivo sólo muestre el archivo PDF a seleccionar.
Cuando el usuario haga clic en "Aceptar", se mostrará la ruta del archivo en el campo Ruta del archivo.
Ejecutemos la solución y probemos el botón "Examinar".
Interfaz de usuario de Form1
Pulse el botón "Examinar" y aparecerá la siguiente ventana:
Diálogo de exploración de archivos para seleccionar un archivo PDF
Seleccione el archivo (estoy seleccionando IronPDFTest.pdf) y presione "Abrir". Aparecerá la siguiente ventana.
PDF en C#
Ahora vamos a escribir el código detrás del botón "Leer" para leer el archivo.
Quizá piense que el código para leer un archivo PDF es complejo y difícil de escribir y comprender.
No se preocupe. IronPDF ha simplificado las cosas y lo ha hecho todo mucho más fácil. Podemos leer fácilmente el archivo PDF utilizando sólo dos líneas de código.
Vaya a Diseño Form1 y haga "doble clic" en el botón "Leer". Aparecerá la siguiente ventana:
private void Read_Click(object sender, EventArgs e)
{
}
private void Read_Click(object sender, EventArgs e)
{
}
Private Sub Read_Click(ByVal sender As Object, ByVal e As EventArgs)
End Sub
Agrega un espacio de nombres using IronPdf
para importar la biblioteca IronPDF:
using System;
using IronPdf;
using System;
using IronPdf;
Imports System
Imports IronPdf
Escribe el siguiente código dentro de la función Read_Click
:
private void Read_Click(object sender, EventArgs e)
{
using PdfDocument pdf = PdfDocument.FromFile(FilePath.Text);
FileContent.Text = pdf.ExtractAllText();
}
private void Read_Click(object sender, EventArgs e)
{
using PdfDocument pdf = PdfDocument.FromFile(FilePath.Text);
FileContent.Text = pdf.ExtractAllText();
}
Private Sub Read_Click(ByVal sender As Object, ByVal e As EventArgs)
Using pdf As PdfDocument = PdfDocument.FromFile(FilePath.Text)
FileContent.Text = pdf.ExtractAllText()
End Using
End Sub
FilePath
es el nombre del campo de texto que muestra la ubicación del documento PDF que queremos leer. Obtendremos la ubicación del archivo de forma dinámica.
ExtractAllText con IronPDF es la función de IronPDF que extraerá todos los datos de las páginas PDF. Estos datos se mostrarán en el cuadro de texto enriquecido y se denominarán "Contenido del archivo".
A continuación, vamos a escribir el código detrás del "Botón Borrar". Esto es sólo un elemento adicional si desea borrar la pantalla una vez que haya leído el documento PDF.
Haga doble clic en el "Botón Borrar", y le llevará al siguiente código:
void Clear_Click(object sender, EventArgs e)
{
}
void Clear_Click(object sender, EventArgs e)
{
}
Private Sub Clear_Click(ByVal sender As Object, ByVal e As EventArgs)
End Sub
Escriba el siguiente código dentro de la función Clear_Click
:
void Clear_Click(object sender, EventArgs e)
{
FileContent.Text = "";
FilePath.Text = "";
}
void Clear_Click(object sender, EventArgs e)
{
FileContent.Text = "";
FilePath.Text = "";
}
Private Sub Clear_Click(ByVal sender As Object, ByVal e As EventArgs)
FileContent.Text = ""
FilePath.Text = ""
End Sub
Haga clic en el botón "Examinar" y seleccione el documento que desea leer. En mi caso, estoy leyendo el archivo IronPDF.pdf como ejemplo:
Documentos PDF
Pulse el botón "Abrir" y aparecerá la siguiente ventana:
Aplicación con un archivo PDF seleccionado
Pulse el botón "Leer". Leerá el archivo y mostrará el contenido como se muestra a continuación.
Mostrar contenido de texto PDF
Este es un ejemplo de solución. No importa cuántas páginas, imágenes o textos haya en sus archivos PDF, IronPDF extraerá todos los textos e imágenes para que pueda utilizarlos con cualquier fin. Basta con obtener la licencia de la biblioteca y empezar a utilizarla.
Esto completa el tutorial. Espero que lo hayas entendido todo, y si tienes alguna duda, no dudes en plantearla en la sección de comentarios.
Puedes descargar el archivo zip del proyecto. Si desea adquirir el paquete completo de productos de software Iron, nuestra oferta especial le permite comprarlos todos al precio de sólo dos. Si necesita más detalles sobre la licencia y el soporte, haga clic en información sobre precios de Iron Software. También puedes obtener las ofertas de licencia de prueba gratuita.