Pruebas en un entorno real
Pruebe en producción sin marcas de agua.
Funciona donde lo necesites.
Si es usted desarrollador, probablemente se habrá encontrado con problemas al intentar leer texto de un archivo PDF. Tal vez le ocurra alguna de las siguientes situaciones.
Usted está desarrollando una aplicación que toma dos documentos PDF como entrada y encuentra la similitud entre los documentos.
Está desarrollando una aplicación que necesita leer documentos PDF y devuelve el recuento de palabras.
Está desarrollando una aplicación que extrae datos de un archivo PDF y lo coloca en una base de datos estructurada.
Está desarrollando una aplicación que necesita extraer contenido de texto PDF y convertirlo en cadena.
Extraer datos de archivos PDF utilizando C# era una tarea difícil y compleja hasta el desarrollo de IronPDF.
IronPDF es una biblioteca que facilita enormemente a los desarrolladores la lectura de archivos PDF.
Puede obtener más información sobre IronPDF y Iron Software Suite.
Puede leer archivos PDF y mostrar los datos en un cuadro de texto de C# utilizando sólo dos líneas de código. Sí, sólo dos líneas de código. También puede extraer todas las imágenes en sus archivos PDF. Además, puede crear otro documento con esas imágenes o mostrarlas en su aplicación según sus necesidades.
Déjenos mostrarle cómo se hace.
Podemos proceder paso a paso con la aplicación para seleccionar cualquier archivo PDF y luego mostrar su contenido.
Los siguientes pasos muestran cómo leer archivos PDF en C#:
**Conocimientos previos
Conocimientos básicos de programación en C
Conocimientos básicos de controles GUI en C
He diseñado este tutorial de tal manera que incluso una persona sin conocimientos de programación será capaz de progresar.
**¿Quién debería leer esto?
Cualquier principiante que aprenda C# debería saber cómo leer archivos PDF porque es algo que sin duda vas a utilizar en tu carrera.
Los desarrolladores profesionales también deberían leer esto para poder entender la librería IronPDF, que nos ayuda a leer, generar y manipular documentos PDF.
Ahora, ¿cómo podemos utilizar esta biblioteca en nuestro proyecto para leer un archivo PDF?
Estoy utilizando una aplicación Windows Forms para la demostración. Puede utilizar una aplicación de consola, una aplicación WPF o una aplicación web ASP.NET según prefiera.
Otra gran ventaja de la biblioteca IronPDF es que puede utilizarse tanto con C# como con VB.NET.
Comencemos la manifestación sin más demora.
Abre Visual Studio. Estoy utilizando Visual Studio 2019.
Haga clic en "Crear nuevo proyecto":
Crear nuevo proyecto
Ahora, selecciona la Windows Forms App de la plantilla, pulsa "Siguiente", y aparecerá la siguiente ventana. Introduzca el nombre del proyecto. He escrito 'Leer Pdf usando IronPDF'.
Configurar proyecto a través de Visual Studio
Ahora, haga clic en "Siguiente", y aparecerá la siguiente ventana. Seleccione '.NET Core 3.1' en el menú desplegable.
Versión 3.1 de .NET Core
Haga clic en el botón "Crear" y el proyecto se creará como se muestra a continuación.
Etapa inicial de una nueva aplicación Windows Forms
Haga clic en el menú Proyecto de la barra de menús y aparecerá una lista desplegable. Seleccione Gestionar paquetes NuGet y haga clic en él. Aparecerá la siguiente ventana:
Gestor de paquetes NuGet
Ahora, haz clic en "Examinar". Aparecerá la siguiente ventana:
**Interfaz de usuario del gestor de paquetes NuGet.
Escribe IronPdf en el cuadro de búsqueda y pulsa "Intro". Aparecerá la siguiente ventana:
Solución NuGet
Seleccione y haga clic en IronPdf. Aparecerá la siguiente ventana:
Instalar gratis IronPdf
Pulse el botón "Instalar" y espere a que finalice la instalación. Tras la instalación, aparecerá la siguiente ventana:
**IronPdf para .NET
Pulsa el botón "Aceptar" y listo.
Nota: Existen otras formas de descargar el paquete NuGet. También puede instalar IronPdf
utilizando la consola del gestor de paquetes; Para ello, abra la consola del gestor de paquetes y escriba el siguiente código:
Install-Package IronPdf
También puede descargarlo en el sitio web de NuGet.
Se abrirá el siguiente archivo Readme.txt:
Archivo Léame de IronPdf con ejemplos de código
Le sugiero que revise todos los enlaces y explore más ejemplos de código sobre esta Biblioteca.
Una vez creado el proyecto e instalado el paquete NuGet, el siguiente paso es diseñar una aplicación Windows Forms que pida al usuario que busque un archivo y muestre su contenido.
Diseño Open Form1:
Form1 Design UI
Haga clic en la barra de herramientas que se encuentra en la parte izquierda de la ventana:
**Interfaz de usuario de caja de herramientas para etiquetas y cuadros de texto.
Busque Etiqueta, y arrástrela y suéltela en el Diseño del formulario
Nombra la etiqueta. Aquí, lo he llamado "C# Read Pdf using IronPDF".
**Formulario 1 con etiqueta añadida.
A continuación, arrastre y suelte un cuadro de texto (para mostrar la ruta del archivo)tres botones (uno para navegar por los archivos, otro para leer archivos pdf utilizando IronPDF, y el tercer botón para "Borrar los campos de texto".)y un RichTextBox (para leer y mostrar el contenido del archivo).
Establezca la "Propiedad de sólo lectura" de TextBox y RichTextBox en "False". Esto es para que los usuarios sólo puedan leer el contenido y la ruta del archivo.
Form1 fulled designed
Haga doble clic en el botón "Examinar" y aparecerá la siguiente ventana:
private void Browse_Click(object sender, EventArgs e)
{
}
private void Browse_Click(object sender, EventArgs e)
{
}
Private Sub Browse_Click(ByVal sender As Object, ByVal e As EventArgs)
End Sub
A continuación, escriba el siguiente código dentro de la función Browse_Click:
private void Browse_Click(object sender, EventArgs e)
{
OpenFileDialog browseFile = new OpenFileDialog
{
InitialDirectory = @"D:\",
Title = "Browse Pdf Files",
CheckFileExists = true,
CheckPathExists = true,
DefaultExt = "pdf",
Filter = "pdf files (*.pdf)
*.pdf",
FilterIndex = 2,
RestoreDirectory = true,
ReadOnlyChecked = true,
ShowReadOnly = true
};
if (browseFile.ShowDialog() == DialogResult.OK)
{
FilePath.Text = browseFile.FileName;
}
}
private void Browse_Click(object sender, EventArgs e)
{
OpenFileDialog browseFile = new OpenFileDialog
{
InitialDirectory = @"D:\",
Title = "Browse Pdf Files",
CheckFileExists = true,
CheckPathExists = true,
DefaultExt = "pdf",
Filter = "pdf files (*.pdf)
*.pdf",
FilterIndex = 2,
RestoreDirectory = true,
ReadOnlyChecked = true,
ShowReadOnly = true
};
if (browseFile.ShowDialog() == DialogResult.OK)
{
FilePath.Text = browseFile.FileName;
}
}
Private Sub Browse_Click(ByVal sender As Object, ByVal e As EventArgs)
Dim browseFile As New OpenFileDialog With {
.InitialDirectory = "D:\",
.Title = "Browse Pdf Files",
.CheckFileExists = True,
.CheckPathExists = True,
.DefaultExt = "pdf",
.Filter = "pdf files (*.pdf) *.pdf",
.FilterIndex = 2,
.RestoreDirectory = True,
.ReadOnlyChecked = True,
.ShowReadOnly = True
}
If browseFile.ShowDialog() = DialogResult.OK Then
FilePath.Text = browseFile.FileName
End If
End Sub
OpenFileDialogue
creará la instancia del control File Dialogue de la Windows Forms App.
He establecido la ruta inicial en la unidad D, pero puede establecerla en cualquiera.
He puesto DefaultExt = "pdf"
ya que sólo tenemos que leer el archivo pdf.
He utilizado un filtro para que el cuadro de diálogo Examinar archivo sólo muestre el archivo PDF a seleccionar.
Cuando el usuario haga clic en "Aceptar", se mostrará la ruta del archivo en el campo Ruta del archivo.
Ejecutemos la solución y probemos el botón "Examinar".
Formulario1 UI
Pulse el botón "Examinar" y aparecerá la siguiente ventana:
Buscar archivo para seleccionar un archivo PDF
Seleccione el archivo (Estoy seleccionando IronPDFTest.pdf) y pulse "Abrir". Aparecerá la siguiente ventana.
PDF en C#
Ahora vamos a escribir el código detrás del botón "Leer" para leer el archivo.
Quizá piense que el código para leer un archivo PDF es complejo y difícil de escribir y comprender.
No se preocupe. IronPDF ha simplificado las cosas y lo ha hecho todo mucho más fácil. Podemos leer fácilmente el archivo PDF utilizando sólo dos líneas de código.
Vaya a Diseño Form1 y haga "doble clic" en el botón "Leer". Aparecerá la siguiente ventana:
private void Read_Click(object sender, EventArgs e)
{
}
private void Read_Click(object sender, EventArgs e)
{
}
Private Sub Read_Click(ByVal sender As Object, ByVal e As EventArgs)
End Sub
Añade un namespace using IronPdf
para importar la librería IronPDF:
using System;
using IronPdf;
using System;
using IronPdf;
Imports System
Imports IronPdf
Escribe el siguiente código dentro de la función Read_Click
:
private void Read_Click(object sender, EventArgs e)
{
using PdfDocument pdf = PdfDocument.FromFile(FilePath.Text);
FileContent.Text = pdf.ExtractAllText();
}
private void Read_Click(object sender, EventArgs e)
{
using PdfDocument pdf = PdfDocument.FromFile(FilePath.Text);
FileContent.Text = pdf.ExtractAllText();
}
Private Sub Read_Click(ByVal sender As Object, ByVal e As EventArgs)
Using pdf As PdfDocument = PdfDocument.FromFile(FilePath.Text)
FileContent.Text = pdf.ExtractAllText()
End Using
End Sub
FilePath
es el nombre del campo de texto que muestra la ubicación del documento PDF que queremos leer. Obtendremos la ubicación del archivo de forma dinámica.
ExtraerTodoTexto es la función de IronPDF que extraerá todos los datos de las páginas PDF. Estos datos se mostrarán en el cuadro de texto enriquecido y se denominarán "Contenido del archivo".
A continuación, vamos a escribir el código detrás del "Botón Borrar". Esto es sólo un elemento adicional si desea borrar la pantalla una vez que haya leído el documento PDF.
Haga doble clic en el "Botón Borrar", y le llevará al siguiente código:
void Clear_Click(object sender, EventArgs e)
{
}
void Clear_Click(object sender, EventArgs e)
{
}
Private Sub Clear_Click(ByVal sender As Object, ByVal e As EventArgs)
End Sub
Escribe el siguiente código dentro de la función Clear_Click
:
void Clear_Click(object sender, EventArgs e)
{
FileContent.Text = "";
FilePath.Text = "";
}
void Clear_Click(object sender, EventArgs e)
{
FileContent.Text = "";
FilePath.Text = "";
}
Private Sub Clear_Click(ByVal sender As Object, ByVal e As EventArgs)
FileContent.Text = ""
FilePath.Text = ""
End Sub
Haga clic en el botón "Examinar" y seleccione el documento que desea leer. En mi caso, estoy leyendo el archivo IronPDF.pdf como ejemplo:
**Documentos PDF
Pulse el botón "Abrir" y aparecerá la siguiente ventana:
Aplicación con un archivo PDF seleccionado
Pulse el botón "Leer". Leerá el archivo y mostrará el contenido como se muestra a continuación.
Visualizar contenido de texto en PDF
Este es un ejemplo de solución. No importa cuántas páginas, imágenes o textos haya en sus archivos PDF, IronPDF extraerá todos los textos e imágenes para que pueda utilizarlos con cualquier fin. Basta con obtener la licencia de la biblioteca y empezar a utilizarla.
Esto completa el tutorial. Espero que lo hayas entendido todo, y si tienes alguna duda, no dudes en plantearla en la sección de comentarios.
Puede descargar el archivo zip del proyecto. Si desea adquirir el paquete completo de productos de software Iron, nuestra oferta especial le permite comprarlos todos al precio de sólo dos. Si necesita más información sobre la licencia y la asistencia, haga clic en esta página de precios. También puede obtener la licencia de prueba gratuita
9 productos API .NET para sus documentos de oficina