USO DE IRONPDF

C# Leer archivo PDF: Tutorial fácil

Actualizado 25 de noviembre, 2021
Compartir:

Si es usted desarrollador, probablemente se habrá encontrado con problemas al intentar leer texto de un archivo PDF. Tal vez le ocurra alguna de las siguientes situaciones.

  1. Usted está desarrollando una aplicación que toma dos documentos PDF como entrada y encuentra la similitud entre los documentos.
  2. Está desarrollando una aplicación que necesita leer documentos PDF y devuelve el recuento de palabras.
  3. Está desarrollando una aplicación que extrae datos de un archivo PDF y lo coloca en una base de datos estructurada.
  4. Está desarrollando una aplicación que necesita extraer contenido de texto PDF y convertirlo en cadena.
  5. Extraer datos de archivos PDF utilizando C# era una tarea difícil y compleja hasta el desarrollo de IronPDF.

    IronPDF es una biblioteca que facilita enormemente a los desarrolladores la lectura de archivos PDF.

    Puede obtener más información sobre IronPDF y Iron Software Suite.

    Puede leer archivos PDF y mostrar los datos en un cuadro de texto de C# utilizando sólo dos líneas de código. Sí, sólo dos líneas de código. También puede extraer todas las imágenes en sus archivos PDF. Además, puede crear otro documento con esas imágenes o mostrarlas en su aplicación según sus necesidades.

    Déjenos mostrarle cómo se hace.

    Podemos proceder paso a paso con la aplicación para seleccionar cualquier archivo PDF y luego mostrar su contenido.

    Los siguientes pasos muestran cómo leer archivos PDF en C#:

    **Conocimientos previos

  6. Conocimientos básicos de programación en C
  7. Conocimientos básicos de controles GUI en C

    He diseñado este tutorial de tal manera que incluso una persona sin conocimientos de programación será capaz de progresar.

    **¿Quién debería leer esto?

    Cualquier principiante que aprenda C# debería saber cómo leer archivos PDF porque es algo que sin duda vas a utilizar en tu carrera.

    Los desarrolladores profesionales también deberían leer esto para poder entender la librería IronPDF, que nos ayuda a leer, generar y manipular documentos PDF.

    Ahora, ¿cómo podemos utilizar esta biblioteca en nuestro proyecto para leer un archivo PDF?

    Estoy utilizando una aplicación Windows Forms para la demostración. Puede utilizar una aplicación de consola, una aplicación WPF o una aplicación web ASP.NET según prefiera.

    Otra gran ventaja de la biblioteca IronPDF es que puede utilizarse tanto con C# como con VB.NET.

    Comencemos la manifestación sin más demora.


Paso #1: Crear un proyecto de Visual Studio

Abre Visual Studio. Estoy utilizando Visual Studio 2019.

Haga clic en "Crear nuevo proyecto":

C# Read PDF File: Easy Tutorial, Figura 3: Crear nuevo proyecto

Crear nuevo proyecto

Ahora, selecciona la Windows Forms App de la plantilla, pulsa "Siguiente", y aparecerá la siguiente ventana. Introduzca el nombre del proyecto. He escrito 'Leer Pdf usando IronPDF'.

C# Read PDF File: Easy Tutorial, Figura 16: Configurar proyecto mediante Visual Studio

Configurar proyecto a través de Visual Studio

Ahora, haga clic en "Siguiente", y aparecerá la siguiente ventana. Seleccione '.NET Core 3.1' en el menú desplegable.

C# Read PDF File: Easy Tutorial, Figura 9: .NET Core 3.1 version

Versión 3.1 de .NET Core

Haga clic en el botón "Crear" y el proyecto se creará como se muestra a continuación.

C# Read PDF File: Easy Tutorial, Figura 6: Fase inicial de una nueva aplicación Windows Forms

Etapa inicial de una nueva aplicación Windows Forms


Paso #2: Instalar el paquete NuGet de IronPdf

Haga clic en el menú Proyecto de la barra de menús y aparecerá una lista desplegable. Seleccione Gestionar paquetes NuGet y haga clic en él. Aparecerá la siguiente ventana:

C# Read PDF File: Easy Tutorial, Figura 1: Gestor de paquetes NuGet

Gestor de paquetes NuGet

Ahora, haz clic en "Examinar". Aparecerá la siguiente ventana:

C# Read PDF File: Easy Tutorial, Figura 2: UI del gestor de paquetes NuGet

**Interfaz de usuario del gestor de paquetes NuGet.

Escribe IronPdf en el cuadro de búsqueda y pulsa "Intro". Aparecerá la siguiente ventana:

C# Read PDF File: Easy Tutorial, Figura 4: Solución NuGet

Solución NuGet

Seleccione y haga clic en IronPdf. Aparecerá la siguiente ventana:

C# Leer Archivo PDF: Tutorial Fácil, Figura 7: Instalar IronPdf Gratis

Instalar gratis IronPdf

Pulse el botón "Instalar" y espere a que finalice la instalación. Tras la instalación, aparecerá la siguiente ventana:

C# Read PDF File: Easy Tutorial, Figura 5: IronPdf para .NET

**IronPdf para .NET

Pulsa el botón "Aceptar" y listo.

Nota: Existen otras formas de descargar el paquete NuGet. También puede instalar IronPdf utilizando la consola del gestor de paquetes; Para ello, abra la consola del gestor de paquetes y escriba el siguiente código:

Install-Package IronPdf

También puede descargarlo en el sitio web de NuGet.

Se abrirá el siguiente archivo Readme.txt:

C# Read PDF File: Easy Tutorial, Figura 12: Archivo Léame de IronPdf con ejemplos de código

Archivo Léame de IronPdf con ejemplos de código

Le sugiero que revise todos los enlaces y explore más ejemplos de código sobre esta Biblioteca.


Paso #3: Diseñar una aplicación Windows Forms

Una vez creado el proyecto e instalado el paquete NuGet, el siguiente paso es diseñar una aplicación Windows Forms que pida al usuario que busque un archivo y muestre su contenido.

Diseño Open Form1:

C# Read PDF File: Easy Tutorial, Figura 14: Form1 Design UI

Form1 Design UI

Haga clic en la barra de herramientas que se encuentra en la parte izquierda de la ventana:

C# Read PDF File: Easy Tutorial, Figura 15: Toolbox UI for Label and TextBox

**Interfaz de usuario de caja de herramientas para etiquetas y cuadros de texto.

Busque Etiqueta, y arrástrela y suéltela en el Diseño del formulario

Nombra la etiqueta. Aquí, lo he llamado "C# Read Pdf using IronPDF".

C# Read PDF File: Easy Tutorial, Figura 20: Form1 UI with Label added

**Formulario 1 con etiqueta añadida.

A continuación, arrastre y suelte un cuadro de texto (para mostrar la ruta del archivo)tres botones (uno para navegar por los archivos, otro para leer archivos pdf utilizando IronPDF, y el tercer botón para "Borrar los campos de texto".)y un RichTextBox (para leer y mostrar el contenido del archivo).

Establezca la "Propiedad de sólo lectura" de TextBox y RichTextBox en "False". Esto es para que los usuarios sólo puedan leer el contenido y la ruta del archivo.

C# Read PDF File: Easy Tutorial, Figura 10: Form1 fulled designed

Form1 fulled designed


Paso #4: Añadir el código back-end para explorar archivos PDF

Haga doble clic en el botón "Examinar" y aparecerá la siguiente ventana:

private void Browse_Click(object sender, EventArgs e)
{
}
private void Browse_Click(object sender, EventArgs e)
{
}
Private Sub Browse_Click(ByVal sender As Object, ByVal e As EventArgs)
End Sub
VB   C#

A continuación, escriba el siguiente código dentro de la función Browse_Click:

private void Browse_Click(object sender, EventArgs e)
{
    OpenFileDialog browseFile = new OpenFileDialog
    {
        InitialDirectory = @"D:\",
        Title = "Browse Pdf Files",
        CheckFileExists = true,
        CheckPathExists = true,
        DefaultExt = "pdf",
        Filter = "pdf files (*.pdf)
*.pdf",
        FilterIndex = 2,
        RestoreDirectory = true,
        ReadOnlyChecked = true,
        ShowReadOnly = true
    };
    if (browseFile.ShowDialog() == DialogResult.OK)
    {
        FilePath.Text = browseFile.FileName;
    }
}
private void Browse_Click(object sender, EventArgs e)
{
    OpenFileDialog browseFile = new OpenFileDialog
    {
        InitialDirectory = @"D:\",
        Title = "Browse Pdf Files",
        CheckFileExists = true,
        CheckPathExists = true,
        DefaultExt = "pdf",
        Filter = "pdf files (*.pdf)
*.pdf",
        FilterIndex = 2,
        RestoreDirectory = true,
        ReadOnlyChecked = true,
        ShowReadOnly = true
    };
    if (browseFile.ShowDialog() == DialogResult.OK)
    {
        FilePath.Text = browseFile.FileName;
    }
}
Private Sub Browse_Click(ByVal sender As Object, ByVal e As EventArgs)
	Dim browseFile As New OpenFileDialog With {
		.InitialDirectory = "D:\",
		.Title = "Browse Pdf Files",
		.CheckFileExists = True,
		.CheckPathExists = True,
		.DefaultExt = "pdf",
		.Filter = "pdf files (*.pdf) *.pdf",
		.FilterIndex = 2,
		.RestoreDirectory = True,
		.ReadOnlyChecked = True,
		.ShowReadOnly = True
	}
	If browseFile.ShowDialog() = DialogResult.OK Then
		FilePath.Text = browseFile.FileName
	End If
End Sub
VB   C#

OpenFileDialogue creará la instancia del control File Dialogue de la Windows Forms App.

He establecido la ruta inicial en la unidad D, pero puede establecerla en cualquiera.

He puesto DefaultExt = "pdf" ya que sólo tenemos que leer el archivo pdf.

He utilizado un filtro para que el cuadro de diálogo Examinar archivo sólo muestre el archivo PDF a seleccionar.

Cuando el usuario haga clic en "Aceptar", se mostrará la ruta del archivo en el campo Ruta del archivo.

Ejecutemos la solución y probemos el botón "Examinar".

C# Read PDF File: Easy Tutorial, Figura 10: Form1 UI

Formulario1 UI

Pulse el botón "Examinar" y aparecerá la siguiente ventana:

C# Read PDF File: Easy Tutorial, Figura 11: Cuadro de diálogo Browse File para seleccionar un archivo PDF

Buscar archivo para seleccionar un archivo PDF

Seleccione el archivo (Estoy seleccionando IronPDFTest.pdf) y pulse "Abrir". Aparecerá la siguiente ventana.

C# Leer archivo PDF: Tutorial fácil, Figura 13: PDF en C#

PDF en C#

Ahora vamos a escribir el código detrás del botón "Leer" para leer el archivo.


Paso #5: Añadir el código back-end para leer documentos PDF utilizando IronPDF

Quizá piense que el código para leer un archivo PDF es complejo y difícil de escribir y comprender.

No se preocupe. IronPDF ha simplificado las cosas y lo ha hecho todo mucho más fácil. Podemos leer fácilmente el archivo PDF utilizando sólo dos líneas de código.

Vaya a Diseño Form1 y haga "doble clic" en el botón "Leer". Aparecerá la siguiente ventana:

private void Read_Click(object sender, EventArgs e)
{
}
private void Read_Click(object sender, EventArgs e)
{
}
Private Sub Read_Click(ByVal sender As Object, ByVal e As EventArgs)
End Sub
VB   C#

Añade un namespace using IronPdf para importar la librería IronPDF:

using System;
using IronPdf;
using System;
using IronPdf;
Imports System
Imports IronPdf
VB   C#

Escribe el siguiente código dentro de la función Read_Click:

private void Read_Click(object sender, EventArgs e)
{
    using PdfDocument pdf = PdfDocument.FromFile(FilePath.Text);
    FileContent.Text = pdf.ExtractAllText(); 
}
private void Read_Click(object sender, EventArgs e)
{
    using PdfDocument pdf = PdfDocument.FromFile(FilePath.Text);
    FileContent.Text = pdf.ExtractAllText(); 
}
Private Sub Read_Click(ByVal sender As Object, ByVal e As EventArgs)
	Using pdf As PdfDocument = PdfDocument.FromFile(FilePath.Text)
		FileContent.Text = pdf.ExtractAllText()
	End Using
End Sub
VB   C#

FilePath es el nombre del campo de texto que muestra la ubicación del documento PDF que queremos leer. Obtendremos la ubicación del archivo de forma dinámica.

ExtraerTodoTexto es la función de IronPDF que extraerá todos los datos de las páginas PDF. Estos datos se mostrarán en el cuadro de texto enriquecido y se denominarán "Contenido del archivo".

A continuación, vamos a escribir el código detrás del "Botón Borrar". Esto es sólo un elemento adicional si desea borrar la pantalla una vez que haya leído el documento PDF.

Haga doble clic en el "Botón Borrar", y le llevará al siguiente código:

void Clear_Click(object sender, EventArgs e)
{
}
void Clear_Click(object sender, EventArgs e)
{
}
Private Sub Clear_Click(ByVal sender As Object, ByVal e As EventArgs)
End Sub
VB   C#

Escribe el siguiente código dentro de la función Clear_Click:

void Clear_Click(object sender, EventArgs e)
{
    FileContent.Text = "";
    FilePath.Text = "";
}
void Clear_Click(object sender, EventArgs e)
{
    FileContent.Text = "";
    FilePath.Text = "";
}
Private Sub Clear_Click(ByVal sender As Object, ByVal e As EventArgs)
	FileContent.Text = ""
	FilePath.Text = ""
End Sub
VB   C#

Ejecutar la solución

Haga clic en el botón "Examinar" y seleccione el documento que desea leer. En mi caso, estoy leyendo el archivo IronPDF.pdf como ejemplo:

C# Read PDF File: Easy Tutorial, Figura 8: Documentos PDF

**Documentos PDF

Pulse el botón "Abrir" y aparecerá la siguiente ventana:

C# Read PDF File: Easy Tutorial, Figura 13: Aplicación con un archivo PDF seleccionado

Aplicación con un archivo PDF seleccionado

Pulse el botón "Leer". Leerá el archivo y mostrará el contenido como se muestra a continuación.

C# Read PDF File: Easy Tutorial, Figura 19: Mostrar contenido de texto PDF

Visualizar contenido de texto en PDF


Resumen

Este es un ejemplo de solución. No importa cuántas páginas, imágenes o textos haya en sus archivos PDF, IronPDF extraerá todos los textos e imágenes para que pueda utilizarlos con cualquier fin. Basta con obtener la licencia de la biblioteca y empezar a utilizarla.

Esto completa el tutorial. Espero que lo hayas entendido todo, y si tienes alguna duda, no dudes en plantearla en la sección de comentarios.

Puede descargar el archivo zip del proyecto. Si desea adquirir el paquete completo de productos de software Iron, nuestra oferta especial le permite comprarlos todos al precio de sólo dos. Si necesita más información sobre la licencia y la asistencia, haga clic en esta página de precios. También puede obtener la licencia de prueba gratuita

< ANTERIOR
Generador de PDF .NET en 1 clic
SIGUIENTE >
Cómo proteger con contraseña un documento PDF

¿Listo para empezar? Versión: 2024.7 recién publicada

Descarga gratuita de NuGet Descargas totales: 9,974,197 Ver licencias >
123