USO DE IRONPDF

Tutorial de C#: Crear un visor de contenido de texto PDF con IronPDF (Windows Forms)

En la era digital actual, los archivos PDF son integrales en muchos flujos de trabajo en la educación, los negocios y el uso personal. Son un formato estándar para compartir y presentar datos diversos, incluyendo texto, imágenes y tablas.

Aunque mostrar documentos PDF completos con fidelidad visual completa dentro de una aplicación de Windows Forms en C# puede implicar componentes de renderizado dedicados, los desarrolladores a menudo tienen otras necesidades. A veces, el objetivo es leer texto PDF en C#, extraer datos o mostrar el contenido textual de un PDF para una revisión rápida, indexación o accesibilidad.

Este artículo le guiará en la creación de una aplicación que se centra en esta tarea específica: construir un visor de contenido de texto PDF simple en C# utilizando IronPDF, una poderosa biblioteca .NET. Aprenderás a utilizar IronPDF para cargar un PDF y extraer y mostrar eficazmente su contenido de texto en una aplicación de Windows Forms.

¿Qué es IronPDF?

IronPDF es una completa biblioteca de C# que permite a los desarrolladores .NET crear, editar y procesar archivos PDF dentro de sus aplicaciones. Permite a los usuarios convertir HTML, imágenes y SVG en documentos PDF y, lo que es importante para este tutorial, leer y extraer contenido de PDFs existentes. IronPDF está diseñado para facilitar su uso y ofrece una amplia gama de funciones para manipular archivos PDF.

Windows Instalador de Windows
Utilice el IronPDF Instalador de Windows para la instalación directa del producto.

Requisitos para construir un visor de texto PDF

Para crear esta aplicación de visualización de texto PDF en C#, necesitarás:

  • Visual Studio: Un entorno de desarrollo integrado (IDE) para crear aplicaciones de Windows Forms.
  • IronPDF: Un paquete NuGet que proporciona la funcionalidad para leer, crear y manipular documentos PDF, incluida la extracción de texto.

    Ilustración que muestra el concepto de conversión de HTML a PDF

    IronPDF también puede crear PDFs a partir de HTML, una función separada de la extracción de texto mostrada en este tutorial.

Pasos para crear un visor de contenido de texto PDF en C# con IronPDF

Paso 1: Crear una nueva aplicación de Windows Forms en Visual Studio

Para comenzar, inicie Visual Studio y haga clic en "Crear un nuevo proyecto". Seleccione "Aplicación de formularios de Windows (.NET Framework)" o una plantilla .NET similar de la lista.

Diálogo de nuevo proyecto en Visual Studio

Creación de Nuevo Proyecto en Visual Studio

A continuación, proporciona un nombre para tu proyecto (por ejemplo, CSharpPdfTextReader) y haz clic en el botón Crear. Esto configurará un nuevo proyecto de aplicación de Windows Forms.

Paso 2: Instalar la biblioteca IronPDF

Usando la interfaz gráfica del Gestor de Paquetes NuGet

  1. En el Explorador de soluciones, haga clic derecho en su proyecto y seleccione "Administrar paquetes NuGet..."

  2. Ve a la pestaña "Examinar" y busca "IronPdf".

  3. Seleccione el paquete IronPdf y haga clic en "Instalar".

    Gestor de paquetes NuGet en Visual Studio buscando IronPDF

    Instalación de IronPDF a través del Administrador de paquetes NuGet

    NuGet Instalación con NuGet

    PM >  Install-Package IronPdf

    Consulta IronPDF en NuGet para una instalación rápida. Con más de 10 millones de descargas, está transformando el desarrollo de PDF con C#. También puedes descargar el DLL o el instalador de Windows.

Uso de la consola del gestor de paquetes NuGet

Alternativamente, abra la Consola del Administrador de Paquetes (Herramientas > Administrador de Paquetes NuGet > Consola del Administrador de Paquetes) y ejecute el comando:

Install-Package IronPdf
Install-Package IronPdf
SHELL

Esto descargará e instalará IronPDF y sus dependencias en su proyecto.

Paso 3: Agrega un RichTextBox a tu formulario para mostrar texto

Usaremos un control RichTextBox para mostrar el contenido de texto extraído del PDF. Un RichTextBox es adecuado para mostrar texto con formato, aunque para este tutorial, su función principal es presentar el texto plano extraído por IronPDF. Presenta eficazmente la información textual sin intentar reproducir el diseño visual original del PDF.

Para agregar un RichTextBox:

  1. Abra su formulario en la vista del Diseñador.

  2. Vaya a la Caja de herramientas (Ver > Caja de herramientas).

  3. Encuentra RichTextBox bajo "Controles comunes", arrástralo a tu formulario.

  4. Ajuste su tamaño y posición según sea necesario. En la ventana de Propiedades, puede establecer su Name (por ejemplo, pdfDataRichTextBox) y establecer su propiedad Dock en Fill si desea que ocupe la mayor parte del formulario.

    Visor de PDF C# Aplicación de Windows (Tutorial), Figura 4: Acceder al RickTextBox en Form1

    Agregar un RichTextBox a Form1 para mostrar el texto extraído del PDF

Paso 4: Añadir un botón para seleccionar el archivo PDF

Agrega un control Button a tu formulario. Los usuarios harán clic en este botón para abrir un cuadro de diálogo de archivos y seleccionar un archivo PDF para la extracción de texto.

  1. Arrastra un Button desde el cuadro de herramientas a tu formulario.

  2. En la ventana de Propiedades, establezca su Name (por ejemplo, openBtn) y Text (por ejemplo, "Abrir PDF y Mostrar Texto").

    Visor de PDF C# Aplicación de Windows (Tutorial), Figura 5: Agregar un nuevo botón a Form1

    Agregar un botón a Form1 para activar la selección de PDF

Paso 5: Añadir código C# para cargar PDF y extraer texto

Haz doble clic en el botón que acabas de añadir ("Open PDF & Display Text") para crear su controlador de eventos Click en Form1.cs.

Primero, asegúrate de tener el espacio de nombres de IronPDF importado en la parte superior de tu archivo Form1.cs:

using IronPdf;
using System; // For EventArgs, Exception
using System.Windows.Forms; // For OpenFileDialog, MessageBox, DialogResult, etc.
using IronPdf;
using System; // For EventArgs, Exception
using System.Windows.Forms; // For OpenFileDialog, MessageBox, DialogResult, etc.
Imports IronPdf
Imports System ' For EventArgs, Exception
Imports System.Windows.Forms ' For OpenFileDialog, MessageBox, DialogResult, etc.
$vbLabelText   $csharpLabel

Ahora, implementa el controlador de eventos para el clic del botón. Este código hará:

  1. Solicite al usuario que seleccione un archivo PDF.

  2. Utilice IronPDF para cargar el PDF seleccionado.

  3. Utiliza el método ExtractAllText() de IronPDF para obtener todo el texto del PDF.

  4. Muestra este texto extraído en el RichTextBox.
private void openBtn_Click(object sender, EventArgs e)
{
    var openFileDialog = new OpenFileDialog();
    openFileDialog.Filter = "PDF files (*.pdf)
*.pdf
All files (*.*)
*.*";
    openFileDialog.Title = "Select a PDF file to extract text from";

    if (openFileDialog.ShowDialog() == DialogResult.OK)
    {
        try
        {
            // It's recommended to set your license key once at application startup.
            // License.LicenseKey = "YourIronPdfLicenseKey"; 
            // If no key is set, IronPDF runs in trial mode (watermarks on output, time limits).
            // For text extraction, the trial is fully functional for development.

            // Load the selected PDF using IronPDF
            var pdf = PdfDocument.FromFile(openFileDialog.FileName);

            // Extract all text content from the PDF
            string extractedText = pdf.ExtractAllText();

            // Display the extracted text in the RichTextBox
            // (Assuming your RichTextBox is named pdfDataRichTextBox, change if different)
            pdfDataRichTextBox.Text = extractedText; 
        }
        catch (Exception ex)
        {
            MessageBox.Show("An error occurred while processing the PDF file: " + ex.Message, "Error", MessageBoxButtons.OK, MessageBoxIcon.Error);
        }
    }
}
private void openBtn_Click(object sender, EventArgs e)
{
    var openFileDialog = new OpenFileDialog();
    openFileDialog.Filter = "PDF files (*.pdf)
*.pdf
All files (*.*)
*.*";
    openFileDialog.Title = "Select a PDF file to extract text from";

    if (openFileDialog.ShowDialog() == DialogResult.OK)
    {
        try
        {
            // It's recommended to set your license key once at application startup.
            // License.LicenseKey = "YourIronPdfLicenseKey"; 
            // If no key is set, IronPDF runs in trial mode (watermarks on output, time limits).
            // For text extraction, the trial is fully functional for development.

            // Load the selected PDF using IronPDF
            var pdf = PdfDocument.FromFile(openFileDialog.FileName);

            // Extract all text content from the PDF
            string extractedText = pdf.ExtractAllText();

            // Display the extracted text in the RichTextBox
            // (Assuming your RichTextBox is named pdfDataRichTextBox, change if different)
            pdfDataRichTextBox.Text = extractedText; 
        }
        catch (Exception ex)
        {
            MessageBox.Show("An error occurred while processing the PDF file: " + ex.Message, "Error", MessageBoxButtons.OK, MessageBoxIcon.Error);
        }
    }
}
Private Sub openBtn_Click(ByVal sender As Object, ByVal e As EventArgs)
	Dim openFileDialog As New OpenFileDialog()
	openFileDialog.Filter = "PDF files (*.pdf) *.pdf All files (*.*) *.*"
	openFileDialog.Title = "Select a PDF file to extract text from"

	If openFileDialog.ShowDialog() = DialogResult.OK Then
		Try
			' It's recommended to set your license key once at application startup.
			' License.LicenseKey = "YourIronPdfLicenseKey"; 
			' If no key is set, IronPDF runs in trial mode (watermarks on output, time limits).
			' For text extraction, the trial is fully functional for development.

			' Load the selected PDF using IronPDF
			Dim pdf = PdfDocument.FromFile(openFileDialog.FileName)

			' Extract all text content from the PDF
			Dim extractedText As String = pdf.ExtractAllText()

			' Display the extracted text in the RichTextBox
			' (Assuming your RichTextBox is named pdfDataRichTextBox, change if different)
			pdfDataRichTextBox.Text = extractedText
		Catch ex As Exception
			MessageBox.Show("An error occurred while processing the PDF file: " & ex.Message, "Error", MessageBoxButtons.OK, MessageBoxIcon.Error)
		End Try
	End If
End Sub
$vbLabelText   $csharpLabel

Desglose del código:

  • openFileDialog: Un cuadro de diálogo estándar para la selección de archivos, filtrado para archivos PDF.
  • PdfDocument.FromFile(openFileDialog.FileName): Este método de IronPDF carga el PDF elegido en un objeto PdfDocument.
  • pdf.ExtractAllText(): Esta es la función clave de IronPDF para este tutorial. Lee todo el PDF y extrae todo el contenido de texto discernible en una sola cadena. Esto es increíblemente útil para escenarios de C# parse PDF text.
  • pdfDataRichTextBox.Text = extractedText;: El texto extraído se asigna a la propiedad Text de tu RichTextBox (asegúrate de que el nombre pdfDataRichTextBox coincida con el nombre que diste a tu control RichTextBox).

    Esto demuestra cómo IronPDF simplifica leer texto PDF en C#, permitiendo a los desarrolladores acceder al contenido PDF programáticamente con un esfuerzo mínimo.

Paso 6: Compila y ejecuta tu aplicación visualizadora de texto PDF C#

  1. En Visual Studio, ve al menú "Build" y selecciona "Build Solution".

  2. Una vez que la compilación sea exitosa, presiona "F5" o haz clic en el botón "Iniciar" para ejecutar la aplicación.

    La ventana de su aplicación aparecerá. Haga clic en el botón "Abrir PDF y mostrar texto", seleccione un archivo PDF de su computadora y haga clic en "Abrir".

    Visor de PDF C# Aplicación de Windows (Tutorial), Figura 6: Ejecutar la aplicación

    Ejecutando la Aplicación Visor de Texto PDF en C#

    El RichTextBox mostrará el contenido de texto extraído del archivo PDF seleccionado.

    Visor de PDF C# Aplicación de Windows (Tutorial), Figura 7: Muestra el contenido del texto después de seleccionar un archivo PDF

    Contenido de texto extraído del PDF y mostrado en el RichTextBox

    Para obtener información sobre cómo renderizar visualmente PDFs en aplicaciones MAUI (lo cual es diferente del enfoque de extracción de texto de este tutorial), podrías explorar "Tutorial de visualización de PDFs en MAUI".

Conclusión: Acceso simplificado al contenido de texto de PDF con C# e IronPDF

Al seguir estos pasos, ha creado una aplicación de Windows Forms en C# que extrae y muestra de manera efectiva el contenido de texto de archivos PDF utilizando IronPDF. Este enfoque es valioso cuando necesitas acceder programáticamente a la información textual dentro de archivos PDF para su visualización, análisis o procesamiento adicional en tus aplicaciones .NET.

IronPDF proporciona capacidades robustas para la extracción de texto PDF en C#, y es solo una parte de su completo conjunto de características. También puede usar IronPDF para tareas más avanzadas, como la búsqueda de texto dentro de PDFs, editar formularios PDF.

Recuerde, este tutorial se centró en un caso de uso específico: hacer que el texto PDF sea accesible en una aplicación C#. Puedes adaptar y expandir esta base para satisfacer requisitos más complejos.

Si estás interesado en explorar el potencial completo de IronPDF:

  • Sumérgete en la documentación de IronPDF para guías detalladas y ejemplos.
  • Para utilizar IronPDF en sus aplicaciones de producción sin limitaciones de prueba, se requiere una clave de licencia. Puedes comprar una licencia en el sitio web de IronPDF. Las licencias comienzan desde $749.
  • También puede evaluar la versión comercial completa con una prueba gratuita.

    Comience con IronPDF ahora.
    green arrow pointer

Chipego
Ingeniero de software
Chipego tiene una habilidad natural para escuchar que le ayuda a comprender los problemas de los clientes y a ofrecer soluciones inteligentes. Se unió al equipo de Iron Software en 2023, después de estudiar una licenciatura en Tecnología de la Información. IronPDF e IronOCR son los dos productos en los que Chipego se ha centrado, pero su conocimiento de todos los productos crece día a día, a medida que encuentra nuevas formas de ayudar a los clientes. Disfruta de lo colaborativa que es la vida en Iron Software, con miembros del equipo de toda la empresa que aportan su variada experiencia para contribuir a soluciones eficaces e innovadoras. Cuando Chipego está lejos de su escritorio, a menudo se le puede encontrar disfrutando de un buen libro o jugando al fútbol.
< ANTERIOR
Cómo leer una tabla PDF en C#
SIGUIENTE >
Cómo convertir Word (Docx) a PDF en C# (Tutorial)