Pruebe en producción sin marcas de agua.
Funciona donde lo necesite.
Obtén 30 días de producto totalmente funcional.
Ténlo en funcionamiento en minutos.
Acceso completo a nuestro equipo de asistencia técnica durante la prueba del producto
En la era digital actual, los archivos PDF son integrales en muchos flujos de trabajo en la educación, los negocios y el uso personal. Son un formato estándar para compartir y presentar datos diversos, incluyendo texto, imágenes y tablas.
Aunque mostrar documentos PDF completos con fidelidad visual completa dentro de una aplicación de Windows Forms en C# puede implicar componentes de renderizado dedicados, los desarrolladores a menudo tienen otras necesidades. A veces, el objetivo es leer texto PDF en C#, extraer datos o mostrar el contenido textual de un PDF para una revisión rápida, indexación o accesibilidad.
Este artículo le guiará en la creación de una aplicación que se centra en esta tarea específica: construir un visor de contenido de texto PDF simple en C# utilizando IronPDF, una poderosa biblioteca .NET. Aprenderás a utilizar IronPDF para cargar un PDF y extraer y mostrar eficazmente su contenido de texto en una aplicación de Windows Forms.
IronPDF es una completa biblioteca de C# que permite a los desarrolladores .NET crear, editar y procesar archivos PDF dentro de sus aplicaciones. Permite a los usuarios convertir HTML, imágenes y SVG en documentos PDF y, lo que es importante para este tutorial, leer y extraer contenido de PDFs existentes. IronPDF está diseñado para facilitar su uso y ofrece una amplia gama de funciones para manipular archivos PDF.
Para crear esta aplicación de visualización de texto PDF en C#, necesitarás:
IronPDF: Un paquete NuGet que proporciona la funcionalidad para leer, crear y manipular documentos PDF, incluida la extracción de texto.
IronPDF también puede crear PDFs a partir de HTML, una función separada de la extracción de texto mostrada en este tutorial.
Para comenzar, inicie Visual Studio y haga clic en "Crear un nuevo proyecto". Seleccione "Aplicación de formularios de Windows (.NET Framework)" o una plantilla .NET similar de la lista.
Creación de Nuevo Proyecto en Visual Studio
A continuación, proporciona un nombre para tu proyecto (por ejemplo, CSharpPdfTextReader
) y haz clic en el botón Crear. Esto configurará un nuevo proyecto de aplicación de Windows Forms.
En el Explorador de soluciones, haga clic derecho en su proyecto y seleccione "Administrar paquetes NuGet..."
Ve a la pestaña "Examinar" y busca "IronPdf".
Seleccione el paquete IronPdf
y haga clic en "Instalar".
Instalación de IronPDF a través del Administrador de paquetes NuGet
Alternativamente, abra la Consola del Administrador de Paquetes (Herramientas > Administrador de Paquetes NuGet > Consola del Administrador de Paquetes) y ejecute el comando:
Install-Package IronPdf
Install-Package IronPdf
Esto descargará e instalará IronPDF y sus dependencias en su proyecto.
Usaremos un control RichTextBox
para mostrar el contenido de texto extraído del PDF. Un RichTextBox
es adecuado para mostrar texto con formato, aunque para este tutorial, su función principal es presentar el texto plano extraído por IronPDF. Presenta eficazmente la información textual sin intentar reproducir el diseño visual original del PDF.
Para agregar un RichTextBox
:
Abra su formulario en la vista del Diseñador.
Vaya a la Caja de herramientas (Ver > Caja de herramientas).
Encuentra RichTextBox
bajo "Controles comunes", arrástralo a tu formulario.
Ajuste su tamaño y posición según sea necesario. En la ventana de Propiedades, puede establecer su Name
(por ejemplo, pdfDataRichTextBox
) y establecer su propiedad Dock
en Fill
si desea que ocupe la mayor parte del formulario.
Agregar un RichTextBox a Form1 para mostrar el texto extraído del PDF
Agrega un control Button
a tu formulario. Los usuarios harán clic en este botón para abrir un cuadro de diálogo de archivos y seleccionar un archivo PDF para la extracción de texto.
Arrastra un Button
desde el cuadro de herramientas a tu formulario.
En la ventana de Propiedades, establezca su Name
(por ejemplo, openBtn
) y Text
(por ejemplo, "Abrir PDF y Mostrar Texto").
Agregar un botón a Form1 para activar la selección de PDF
Haz doble clic en el botón que acabas de añadir ("Open PDF & Display Text") para crear su controlador de eventos Click
en Form1.cs
.
Primero, asegúrate de tener el espacio de nombres de IronPDF importado en la parte superior de tu archivo Form1.cs
:
using IronPdf;
using System; // For EventArgs, Exception
using System.Windows.Forms; // For OpenFileDialog, MessageBox, DialogResult, etc.
using IronPdf;
using System; // For EventArgs, Exception
using System.Windows.Forms; // For OpenFileDialog, MessageBox, DialogResult, etc.
Imports IronPdf
Imports System ' For EventArgs, Exception
Imports System.Windows.Forms ' For OpenFileDialog, MessageBox, DialogResult, etc.
Ahora, implementa el controlador de eventos para el clic del botón. Este código hará:
Solicite al usuario que seleccione un archivo PDF.
Utilice IronPDF para cargar el PDF seleccionado.
Utiliza el método ExtractAllText()
de IronPDF para obtener todo el texto del PDF.
RichTextBox
.private void openBtn_Click(object sender, EventArgs e)
{
var openFileDialog = new OpenFileDialog();
openFileDialog.Filter = "PDF files (*.pdf)
*.pdf
All files (*.*)
*.*";
openFileDialog.Title = "Select a PDF file to extract text from";
if (openFileDialog.ShowDialog() == DialogResult.OK)
{
try
{
// It's recommended to set your license key once at application startup.
// License.LicenseKey = "YourIronPdfLicenseKey";
// If no key is set, IronPDF runs in trial mode (watermarks on output, time limits).
// For text extraction, the trial is fully functional for development.
// Load the selected PDF using IronPDF
var pdf = PdfDocument.FromFile(openFileDialog.FileName);
// Extract all text content from the PDF
string extractedText = pdf.ExtractAllText();
// Display the extracted text in the RichTextBox
// (Assuming your RichTextBox is named pdfDataRichTextBox, change if different)
pdfDataRichTextBox.Text = extractedText;
}
catch (Exception ex)
{
MessageBox.Show("An error occurred while processing the PDF file: " + ex.Message, "Error", MessageBoxButtons.OK, MessageBoxIcon.Error);
}
}
}
private void openBtn_Click(object sender, EventArgs e)
{
var openFileDialog = new OpenFileDialog();
openFileDialog.Filter = "PDF files (*.pdf)
*.pdf
All files (*.*)
*.*";
openFileDialog.Title = "Select a PDF file to extract text from";
if (openFileDialog.ShowDialog() == DialogResult.OK)
{
try
{
// It's recommended to set your license key once at application startup.
// License.LicenseKey = "YourIronPdfLicenseKey";
// If no key is set, IronPDF runs in trial mode (watermarks on output, time limits).
// For text extraction, the trial is fully functional for development.
// Load the selected PDF using IronPDF
var pdf = PdfDocument.FromFile(openFileDialog.FileName);
// Extract all text content from the PDF
string extractedText = pdf.ExtractAllText();
// Display the extracted text in the RichTextBox
// (Assuming your RichTextBox is named pdfDataRichTextBox, change if different)
pdfDataRichTextBox.Text = extractedText;
}
catch (Exception ex)
{
MessageBox.Show("An error occurred while processing the PDF file: " + ex.Message, "Error", MessageBoxButtons.OK, MessageBoxIcon.Error);
}
}
}
Private Sub openBtn_Click(ByVal sender As Object, ByVal e As EventArgs)
Dim openFileDialog As New OpenFileDialog()
openFileDialog.Filter = "PDF files (*.pdf) *.pdf All files (*.*) *.*"
openFileDialog.Title = "Select a PDF file to extract text from"
If openFileDialog.ShowDialog() = DialogResult.OK Then
Try
' It's recommended to set your license key once at application startup.
' License.LicenseKey = "YourIronPdfLicenseKey";
' If no key is set, IronPDF runs in trial mode (watermarks on output, time limits).
' For text extraction, the trial is fully functional for development.
' Load the selected PDF using IronPDF
Dim pdf = PdfDocument.FromFile(openFileDialog.FileName)
' Extract all text content from the PDF
Dim extractedText As String = pdf.ExtractAllText()
' Display the extracted text in the RichTextBox
' (Assuming your RichTextBox is named pdfDataRichTextBox, change if different)
pdfDataRichTextBox.Text = extractedText
Catch ex As Exception
MessageBox.Show("An error occurred while processing the PDF file: " & ex.Message, "Error", MessageBoxButtons.OK, MessageBoxIcon.Error)
End Try
End If
End Sub
Desglose del código:
openFileDialog
: Un cuadro de diálogo estándar para la selección de archivos, filtrado para archivos PDF.PdfDocument.FromFile(openFileDialog.FileName)
: Este método de IronPDF carga el PDF elegido en un objeto PdfDocument
.pdf.ExtractAllText()
: Esta es la función clave de IronPDF para este tutorial. Lee todo el PDF y extrae todo el contenido de texto discernible en una sola cadena. Esto es increíblemente útil para escenarios de C# parse PDF text.pdfDataRichTextBox.Text = extractedText;
: El texto extraído se asigna a la propiedad Text
de tu RichTextBox
(asegúrate de que el nombre pdfDataRichTextBox
coincida con el nombre que diste a tu control RichTextBox).
Esto demuestra cómo IronPDF simplifica leer texto PDF en C#, permitiendo a los desarrolladores acceder al contenido PDF programáticamente con un esfuerzo mínimo.
En Visual Studio, ve al menú "Build" y selecciona "Build Solution".
Una vez que la compilación sea exitosa, presiona "F5" o haz clic en el botón "Iniciar" para ejecutar la aplicación.
La ventana de su aplicación aparecerá. Haga clic en el botón "Abrir PDF y mostrar texto", seleccione un archivo PDF de su computadora y haga clic en "Abrir".
Ejecutando la Aplicación Visor de Texto PDF en C#
El RichTextBox
mostrará el contenido de texto extraído del archivo PDF seleccionado.
Contenido de texto extraído del PDF y mostrado en el RichTextBox
Para obtener información sobre cómo renderizar visualmente PDFs en aplicaciones MAUI (lo cual es diferente del enfoque de extracción de texto de este tutorial), podrías explorar "Tutorial de visualización de PDFs en MAUI".
Al seguir estos pasos, ha creado una aplicación de Windows Forms en C# que extrae y muestra de manera efectiva el contenido de texto de archivos PDF utilizando IronPDF. Este enfoque es valioso cuando necesitas acceder programáticamente a la información textual dentro de archivos PDF para su visualización, análisis o procesamiento adicional en tus aplicaciones .NET.
IronPDF proporciona capacidades robustas para la extracción de texto PDF en C#, y es solo una parte de su completo conjunto de características. También puede usar IronPDF para tareas más avanzadas, como la búsqueda de texto dentro de PDFs, editar formularios PDF.
Recuerde, este tutorial se centró en un caso de uso específico: hacer que el texto PDF sea accesible en una aplicación C#. Puedes adaptar y expandir esta base para satisfacer requisitos más complejos.
Si estás interesado en explorar el potencial completo de IronPDF:
También puede evaluar la versión comercial completa con una prueba gratuita.