C# PDF Parser

This article was translated from English: Does it need improvement?
Translated
View the article in English

Con las herramientas adecuadas, puede ser fácil trabajar con archivos PDF en C# y utilizar toda la funcionalidad que necesita para una aplicación .NET, incluido el uso de las funciones de análisis sintáctico de archivos PDF de C#. Este tutorial utilizará IronPDF, una librería de C#, para hacerlo en un par de sencillos pasos.

Biblioteca NuGet C# para PDF

Instalar con NuGet

Install-Package IronPdf
o
Java PDF JAR

Descargar DLL

Descargar DLL

Instalar manualmente en su proyecto

C# Analizar Archivo PDF

Analizar archivos PDF es bastante fácil. En el código siguiente, utilizamos el método ExtractAllText para extraer cada línea de texto de todo el documento PDF. Más tarde, se puede ver el lado a lado del contenido del PDF extraído, como la salida.

:path=/static-assets/pdf/content-code-examples/how-to/csharp-parse-pdf-parse-pdf.cs
using IronPdf;

// Select the desired PDF File
PdfDocument pdf = PdfDocument.FromFile("sample.pdf");

// Extract all text from an pdf
string allText = pdf.ExtractAllText();

// Extract all text from page 1
string page1Text = pdf.ExtractTextFromPage(0);
Imports IronPdf

' Select the desired PDF File
Private pdf As PdfDocument = PdfDocument.FromFile("sample.pdf")

' Extract all text from an pdf
Private allText As String = pdf.ExtractAllText()

' Extract all text from page 1
Private page1Text As String = pdf.ExtractTextFromPage(0)
VB   C#

Ver contenido PDF analizado

Hemos utilizado un formulario de C# para mostrarle el contenido del PDF analizado a partir de la ejecución del código anterior. Esta salida proporciona el texto exacto de un PDF para que pueda utilizarlo para sus necesidades de documentos personales o de clientes.

~ PDF ~

~ C# Form ~


Acceso rápido a la biblioteca

Documentación

Lea la Referencia de la API para obtener documentación sobre IronPDF y todas sus funciones.

Documentación