C# Leer PDF Tutorial

This article was translated from English: Does it need improvement?
Translated
View the article in English

Hoy veremos un método sencillo para leer contenido PDF y extraer texto en su formato original. Esto puede hacerse para documentos enteros o páginas específicas, todo dentro de su proyecto de C#.

Biblioteca NuGet C# para PDF

Instalar con NuGet

Install-Package IronPdf
o
Java PDF JAR

Descargar DLL

Descargar DLL

Instalar manualmente en su proyecto

Biblioteca NuGet C# para PDF

Instalar con NuGet

Install-Package IronPdf
o
Java PDF JAR

Descargar DLL

Descargar DLL

Instalar manualmente en su proyecto

Comience a usar IronPDF en su proyecto hoy con una prueba gratuita.

Primer Paso:
green arrow pointer

Echa un vistazo IronPDF en Nuget para una instalación y despliegue rápidos. Con más de 8 millones de descargas, está transformando PDF con C#.

Biblioteca NuGet C# para PDF nuget.org/packages/IronPdf/
Install-Package IronPdf

Considere instalar el IronPDF DLL directamente. Descárguelo e instálelo manualmente para su proyecto o forma GAC: IronPdf.zip

Instalar manualmente en su proyecto

Descargar DLL

Leer archivo PDF en C#

Usando esta librería de C#, podemos leer archivos PDF, extraer contenido, e incluso extraer imágenes originales y de alta calidad. Vea en los ejemplos siguientes las muchas formas en que podemos utilizar distintas funciones para satisfacer nuestras necesidades de lectura de PDF en un entorno .NET.

:path=/static-assets/pdf/content-code-examples/how-to/csharp-read-pdf-read-pdf.cs
using IronPdf;
using IronSoftware.Drawing;
using System.Collections.Generic;

// Select the desired PDF File
PdfDocument pdf = PdfDocument.FromFile("sample.pdf");

// Extract all text from an pdf
string allText = pdf.ExtractAllText();

// Get all Images
IEnumerable<AnyBitmap> AllImages = pdf.ExtractAllImages();

// Else combine above both functionality using PageCount
for (var index = 0; index < pdf.PageCount; index++)
{
    string Text = pdf.ExtractTextFromPage(index);
    IEnumerable<AnyBitmap> Images = pdf.ExtractImagesFromPage(index);
}
Imports IronPdf
Imports IronSoftware.Drawing
Imports System.Collections.Generic

' Select the desired PDF File
Private pdf As PdfDocument = PdfDocument.FromFile("sample.pdf")

' Extract all text from an pdf
Private allText As String = pdf.ExtractAllText()

' Get all Images
Private AllImages As IEnumerable(Of AnyBitmap) = pdf.ExtractAllImages()

' Else combine above both functionality using PageCount
For index = 0 To pdf.PageCount - 1
	Dim Text As String = pdf.ExtractTextFromPage(index)
	Dim Images As IEnumerable(Of AnyBitmap) = pdf.ExtractImagesFromPage(index)
Next index
VB   C#

Salida

Hemos utilizado un formulario en C# para mostrarle el resultado perfecto de la lectura del contenido del PDF. Con este enfoque, se trata de simplificar y utilizar la menor cantidad de código posible para satisfacer las necesidades de su proyecto.

~ PDF ~

~ C# Form ~


Acceso rápido a la biblioteca

Documentación de la biblioteca

La documentación de la biblioteca IronPDF está disponible en la práctica Referencia de la API para que pueda explorarla y compartirla.

Documentación de la biblioteca