C# Leer PDF Tutorial

This article was translated from English: Does it need improvement?
Translated
View the article in English

Hoy veremos un método sencillo para leer contenido PDF y extraer texto en su formato original. Esto puede hacerse para documentos enteros o páginas específicas, todo dentro de su proyecto de C#.

Csharp Parse Pdf1 related to C# Leer PDF Tutorial
Csharp Parse Pdf2 related to C# Leer PDF Tutorial
Csharp Parse Pdf3 related to C# Leer PDF Tutorial

Comience con IronPDF

Comience a usar IronPDF en su proyecto hoy con una prueba gratuita.

Primer Paso:
green arrow pointer


Leer archivo PDF en C#

Usando esta librería de C#, podemos leer archivos PDF, extraer contenido, e incluso extraer imágenes originales y de alta calidad. Vea en los ejemplos siguientes las muchas formas en que podemos utilizar distintas funciones para satisfacer nuestras necesidades de lectura de PDF en un entorno .NET.

:path=/static-assets/pdf/content-code-examples/how-to/csharp-read-pdf-read-pdf.cs
using IronPdf;
using IronSoftware.Drawing;
using System.Collections.Generic;

// Select the desired PDF File
PdfDocument pdf = PdfDocument.FromFile("sample.pdf");

// Extract all text from an pdf
string allText = pdf.ExtractAllText();

// Get all Images
IEnumerable<AnyBitmap> AllImages = pdf.ExtractAllImages();

// Else combine above both functionality using PageCount
for (var index = 0; index < pdf.PageCount; index++)
{
    string Text = pdf.ExtractTextFromPage(index);
    IEnumerable<AnyBitmap> Images = pdf.ExtractImagesFromPage(index);
}
Imports IronPdf
Imports IronSoftware.Drawing
Imports System.Collections.Generic

' Select the desired PDF File
Private pdf As PdfDocument = PdfDocument.FromFile("sample.pdf")

' Extract all text from an pdf
Private allText As String = pdf.ExtractAllText()

' Get all Images
Private AllImages As IEnumerable(Of AnyBitmap) = pdf.ExtractAllImages()

' Else combine above both functionality using PageCount
For index = 0 To pdf.PageCount - 1
	Dim Text As String = pdf.ExtractTextFromPage(index)
	Dim Images As IEnumerable(Of AnyBitmap) = pdf.ExtractImagesFromPage(index)
Next index
VB   C#

Salida

Hemos utilizado un formulario en C# para mostrarle el resultado perfecto de la lectura del contenido del PDF. Con este enfoque, se trata de simplificar y utilizar la menor cantidad de código posible para satisfacer las necesidades de su proyecto.

~ PDF ~

Csharp Read Pdf4 related to ~ PDF ~

~ C# Form ~

Csharp Read Pdf5 related to ~ C# Form ~

Acceso rápido a la biblioteca

Documentation related to Acceso rápido a la biblioteca

Documentación de la biblioteca

La documentación de la biblioteca IronPDF está disponible en la práctica Referencia de la API para que pueda explorarla y compartirla.

Documentación de referencia de la API de IronPDF