Pruebas en un entorno real
Pruebe en producción sin marcas de agua.
Funciona donde lo necesites.
PDF (Formato de documento portátil) es un formato de archivo muy utilizado para compartir documentos de forma coherente y segura. La lectura y manipulación de este tipo de archivos en C# es un requisito habitual en diversas aplicaciones, como sistemas de gestión de documentos, herramientas de generación de informes, etc. En este artículo, compararemos dos bibliotecas populares para leer archivos PDF en C#: IronPDF e iTextSharp (la última biblioteca .NET iText).
IronPDF es una completa biblioteca C# de Iron Software que ofrece una amplia gama de funciones para trabajar con archivos PDF. Permite a los desarrolladores crear, editar y manipular documentos PDF sin problemas. IronPDF es conocido por su sencillez y facilidad de uso, lo que lo convierte en una excelente opción para los desarrolladores que necesitan integrar rápidamente funciones PDF en sus aplicaciones.
iTextSharp es otra biblioteca popular para trabajar con archivos PDF en C#. Existe desde hace tiempo y se utiliza mucho en la industria. iText ofrece un rico conjunto de funciones para crear y manipular documentos PDF. Es conocido por su flexibilidad y extensibilidad, lo que lo hace adecuado para tareas complejas relacionadas con PDF.
Crear un nuevo proyecto C# en Visual Studio para comparar IronPDF Vs iTextSharp para la lectura de archivos PDF.
Instale las bibliotecas IronPDF e iTextSharp en el proyecto.
Lee archivos PDF con IronPDF.
Visual Studio: Asegúrese de tener Visual Studio o cualquier otro entorno de desarrollo C# instalado.
Comience configurando una aplicación de consola C#. Abra Visual Studio y seleccione Crear un nuevo proyecto. Seleccione el tipo de aplicación Consola.
Indique el nombre del proyecto como se muestra a continuación.
Seleccione la versión .NET necesaria para el proyecto.
Una vez hecho esto, Visual Studio generará un nuevo proyecto.
iTextSharp puede instalarse desde la página NuGet Gestor de paquetes. La última versión está disponible como paquete iText.
O desde el gestor de paquetes de Visual Studio, como se muestra a continuación. Busque iText en el Gestor de paquetes y haga clic en Instalar.
IronPDF puede instalarse desde el NuGet Package Manager como se muestra a continuación.
O desde el gestor de paquetes de Visual Studio, como se muestra a continuación. Buscar IronPDF en el Gestor de paquetes y haga clic en Instalar.
Añada el siguiente código al archivo program.cs y proporcione un documento PDF de ejemplo con el siguiente contenido.
using IronPdf;
Console.WriteLine("Comparison of IronPDF And itextsharp Read PDF Files in C#");
// pdfreader reader
ReadUsingIronPDF.Read();
public class ReadUsingIronPDF
{
public static void Read()
{
// read from specific location
string filename = "C:\\code\\articles\\ITextSharp\\ITextSharpIronPdfDemo\\Example.pdf";
var pdfReader = PdfDocument.FromFile(filename);
// Get all text to put in a search index using new simpletextextractionstrategy
var allText = pdfReader.ExtractAllText();
Console.WriteLine("------------------Text From PDF-----------------");
Console.WriteLine(allText);
Console.WriteLine("------------------Text From PDF-----------------");
var allIMages = pdfReader.ExtractAllImages();
Console.WriteLine("------------------Image Count From PDF-----------------");
Console.WriteLine($"Total Images={allIMages.Count()}");
Console.WriteLine("------------------Image Count From PDF-----------------");
Console.WriteLine("------------------one Page Text From PDF page-----------------");
var pageCount = pdfReader.PageCount;
for (int page = 0; page < pageCount; page++)
{
string Text = pdfReader.ExtractTextFromPage(page);
Console.WriteLine(Text);
}
}
}
using IronPdf;
Console.WriteLine("Comparison of IronPDF And itextsharp Read PDF Files in C#");
// pdfreader reader
ReadUsingIronPDF.Read();
public class ReadUsingIronPDF
{
public static void Read()
{
// read from specific location
string filename = "C:\\code\\articles\\ITextSharp\\ITextSharpIronPdfDemo\\Example.pdf";
var pdfReader = PdfDocument.FromFile(filename);
// Get all text to put in a search index using new simpletextextractionstrategy
var allText = pdfReader.ExtractAllText();
Console.WriteLine("------------------Text From PDF-----------------");
Console.WriteLine(allText);
Console.WriteLine("------------------Text From PDF-----------------");
var allIMages = pdfReader.ExtractAllImages();
Console.WriteLine("------------------Image Count From PDF-----------------");
Console.WriteLine($"Total Images={allIMages.Count()}");
Console.WriteLine("------------------Image Count From PDF-----------------");
Console.WriteLine("------------------one Page Text From PDF page-----------------");
var pageCount = pdfReader.PageCount;
for (int page = 0; page < pageCount; page++)
{
string Text = pdfReader.ExtractTextFromPage(page);
Console.WriteLine(Text);
}
}
}
Imports IronPdf
Console.WriteLine("Comparison of IronPDF And itextsharp Read PDF Files in C#")
' pdfreader reader
ReadUsingIronPDF.Read()
'INSTANT VB TODO TASK: Local functions are not converted by Instant VB:
'public class ReadUsingIronPDF
'{
' public static void Read()
' {
' ' read from specific location
' string filename = "C:\code\articles\ITextSharp\ITextSharpIronPdfDemo\Example.pdf";
' var pdfReader = PdfDocument.FromFile(filename);
' ' Get all text to put in a search index using new simpletextextractionstrategy
' var allText = pdfReader.ExtractAllText();
' Console.WriteLine("------------------Text From PDF-----------------");
' Console.WriteLine(allText);
' Console.WriteLine("------------------Text From PDF-----------------");
' var allIMages = pdfReader.ExtractAllImages();
' Console.WriteLine("------------------Image Count From PDF-----------------");
' Console.WriteLine(string.Format("Total Images={0}", allIMages.Count()));
' Console.WriteLine("------------------Image Count From PDF-----------------");
' Console.WriteLine("------------------one Page Text From PDF page-----------------");
' var pageCount = pdfReader.PageCount;
' for (int page = 0; page < pageCount; page++)
' {
' string Text = pdfReader.ExtractTextFromPage(page);
' Console.WriteLine(Text);
' }
' }
'}
Para crear un PDF de texto, cree un documento Word y añada el texto anterior al documento Word y guárdelo como documento PDF con el nombre Ejemplo.pdf
En el código, creamos un PDFReader a partir de la ruta del archivo PDF y extraemos todo el texto
Las imágenes del PDF se pueden extraer con el método ExtractImages
Ahora para comparar el texto leído desde iTextSharp añada el siguiente código al mismo fichero program.cs. Por simplicidad, no hemos separado las clases en diferentes archivos.
using IronPdf;
using iText.Kernel.Pdf;
using iText.Kernel.Pdf.Canvas.Parser.Listener;
using iText.Kernel.Pdf.Canvas.Parser;
Console.WriteLine("Comparison of IronPDF And Itextsharp Read PDF Files in C#");
//ReadUsingIronPDF.Read();
ReadUsingITextSharp.Read();
public class ReadUsingITextSharp
{
public static void Read()
{
string pdfFile = "C:\\code\\articles\\ITextSharp\\ITextSharpIronPdfDemo\\Example.pdf";
// Create a PDF reader
PdfReader pdfReader = new PdfReader(pdfFile);
iText.Kernel.Pdf.PdfDocument pdfDocument = new iText.Kernel.Pdf.PdfDocument(pdfReader);
// Extract plain text from the PDF
LocationTextExtractionStrategy strategy = new LocationTextExtractionStrategy();
string pdfText = PdfTextExtractor.GetTextFromPage(pdfDocument.GetPage(1), strategy);
// Display or manipulate the extracted text as needed
Console.WriteLine(pdfText);
}
}
using IronPdf;
using iText.Kernel.Pdf;
using iText.Kernel.Pdf.Canvas.Parser.Listener;
using iText.Kernel.Pdf.Canvas.Parser;
Console.WriteLine("Comparison of IronPDF And Itextsharp Read PDF Files in C#");
//ReadUsingIronPDF.Read();
ReadUsingITextSharp.Read();
public class ReadUsingITextSharp
{
public static void Read()
{
string pdfFile = "C:\\code\\articles\\ITextSharp\\ITextSharpIronPdfDemo\\Example.pdf";
// Create a PDF reader
PdfReader pdfReader = new PdfReader(pdfFile);
iText.Kernel.Pdf.PdfDocument pdfDocument = new iText.Kernel.Pdf.PdfDocument(pdfReader);
// Extract plain text from the PDF
LocationTextExtractionStrategy strategy = new LocationTextExtractionStrategy();
string pdfText = PdfTextExtractor.GetTextFromPage(pdfDocument.GetPage(1), strategy);
// Display or manipulate the extracted text as needed
Console.WriteLine(pdfText);
}
}
Imports IronPdf
Imports iText.Kernel.Pdf
Imports iText.Kernel.Pdf.Canvas.Parser.Listener
Imports iText.Kernel.Pdf.Canvas.Parser
Console.WriteLine("Comparison of IronPDF And Itextsharp Read PDF Files in C#")
'ReadUsingIronPDF.Read();
ReadUsingITextSharp.Read()
'INSTANT VB TODO TASK: Local functions are not converted by Instant VB:
'public class ReadUsingITextSharp
'{
' public static void Read()
' {
' string pdfFile = "C:\code\articles\ITextSharp\ITextSharpIronPdfDemo\Example.pdf";
' ' Create a PDF reader
' PdfReader pdfReader = New PdfReader(pdfFile);
' iText.Kernel.Pdf.PdfDocument pdfDocument = New iText.Kernel.Pdf.PdfDocument(pdfReader);
' ' Extract plain text from the PDF
' LocationTextExtractionStrategy strategy = New LocationTextExtractionStrategy();
' string pdfText = PdfTextExtractor.GetTextFromPage(pdfDocument.GetPage(1), strategy);
' ' Display or manipulate the extracted text as needed
' Console.WriteLine(pdfText);
' }
'}
Curva de aprendizaje: iTextSharp tiene una curva de aprendizaje más pronunciada, especialmente para los principiantes.
Facilidad de uso: IronPDF es conocido por su sencilla API, lo que facilita a los desarrolladores los primeros pasos.
Para utilizar IronPDF. Introduzca esta clave en el archivo appsettings.json.
"IronPdf.LicenseKey": "your license key"
Para recibir una licencia de prueba, indique su dirección de correo electrónico.
Elegir entre IronPDF e iTextSharp depende de los requisitos específicos de su proyecto. Si necesita una biblioteca sencilla y fácil de usar para las operaciones habituales con PDF, IronPDF puede ser la mejor opción. A la hora de tomar una decisión, tenga en cuenta factores como la complejidad de su aplicación, el presupuesto y la curva de aprendizaje.
IronPDF está diseñado para integrar perfectamente la generación de PDF en su aplicación, gestionando sin esfuerzo la conversión de documentos formateados en PDF. Esta versátil herramienta le permite convertir formularios web, páginas HTML locales y otros contenidos web a PDF utilizando .NET. Los usuarios pueden descargar, enviar por correo electrónico o almacenar documentos en la nube cómodamente. Tanto si necesita elaborar facturas, presupuestos, informes, contratos u otros documentos profesionales, IronPDF te tiene cubierto. Mejore su aplicación con las funciones intuitivas y eficaces de generación de PDF de IronPDF.
9 productos API .NET para sus documentos de oficina