PRODUKT-VERGLEICHE

iTextSharp Read PDF-Alternativen (Entwickler-Tutorial)

Veröffentlicht 3. April 2024
Teilen Sie:

PDF (Portable Document Format) ist ein weit verbreitetes Dateiformat für den konsistenten und sicheren Austausch von Dokumenten. Das Lesen und Bearbeiten solcher Dateien in C# ist eine häufige Anforderung in verschiedenen Anwendungen, wie z. B. Dokumentenverwaltungssystemen, Berichtstools und mehr. In diesem Artikel werden wir zwei beliebte Bibliotheken zum Lesen von PDF-Dateien in C# vergleichen: IronPDF und iTextSharp (die neueste .NET-Bibliothek iText).

IronPDF ist eine umfassende C#-Bibliothek von Iron Software das eine breite Palette von Funktionen für die Arbeit mit PDF-Dateien bietet. Es ermöglicht Entwicklern, PDF-Dokumente nahtlos zu erstellen, zu bearbeiten und zu manipulieren. IronPDF ist für seine Einfachheit und Benutzerfreundlichkeit bekannt, was es zu einer ausgezeichneten Wahl für Entwickler macht, die schnell PDF-Funktionen in ihre Anwendungen integrieren müssen.

iTextSharp ist eine weitere beliebte Bibliothek für die Arbeit mit PDF-Dateien in C#. Es gibt sie schon seit geraumer Zeit und sie ist in der Industrie weit verbreitet. iText bietet eine Vielzahl von Funktionen zur Erstellung und Bearbeitung von PDF-Dokumenten. Es ist bekannt für seine Flexibilität und Erweiterbarkeit, wodurch es sich für komplexe Aufgaben im Zusammenhang mit PDF eignet.

Verwendung von IronPDF vs. iTextSharp zum Lesen von PDFs in C#

  1. Erstellen Sie ein neues C#-Projekt in Visual Studio, um IronPDF mit iTextSharp für das Lesen von PDF-Dateien zu vergleichen.

  2. Installieren Sie IronPDF- und iTextSharp-Bibliotheken in das Projekt.

  3. Lesen Sie PDF-Dateien mit IronPDF.

  4. PDF-Dateien mit iTextSharp lesen.

Voraussetzungen

  1. Visual Studio: Stellen Sie sicher, dass Sie Visual Studio oder eine andere C#-Entwicklungsumgebung installiert haben.

  2. NuGet Package Manager: Stellen Sie sicher, dass Sie NuGet verwenden können, um Pakete in Ihrem Projekt zu verwalten.

Schritt 1: Erstellen Sie ein neues C#-Projekt in Visual Studio, um IronPDF und iTextSharp beim Lesen von PDF-Dateien zu vergleichen

Beginnen Sie mit dem Einrichten einer C#-Konsolenanwendung. Öffnen Sie Visual Studio und wählen Sie Neues Projekt erstellen. Wählen Sie den Typ Konsolenanwendung.

iTextSharp Read PDF-Alternativen (Entwickler-Tutorial): Abbildung 1 - Konsolenanwendung

Geben Sie den Projektnamen wie unten gezeigt an.

iTextSharp Lesen von PDF-Alternativen (Entwickler-Tutorial): Abbildung 2 - Projektkonfiguration

Wählen Sie die gewünschte .NET-Version für das Projekt aus.

iTextSharp Read PDF-Alternativen (Entwickler-Tutorial): Abbildung 3 - Framework

Sobald dies geschehen ist, erstellt Visual Studio ein neues Projekt.

Schritt 2: Installieren Sie IronPDF- und iTextSharp-Bibliotheken in das Projekt

iTextSharp kann über das Verzeichnis *NuGet Paketmanager. Die neueste Version ist als iText-Paket erhältlich.

iTextSharp Read PDF-Alternativen (Entwickler-Tutorial): Abbildung 4 - iText

Oder über den Visual Studio Package Manager wie unten gezeigt. Suchen Sie im Paketmanager nach iText und klicken Sie auf Installieren.

iTextSharp Read PDF-Alternativen (Entwickler-Tutorial): Abbildung 5 - NuGet-Paketmanager

IronPDF kann vom *NuGet Paketmanager wie unten dargestellt.

iTextSharp Read PDF-Alternativen (Entwickler-Tutorial): Abbildung 6 - IronPDF

Oder über den Visual Studio-Paketmanager wie unten gezeigt. Suche nach IronPDF im Paketmanager und klicken Sie auf Installieren.

iTextSharp Read PDF-Alternativen (Entwickler-Tutorial): Abbildung 7 - IronPDF installieren

Schritt 3: Lesen von Text aus einer PDF-Datei mit IronPDF

Fügen Sie den folgenden Code zur Datei program.cs hinzu und erstellen Sie ein PDF-Beispieldokument mit dem folgenden Inhalt.

iTextSharp Lesen von PDF-Alternativen (Entwickler-Tutorial): Abbildung 8 - PDF-Eingabe

using IronPdf;
Console.WriteLine("Comparison of IronPDF And itextsharp Read PDF Files in C#");
// pdfreader reader
ReadUsingIronPDF.Read();
public class ReadUsingIronPDF
{
    public static void Read()
    {
        // read from specific location
        string filename = "C:\\code\\articles\\ITextSharp\\ITextSharpIronPdfDemo\\Example.pdf";
        var pdfReader = PdfDocument.FromFile(filename);
        // Get all text to put in a search index using new simpletextextractionstrategy
        var allText = pdfReader.ExtractAllText();
        Console.WriteLine("------------------Text From PDF-----------------");
        Console.WriteLine(allText);
        Console.WriteLine("------------------Text From PDF-----------------");
        var allIMages = pdfReader.ExtractAllImages();
        Console.WriteLine("------------------Image Count From PDF-----------------");
        Console.WriteLine($"Total Images={allIMages.Count()}");
        Console.WriteLine("------------------Image Count From PDF-----------------");
        Console.WriteLine("------------------one Page Text From PDF page-----------------");
        var pageCount = pdfReader.PageCount;
        for (int page = 0; page < pageCount; page++)
        {
            string Text = pdfReader.ExtractTextFromPage(page);
            Console.WriteLine(Text);
        }    
    }
}
using IronPdf;
Console.WriteLine("Comparison of IronPDF And itextsharp Read PDF Files in C#");
// pdfreader reader
ReadUsingIronPDF.Read();
public class ReadUsingIronPDF
{
    public static void Read()
    {
        // read from specific location
        string filename = "C:\\code\\articles\\ITextSharp\\ITextSharpIronPdfDemo\\Example.pdf";
        var pdfReader = PdfDocument.FromFile(filename);
        // Get all text to put in a search index using new simpletextextractionstrategy
        var allText = pdfReader.ExtractAllText();
        Console.WriteLine("------------------Text From PDF-----------------");
        Console.WriteLine(allText);
        Console.WriteLine("------------------Text From PDF-----------------");
        var allIMages = pdfReader.ExtractAllImages();
        Console.WriteLine("------------------Image Count From PDF-----------------");
        Console.WriteLine($"Total Images={allIMages.Count()}");
        Console.WriteLine("------------------Image Count From PDF-----------------");
        Console.WriteLine("------------------one Page Text From PDF page-----------------");
        var pageCount = pdfReader.PageCount;
        for (int page = 0; page < pageCount; page++)
        {
            string Text = pdfReader.ExtractTextFromPage(page);
            Console.WriteLine(Text);
        }    
    }
}
Imports IronPdf
Console.WriteLine("Comparison of IronPDF And itextsharp Read PDF Files in C#")
' pdfreader reader
ReadUsingIronPDF.Read()
'INSTANT VB TODO TASK: Local functions are not converted by Instant VB:
'public class ReadUsingIronPDF
'{
'	public static void Read()
'	{
'		' read from specific location
'		string filename = "C:\code\articles\ITextSharp\ITextSharpIronPdfDemo\Example.pdf";
'		var pdfReader = PdfDocument.FromFile(filename);
'		' Get all text to put in a search index using new simpletextextractionstrategy
'		var allText = pdfReader.ExtractAllText();
'		Console.WriteLine("------------------Text From PDF-----------------");
'		Console.WriteLine(allText);
'		Console.WriteLine("------------------Text From PDF-----------------");
'		var allIMages = pdfReader.ExtractAllImages();
'		Console.WriteLine("------------------Image Count From PDF-----------------");
'		Console.WriteLine(string.Format("Total Images={0}", allIMages.Count()));
'		Console.WriteLine("------------------Image Count From PDF-----------------");
'		Console.WriteLine("------------------one Page Text From PDF page-----------------");
'		var pageCount = pdfReader.PageCount;
'		for (int page = 0; page < pageCount; page++)
'		{
'			string Text = pdfReader.ExtractTextFromPage(page);
'			Console.WriteLine(Text);
'		}
'	}
'}
VB   C#

Code Erläuterung

  1. Um ein Text-PDF zu erstellen, erstellen Sie ein Word-Dokument, fügen Sie den obigen Text in das Word-Dokument ein und speichern Sie es als PDF-Dokument unter dem Namen Beispiel.pdf

  2. Im Code erstellen wir einen PDFReader aus dem Pfad der PDF-Datei und extrahieren den gesamten Text

  3. Die Bilder in PDF können mit der Methode ExtractImages extrahiert werden

  4. Jede Seite in PDF-Dokumenten kann mit der Methode ExtractTextFromPage gelesen werden

Ausgabe

iTextSharp Alternativen zum PDF-Lesen (Entwickler-Tutorial): Abbildung 9 - PDF lesen mit IronPDF Output

Schritt 3: Lesen von Text aus einer PDF-Datei mit iTextSharp

Um nun den gelesenen Text aus iTextSharp zu vergleichen, fügen Sie den folgenden Code in dieselbe program.cs-Datei ein. Der Einfachheit halber haben wir die Klassen nicht in verschiedene Dateien aufgeteilt.

using IronPdf;
using iText.Kernel.Pdf;
using iText.Kernel.Pdf.Canvas.Parser.Listener;
using iText.Kernel.Pdf.Canvas.Parser;
Console.WriteLine("Comparison of IronPDF And Itextsharp Read PDF Files in C#");
//ReadUsingIronPDF.Read();
ReadUsingITextSharp.Read();
public class ReadUsingITextSharp
{
    public static void Read()
    {
        string pdfFile = "C:\\code\\articles\\ITextSharp\\ITextSharpIronPdfDemo\\Example.pdf";
        // Create a PDF reader
        PdfReader pdfReader = new PdfReader(pdfFile);
        iText.Kernel.Pdf.PdfDocument pdfDocument = new iText.Kernel.Pdf.PdfDocument(pdfReader);
        // Extract plain text from the PDF
        LocationTextExtractionStrategy strategy = new LocationTextExtractionStrategy();
        string pdfText = PdfTextExtractor.GetTextFromPage(pdfDocument.GetPage(1), strategy);
        // Display or manipulate the extracted text as needed
        Console.WriteLine(pdfText);
    }
}
using IronPdf;
using iText.Kernel.Pdf;
using iText.Kernel.Pdf.Canvas.Parser.Listener;
using iText.Kernel.Pdf.Canvas.Parser;
Console.WriteLine("Comparison of IronPDF And Itextsharp Read PDF Files in C#");
//ReadUsingIronPDF.Read();
ReadUsingITextSharp.Read();
public class ReadUsingITextSharp
{
    public static void Read()
    {
        string pdfFile = "C:\\code\\articles\\ITextSharp\\ITextSharpIronPdfDemo\\Example.pdf";
        // Create a PDF reader
        PdfReader pdfReader = new PdfReader(pdfFile);
        iText.Kernel.Pdf.PdfDocument pdfDocument = new iText.Kernel.Pdf.PdfDocument(pdfReader);
        // Extract plain text from the PDF
        LocationTextExtractionStrategy strategy = new LocationTextExtractionStrategy();
        string pdfText = PdfTextExtractor.GetTextFromPage(pdfDocument.GetPage(1), strategy);
        // Display or manipulate the extracted text as needed
        Console.WriteLine(pdfText);
    }
}
Imports IronPdf
Imports iText.Kernel.Pdf
Imports iText.Kernel.Pdf.Canvas.Parser.Listener
Imports iText.Kernel.Pdf.Canvas.Parser
Console.WriteLine("Comparison of IronPDF And Itextsharp Read PDF Files in C#")
'ReadUsingIronPDF.Read();
ReadUsingITextSharp.Read()
'INSTANT VB TODO TASK: Local functions are not converted by Instant VB:
'public class ReadUsingITextSharp
'{
'	public static void Read()
'	{
'		string pdfFile = "C:\code\articles\ITextSharp\ITextSharpIronPdfDemo\Example.pdf";
'		' Create a PDF reader
'		PdfReader pdfReader = New PdfReader(pdfFile);
'		iText.Kernel.Pdf.PdfDocument pdfDocument = New iText.Kernel.Pdf.PdfDocument(pdfReader);
'		' Extract plain text from the PDF
'		LocationTextExtractionStrategy strategy = New LocationTextExtractionStrategy();
'		string pdfText = PdfTextExtractor.GetTextFromPage(pdfDocument.GetPage(1), strategy);
'		' Display or manipulate the extracted text as needed
'		Console.WriteLine(pdfText);
'	}
'}
VB   C#

Ausgabe

iTextSharp Lesen von PDF-Alternativen (Entwickler-Tutorial): Abbildung 10 - PDF lesen mit iTextSharp Output

iTextSharp-Einschränkungen

  1. Lernkurve: iTextSharp hat eine steilere Lernkurve, besonders für Anfänger.

  2. Lizenzierung: Das Lizenzierungsmodell von iTextSharp ist möglicherweise nicht für alle Projekte geeignet, insbesondere für solche mit begrenztem Budget.

IronPDF Vorteile

  1. Benutzerfreundlichkeit: IronPDF ist bekannt für seine unkomplizierte API, die Entwicklern den Einstieg erleichtert.

  2. Dokumenten-Rendering: IronPDF bietet eine genaue Wiedergabe von PDF-Dokumenten, die sicherstellt, dass der extrahierte Text dem Original entspricht.

Lizenzierung (kostenlose Testversion verfügbar)

Zu verwenden IronPDF. Fügen Sie diesen Schlüssel in die Datei appsettings.json ein.

"IronPdf.LicenseKey": "your license key"

Um eine Testlizenz zu erhalten, geben Sie bitte Ihre E-Mail-Adresse an.

Schlussfolgerung

Die Wahl zwischen IronPDF und iTextSharp hängt von den spezifischen Anforderungen Ihres Projekts ab. Wenn Sie eine unkomplizierte und benutzerfreundliche Bibliothek für gängige PDF-Operationen benötigen, ist IronPDF möglicherweise die bessere Wahl. Berücksichtigen Sie Faktoren wie die Komplexität Ihrer Anwendung, Ihr Budget und die Lernkurve, wenn Sie Ihre Entscheidung treffen.

IronPDF wurde entwickelt, um die PDF-Erzeugung nahtlos in Ihre Anwendung zu integrieren und die Konvertierung von formatierten Dokumenten in PDFs mühelos durchzuführen. Mit diesem vielseitigen Tool können Sie Webformulare, lokale HTML-Seiten und andere Webinhalte mit .NET in PDF konvertieren. Die Benutzer können Dokumente bequem herunterladen, per E-Mail versenden oder in der Cloud speichern. Ob Sie Rechnungen, Angebote, Berichte, Verträge oder andere professionelle Dokumente erstellen müssen, IronPDF hat für Sie gesorgt. Verbessern Sie Ihre Anwendung mit den intuitiven und effizienten PDF-Erstellungsfunktionen von IronPDF.

< PREVIOUS
Wie man PDF-Dokumente in C# mit iTextSharp liest:
NÄCHSTES >
PDFsharp vs. iTextSharp (C# PDF Library Vergleich)

Sind Sie bereit, loszulegen? Version: 2024.10 gerade veröffentlicht

Gratis NuGet-Download Downloads insgesamt: 11,308,499 Lizenzen anzeigen >