PRODUKT-VERGLEICHE

iText7 PDF lesen in C# Alternativen (VS IronPDF)

Veröffentlicht 20. Juni 2023
Teilen Sie:

PDF ist ein tragbares Dokumentenformat, das von Adobe Acrobat Reader erstellt wird und für den digitalen Austausch von Informationen über das Internet weit verbreitet ist. Es bewahrt die Formatierung der Daten und bietet Funktionen wie die Einstellung von Sicherheitsberechtigungen und Passwortschutz. Als C#-Entwickler sind Sie vielleicht schon auf Szenarien gestoßen, in denen die Integration von PDF-Funktionen in Ihre Softwareanwendung erforderlich ist. Sie von Grund auf neu zu erstellen, kann eine zeitraubende und mühsame Aufgabe sein. In Anbetracht der Leistung, Effektivität und Effizienz der Anwendung ist die Abwägung zwischen der Erstellung eines neuen Dienstes von Grund auf oder der Verwendung einer vorgefertigten Bibliothek daher erheblich.

Es gibt mehrere PDF-Bibliotheken für C#. In diesem Artikel werden wir zwei der beliebtesten PDF-Bibliotheken zum Lesen von PDF-Dokumenten in C# untersuchen.

iText-Software

iText 7, früher bekannt als iText 7 Core, ist eine PDF-Bibliothek zur Programmierung von PDF-Dokumenten in .NET C# und Java. Es ist als Open-Source-Lizenz verfügbar (AGPL) und kann für kommerzielle Anwendungen lizenziert werden.

iText Core ist eine High-Level-API, die einfache Methoden zur Erzeugung und Bearbeitung von PDFs auf alle möglichen Arten bietet. Mit iText 7 Core können Sie PDF-Dateien teilen, zusammenführen, mit Anmerkungen versehen, Formulare ausfüllen, digital unterschreiben und vieles mehr. iText 7 bietet eine HTML zu PDF Konverter.

IronPDF

IronPDF ist eine .NET- und .NET-Framework C#- und Java-API, die zur Erzeugung von PDF-Dokumenten aus HTML, CSS und JavaScript entweder aus einer URL, HTML-Dateien oder HTML-Strings verwendet wird. IronPDF ermöglicht Ihnen die Bearbeitung vorhandener PDF-Dateien, wie z. B. das Teilen, Zusammenführen, Kommentieren, digitales Signieren und vieles mehr.

IronPDF ist mit mehr als 50 Funktionen zum Erstellen, Lesen und Bearbeiten von PDF-Dateien ausgestattet. Geschwindigkeit, Benutzerfreundlichkeit und Genauigkeit stehen im Vordergrund, wenn es darum geht, mit Adobe Acrobat Reader qualitativ hochwertige, pixelgenaue professionelle PDF-Dateien zu erstellen. Die API ist gut dokumentiert, und auf der Seite mit den Code-Beispielen finden Sie eine Menge Quellcode-Beispiele.

Erstellen einer Konsolenanwendung

Wir werden Visual Studio 2022 IDE verwenden, um mit der Erstellung einer Anwendung zu beginnen. Visual Studio ist die offizielle IDE für die C#-Entwicklung, und Sie müssen sie installiert haben. Sie können es herunterladen von Microsoft Visual Studio-Website, falls nicht installiert.

Mit den folgenden Schritten wird ein neues Projekt mit dem Namen "DemoApp" erstellt.

  1. Öffnen Sie Visual Studio und klicken Sie auf "Ein neues Projekt erstellen".

    Itext7 Read PDF in C# Alternativen (VS IronPDF) Abbildung 1 - Neues Projekt

  2. Wählen Sie "Konsolenanwendung" und klicken Sie auf "Weiter".

    Itext7 PDF lesen in C# Alternativen (VS IronPDF) Abbildung 2

  3. Legen Sie den Namen des Projekts fest.

    Itext7 PDF lesen in C# Alternativen (VS IronPDF) Abbildung 3

  4. Wählen Sie die .NET-Version aus. Wählen Sie die stabile Version .NET 6.0.

    Itext7 PDF lesen in C# Alternativen (VS IronPDF) Abbildung 4

IronPDF-Bibliothek installieren

Sobald das Projekt erstellt ist, muss die IronPDF-Bibliothek im Projekt installiert werden, um sie verwenden zu können. Befolgen Sie diese Schritte, um es zu installieren.

  1. Öffnen Sie den NuGet Package Manager, entweder über den Lösungsexplorer oder über Tools.

    Itext7 PDF lesen in C# Alternativen (VS IronPDF) Abbildung 5

  2. Suchen Sie nach IronPDF Library und wählen Sie es für das aktuelle Projekt aus. Klicken Sie auf Installieren.

    Itext7 PDF lesen in C# Alternativen (VS IronPDF) Abbildung 6

    Fügen Sie den folgenden Namespace am Anfang der Datei Program.cs hinzu

using IronPdf;
using IronPdf;
Imports IronPdf
VB   C#

IText 7-Bibliothek installieren

Sobald das Projekt erstellt ist, muss die iText 7-Bibliothek im Projekt installiert werden, um sie verwenden zu können. Befolgen Sie die Schritte zur Installation der Software.

  1. Öffnen Sie den NuGet Package Manager entweder über den Lösungsexplorer oder über Tools.

    Itext7 PDF lesen in C# Alternativen (VS IronPDF) Abbildung 7

  2. Suchen Sie nach der iText 7-Bibliothek und wählen Sie sie für das aktuelle Projekt aus. Klicken Sie auf Installieren.

    Itext7 PDF lesen in C# Alternativen (VS IronPDF) Abbildung 8

    Fügen Sie die folgenden Namespaces am Anfang der Datei Program.cs hinzu

using iText.Kernel.Pdf.Canvas.Parser.Listener;
using iText.Kernel.Pdf.Canvas.Parser;
using iText.Kernel.Pdf;
using iText.Kernel.Pdf.Canvas.Parser.Listener;
using iText.Kernel.Pdf.Canvas.Parser;
using iText.Kernel.Pdf;
Imports iText.Kernel.Pdf.Canvas.Parser.Listener
Imports iText.Kernel.Pdf.Canvas.Parser
Imports iText.Kernel.Pdf
VB   C#

PDF-Dateien öffnen

Wir werden die folgende PDF-Datei verwenden, um Text daraus zu extrahieren. Es handelt sich um ein zweiseitiges PDF-Dokument.

Itext7 PDF lesen in C# Alternativen (VS IronPDF) Abbildung 9

IText-Bibliothek verwenden

Um eine PDF-Datei mit der iText-Bibliothek zu öffnen, ist ein zweistufiger Prozess erforderlich. Zunächst erstellen wir ein "pdfReader"-Objekt und übergeben den Speicherort der Datei als Parameter. Dann verwenden wir die Klasse PdfDocument, um ein neues PDF-Dokument zu erstellen. Der Code lautet wie folgt:

PdfReader pdfReader = new PdfReader("sample.pdf");
PdfDocument pdfDoc = new PdfDocument(pdfReader);
PdfReader pdfReader = new PdfReader("sample.pdf");
PdfDocument pdfDoc = new PdfDocument(pdfReader);
Dim pdfReader As New PdfReader("sample.pdf")
Dim pdfDoc As New PdfDocument(pdfReader)
VB   C#

IronPDF verwenden

Das Öffnen von PDF-Dateien mit IronPDF ist einfach. Verwenden Sie die Methode FromFile der Klasse PdfDocument, um PDFs von einem beliebigen Dateispeicherort zu öffnen. Der folgende einzeilige Code öffnet eine PDF-Datei zum Lesen von Daten:

var pdf = PdfDocument.FromFile("sample.pdf");
var pdf = PdfDocument.FromFile("sample.pdf");
Dim pdf = PdfDocument.FromFile("sample.pdf")
VB   C#

Daten aus PDF-Dateien lesen

IText7-Bibliothek verwenden

Das Lesen von PDF-Daten ist in der iText 7-Bibliothek nicht ganz so einfach. Wir müssen jede Seite des PDF-Dokuments manuell durchlaufen, um Text von jeder Seite zu extrahieren. Der folgende Quellcode hilft, den Text seitenweise aus dem PDF-Dokument zu extrahieren:

for (int page = 1; page <= pdfDoc.GetNumberOfPages(); page++)
{
    ITextExtractionStrategy strategy = new SimpleTextExtractionStrategy();
    string pageContent = PdfTextExtractor.GetTextFromPage(pdfDoc.GetPage(page), strategy);
    Console.WriteLine(pageContent);
}
pdfDoc.Close();
pdfReader.Close();
for (int page = 1; page <= pdfDoc.GetNumberOfPages(); page++)
{
    ITextExtractionStrategy strategy = new SimpleTextExtractionStrategy();
    string pageContent = PdfTextExtractor.GetTextFromPage(pdfDoc.GetPage(page), strategy);
    Console.WriteLine(pageContent);
}
pdfDoc.Close();
pdfReader.Close();
Dim page As Integer = 1
Do While page <= pdfDoc.GetNumberOfPages()
	Dim strategy As ITextExtractionStrategy = New SimpleTextExtractionStrategy()
	Dim pageContent As String = PdfTextExtractor.GetTextFromPage(pdfDoc.GetPage(page), strategy)
	Console.WriteLine(pageContent)
	page += 1
Loop
pdfDoc.Close()
pdfReader.Close()
VB   C#

In dem obigen Code ist eine Menge los. Zuerst deklarieren wir die Textextraktionsstrategie und verwenden dann die Methode "GetTextFromPage" der Klasse "PdfExtractor", um den Text zu lesen. Diese Methode akzeptiert zwei Parameter: Der erste ist die Seite des PDF-Dokuments und der zweite die Strategie. Um die Seite des PDF-Dokuments abzurufen, verwenden Sie die Instanz von PdfDocument, um die Methode GetPage aufzurufen und die Seitenzahl als Parameter zu übergeben. Die Ausgabe wird als String zurückgegeben, der dann auf dem Konsolenbildschirm angezeigt wird. Schließlich werden die Objekte PDFReader und PdfDocument geschlossen. Sehen Sie sich auch das folgende Codebeispiel an hier.

Ausgabe

Itext7 PDF lesen in C# Alternativen (VS IronPDF) Abbildung 10

IronPDF verwenden

So wie das Öffnen der PDF-Datei eine einzige Codezeile war, ist auch das Lesen von Text aus einer PDF-Datei ein einzeiliger Prozess. Die Klasse PDFDocument bietet die Methode ExtractAllText, um lesen Sie den gesamten Inhalt aus der Datei. console.WriteLine" wird verwendet, um den Text auf dem Bildschirm zu drucken. Der Code lautet wie folgt:

string text = pdf.ExtractAllText();
Console.WriteLine(text);
string text = pdf.ExtractAllText();
Console.WriteLine(text);
Dim text As String = pdf.ExtractAllText()
Console.WriteLine(text)
VB   C#

Ausgabe

Itext7 PDF lesen in C# Alternativen (VS IronPDF) Abbildung 11

Die Ausgabe ist genau und fehlerfrei. Um die Methode ExtractAllText zu verwenden, benötigen Sie jedoch eine Lizenz, da sie nur im Produktionsmodus funktioniert. Sie können Ihren Testlizenzschlüssel für 30 Tage hier abrufen link.

Vergleich

Im Vergleich dazu liefern beide Bibliotheken beim Extrahieren von Text aus einem PDF-Dokument 100 % genaue Ergebnisse. In Bezug auf die Genauigkeit sind sie beide gleich. IronPDF ist jedoch effizienter, was die Leistung und die Lesbarkeit des Codes angeht.

IronPDF benötigt nur zwei Codezeilen, um die gleiche Aufgabe wie iText zu erfüllen. Es bietet sofort einsetzbare Textextraktionsmethoden, ohne dass eine zusätzliche Logik implementiert werden muss. der iText-Code ist etwas kompliziert, und Sie müssen die beiden Instanzen, die beim Öffnen eines PDF-Dokuments erstellt werden, schließen. IronPDF hingegen löscht den Speicher automatisch, sobald die Aufgabe erledigt ist.

Zusammenfassung

In diesem Artikel haben wir uns angesehen, wie man PDF-Dokumente mit der iText-Bibliothek in C# lesen kann, und haben es dann mit IronPDF verglichen. Beide Bibliotheken liefern genaue Ergebnisse und bieten zahlreiche Methoden zur PDF-Bearbeitung. Mit diesen beiden Bibliotheken können Sie Daten aus PDF-Dateien erstellen, bearbeiten und lesen.

iText ist quelloffen und frei verwendbar, allerdings mit Einschränkungen. Sie kann sein lizenziert für die kommerzielle Nutzung. IronPDF ist ebenfalls kostenlos und kann lizenziert für kommerzielle Aktivitäten mit einem 30 Tage kostenlos testen.

Laden Sie IronPDF herunter und probieren Sie es aus.

< PREVIOUS
PDF in Bild umwandeln mit Itextsharp
NÄCHSTES >
Ein Vergleich zwischen IronPDF und Foxit PDF SDK

Sind Sie bereit, loszulegen? Version: 2024.10 gerade veröffentlicht

Gratis NuGet-Download Downloads insgesamt: 11,308,499 Lizenzen anzeigen >