PRODUKT-VERGLEICHE

iText7 PDF lesen in C# Alternativen (VS IronPDF)

PDF ist ein tragbares Dokumentenformat, das von Adobe Acrobat Reader erstellt wird und für den digitalen Austausch von Informationen über das Internet weit verbreitet ist. Es bewahrt die Formatierung der Daten und bietet Funktionen wie die Einstellung von Sicherheitsberechtigungen und Passwortschutz. Als C#-Entwickler sind Sie vielleicht schon auf Szenarien gestoßen, in denen die Integration von PDF-Funktionen in Ihre Softwareanwendung erforderlich ist. Sie von Grund auf neu zu erstellen, kann eine zeitraubende und mühsame Aufgabe sein. In Anbetracht der Leistung, Effektivität und Effizienz der Anwendung ist die Abwägung zwischen der Erstellung eines neuen Dienstes von Grund auf oder der Verwendung einer vorgefertigten Bibliothek daher erheblich.

Es gibt mehrere PDF-Bibliotheken für C#. In diesem Artikel werden wir zwei der beliebtesten PDF-Bibliotheken zum Lesen von PDF-Dokumenten in C# untersuchen.

iText-Software

iText 7, früher bekannt als iText 7 Core, ist eine PDF-Bibliothek zum Programmieren von PDF-Dokumenten in .NET C# und Java. Es ist als Open-Source-Lizenz (AGPL) verfügbar und kann für kommerzielle Anwendungen lizenziert werden.

iText Core ist eine High-Level-API, die einfache Methoden zur Erzeugung und Bearbeitung von PDFs auf alle möglichen Arten bietet. Mit iText 7 Core können Sie PDF-Dateien aufteilen, zusammenführen, mit Anmerkungen versehen, Formulare ausfüllen, digital unterschreiben und vieles mehr. iText 7 bietet einen HTML-zu-PDF-Konverter.

IronPDF

Erfahren Sie mehr über IronPDF ist eine .NET und .NET Framework C# und Java API, die für die Erstellung von PDF-Dokumenten aus HTML, CSS und JavaScript verwendet wird, entweder von einer URL, HTML-Dateien oder HTML-Strings. IronPDF ermöglicht die Bearbeitung vorhandener PDF-Dateien wie Teilen, Zusammenführen, Kommentieren, digitales Signieren und vieles mehr.

IronPDF verfügt über mehr als 50 Funktionen zum Erstellen, Lesen und Bearbeiten von PDF-Dateien. Der Schwerpunkt liegt auf Geschwindigkeit, Benutzerfreundlichkeit und Genauigkeit, wenn es darum geht, hochwertige, pixelgenaue professionelle PDF-Dateien mit Adobe Acrobat Reader zu erstellen. Die API ist gut dokumentiert, und eine Menge Beispiel-Quellcode kann auf der Seite mit Codebeispielen gefunden werden.

Erstellen einer Konsolenanwendung

Wir werden Visual Studio 2022 IDE verwenden, um mit der Erstellung einer Anwendung zu beginnen. Visual Studio ist die offizielle IDE für die C#-Entwicklung, und Sie müssen sie installiert haben. Sie können es von der Microsoft Visual Studio-Website herunterladen, wenn es nicht installiert ist.

Mit den folgenden Schritten wird ein neues Projekt mit dem Namen "DemoApp" erstellt.

  1. Öffnen Sie Visual Studio und klicken Sie auf "Ein neues Projekt erstellen".

    Itext7 PDF in C# lesen Alternativen (VS IronPDF) Abbildung 1 - Neues Projekt

  2. Wählen Sie "Konsolenanwendung" und klicken Sie auf "Weiter".

    Itext7 PDF in C# lesen Alternativen (VS IronPDF) Abbildung 2

  3. Legen Sie den Namen des Projekts fest.

    Itext7 PDF in C# lesen Alternativen (VS IronPDF) Abbildung 3

  4. Wählen Sie die .NET-Version aus. Wählen Sie die stabile Version .NET 6.0.

    Itext7 PDF in C# lesen: Alternativen (im Vergleich zu IronPDF) Abbildung 4

IronPDF-Bibliothek installieren

Sobald das Projekt erstellt ist, muss die IronPDF-Bibliothek im Projekt installiert werden, um sie zu verwenden. Befolgen Sie diese Schritte, um es zu installieren.

  1. Öffnen Sie den NuGet Package Manager, entweder über den Lösungsexplorer oder über Tools.

    Itext7 PDF in C# lesen Alternativen (VS IronPDF) Abbildung 5

  2. Suchen Sie nach IronPDF Library und wählen Sie sie für das aktuelle Projekt aus. Klicken Sie auf Installieren.

    Itext7 PDF in C# lesen Alternativen (VS IronPDF) Abbildung 6

    Fügen Sie den folgenden Namespace am Anfang der Datei Program.cs hinzu

using IronPdf;
using IronPdf;
Imports IronPdf
$vbLabelText   $csharpLabel

IText 7-Bibliothek installieren

Sobald das Projekt erstellt ist, muss die iText 7-Bibliothek im Projekt installiert werden, um sie zu verwenden. Befolgen Sie die Schritte zur Installation der Software.

  1. Öffnen Sie den NuGet Package Manager entweder über den Lösungsexplorer oder über Tools.

    Itext7 PDF in C# lesen Alternativen (VS IronPDF) Abbildung 7

  2. Suchen Sie nach iText 7 Library und wählen Sie es für das aktuelle Projekt aus. Klicken Sie auf Installieren.

    Itext7 PDF in C# Alternativen lesen (VS IronPDF) Abbildung 8

    Fügen Sie die folgenden Namespaces am Anfang der Datei Program.cs hinzu

using iText.Kernel.Pdf.Canvas.Parser.Listener;
using iText.Kernel.Pdf.Canvas.Parser;
using iText.Kernel.Pdf;
using iText.Kernel.Pdf.Canvas.Parser.Listener;
using iText.Kernel.Pdf.Canvas.Parser;
using iText.Kernel.Pdf;
Imports iText.Kernel.Pdf.Canvas.Parser.Listener
Imports iText.Kernel.Pdf.Canvas.Parser
Imports iText.Kernel.Pdf
$vbLabelText   $csharpLabel

PDF-Dateien öffnen

Wir werden die folgende PDF-Datei verwenden, um Text daraus zu extrahieren. Es handelt sich um ein zweiseitiges PDF-Dokument.

Itext7 PDF in C# lesen Alternativen (VS IronPDF) Abbildung 9

IText-Bibliothek verwenden

Das Öffnen einer PDF-Datei mit der iText-Bibliothek ist ein zweistufiger Prozess. Zuerst erstellen wir ein PdfReader-Objekt und übergeben den Dateipfad als Parameter. Dann verwenden wir die PdfDocument-Klasse, um ein neues PDF-Dokument zu erstellen. Der Code lautet wie folgt:

PdfReader pdfReader = new PdfReader("sample.pdf");
PdfDocument pdfDoc = new PdfDocument(pdfReader);
PdfReader pdfReader = new PdfReader("sample.pdf");
PdfDocument pdfDoc = new PdfDocument(pdfReader);
Dim pdfReader As New PdfReader("sample.pdf")
Dim pdfDoc As New PdfDocument(pdfReader)
$vbLabelText   $csharpLabel

IronPDF verwenden

Das Öffnen von PDF-Dateien mit IronPDF ist einfach. Verwenden Sie die PdfDocument-Klasse mit der FromFile-Methode, um PDFs von einem beliebigen Dateispeicherort zu öffnen. Der folgende einzeilige Code öffnet eine PDF-Datei zum Lesen von Daten:

var pdf = PdfDocument.FromFile("sample.pdf");
var pdf = PdfDocument.FromFile("sample.pdf");
Dim pdf = PdfDocument.FromFile("sample.pdf")
$vbLabelText   $csharpLabel

Daten aus PDF-Dateien lesen

IText7-Bibliothek verwenden

PDF-Daten zu lesen ist in der iText 7-Bibliothek nicht so einfach. Wir müssen jede Seite des PDF-Dokuments manuell durchlaufen, um Text von jeder Seite zu extrahieren. Der folgende Quellcode hilft, den Text seitenweise aus dem PDF-Dokument zu extrahieren:

for (int page = 1; page <= pdfDoc.GetNumberOfPages(); page++)
{
    ITextExtractionStrategy strategy = new SimpleTextExtractionStrategy();
    string pageContent = PdfTextExtractor.GetTextFromPage(pdfDoc.GetPage(page), strategy);
    Console.WriteLine(pageContent);
}
pdfDoc.Close();
pdfReader.Close();
for (int page = 1; page <= pdfDoc.GetNumberOfPages(); page++)
{
    ITextExtractionStrategy strategy = new SimpleTextExtractionStrategy();
    string pageContent = PdfTextExtractor.GetTextFromPage(pdfDoc.GetPage(page), strategy);
    Console.WriteLine(pageContent);
}
pdfDoc.Close();
pdfReader.Close();
Dim page As Integer = 1
Do While page <= pdfDoc.GetNumberOfPages()
	Dim strategy As ITextExtractionStrategy = New SimpleTextExtractionStrategy()
	Dim pageContent As String = PdfTextExtractor.GetTextFromPage(pdfDoc.GetPage(page), strategy)
	Console.WriteLine(pageContent)
	page += 1
Loop
pdfDoc.Close()
pdfReader.Close()
$vbLabelText   $csharpLabel

In dem obigen Code ist eine Menge los. Zuerst deklarieren wir die Text Extraction Strategy, und dann verwenden wir die PdfExtractor-Klasse mit der GetTextFromPage-Methode, um Text zu lesen. Diese Methode akzeptiert zwei Parameter: Der erste ist die Seite des PDF-Dokuments, der zweite ist die Strategie. Um die Seite des PDF-Dokuments zu erhalten, verwenden Sie die Instanz von PdfDocument, um die GetPage-Methode aufzurufen, und übergeben Sie die Seitennummer als Parameter. Die Ausgabe wird als String zurückgegeben, der dann auf dem Konsolenbildschirm angezeigt wird. Schließlich werden die PDFReader- und PdfDocument-Objekte geschlossen. Sehen Sie sich auch das folgende Codebeispiel zum Extrahieren von Text aus PDF mit iText7 an.

Ausgabe

Itext7 PDF in C# lesen Alternativen (VS IronPDF) Abbildung 10

IronPDF verwenden

So wie das Öffnen der PDF-Datei eine einzige Codezeile war, ist auch das Lesen von Text aus einer PDF-Datei ein einzeiliger Prozess. Die PDFDocument-Klasse stellt die ExtractAllText-Methode bereit, um den gesamten Inhalt aus dem PDF zu lesen. Console.WriteLine wird verwendet, um den Text auf dem Bildschirm auszugeben. Der Code lautet wie folgt:

string text = pdf.ExtractAllText();
Console.WriteLine(text);
string text = pdf.ExtractAllText();
Console.WriteLine(text);
Dim text As String = pdf.ExtractAllText()
Console.WriteLine(text)
$vbLabelText   $csharpLabel

Ausgabe

Itext7 Read PDF in C# Alternativen (VS IronPDF) Abbildung 11

Die Ausgabe ist genau und fehlerfrei. Um jedoch die Methode ExtractAllText zu verwenden, benötigen Sie eine Lizenz, da sie nur im Produktionsmodus funktioniert. Sie können Ihren Testlizenzschlüssel für 30 Tage von der IronPDF-Testlizenzseite erhalten.

Vergleich

Im Vergleich dazu liefern beide Bibliotheken beim Extrahieren von Text aus einem PDF-Dokument 100 % genaue Ergebnisse. Sie sind identisch, was die Genauigkeit angeht. IronPDF ist jedoch effizienter, was die Leistung und die Lesbarkeit des Codes angeht.

IronPDF benötigt nur zwei Codezeilen, um die gleiche Aufgabe wie iText zu erfüllen. Es bietet sofort einsetzbare Textextraktionsmethoden, ohne dass eine zusätzliche Logik implementiert werden muss. der iText-Code ist etwas kompliziert, und Sie müssen die beiden Instanzen, die beim Öffnen eines PDF-Dokuments erstellt werden, schließen. IronPDF hingegen löscht den Speicher automatisch, sobald die Aufgabe erledigt ist.

Zusammenfassung

In diesem Artikel haben wir uns angeschaut, wie man PDF-Dokumente mit der iText-Bibliothek in C# liest, und sie dann mit IronPDF verglichen. Beide Bibliotheken liefern genaue Ergebnisse und bieten zahlreiche Methoden zur PDF-Bearbeitung. Mit diesen beiden Bibliotheken können Sie PDF-Dateien erstellen, bearbeiten und Daten aus ihnen lesen.

iText ist quelloffen und frei verwendbar, allerdings mit Einschränkungen. Es kann für die kommerzielle Nutzung lizenziert werden. IronPDF ist auch kostenlos nutzbar und kann für kommerzielle Aktivitäten mit einer kostenlosen 30-tägigen Testversion lizenziert werden.

Laden Sie IronPDF herunter und probieren Sie es aus.

Chipego
Software-Ingenieur
Chipego hat eine natürliche Fähigkeit zum Zuhören, die ihm hilft, Kundenprobleme zu verstehen und intelligente Lösungen anzubieten. Er trat dem Iron Software-Team 2023 bei, nachdem er einen Bachelor of Science in Informationstechnologie erworben hatte. IronPDF und IronOCR sind die beiden Produkte, auf die sich Chipego konzentriert hat, aber sein Wissen über alle Produkte wächst täglich, da er neue Wege findet, Kunden zu unterstützen. Er genießt die Zusammenarbeit bei Iron Software, da Teammitglieder aus dem gesamten Unternehmen ihre unterschiedlichen Erfahrungen einbringen und so zu effektiven, innovativen Lösungen beitragen. Wenn Chipego nicht an seinem Schreibtisch sitzt, kann man ihn oft bei einem guten Buch oder beim Fußballspielen antreffen.
< PREVIOUS
PDF in Bild umwandeln mit Itextsharp
NÄCHSTES >
Ein Vergleich zwischen IronPDF und Foxit PDF SDK