Zum Fußzeileninhalt springen
PRODUKTVERGLEICHE

iText7 PDF in C# lesen Alternativen (VS IronPDF)

PDF ist ein tragbares Dokumentenformat, das von Adobe Acrobat Reader erstellt wurde und häufig zum digitalen Austausch von Informationen über das Internet verwendet wird. Es bewahrt das Datenformat und bietet Funktionen wie das Festlegen von Sicherheitsberechtigungen und Passwortschutz. Als C#-Entwickler haben Sie möglicherweise Szenarien erlebt, in denen es notwendig ist, PDF-Funktionalität in Ihre Softwareanwendung zu integrieren. Es von Grund auf neu zu erstellen, kann eine zeitaufwendige und mühsame Aufgabe sein. Daher ist es angesichts der Leistung, Effektivität und Effizienz der Anwendung von Bedeutung, den Kompromiss zwischen der Erstellung eines neuen Dienstes von Grund auf neu oder der Verwendung einer vorgefertigten Bibliothek abzuwägen.

Es gibt mehrere PDF-Bibliotheken für C#. In diesem Artikel werden wir zwei der beliebtesten PDF-Bibliotheken zum Lesen von PDF-Dokumenten in C# untersuchen.

iText-Software

iText 7, früher bekannt als iText 7 Core, ist eine PDF-Bibliothek zum Programmieren von PDF-Dokumenten in .NET C# und Java. Es ist als Open Source-Lizenz (AGPL) erhältlich und kann für kommerzielle Anwendungen lizenziert werden.

iText Core ist eine High-Level-API, die einfache Methoden zum Generieren und Bearbeiten von PDFs in jeder erdenklichen Weise bietet. Mit iText 7 Core können Sie PDF-Dateien aufteilen, zusammenführen, kommentieren, Formulare ausfüllen, digital unterschreiben und vieles mehr tun. iText 7 bietet einen HTML-zu-PDF-Konverter.

IronPDF

Erfahren Sie mehr über IronPDF ist eine .NET- und .NET Framework C#- und Java-API, die zum Generieren von PDF-Dokumenten aus HTML, CSS und JavaScript entweder aus einer URL, HTML-Dateien oder HTML-Strings verwendet wird. IronPDF ermöglicht das Manipulieren bestehender PDF-Dateien, wie das Aufteilen, Zusammenführen, Kommentieren, digital Signieren und vieles mehr.

IronPDF ist mit über 50 Funktionen angereichert, um PDF-Dateien zu erstellen, zu lesen und zu bearbeiten. Es priorisiert Geschwindigkeit, Benutzerfreundlichkeit und Genauigkeit, wenn Sie hochwertige, pixelgenaue professionelle PDF-Dateien mit Adobe Acrobat Reader liefern müssen. Die API ist gut dokumentiert, und viele Beispiel-Quellcodes finden Sie auf der Beispielcode-Seite.

Erstellen Sie eine Konsolenanwendung

Wir werden die Visual Studio 2022 IDE verwenden, um eine Anwendung zu erstellen, mit der wir beginnen. Visual Studio ist die offizielle IDE für die C#-Entwicklung, und Sie müssen es installiert haben. Wenn es nicht installiert ist, können Sie es von der Microsoft Visual Studio Website herunterladen.

Die folgenden Schritte werden ein neues Projekt namens "DemoApp" erstellen.

  1. Öffnen Sie Visual Studio und klicken Sie auf "Create a New Project".

Itext7 Read PDF in C# Alternatives (VS IronPDF) Abbildung 1 – Neues Projekt

  1. Wählen Sie "Console Application" und klicken Sie auf "Next".

Itext7 Read PDF in C# Alternatives (VS IronPDF) Abbildung 2

  1. Geben Sie dem Projekt einen Namen.

Itext7 Read PDF in C# Alternatives (VS IronPDF) Abbildung 3

  1. Wählen Sie die .NET-Version. Wählen Sie die stabile Version .NET 6.0.

Itext7 Read PDF in C# Alternatives (VS IronPDF) Abbildung 4

IronPDF-Bibliothek installieren

Sobald das Projekt erstellt ist, muss die IronPDF-Bibliothek im Projekt installiert werden, um sie zu verwenden. Befolgen Sie diese Schritte zur Installation.

  1. Öffnen Sie den NuGet-Paket-Manager, entweder aus dem Lösungsexplorer oder über Tools.

Itext7 Read PDF in C# Alternatives (VS IronPDF) Abbildung 5

  1. Suchen Sie nach der IronPDF-Bibliothek und wählen Sie sie für das aktuelle Projekt aus. Klicken Sie auf Installieren.

Itext7 Read PDF in C# Alternatives (VS IronPDF) Abbildung 6

Fügen Sie die folgende Namespace-Deklaration am Anfang der Program.cs-Datei hinzu:

using IronPdf;
using IronPdf;
$vbLabelText   $csharpLabel

Installation der iText 7-Bibliothek

Sobald das Projekt erstellt ist, muss die iText 7-Bibliothek im Projekt installiert werden, um sie zu verwenden. Befolgen Sie die Schritte zur Installation.

  1. Öffnen Sie den NuGet-Paketmanager entweder über den Lösungs-Explorer oder über Werkzeuge.

Itext7 Read PDF in C# Alternatives (VS IronPDF) Abbildung 7

  1. Suchen Sie nach der iText 7-Bibliothek und wählen Sie sie für das aktuelle Projekt aus. Klicken Sie auf Install.

Itext7 Read PDF in C# Alternatives (VS IronPDF) Abbildung 8

Fügen Sie die folgenden Namespaces am Anfang der Program.cs-Datei hinzu:

using iText.Kernel.Pdf.Canvas.Parser.Listener;
using iText.Kernel.Pdf.Canvas.Parser;
using iText.Kernel.Pdf;
using iText.Kernel.Pdf.Canvas.Parser.Listener;
using iText.Kernel.Pdf.Canvas.Parser;
using iText.Kernel.Pdf;
$vbLabelText   $csharpLabel

PDF-Dateien öffnen

Wir werden die folgende PDF-Datei verwenden, um Text aus ihr zu extrahieren. Es ist ein zweiseitiges PDF-Dokument.

Itext7 Read PDF in C# Alternatives (VS IronPDF) Abbildung 9

Verwendung der iText-Bibliothek

Eine PDF-Datei mit der iText-Bibliothek zu öffnen, ist ein zweistufiger Prozess. Zuerst erstellen wir ein PdfReader-Objekt und übergeben den Speicherort der Datei als Parameter. Dann verwenden wir die PdfDocument-Klasse, um ein neues PDF-Dokument zu erstellen. Der Code sieht wie folgt aus:

// Initialize a reader instance by specifying the path of the PDF file
PdfReader pdfReader = new PdfReader("sample.pdf");

// Initialize a document instance using the PdfReader
PdfDocument pdfDoc = new PdfDocument(pdfReader);
// Initialize a reader instance by specifying the path of the PDF file
PdfReader pdfReader = new PdfReader("sample.pdf");

// Initialize a document instance using the PdfReader
PdfDocument pdfDoc = new PdfDocument(pdfReader);
$vbLabelText   $csharpLabel

Verwendung von IronPDF

PDF-Dateien mit IronPDF zu öffnen ist einfach. Verwenden Sie die PdfDocument-Klasse, um mit der FromFile-Methode PDFs aus jedem Speicherort zu öffnen. Der folgende Einzeiler öffnet eine PDF-Datei zum Lesen der Daten:

// Open a PDF file using IronPDF and create a PdfDocument instance
var pdf = PdfDocument.FromFile("sample.pdf");
// Open a PDF file using IronPDF and create a PdfDocument instance
var pdf = PdfDocument.FromFile("sample.pdf");
$vbLabelText   $csharpLabel

Lesen von Daten aus PDF-Dateien

Verwendung der iText7-Bibliothek

Das Lesen von PDF-Daten ist in der iText 7-Bibliothek nicht so unkompliziert. Wir müssen manuell durch jede Seite des PDF-Dokuments blättern, um Text aus jeder Seite zu extrahieren. Der folgende Quellcode hilft, Text aus dem PDF-Dokument seitenweise zu extrahieren:

// Iterate through each page and extract text
for (int page = 1; page <= pdfDoc.GetNumberOfPages(); page++)
{
    // Define the text extraction strategy
    ITextExtractionStrategy strategy = new SimpleTextExtractionStrategy();

    // Extract text from the current page using the strategy
    string pageContent = PdfTextExtractor.GetTextFromPage(pdfDoc.GetPage(page), strategy);

    // Output the extracted text to the console
    Console.WriteLine(pageContent);
}

// Close document and reader to release resources
pdfDoc.Close();
pdfReader.Close();
// Iterate through each page and extract text
for (int page = 1; page <= pdfDoc.GetNumberOfPages(); page++)
{
    // Define the text extraction strategy
    ITextExtractionStrategy strategy = new SimpleTextExtractionStrategy();

    // Extract text from the current page using the strategy
    string pageContent = PdfTextExtractor.GetTextFromPage(pdfDoc.GetPage(page), strategy);

    // Output the extracted text to the console
    Console.WriteLine(pageContent);
}

// Close document and reader to release resources
pdfDoc.Close();
pdfReader.Close();
$vbLabelText   $csharpLabel

Im obigen Code geschieht viel. Zuerst deklarieren wir die Text Extraktionsstrategie und verwenden dann die Methode GetTextFromPage der Klasse PdfExtractor, um Text zu lesen. Diese Methode akzeptiert zwei Parameter: Der erste ist die PDF-Dokumentseite und der zweite die Strategie. Um die PDF-Dokumentseite zu erhalten, verwenden Sie die Instanz von PdfDocument, um die GetPage-Methode aufzurufen und die Seitennummer als Parameter zu übergeben. Die Ausgabe wird als Zeichenfolge zurückgegeben, die dann auf dem Konsolenausgabebildschirm angezeigt wird. Schließlich werden die PDFReader- und PdfDocument-Objekte geschlossen. Sehen Sie sich auch das folgende Codebeispiel zum Extrahieren von Text aus einem PDF mit iText7 an.

Ausgabe

Itext7 Read PDF in C# Alternatives (VS IronPDF) Abbildung 10

Verwendung von IronPDF

So wie das Öffnen der PDF-Datei ein Einzeiler war, ist auch das Lesen von Text aus einer PDF-Datei ein Einzeiler. Die PDFDocument-Klasse bietet die ExtractAllText-Methode, um den gesamten Inhalt aus dem PDF zu lesen. Console.WriteLine wird verwendet, um den Text auf dem Bildschirm auszugeben. Der Code sieht wie folgt aus:

// Extract all text from the PDF document
string text = pdf.ExtractAllText();

// Display the extracted text
Console.WriteLine(text);
// Extract all text from the PDF document
string text = pdf.ExtractAllText();

// Display the extracted text
Console.WriteLine(text);
$vbLabelText   $csharpLabel

Ausgabe

Itext7 Read PDF in C# Alternatives (VS IronPDF) Abbildung 11

Die Ausgabe ist genau und fehlerfrei. Allerdings muss man, um die ExtractAllText-Methode zu verwenden, eine Lizenz besitzen, da sie nur im Produktionsmodus funktioniert. Sie können Ihren Testlizenzschlüssel für 30 Tage von der IronPDF-Testlizenz-Seite erhalten.

Vergleich

Im Vergleich liefern beide Bibliotheken 100 % genaue Ergebnisse beim Extrahieren von Text aus einem PDF-Dokument. In Bezug auf die Genauigkeit sind sie identisch. Jedoch ist IronPDF effizienter in Bezug auf Leistung und Lesbarkeit des Codes.

IronPDF benötigt nur zwei Codezeilen, um dieselbe Aufgabe wie iText zu erledigen. Es bietet Textextraktionsmethoden ohne zusätzliche Logik, die implementiert werden muss. Der iText-Code ist etwas knifflig und man muss die beiden beim Öffnen eines PDF-Dokuments erstellten Instanzen schließen. Hingegen räumt IronPDF automatisch den Speicher auf, sobald die Aufgabe erledigt ist.

Zusammenfassung

In diesem Artikel haben wir uns angesehen, wie man PDF-Dokumente mit der iText-Bibliothek in C# lesen kann und sie dann mit IronPDF verglichen. Beide Bibliotheken liefern genaue Ergebnisse und bieten zahlreiche PDF-Manipulationsmethoden, mit denen man arbeiten kann. Sie können Daten aus PDF-Dateien mit beiden Bibliotheken erstellen, bearbeiten und lesen.

iText ist Open Source und frei nutzbar, jedoch mit Einschränkungen. Es kann für kommerzielle Nutzung lizenziert werden. IronPDF ist ebenfalls frei nutzbar und kann für kommerzielle Aktivitäten lizenziert werden mit einem 30-tägigen kostenlosen Testzeitraum.

Laden Sie IronPDF herunter und probieren Sie es aus.

Hinweis:iText 7 ist eine eingetragene Marke des jeweiligen Eigentümers. Diese Seite ist nicht verbunden mit, wird nicht unterstützt von oder gesponsert von iText 7. Alle Produktnamen, Logos und Marken sind das Eigentum ihrer jeweiligen Inhaber. Die Vergleiche dienen nur zu Informationszwecken und spiegeln öffentlich verfügbare Informationen zum Zeitpunkt des Schreibens wider.

Häufig gestellte Fragen

Was ist IronPDF und wie verhält es sich im Vergleich zu iText 7?

IronPDF ist eine .NET-Bibliothek, die zum Erstellen und Manipulieren von PDF-Dokumenten aus HTML, CSS und JavaScript entwickelt wurde. Im Vergleich zu iText 7 legt IronPDF Wert auf Geschwindigkeit, Benutzerfreundlichkeit und Genauigkeit und benötigt weniger Codezeilen, um PDF-Aufgaben zu erledigen.

Wie kann ich HTML in PDF in C# konvertieren?

Sie können die RenderHtmlAsPdf-Methode von IronPDF verwenden, um HTML-Strings in PDFs zu konvertieren. Zusätzlich können Sie HTML-Dateien mithilfe von RenderHtmlFileAsPdf in PDFs konvertieren.

Was sind die Installationsschritte für IronPDF in einem C#-Projekt?

Um IronPDF in einem C#-Projekt zu installieren, öffnen Sie den NuGet-Paket-Manager in Visual Studio, suchen Sie nach IronPDF, wählen Sie es für Ihr Projekt aus und klicken Sie auf Installieren. Fügen Sie am Anfang Ihrer C#-Datei using IronPdf; hinzu.

Wie extrahiere ich Text aus einem PDF mit IronPDF?

Um Text aus einem PDF mit IronPDF zu extrahieren, verwenden Sie die FromFile-Methode der PdfDocument-Klasse, um das PDF zu laden, gefolgt von der ExtractAllText-Methode, um den Text abzurufen.

Was sind einige Tipps zur Fehlerbehebung bei der Verwendung von IronPDF?

Stellen Sie sicher, dass IronPDF über NuGet korrekt installiert ist und dass die richtigen Namespaces in Ihrer C#-Datei enthalten sind. Überprüfen Sie die Dateipfade und stellen Sie sicher, dass der HTML-Inhalt gut geformt ist, wenn Sie HTML in PDF konvertieren.

Kann IronPDF PDF-Formulare und Anmerkungen verarbeiten?

Ja, IronPDF unterstützt Funktionen wie das Ausfüllen von Formularen und das Hinzufügen von Anmerkungen zu PDFs, sodass Sie interaktive und dynamische PDF-Dokumente erstellen können.

Ist IronPDF kostenlos nutzbar?

IronPDF bietet eine kostenlose Version mit eingeschränkten Funktionen und eine 30-tägige kostenlose Testversion für die kommerzielle Version, die alle Funktionen bietet.

Was sind die Einschränkungen bei der Verwendung von iText 7 zur PDF-Manipulation?

Obwohl iText 7 eine robuste PDF-Bibliothek ist, erfordert es für bestimmte Aufgaben wie das Textextrahieren zusätzliche Logik, was im Vergleich zu IronPDF zu komplexerem und längerem Code führen kann.

Curtis Chau
Technischer Autor

Curtis Chau hat einen Bachelor-Abschluss in Informatik von der Carleton University und ist spezialisiert auf Frontend-Entwicklung mit Expertise in Node.js, TypeScript, JavaScript und React. Leidenschaftlich widmet er sich der Erstellung intuitiver und ästhetisch ansprechender Benutzerschnittstellen und arbeitet gerne mit modernen Frameworks sowie der Erstellung gut strukturierter, optisch ansprechender ...

Weiterlesen
iText Logo

Sind Sie es leid, teure Erneuerungen und veraltete Produktaktualisierungen zu haben?

Machen Sie sich den Umstieg von iText leicht - mit unserer technischen Unterstützung bei der Migration und einem besseren Angebot.

IronPDF Logo