IRONPDF VERWENDEN

PDF-Dokumente zeilenweise in C# lesen

Veröffentlicht 29. April 2024
Teilen Sie:

Sie mögen PDFs als statische Dokumente betrachten, aber sie werden immer dynamischer. Mit Hilfe von PDFs können Sie ein Dokument erstellen, das sowohl interaktiv ist als auch weitergegeben werden kann. Sie können die Struktur des PDF-Formats verstehen, indem Sie die "Portable Document Format Reference" im Acrobat SDK auf der Adobe-Website lesen. Die beiden häufigsten Gründe für die programmgesteuerte Erstellung von PDFs sind:

  1. Für Newsletter und andere digitale Publikationen, die Grafiken und Formatierungen erfordern, die mit druckfertigen PDFs nicht möglich sind.

  2. Interaktivität in E-Books oder digitalen Magazinen schaffen.

    Das programmatische Lesen von PDF-Dateien ist eine schwierige Aufgabe, da die Extraktion von Text aus einer PDF-Datei nicht einfach ist. Die Struktur der PDF-Datei ist komplex, zumal sie auch Bilder enthalten kann. Was ist also die Lösung, wenn Entwickler Text aus PDF-Dateien zeilenweise abrufen müssen, ohne Adobe Acrobat zu verwenden? Die Antwort ist die IronPDF C# PDF-Bibliothek. In diesem Tutorial erfahren Sie, wie Sie PDF-Dateien programmgesteuert in C# mit der IronPDF C#-Bibliothek lesen können.

PDF-Dokumente zeilenweise in C# lesen;

Der Inhalt dieses Artikels wird im Folgenden aufgeführt:

  1. IronPDF: Eine C# PDF-Bibliothek

  2. Schritte zum Lesen von PDF-Dokumenten

  3. Erstellen eines C#-Projekts in Visual Studio

  4. Installieren Sie die IronPDF-Bibliothek mit dem NuGet-Paketmanager

  5. Code zum Lesen von PDF-Dateien schreiben

  6. Fazit: die beste Bibliothek zum Lesen von PDFs

IronPDF: Eine C# PDF-Bibliothek

IronPDF ist eine .NET PDF-Bibliothek, die Entwicklern eine einfache und leistungsstarke Möglichkeit bietet, PDF-Dateien zu erzeugen und zu lesen. Es wurde von Grund auf so konzipiert, dass es mit .NET Core, ASP.NET Core und .NET-Standard kompatibel ist.

IronPDF bietet Entwicklern umfangreiche APIs für die Erstellung, Bearbeitung und Generierung von PDF-Dateien. Entwickler können mithilfe der intuitiven API programmgesteuert eine neue PDF-Datei erstellen oder eine bestehende öffnen. Die Bibliothek unterstützt verschiedene Dokumente, wie z. B. Bilder, Videos, Textdokumente und Vektorgrafiken, die im PDF-Dokument erzeugt werden.

Schauen wir uns an, wie wir PDFs mit IronPDF zeilenweise lesen können.

Erstellen eines C#-Projekts in Visual Studio

Ich werde Visual Studio 2022 für die Erstellung des C#-Projekts verwenden. Jede Version, die Sie haben, sollte funktionieren, aber es wird empfohlen, die neueste Version zu verwenden, um eine bessere Erfahrung zu machen. IronPDF arbeitet gut mit der neuesten Version des Microsoft-Frameworks, .NET 6. Wenn Sie erweiterte Unterstützung und Stabilität benötigen, ist die Verwendung dieses Frameworks empfehlenswert.

Führen Sie anschließend die folgenden Schritte aus, um ein C#-Projekt in Microsoft Visual Studio zu erstellen:

  1. Öffnen Sie Visual Studio 2022.

  2. Klicken Sie auf die Schaltfläche "Neues Projekt erstellen" am unteren Rand.

  3. Wählen Sie für dieses Lernprogramm die Vorlage "Konsolenanwendung". Sie können jede beliebige Vorlage entsprechend Ihren Anforderungen verwenden.

  4. Geben Sie dem Projekt einen richtigen Namen.

  5. Wählen Sie das .NET 6-Framework, da es das neueste ist und eine erweiterte Unterstützung bietet.

  6. Klicken Sie auf die Schaltfläche "Erstellen".

    Wenn Sie die oben genannten Schritte befolgen, können Sie problemlos ein C#-Projekt in Visual Studio erstellen. Nun ist es an der Zeit, die IronPDF-Bibliothek zu installieren. Sie können ein bestehendes Projekt für die Verwendung mit der IronPDF-Bibliothek verwenden. Sie müssen eine Aufgabe öffnen und die Bibliothek installieren. Im nächsten Abschnitt erfahren Sie, wie Sie die IronPDF-Bibliothek installieren.

Installieren der IronPDF-Bibliothek

IronPDF unterstützt die Installation einer IronPDF-Bibliothek auf mehrere Arten. IronPDF ist eine Bibliothek, die Sie in einer Vielzahl von Szenarien einsetzen können. Sie können das Programm mit NuGet Package installieren und es dann über die Package Manager Console nutzen. Führen Sie einfach den folgenden Befehl aus, und die IronPDF-Bibliothek wird in Ihrem Projekt installiert:

Install-Package IronPDF

Alternativ können Sie die IronPDF C#-Bibliothek herunterladen und als ZIP-Datei in einen beliebigen Ordner auf Ihrer Festplatte extrahieren - eine Installation ist nicht erforderlich. Öffnen Sie zunächst das Visual Studio-Projekt, in dem Sie IronPDF installieren möchten. Wenn Sie sich in der IDE befinden, klicken Sie im Projektmappen-Explorer auf Projektreferenzen und dann auf Referenz hinzufügen. Suchen Sie das Zip-Archiv "IronPDF", das wir zuvor heruntergeladen haben, und wählen Sie es aus. Klicken Sie auf die Schaltfläche "OK", und IronPDF wird dem Projekt als Referenz hinzugefügt.

Jetzt ist unser Projekt bereit für IronPDF. Beginnen wir mit dem Schreiben von Code zum zeilenweisen Lesen von PDF-Dokumenten.

Schreiben von Code zum Lesen einer PDF-Datei

Ich werde Ihnen nun zeigen, wie Sie eine PDF-Datei mit nur zwei Zeilen Code lesen können. Die Funktionen von IronPDF sind hervorragend und sehr effizient. Werfen wir einen Blick auf ein Codebeispiel:

using IronPdf;
using System.Drawing;
//Select the Desired PDF File
using PdfDocument PDF = PdfDocument.FromFile("test.pdf");
//Using ExtractAllText() method, extract every single text from an pdf
string line = PDF.ExtractAllText();
//Get all Images
IEnumerable<Image> AllImages = PDF.ExtractAllImages();
//View text in an Label or textbox
Console.WriteLine(line);
using IronPdf;
using System.Drawing;
//Select the Desired PDF File
using PdfDocument PDF = PdfDocument.FromFile("test.pdf");
//Using ExtractAllText() method, extract every single text from an pdf
string line = PDF.ExtractAllText();
//Get all Images
IEnumerable<Image> AllImages = PDF.ExtractAllImages();
//View text in an Label or textbox
Console.WriteLine(line);
Imports IronPdf
Imports System.Drawing
'Select the Desired PDF File
Private PdfDocument As using
'Using ExtractAllText() method, extract every single text from an pdf
Private line As String = PDF.ExtractAllText()
'Get all Images
Private AllImages As IEnumerable(Of Image) = PDF.ExtractAllImages()
'View text in an Label or textbox
Console.WriteLine(line)
VB   C#

Der obige Code hilft uns, die PDF-Datei zu lesen. Im Parameter von "FromFile" geben wir den Pfad der PDF-Eingabedatei an. Dann extrahiert die Funktion "ExtractAllText" den Text aus allen Seiten der Test-PDF-Datei. Wir können den Text in einer Textdatei speichern oder ihn in der Konsole anzeigen. Weitere Tutorials finden Sie auf der WebsiteIronPDF Beispiele für Textextraktion Seite. Wir können die folgende Funktion in Form einer Funktion schreiben, die an einer beliebigen Stelle im Programm verwendet werden kann, etwa so:

private void Extract()
{
    // Select the Desired PDF File
    using PdfDocument PDF = PdfDocument.FromFile("any.pdf");
    //Using ExtractAllText() method, extract every single text from an pdf
    string line = PDF.ExtractAllText();
    //View text in the console
    Console.WriteLine(line);
}
private void Extract()
{
    // Select the Desired PDF File
    using PdfDocument PDF = PdfDocument.FromFile("any.pdf");
    //Using ExtractAllText() method, extract every single text from an pdf
    string line = PDF.ExtractAllText();
    //View text in the console
    Console.WriteLine(line);
}
Private Sub Extract()
	' Select the Desired PDF File
	Using PDF As PdfDocument = PdfDocument.FromFile("any.pdf")
		'Using ExtractAllText() method, extract every single text from an pdf
		Dim line As String = PDF.ExtractAllText()
		'View text in the console
		Console.WriteLine(line)
	End Using
End Sub
VB   C#

Schauen wir uns die von IronPDF erzeugte Ausgabe an.

Text ausgeben

Lesen einer PDF-Datei Zeile für Zeile in C#: Abbildung 1

IronPDF extrahiert den Text perfekt und ohne Fehler. Die Ergebnisse sind erstklassig.

Schlussfolgerung: Die beste Bibliothek zum PDF-Lesen

Viele Entwickler verwenden verschiedene PDF-Lesebibliotheken in ihrer Software oder anderen Programmen. Für die Bearbeitung und das Lesen von PDF-Dateien gibt es mehrere Bibliotheken. IronPDF ist jedoch die beste Bibliothek für alle Vorgänge, die PDFs betreffen.

In vielen Branchen und Bereichen werden PDF-Generierungsprogramme eingesetzt, um PDF-Dokumente zu erzeugen und zu drucken. Viele Bibliotheken auf dem Markt, wie die PDF Sharp-Bibliothek und viele andere .NET-Bibliotheken, ermöglichen es Ihnen, schnell PDFs mit Ihren Inhalten zu erstellen. Die beste Bibliothek für die programmatische PDF-Erzeugung ist jedoch IronPDF. IronPDF bietet viele Funktionen, darunter Verschlüsselung, Passwortschutz und die Konvertierung von MS Office-Formaten in PDF. Mit IronPDF können Sie mit diesen leistungsstarken Werkzeugen problemlos PDF-Dokumente erstellen.

IronPDF ist eine kostenlose Bibliothek, für die kommerzielle Nutzung müssen Sie jedoch bezahlen. Es steht eine 30-tägige Testphase zur Verfügung, in der es in der Produktion getestet werden kann. IronPDF ist zu einem sehr erschwinglichen Preis erhältlich, und Sie können derzeit auch ein komplettes Set von 5 verschiedenen Programmen für den Preis von nur zwei Programmen erwerben. Alle Informationen über den Preisplan finden Sie auf der WebsiteIronPDF-Lizenzierungsseite.

< PREVIOUS
Wie man mit C# PDF in Bitmap konvertiert
NÄCHSTES >
Erstellen von Berichtsanwendungen in C#

Sind Sie bereit, loszulegen? Version: 2024.12 gerade veröffentlicht

Gratis NuGet-Download Downloads insgesamt: 11,810,873 Lizenzen anzeigen >