IRONPDF VERWENDEN

Wie man PDF-Dateien in C# liest

Aktualisiert 24. März 2024
Teilen Sie:

Dieser Artikel verwendet IronPDF für .NET, eine C# PDF-Bibliothek zum Lesen von PDF-Dateien.

Wie man PDF-Dateien mit IronPDF liest

  1. Laden Sie Visual Studio herunter, falls dies noch nicht geschehen ist. Richten Sie die Umgebung ein und installieren Sie IronPDF Library.

  2. Verwenden Sie pdfDocument.FromFile methode, um die gewünschte PDF-Datei zu öffnen und zu laden.

  3. Verwenden Sie die IronPDF-Methode ExtractAllText, um den Inhalt abzurufen.

  4. Analysieren oder manipulieren Sie den extrahierten Text nach Bedarf.

  5. Drucken Sie den extrahierten Text in der Konsole zum Lesen aus.

IronPDF

IronPDF, eine robuste PDF-Reader-Bibliothek für C#, ermöglicht Entwicklern die mühelose Arbeit mit PDF-Dokumenten. Mit seinen umfangreichen Funktionen und Möglichkeiten vereinfacht IronPDF die Handhabung von PDF-Dokumenten und ermöglicht es den Benutzern, PDF-Inhalte mühelos zu lesen, zu extrahieren und zu manipulieren. Ganz gleich, ob Sie Dokumentenprozesse automatisieren, Daten und Bilder für die Analyse extrahieren oder PDFs von Grund auf neu erstellen, IronPDF bietet ein umfassendes Set von Werkzeugen zur Rationalisierung dieser Aufgaben.

Dieser Artikel erkundet die Welt der effizienten PDF-Verarbeitung in C# mit IronPDFund zeigt seine Vielseitigkeit und seinen Wert als unverzichtbares Werkzeug für Entwickler auf ihrem Weg zur Softwareentwicklung.

Erstellen eines neuen Visual Studio-Projekts

Bevor wir uns mit der Codierung befassen, sollten wir zunächst eine neue Visual Studio C#-Konsolenanwendungsprojekt. Dieses Projekt wird als spezieller Arbeitsbereich für Entwicklung und praktische Beispiele dienen.

  1. Starten Sie dazu Visual Studio und erstellen Sie ein neues Projekt, indem Sie im Menü "Datei" die Option "Neu" und anschließend "Projekt" wählen

    Lesen von PDF-Dateien in C#, Abbildung 1: Navigieren Sie zum Dialogfeld Projekt erstellen in Visual Studio

    Navigieren Sie zum Dialogfeld Projekt erstellen in Visual Studio

  2. Daraufhin wird ein neues Fenster angezeigt, in dem Sie die Projektvorlagen festlegen können. Entscheiden Sie sich der Einfachheit halber für die Vorlage "Konsolenanwendung" und klicken Sie auf die Schaltfläche Weiter, die sich sinnvollerweise in der linken unteren Ecke des Fensters befindet.

    Wie man PDF-Dateien in C# liest, Abbildung 2: Erstellen eines neuen Projekts in Visual Studio

    Erstellen Sie ein neues Projekt in Visual Studio

  3. Im darauffolgenden Fenster werden Sie aufgefordert, einen Namen für Ihr Projekt zu vergeben und den gewünschten Projektstandort anzugeben. Sobald Sie diese Angaben gemacht haben, klicken Sie auf die Schaltfläche Weiter, um fortzufahren.

    Lesen von PDF-Dateien in C#, Abbildung 3: Konfigurieren Sie das Projekt

    Konfigurieren Sie das Projekt

  4. Wählen Sie in diesem Schritt Ihr bevorzugtes Zielframework aus und schließen Sie die Projekterstellung mit einem Klick auf die Schaltfläche Erstellen ab.

    Wie man PDF-Dateien in C# liest, Abbildung 4: .NET-Framework

    .NET-Framework-Auswahl

    Nachdem Ihr Projekt nun feststeht, ist der nächste wichtige Schritt die Installation von IronPDF.

Installation von IronPDF

IronPDF bietet eine Vielzahl von Möglichkeiten zum Herunterladen und Installieren der PDF-Bibliothek. In diesem Leitfaden liegt der Schwerpunkt auf der Installation von IronPDF mit dem NuGet Package Manager, einer bewährten und weit verbreiteten Methode.

  1. Navigieren Sie in Visual Studio zum Menü "Tools" und fahren Sie mit dem Mauszeiger elegant über die Option "NuGet Package Manager".

  2. Wählen Sie im erweiterten Menü "NuGet Package Manager for Solutions"

    Lesen von PDF-Dateien in C#, Abbildung 5: Navigieren zu NuGet Package Manager

    Navigieren Sie zu NuGet Package Manager

  3. Wenn Sie diese Option wählen, öffnet sich ein neues Fenster. Navigieren Sie in diesem verfeinerten Fenster zum Menü "Durchsuchen" und geben Sie "IronPDF" in die Suchleiste ein.

  4. Auf dem Bildschirm werden dann die verfügbaren IronPDF-Pakete angezeigt. Um fortzufahren, wählen Sie das neueste Paket aus der Liste und führen Sie es aus, indem Sie auf die Option "Installieren" klicken.

    Lesen von PDF-Dateien in C#, Abbildung 6: Suchen und installieren Sie das IronPDF-Paket in der NuGet Package Manager UI

    Suchen und installieren Sie das IronPDF-Paket in der NuGet Package Manager UI

    Für diejenigen, die einen eher kommandozeilenorientierten Ansatz bevorzugen, bietet die NuGet Package Manager Console einen eleganten Weg. Öffnen Sie einfach diese Konsole, geben Sie den folgenden Befehl ein und drücken Sie "Enter":

Install-Package IronPdf

Sie haben auch die Möglichkeit, das Paket direkt bei der NuGet-Website link.

PDF-Dateien mit IronPDF lesen

In diesem Abschnitt wird gezeigt, wie Sie mit Hilfe von IronPDF komplette PDF-Dateien mit der Programmiersprache C# öffnen und lesen können.

using IronPdf;
using System;

IronPdf.License.LicenseKey = "";
//raw text string path
var pdf = PdfDocument.FromFile("document_scaled_compressed.pdf");

string text = pdf.ExtractAllText();

Console.WriteLine(text);
using IronPdf;
using System;

IronPdf.License.LicenseKey = "";
//raw text string path
var pdf = PdfDocument.FromFile("document_scaled_compressed.pdf");

string text = pdf.ExtractAllText();

Console.WriteLine(text);
Imports IronPdf
Imports System

IronPdf.License.LicenseKey = ""
'raw text string path
Dim pdf = PdfDocument.FromFile("document_scaled_compressed.pdf")

Dim text As String = pdf.ExtractAllText()

Console.WriteLine(text)
VB   C#

1. Notwendige Bibliotheken importieren

Für den Anfang müssen Sie die erforderlichen Namensräume importieren. Im obigen Codebeispiel wird der Namespace IronPdf importiert, der die wesentlichen Funktionen für die Arbeit mit PDFs enthält. Darüber hinaus wird auch der Namensraum "System" für allgemeine Operationen auf Systemebene importiert.

using IronPdf;
using System;
using IronPdf;
using System;
Imports IronPdf
Imports System
VB   C#

2. Einstellen des IronPDF-Lizenzschlüssels

IronPDF erfordert einen gültigen Lizenzschlüssel, um in einer Produktionsumgebung verwendet werden zu können. Im Beispielcode gibt es eine Zeile, in der der Lizenzschlüssel festgelegt werden sollte. In dem von Ihnen zur Verfügung gestellten Code bleibt der Lizenzschlüssel jedoch leer "". Stellen Sie sicher, dass Sie die leere Zeichenfolge durch einen gültigen Lizenzschlüssel von IronPDF ersetzen, wenn Sie das Programm in einer Produktionsumgebung verwenden.

IronPdf.License.LicenseKey = "Your_License_Key_Here";
IronPdf.License.LicenseKey = "Your_License_Key_Here";
IronPdf.License.LicenseKey = "Your_License_Key_Here"
VB   C#

3. Laden eines PDF-Dokuments

Der nächste Schritt ist das Laden und Parsen der PDF-Datei. Im vorliegenden Code wird die Methode "PdfDocument.FromFile" verwendet, um eine PDF-Datei mit dem Dateinamen "document_scaled_compressed.pdf" zu laden und sie der Variablen pdf zuzuweisen. Diese PDF-Datei wird für die Textextraktion verwendet.

var pdf = PdfDocument.FromFile("document_scaled_compressed.pdf");
var pdf = PdfDocument.FromFile("document_scaled_compressed.pdf");
Dim pdf = PdfDocument.FromFile("document_scaled_compressed.pdf")
VB   C#

4. Extrahieren von Text aus dem PDF-Dokument

IronPDF bietet eine unkomplizierte Möglichkeit, Text aus einem geladenen PDF-Dokument zu extrahieren. Die extractAllText methode kann den gesamten Textinhalt von jeder Seite des PDF extrahieren und in einer string-Variablen namens text speichern, die als PDF-Konvertierung ****zu Text funktioniert.

string text = pdf.ExtractAllText();
string text = pdf.ExtractAllText();
Dim text As String = pdf.ExtractAllText()
VB   C#

5. Anzeige des extrahierten Textes

Der letzte Schritt ist die Anzeige des extrahierten Textes. Im Code wird Console.WriteLine den extrahierten Text drucken und in die Konsole schreiben. Dies ist eine nützliche Methode zur Fehlersuche oder zur Darstellung des Textes für den Benutzer.

Console.WriteLine(text);
Console.WriteLine(text);
Console.WriteLine(text)
VB   C#

OUTPUT Aus der PDF-Datei extrahierter Text

How to Read PDF Files in C#, Abbildung 7: Der extrahierte Text aus der PDF-Datei

Der extrahierte Text aus der PDF-Datei

Schlussfolgerung

Dieser Artikel hat Entwickler durch den Prozess der effektiven Arbeit mit PDF-Dateien in C# unter Verwendung der IronPDF bibliothek. Zunächst wurde die Einrichtung eines eigenen Visual-Studio-Projekts veranschaulicht und anschließend die unkomplizierte Installation von IronPDF über den NuGet Package Manager. In dem Artikel wird dann Schritt für Schritt erklärt, wie man die erforderlichen Bibliotheken importiert, den IronPDF-Lizenzschlüssel festlegt, eine PDF-Datei lädt, Textinhalte extrahiert und den extrahierten Text aus allen Seiten anzeigt. Sie können den extrahierten Text auch mit C# in einer TXT-Datei speichern.

Mit seinem benutzerfreundlichen Ansatz und seinen umfassenden Funktionen, IronPDF ist ein unverzichtbares Werkzeug für die Automatisierung von Dokumentenprozessen, die Datenextraktion und die PDF-Erstellung aus HTML, URLs und Bildern. Damit ist es ein unschätzbarer Vorteil für die Verbesserung von Softwareentwicklungsprojekten, bei denen PDF-Dateien in C# verarbeitet werden.

Der vollständige Artikel über PDF-Dateien lesen mit IronPDF finden Sie auf den folgenden Seiten anleitungsseite. Das Codebeispiel auf der Seite C# PDF-Leser ist ebenfalls verfügbar. Weitere Code-Beispiele, die IronPDF verwenden, finden Sie hier beispielseite. IronPDF bietet außerdem eine umfangreiche Dokumentation, um Fragen aller Entwickler zu beantworten und umfassenden praktischen Support zu bieten. IronPDF bietet eine kostenlose testlizenz damit die Nutzer den vollen Funktionsumfang erkunden können, bevor sie sich für den Kauf eines unbefristete Lizenz.

< PREVIOUS
Hinzufügen von PDF Stamper in C#
NÄCHSTES >
Komprimieren von PDF-Dateien in der .NET-Bibliothek

Sind Sie bereit, loszulegen? Version: 2024.10 gerade veröffentlicht

Gratis NuGet-Download Downloads insgesamt: 11,308,499 Lizenzen anzeigen >