Test in einer Live-Umgebung
Test in der Produktion ohne Wasserzeichen.
Funktioniert überall, wo Sie es brauchen.
Dieser Artikel verwendet IronPDF für .NET, eine C# PDF-Bibliothek zum Lesen von PDF-Dateien.
Laden Sie Visual Studio herunter, falls dies noch nicht geschehen ist. Richten Sie die Umgebung ein und installieren Sie IronPDF Library.
Verwenden Sie pdfDocument.FromFile methode, um die gewünschte PDF-Datei zu öffnen und zu laden.
Verwenden Sie die IronPDF-Methode ExtractAllText
, um den Inhalt abzurufen.
Analysieren oder manipulieren Sie den extrahierten Text nach Bedarf.
IronPDF, eine robuste PDF-Reader-Bibliothek für C#, ermöglicht Entwicklern die mühelose Arbeit mit PDF-Dokumenten. Mit seinen umfangreichen Funktionen und Möglichkeiten vereinfacht IronPDF die Handhabung von PDF-Dokumenten und ermöglicht es den Benutzern, PDF-Inhalte mühelos zu lesen, zu extrahieren und zu manipulieren. Ganz gleich, ob Sie Dokumentenprozesse automatisieren, Daten und Bilder für die Analyse extrahieren oder PDFs von Grund auf neu erstellen, IronPDF bietet ein umfassendes Set von Werkzeugen zur Rationalisierung dieser Aufgaben.
Dieser Artikel erkundet die Welt der effizienten PDF-Verarbeitung in C# mit IronPDFund zeigt seine Vielseitigkeit und seinen Wert als unverzichtbares Werkzeug für Entwickler auf ihrem Weg zur Softwareentwicklung.
Bevor wir uns mit der Codierung befassen, sollten wir zunächst eine neue Visual Studio C#-Konsolenanwendungsprojekt. Dieses Projekt wird als spezieller Arbeitsbereich für Entwicklung und praktische Beispiele dienen.
Starten Sie dazu Visual Studio und erstellen Sie ein neues Projekt, indem Sie im Menü "Datei" die Option "Neu" und anschließend "Projekt" wählen
Navigieren Sie zum Dialogfeld Projekt erstellen in Visual Studio
Daraufhin wird ein neues Fenster angezeigt, in dem Sie die Projektvorlagen festlegen können. Entscheiden Sie sich der Einfachheit halber für die Vorlage "Konsolenanwendung" und klicken Sie auf die Schaltfläche Weiter, die sich sinnvollerweise in der linken unteren Ecke des Fensters befindet.
Erstellen Sie ein neues Projekt in Visual Studio
Im darauffolgenden Fenster werden Sie aufgefordert, einen Namen für Ihr Projekt zu vergeben und den gewünschten Projektstandort anzugeben. Sobald Sie diese Angaben gemacht haben, klicken Sie auf die Schaltfläche Weiter, um fortzufahren.
Konfigurieren Sie das Projekt
Wählen Sie in diesem Schritt Ihr bevorzugtes Zielframework aus und schließen Sie die Projekterstellung mit einem Klick auf die Schaltfläche Erstellen ab.
.NET-Framework-Auswahl
Nachdem Ihr Projekt nun feststeht, ist der nächste wichtige Schritt die Installation von IronPDF.
IronPDF bietet eine Vielzahl von Möglichkeiten zum Herunterladen und Installieren der PDF-Bibliothek. In diesem Leitfaden liegt der Schwerpunkt auf der Installation von IronPDF mit dem NuGet Package Manager, einer bewährten und weit verbreiteten Methode.
Navigieren Sie in Visual Studio zum Menü "Tools" und fahren Sie mit dem Mauszeiger elegant über die Option "NuGet Package Manager".
Wählen Sie im erweiterten Menü "NuGet Package Manager for Solutions"
Navigieren Sie zu NuGet Package Manager
Wenn Sie diese Option wählen, öffnet sich ein neues Fenster. Navigieren Sie in diesem verfeinerten Fenster zum Menü "Durchsuchen" und geben Sie "IronPDF" in die Suchleiste ein.
Auf dem Bildschirm werden dann die verfügbaren IronPDF-Pakete angezeigt. Um fortzufahren, wählen Sie das neueste Paket aus der Liste und führen Sie es aus, indem Sie auf die Option "Installieren" klicken.
Suchen und installieren Sie das IronPDF-Paket in der NuGet Package Manager UI
Für diejenigen, die einen eher kommandozeilenorientierten Ansatz bevorzugen, bietet die NuGet Package Manager Console einen eleganten Weg. Öffnen Sie einfach diese Konsole, geben Sie den folgenden Befehl ein und drücken Sie "Enter":
Install-Package IronPdf
Sie haben auch die Möglichkeit, das Paket direkt bei der NuGet-Website link.
In diesem Abschnitt wird gezeigt, wie Sie mit Hilfe von IronPDF komplette PDF-Dateien mit der Programmiersprache C# öffnen und lesen können.
using IronPdf;
using System;
IronPdf.License.LicenseKey = "";
//raw text string path
var pdf = PdfDocument.FromFile("document_scaled_compressed.pdf");
string text = pdf.ExtractAllText();
Console.WriteLine(text);
using IronPdf;
using System;
IronPdf.License.LicenseKey = "";
//raw text string path
var pdf = PdfDocument.FromFile("document_scaled_compressed.pdf");
string text = pdf.ExtractAllText();
Console.WriteLine(text);
Imports IronPdf
Imports System
IronPdf.License.LicenseKey = ""
'raw text string path
Dim pdf = PdfDocument.FromFile("document_scaled_compressed.pdf")
Dim text As String = pdf.ExtractAllText()
Console.WriteLine(text)
Für den Anfang müssen Sie die erforderlichen Namensräume importieren. Im obigen Codebeispiel wird der Namespace IronPdf
importiert, der die wesentlichen Funktionen für die Arbeit mit PDFs enthält. Darüber hinaus wird auch der Namensraum "System" für allgemeine Operationen auf Systemebene importiert.
using IronPdf;
using System;
using IronPdf;
using System;
Imports IronPdf
Imports System
IronPDF erfordert einen gültigen Lizenzschlüssel, um in einer Produktionsumgebung verwendet werden zu können. Im Beispielcode gibt es eine Zeile, in der der Lizenzschlüssel festgelegt werden sollte. In dem von Ihnen zur Verfügung gestellten Code bleibt der Lizenzschlüssel jedoch leer ""
. Stellen Sie sicher, dass Sie die leere Zeichenfolge durch einen gültigen Lizenzschlüssel von IronPDF ersetzen, wenn Sie das Programm in einer Produktionsumgebung verwenden.
IronPdf.License.LicenseKey = "Your_License_Key_Here";
IronPdf.License.LicenseKey = "Your_License_Key_Here";
IronPdf.License.LicenseKey = "Your_License_Key_Here"
Der nächste Schritt ist das Laden und Parsen der PDF-Datei. Im vorliegenden Code wird die Methode "PdfDocument.FromFile" verwendet, um eine PDF-Datei mit dem Dateinamen "document_scaled_compressed.pdf" zu laden und sie der Variablen pdf zuzuweisen. Diese PDF-Datei wird für die Textextraktion verwendet.
var pdf = PdfDocument.FromFile("document_scaled_compressed.pdf");
var pdf = PdfDocument.FromFile("document_scaled_compressed.pdf");
Dim pdf = PdfDocument.FromFile("document_scaled_compressed.pdf")
IronPDF bietet eine unkomplizierte Möglichkeit, Text aus einem geladenen PDF-Dokument zu extrahieren. Die extractAllText methode kann den gesamten Textinhalt von jeder Seite des PDF extrahieren und in einer string-Variablen namens text speichern, die als PDF-Konvertierung ****zu Text funktioniert.
string text = pdf.ExtractAllText();
string text = pdf.ExtractAllText();
Dim text As String = pdf.ExtractAllText()
Der letzte Schritt ist die Anzeige des extrahierten Textes. Im Code wird Console.WriteLine den extrahierten Text drucken und in die Konsole schreiben. Dies ist eine nützliche Methode zur Fehlersuche oder zur Darstellung des Textes für den Benutzer.
Console.WriteLine(text);
Console.WriteLine(text);
Console.WriteLine(text)
Der extrahierte Text aus der PDF-Datei
Dieser Artikel hat Entwickler durch den Prozess der effektiven Arbeit mit PDF-Dateien in C# unter Verwendung der IronPDF bibliothek. Zunächst wurde die Einrichtung eines eigenen Visual-Studio-Projekts veranschaulicht und anschließend die unkomplizierte Installation von IronPDF über den NuGet Package Manager. In dem Artikel wird dann Schritt für Schritt erklärt, wie man die erforderlichen Bibliotheken importiert, den IronPDF-Lizenzschlüssel festlegt, eine PDF-Datei lädt, Textinhalte extrahiert und den extrahierten Text aus allen Seiten anzeigt. Sie können den extrahierten Text auch mit C# in einer TXT-Datei speichern.
Mit seinem benutzerfreundlichen Ansatz und seinen umfassenden Funktionen, IronPDF ist ein unverzichtbares Werkzeug für die Automatisierung von Dokumentenprozessen, die Datenextraktion und die PDF-Erstellung aus HTML, URLs und Bildern. Damit ist es ein unschätzbarer Vorteil für die Verbesserung von Softwareentwicklungsprojekten, bei denen PDF-Dateien in C# verarbeitet werden.
Der vollständige Artikel über PDF-Dateien lesen mit IronPDF finden Sie auf den folgenden Seiten anleitungsseite. Das Codebeispiel auf der Seite C# PDF-Leser ist ebenfalls verfügbar. Weitere Code-Beispiele, die IronPDF verwenden, finden Sie hier beispielseite. IronPDF bietet außerdem eine umfangreiche Dokumentation, um Fragen aller Entwickler zu beantworten und umfassenden praktischen Support zu bieten. IronPDF bietet eine kostenlose testlizenz damit die Nutzer den vollen Funktionsumfang erkunden können, bevor sie sich für den Kauf eines unbefristete Lizenz.
9 .NET API-Produkte für Ihre Bürodokumente