using IronPdf;
// Disable local disk access or cross-origin requests
Installation.EnableWebSecurity = true;
// Instantiate Renderer
var renderer = new ChromePdfRenderer();
// Create a PDF from a HTML string using C#
var pdf = renderer.RenderHtmlAsPdf("<h1>Hello World</h1>");
// Export to a file or Stream
pdf.SaveAs("output.pdf");
// Advanced Example with HTML Assets
// Load external html assets: Images, CSS and JavaScript.
// An optional BasePath 'C:\site\assets\' is set as the file location to load assets from
var myAdvancedPdf = renderer.RenderHtmlAsPdf("<img src='icons/iron.png'>", @"C:\site\assets\");
myAdvancedPdf.SaveAs("html-with-assets.pdf");
Dieser Artikel wird IronPDF für .NET verwenden, eine C#-PDF-Bibliothek zum Lesen von PDF-Dateien.
Wie man PDF-Dateien mit IronPDF liest
Laden Sie Visual Studio herunter, falls dies noch nicht geschehen ist. Richten Sie die Umgebung ein und installieren Sie IronPDF Library.
Verwenden Sie die Methode PdfDocument.FromFile, um die gewünschte PDF-Datei zu öffnen und zu laden.
Verwenden Sie die ExtractAllText-Methode von IronPDF, um den Inhalt abzurufen.
Analysieren oder manipulieren Sie den extrahierten Text nach Bedarf.
Drucken Sie den extrahierten Text in der Konsole zum Lesen aus.
IronPDF
IronPDF, eine robuste PDF-Lesebibliothek für C#, ermöglicht es Entwicklern, mühelos mit PDF-Dokumenten zu arbeiten. Mit seinen umfangreichen Funktionen und Möglichkeiten vereinfacht IronPDF die Handhabung von PDF-Dokumenten und ermöglicht es den Benutzern, PDF-Inhalte mühelos zu lesen, zu extrahieren und zu manipulieren. Ganz gleich, ob Sie Dokumentenprozesse automatisieren, Daten und Bilder für die Analyse extrahieren oder PDFs von Grund auf neu erstellen, IronPDF bietet ein umfassendes Set von Werkzeugen zur Rationalisierung dieser Aufgaben.
Dieser Artikel erkundet die Welt der effizienten PDF-Verarbeitung in C# mit IronPDF und zeigt seine Vielseitigkeit und seinen Wert als unverzichtbares Werkzeug für Entwickler auf ihrem Weg in der Softwareentwicklung.
Erstellen eines neuen Visual Studio-Projekts
Bevor wir uns mit dem Codieren beschäftigen, beginnen wir damit, ein neues Visual Studio C#-Konsolenanwendungsprojekt einzurichten. Dieses Projekt wird als spezieller Arbeitsbereich für Entwicklung und praktische Beispiele dienen.
Starten Sie dazu Visual Studio und erstellen Sie ein neues Projekt, indem Sie im Menü "Datei" die Option "Neu" und anschließend "Projekt" wählen
Wechseln Sie zum Dialogfeld "Projekt erstellen" in Visual Studio
Daraufhin wird ein neues Fenster angezeigt, in dem Sie die Projektvorlagen festlegen können. Für diese einfachen Zwecke wählen Sie die Vorlage "Konsolenanwendung" und klicken Sie auf die Schaltfläche Weiter, die bewusst in der unteren linken Ecke des Fensters positioniert ist.
Erstellen Sie ein neues Projekt in Visual Studio
Im darauffolgenden Fenster werden Sie aufgefordert, einen Namen für Ihr Projekt zu vergeben und den gewünschten Projektstandort anzugeben. Sobald diese Details vorliegen, klicken Sie auf die Schaltfläche Nächste, um fortzufahren.
Konfigurieren Sie das Projekt
In diesem Schritt wählen Sie das bevorzugte Ziel-Framework aus und schließen den Projekterstellungsprozess ab, indem Sie auf die Schaltfläche Erstellen klicken.
Auswahl des .NET Frameworks
Da Ihr Projekt nun fest etabliert ist, besteht der nächste entscheidende Schritt in der Installation von IronPDF.
Installation von IronPDF
IronPDF bietet eine Vielzahl von Optionen zum Herunterladen und Installieren der PDF-Bibliothek. In diesem Leitfaden liegt der Schwerpunkt auf der Installation von IronPDF mit dem NuGet Package Manager, einer bewährten und weit verbreiteten Methode.
Navigieren Sie in Visual Studio zum Menü "Tools" und fahren Sie mit dem Mauszeiger elegant über die Option "NuGet Package Manager".
Wählen Sie im erweiterten Menü "NuGet Package Manager for Solutions"
Zu NuGet-Paket-Manager navigieren
Wenn Sie diese Option wählen, öffnet sich ein neues Fenster. Navigieren Sie in diesem verfeinerten Fenster zum Menü "Durchsuchen" und geben Sie "IronPDF" in die Suchleiste ein.
Auf dem Bildschirm werden dann die verfügbaren IronPDF-Pakete angezeigt. Um fortzufahren, wählen Sie das neueste Paket aus der Liste und führen Sie es aus, indem Sie auf die Option "Installieren" klicken.
Suchen und installieren Sie das IronPdf-Paket in der NuGet-Paket-Manager-UI
Für diejenigen, die einen eher kommandozeilenorientierten Ansatz bevorzugen, bietet die NuGet Package Manager Console einen eleganten Weg. Öffnen Sie einfach diese Konsole, geben Sie den folgenden Befehl ein und drücken Sie "Enter":
Install-Package IronPdf
Sie haben auch die Möglichkeit, das Paket direkt über den NuGet-Website-Link zu erwerben.
PDF-Dateien mit IronPDF lesen
In diesem Abschnitt wird gezeigt, wie Sie mit Hilfe von IronPDF komplette PDF-Dateien mit der Programmiersprache C# öffnen und lesen können.
using IronPdf;
using System;
IronPdf.License.LicenseKey = "";
//raw text string path
var pdf = PdfDocument.FromFile("document_scaled_compressed.pdf");
string text = pdf.ExtractAllText();
Console.WriteLine(text);
using IronPdf;
using System;
IronPdf.License.LicenseKey = "";
//raw text string path
var pdf = PdfDocument.FromFile("document_scaled_compressed.pdf");
string text = pdf.ExtractAllText();
Console.WriteLine(text);
Imports IronPdf
Imports System
IronPdf.License.LicenseKey = ""
'raw text string path
Dim pdf = PdfDocument.FromFile("document_scaled_compressed.pdf")
Dim text As String = pdf.ExtractAllText()
Console.WriteLine(text)
$vbLabelText $csharpLabel
1. Notwendige Bibliotheken importieren
Für den Anfang müssen Sie die erforderlichen Namensräume importieren. Im obigen Codebeispiel wird der IronPdf-Namespace importiert, der die wesentlichen Funktionen zum Arbeiten mit PDFs enthält. Zusätzlich wird der System-Namensraum auch für allgemeine Systemebenenoperationen importiert.
using IronPdf;
using System;
using IronPdf;
using System;
Imports IronPdf
Imports System
$vbLabelText $csharpLabel
2. Einstellen des IronPDF-Lizenzschlüssels
IronPDF erfordert einen gültigen Lizenzschlüssel, um in einer Produktionsumgebung verwendet zu werden. Im Beispielcode gibt es eine Zeile, in der der Lizenzschlüssel festgelegt werden sollte. Jedoch ist in Ihrem angegebenen Code der Lizenzschlüssel leer "". Stellen Sie sicher, dass Sie die leere Zeichenfolge durch einen gültigen Lizenzschlüssel von IronPDF ersetzen, wenn Sie das Programm in einer Produktionsumgebung verwenden.
Der nächste Schritt besteht darin, die PDF-Datei zu laden und zu parsen. Im bereitgestellten Code wird die Methode PdfDocument.FromFile verwendet, um eine PDF-Datei mit dem Dateinamen "document_scaled_compressed.pdf" zu laden und sie der Variablen pdf zuzuweisen. Diese PDF-Datei wird für die Textextraktion verwendet.
var pdf = PdfDocument.FromFile("document_scaled_compressed.pdf");
var pdf = PdfDocument.FromFile("document_scaled_compressed.pdf");
Dim pdf = PdfDocument.FromFile("document_scaled_compressed.pdf")
$vbLabelText $csharpLabel
4. Extrahieren von Text aus dem PDF-Dokument
IronPDF bietet eine unkomplizierte Möglichkeit, Text aus einem geladenen PDF-Dokument zu extrahieren. Die ExtractAllText-Methode kann den gesamten Textinhalt jeder Seite des PDFs extrahieren und in einer string-Variablen namens text speichern, wodurch das PDF in Text konvertiert wird.
string text = pdf.ExtractAllText();
string text = pdf.ExtractAllText();
Dim text As String = pdf.ExtractAllText()
$vbLabelText $csharpLabel
5. Anzeige des extrahierten Textes
Der letzte Schritt ist die Anzeige des extrahierten Textes. Im Code wird Console.WriteLine den extrahierten Text in die Konsole ausgeben und schreiben. Dies ist eine nützliche Methode zur Fehlersuche oder zur Darstellung des Textes für den Benutzer.
Console.WriteLine(text);
Console.WriteLine(text);
Console.WriteLine(text)
$vbLabelText $csharpLabel
OUTPUT Aus der PDF-Datei extrahierter Text
Der extrahierte Text aus der PDF-Datei
Schlussfolgerung
Dieser Artikel hat Entwickler durch den Prozess des effektiven Arbeitens mit PDF-Dateien in C# unter Verwendung der IronPDF-Bibliothek geführt. Zunächst wurde die Einrichtung eines eigenen Visual-Studio-Projekts veranschaulicht und anschließend die unkomplizierte Installation von IronPDF über den NuGet Package Manager. In dem Artikel wird dann Schritt für Schritt erklärt, wie man die erforderlichen Bibliotheken importiert, den IronPDF-Lizenzschlüssel festlegt, eine PDF-Datei lädt, Textinhalte extrahiert und den extrahierten Text aus allen Seiten anzeigt. Sie können den extrahierten Text auch mit C# in einer TXT-Datei speichern.
Mit seinem benutzerfreundlichen Ansatz und umfassenden Funktionen dient IronPDF als unverzichtbares Werkzeug zur Automatisierung von Dokumentenprozessen, Datenauswertung und PDF-Erstellung aus HTML, URLs und Bildern, was es zu einem unschätzbaren Vorteil für die Verbesserung von Softwareentwicklungsprojekten macht, die die Handhabung von PDF-Dateien in C# beinhalten.
Der vollständige Artikel zum Lesen von PDF-Dateien mit IronPDF ist auf der folgenden Anleitungsseite zu finden. Das Codebeispiel auf dem C# PDF-Reader ist ebenfalls verfügbar. Weitere Code-Beispiele zur Verwendung von IronPDF finden Sie auf dieser Beispielseite. IronPDF bietet außerdem eine umfangreiche Dokumentation, um Fragen aller Entwickler zu beantworten und umfassenden praktischen Support zu bieten. IronPDF bietet eine kostenlose Testlizenz an, damit die Benutzer seine volle Funktionalität erkunden können, bevor sie sich zum Kauf einer dauerhaften Lizenz entscheiden.
Chipego hat eine natürliche Fähigkeit zum Zuhören, die ihm hilft, Kundenprobleme zu verstehen und intelligente Lösungen anzubieten. Er trat dem Iron Software-Team 2023 bei, nachdem er einen Bachelor of Science in Informationstechnologie erworben hatte. IronPDF und IronOCR sind die beiden Produkte, auf die sich Chipego konzentriert hat, aber sein Wissen über alle Produkte wächst täglich, da er neue Wege findet, Kunden zu unterstützen. Er genießt die Zusammenarbeit bei Iron Software, da Teammitglieder aus dem gesamten Unternehmen ihre unterschiedlichen Erfahrungen einbringen und so zu effektiven, innovativen Lösungen beitragen. Wenn Chipego nicht an seinem Schreibtisch sitzt, kann man ihn oft bei einem guten Buch oder beim Fußballspielen antreffen.