using IronPdf;
// Disable local disk access or cross-origin requests
Installation.EnableWebSecurity = true;
// Instantiate Renderer
var renderer = new ChromePdfRenderer();
// Create a PDF from a HTML string using C#
var pdf = renderer.RenderHtmlAsPdf("<h1>Hello World</h1>");
// Export to a file or Stream
pdf.SaveAs("output.pdf");
// Advanced Example with HTML Assets
// Load external html assets: Images, CSS and JavaScript.
// An optional BasePath 'C:\site\assets\' is set as the file location to load assets from
var myAdvancedPdf = renderer.RenderHtmlAsPdf("<img src='icons/iron.png'>", @"C:\site\assets\");
myAdvancedPdf.SaveAs("html-with-assets.pdf");
Die programmatische PDF-Verarbeitung ist in Branchen wie dem Finanz-, Gesundheits-, Rechts- und Bildungswesen von entscheidender Bedeutung, da dort wichtige Informationen verarbeitet, analysiert und aus PDF-Dokumenten extrahiert werden müssen, beispielsweise für die Datenanalyse, die Dokumentenverwaltung und die Automatisierung. Trotz ihrer Bedeutung kann diese Aufgabe eine Herausforderung sein.
IronPDF: Eine C# PDF-Bibliothek
IronPDF ermöglicht es Ihnen, unglaublich schwierige Aufgaben leicht zu bewältigen. Es ermöglicht die einfache Bearbeitung von Text in einem PDF-Dokument, ähnlich wie Sie mit Textdateien in einem Textdokument arbeiten können, und erlaubt Ihnen gleichzeitig, Dateien in jedem Betriebssystem zu exportieren. Die IronPDF-Anwendung deckt den gesamten Prozess des Betrachtens, Änderns und Extrahierens von Inhalten aus einem PDF-Dokument ab.
Machen Sie den richtigen Schritt mit IronPDF
Mit der IronPDF-Software können Texte im PDF-Format schnell und einfach auf jedem Computer gelesen und geschrieben werden. Die Installation ist eine einfache Aufgabe. Dies ist der beste Weg, um das Lesen von PDF-Dateien in C# zu lernen. Sie können IronPDF auch kostenlos für die Entwicklung herunterladen. Wenn Sie IronPDF erkunden, werden Sie feststellen, dass die Bibliothek umfangreiche Funktionen bietet, die den Umgang mit PDFs sehr einfach machen. Erkunden Sie den Unterricht in Ihrer Freizeit! Es gibt mehrereC#-Beispiele mit HTML zur Erstellung einer PDF-Datei zur Verfügung, um zu lernen, wie man eine optimale Ausgabe beim Lesen von PDFs erzeugt.
PDF-Dateien mit IronPDF lesen
Schritt 1: Installieren Sie das IronPDF-Paket
Um zu beginnen, müssen Sieinstallieren Sie das IronPDF NuGet-Paket in Ihr .NET-Projekt zu integrieren. Öffnen Sie dazu die Paketmanager-Konsole in Visual Studio und geben Sie den folgenden Befehl ein:
Install-Package IronPdf
Schritt 2: Importieren der IronPDF-Bibliothek
Als nächstes müssen Sie die IronPDF-Bibliothek in Ihren Code importieren, indem Sie die folgende Anweisung am Anfang Ihrer Datei einfügen:
using IronPdf;
using IronPdf;
Imports IronPdf
Schritt 3: Laden des PDF-Dokuments
Sobald Sie die IronPDF-Bibliothek importiert haben, können Sie mit dem folgenden Code ein PDF-Dokument in Ihren Code laden:
PdfDocument pdf = PdfDocument.FromFile(@"C:\dotnet.pdf");
var outputPath = "Example.pdf";
pdf.SaveAs(outputPath);
PdfDocument pdf = PdfDocument.FromFile(@"C:\dotnet.pdf");
var outputPath = "Example.pdf";
pdf.SaveAs(outputPath);
Dim pdf As PdfDocument = PdfDocument.FromFile("C:\dotnet.pdf")
Dim outputPath = "Example.pdf"
pdf.SaveAs(outputPath)
Schritt 4: Text aus der PDF-Datei extrahieren
IronPDF bietet eine Reihe von Methoden, um Text aus einer vorhandenen PDF-Datei zu extrahieren. Sie können beispielsweise mit der Extraktion von Text aus einer PDF-Datei beginnen und ihn auf der Konsole ausgeben, indem Sie das folgende Codefragment verwenden:
string text = pdf.ExtractText();
Console.Writeline(text);
string text = pdf.ExtractText();
Console.Writeline(text);
Dim text As String = pdf.ExtractText()
Console.Writeline(text)
Der Code verwendet dann diemethode RasterizeToImageFiles um alle Seiten des PDF-Dokuments als Bilddateien in einen Ordner zu extrahieren. Die extrahierten Bilder können als PNG- oder JPG-Dateien gespeichert werden, und die Abmessungen und Seitenbereiche der Bilder können ebenfalls angegeben werden.
// Extract all pages to a folder as image files
pdf.RasterizeToImageFiles(@"C:\image\folder\*.png");
// Dimensions and page ranges may be specified
pdf.RasterizeToImageFiles(@"C:\image\folder\example_pdf_image_*.jpg", 100, 80);
// Extract all pages to a folder as image files
pdf.RasterizeToImageFiles(@"C:\image\folder\*.png");
// Dimensions and page ranges may be specified
pdf.RasterizeToImageFiles(@"C:\image\folder\example_pdf_image_*.jpg", 100, 80);
' Extract all pages to a folder as image files
pdf.RasterizeToImageFiles("C:\image\folder\*.png")
' Dimensions and page ranges may be specified
pdf.RasterizeToImageFiles("C:\image\folder\example_pdf_image_*.jpg", 100, 80)
Schließlich verwendet der Code dietoBitmap"-Methode alle Seiten des PDF-Dokuments als `AnyBitmap'-Objekte zu extrahieren, die innerhalb des Codes weiterverarbeitet und manipuliert werden können.
// Extract all pages as AnyBitmap objects
AnyBitmap [] pdfBitmaps = pdf.ToBitmap();
// Extract all pages as AnyBitmap objects
AnyBitmap [] pdfBitmaps = pdf.ToBitmap();
' Extract all pages as AnyBitmap objects
Dim pdfBitmaps() As AnyBitmap = pdf.ToBitmap()
Der obige Code demonstriert, wie man den Inhalt einer PDF-Datei mit IronPDF extrahiert und die extrahierten Daten als Bilddateien oder AnyBitmap-Objekte zur weiteren Verarbeitung speichert.
Der Code entfernt zunächst die Seiten zwei und drei aus dem PDF-Dokument, indem er diemethode RemovePages:
pdf.RemovePages(1, 2);
pdf.RemovePages(1, 2);
pdf.RemovePages(1, 2)
Die Methode RemovePages hat zwei Argumente: die zu entfernende Ausgangsseite(in diesem Fall die Seite 2, dargestellt als 1, da die Seitennummerierung bei 0 beginnt) und die Anzahl der zu entfernenden Seiten(in diesem Fall, 2 Seiten).
Schritt 6: Speichern der PDF-Datei
Schließlich können Sie die PDF-Datei auf Ihrem lokalen System speichern, indem Sie dieSaveAs-Methode. Der Code zum Speichern der PDF-Datei lautet wie folgt:
pdf.SaveAs(OutputPath);
pdf.SaveAs(OutputPath);
pdf.SaveAs(OutputPath)
IronPDF-Kompatibilität
IronPDF ist in hohem Maße kompatibel mit allen aktuellen .NET-Frameworks, einschließlich .NET 7. Es unterstützt auch .NET Blazor und .NET MAUI, die neuesten Angebote von Microsoft für die Webentwicklung. Die Kompatibilität der Bibliothek mit diesen Frameworks ermöglicht es den Entwicklern, IronPDF nahtlos in ihre Anwendungen zu integrieren und die Vorteile der leistungsstarken Funktionen zu nutzen.
Eines der Hauptmerkmale von IronPDF ist die Fähigkeit, PDF-Dateien in .NET Blazor und .NET MAUI zu lesen. Diese Funktion ermöglicht es Entwicklern, schnell und einfach Daten aus PDF-Dateien zu lesen und zu extrahieren und sie in .NET-Anwendungen zu verwenden. Diese Funktion kann besonders hilfreich sein, wenn Sie mit großen Datenmengen arbeiten. Entwickler benötigen keine weitere Bibliothek, um IronPDF in ihrem .NET-Projekt zu verwenden.
Zusammenfassend lässt sich sagen, dass das programmgesteuerte Lesen von PDF-Dateien in verschiedenen Branchen von entscheidender Bedeutung ist. IronPDF bietet eine umfassende Lösung für diese Aufgabe, indem es umfangreiche Funktionen zum Lesen, Ändern und Extrahieren von Inhalten aus einer PDF-Datei bereitstellt. IronPDF ist leicht zu installieren und mit nur wenigen Schritten zu verwenden.
Die Bibliothek bietet Methoden zurtext aus PDF-Dokumenten extrahieren, eine PDF-Datei in ein Bild rastern, Seiten bearbeiten und PDF-Dateien speichern. Egal, ob Sie neu in der programmatischen PDF-Verarbeitung sind oder ein erfahrener Entwickler, IronPDF ist das perfekte Werkzeug, um Ihre Fähigkeiten auf die nächste Stufe zu bringen.
Wenn Sie auf der Suche nach einer zuverlässigen und effizienten Lösung zum Lesen von PDF-Dateien in C# sind, ist IronPDF einen Blick wert, insbesondere mit seinerlizenzoptionen und Preisinformationenund einekostenloser Test verfügbar. Weitere Pläne, die IronPDF zur Verfügung stellt, können Sie in der folgenden Abbildung sehen. Sie können das Paket auswählen, das Ihren Bedürfnissen entspricht.
Regan schloss sein Studium an der University of Reading mit einem BA in Elektrotechnik ab. Bevor er zu Iron Software kam, konzentrierte er sich in seinen früheren Jobs auf einzelne Aufgaben. Was ihm bei Iron Software am meisten Spaß macht, ist das Spektrum der Aufgaben, die er übernehmen kann, sei es im Vertrieb, im technischen Support, in der Produktentwicklung oder im Marketing. Es macht ihm Spaß, die Art und Weise zu verstehen, wie Entwickler die Bibliothek von Iron Software nutzen, und dieses Wissen zu nutzen, um die Dokumentation und die Produkte kontinuierlich zu verbessern.
< PREVIOUS Wie man Word (Docx) in PDF in C# konvertiert (Tutorial)