using IronPdf; // Disable local disk access or cross-origin requests Installation.EnableWebSecurity = true; // Instantiate Renderer var renderer = new ChromePdfRenderer(); // Create a PDF from a HTML string using C# var pdf = renderer.RenderHtmlAsPdf("<h1>Hello World</h1>"); // Export to a file or Stream pdf.SaveAs("output.pdf"); // Advanced Example with HTML Assets // Load external html assets: Images, CSS and JavaScript. // An optional BasePath 'C:\site\assets\' is set as the file location to load assets from var myAdvancedPdf = renderer.RenderHtmlAsPdf("<img src='icons/iron.png'>", @"C:\site\assets\"); myAdvancedPdf.SaveAs("html-with-assets.pdf");

IRONPDF VERWENDEN

Wie man PDF-Dateien in C# liest

Regan Pun

22. Februar 2023

Aktualisiert 25. Februar 2024

Teilen Sie:

Die programmatische PDF-Verarbeitung ist in Branchen wie dem Finanz-, Gesundheits-, Rechts- und Bildungswesen von entscheidender Bedeutung, da dort wichtige Informationen verarbeitet, analysiert und aus PDF-Dokumenten extrahiert werden müssen, beispielsweise für die Datenanalyse, die Dokumentenverwaltung und die Automatisierung. Trotz ihrer Bedeutung kann diese Aufgabe eine Herausforderung sein.

IronPDF: Eine C# PDF-Bibliothek

IronPDF ermöglicht es Ihnen, unglaublich schwierige Aufgaben leicht zu bewältigen. Es ermöglicht die einfache Bearbeitung von Text in einem PDF-Dokument, ähnlich wie Sie mit Textdateien in einem Textdokument arbeiten können, und erlaubt Ihnen gleichzeitig, Dateien in jedem Betriebssystem zu exportieren. Die IronPDF-Anwendung deckt den gesamten Prozess des Betrachtens, Änderns und Extrahierens von Inhalten aus einem PDF-Dokument ab.

Machen Sie den richtigen Schritt mit IronPDF

Mit der IronPDF-Software können Texte im PDF-Format schnell und einfach auf jedem Computer gelesen und geschrieben werden. Die Installation ist eine einfache Aufgabe. Dies ist der beste Weg, um das Lesen von PDF-Dateien in C# zu lernen. Sie können IronPDF auch kostenlos für die Entwicklung herunterladen. Wenn Sie IronPDF erkunden, werden Sie feststellen, dass die Bibliothek umfangreiche Funktionen bietet, die den Umgang mit PDFs sehr einfach machen. Erkunden Sie den Unterricht in Ihrer Freizeit! Es gibt mehrereC#-Beispiele mit HTML zur Erstellung einer PDF-Datei zur Verfügung, um zu lernen, wie man eine optimale Ausgabe beim Lesen von PDFs erzeugt.

PDF-Dateien mit IronPDF lesen

Schritt 1: Installieren Sie das IronPDF-Paket

Um zu beginnen, müssen Sieinstallieren Sie das IronPDF NuGet-Paket in Ihr .NET-Projekt zu integrieren. Öffnen Sie dazu die Paketmanager-Konsole in Visual Studio und geben Sie den folgenden Befehl ein:

Install-Package IronPdf

Schritt 2: Importieren der IronPDF-Bibliothek

Als nächstes müssen Sie die IronPDF-Bibliothek in Ihren Code importieren, indem Sie die folgende Anweisung am Anfang Ihrer Datei einfügen:

using IronPdf;

using IronPdf;

Imports IronPdf

Schritt 3: Laden des PDF-Dokuments

Sobald Sie die IronPDF-Bibliothek importiert haben, können Sie mit dem folgenden Code ein PDF-Dokument in Ihren Code laden:

PdfDocument pdf = PdfDocument.FromFile(@"C:\dotnet.pdf");
var outputPath = "Example.pdf";
pdf.SaveAs(outputPath);

PdfDocument pdf = PdfDocument.FromFile(@"C:\dotnet.pdf");
var outputPath = "Example.pdf";
pdf.SaveAs(outputPath);

Dim pdf As PdfDocument = PdfDocument.FromFile("C:\dotnet.pdf")
Dim outputPath = "Example.pdf"
pdf.SaveAs(outputPath)

Schritt 4: Text aus der PDF-Datei extrahieren

IronPDF bietet eine Reihe von Methoden, um Text aus einer vorhandenen PDF-Datei zu extrahieren. Sie können beispielsweise mit der Extraktion von Text aus einer PDF-Datei beginnen und ihn auf der Konsole ausgeben, indem Sie das folgende Codefragment verwenden:

string text = pdf.ExtractText();
Console.Writeline(text);

string text = pdf.ExtractText();
Console.Writeline(text);

Dim text As String = pdf.ExtractText()
Console.Writeline(text)

Mit dem obigen Code können Sietext aus einer PDF-Datei extrahieren.

Wie man PDF-Dateien in C# liest, Abbildung 1: Extrahieren von Text aus einer PDF-Datei mit IronPDF

**Extrahieren von Text aus einem PDF-Dokument mit IronPDF

Schritt 5: PDF in Bilder rastern

Lasst unspDF-Datei mit IronPDF in Bilder rastern ironPDF verwenden. Importieren Sie zunächst die erforderlichen Bibliotheken:

using System.Linq;
using IronPdf;
using IronSoftware.Drawing;

using System.Linq;
using IronPdf;
using IronSoftware.Drawing;

Imports System.Linq
Imports IronPdf
Imports IronSoftware.Drawing

Der Code verwendet dann diemethode RasterizeToImageFiles um alle Seiten des PDF-Dokuments als Bilddateien in einen Ordner zu extrahieren. Die extrahierten Bilder können als PNG- oder JPG-Dateien gespeichert werden, und die Abmessungen und Seitenbereiche der Bilder können ebenfalls angegeben werden.

// Extract all pages to a folder as image files
pdf.RasterizeToImageFiles(@"C:\image\folder\*.png");

// Dimensions and page ranges may be specified
pdf.RasterizeToImageFiles(@"C:\image\folder\example_pdf_image_*.jpg", 100, 80);

// Extract all pages to a folder as image files
pdf.RasterizeToImageFiles(@"C:\image\folder\*.png");

// Dimensions and page ranges may be specified
pdf.RasterizeToImageFiles(@"C:\image\folder\example_pdf_image_*.jpg", 100, 80);

' Extract all pages to a folder as image files
pdf.RasterizeToImageFiles("C:\image\folder\*.png")

' Dimensions and page ranges may be specified
pdf.RasterizeToImageFiles("C:\image\folder\example_pdf_image_*.jpg", 100, 80)

Schließlich verwendet der Code dietoBitmap"-Methode alle Seiten des PDF-Dokuments als `AnyBitmap'-Objekte zu extrahieren, die innerhalb des Codes weiterverarbeitet und manipuliert werden können.

// Extract all pages as AnyBitmap objects
AnyBitmap [] pdfBitmaps = pdf.ToBitmap();

// Extract all pages as AnyBitmap objects
AnyBitmap [] pdfBitmaps = pdf.ToBitmap();

' Extract all pages as AnyBitmap objects
Dim pdfBitmaps() As AnyBitmap = pdf.ToBitmap()

Der obige Code demonstriert, wie man den Inhalt einer PDF-Datei mit IronPDF extrahiert und die extrahierten Daten als Bilddateien oder AnyBitmap-Objekte zur weiteren Verarbeitung speichert.

Schritt 7: PDF-Seiten manipulieren

Wir wollen lernen, wie mandie Seiten eines PDF-Dokuments manipulieren durch Lesen der PDF-Datei mit IronPDF.

Der Code entfernt zunächst die Seiten zwei und drei aus dem PDF-Dokument, indem er diemethode RemovePages:

pdf.RemovePages(1, 2);

pdf.RemovePages(1, 2);

pdf.RemovePages(1, 2)

Die Methode RemovePages hat zwei Argumente: die zu entfernende Ausgangsseite(in diesem Fall die Seite 2, dargestellt als 1, da die Seitennummerierung bei 0 beginnt) und die Anzahl der zu entfernenden Seiten(in diesem Fall, 2 Seiten).

Schritt 6: Speichern der PDF-Datei

Schließlich können Sie die PDF-Datei auf Ihrem lokalen System speichern, indem Sie dieSaveAs-Methode. Der Code zum Speichern der PDF-Datei lautet wie folgt:

pdf.SaveAs(OutputPath);

pdf.SaveAs(OutputPath);

pdf.SaveAs(OutputPath)

IronPDF-Kompatibilität

IronPDF ist in hohem Maße kompatibel mit allen aktuellen .NET-Frameworks, einschließlich .NET 7. Es unterstützt auch .NET Blazor und .NET MAUI, die neuesten Angebote von Microsoft für die Webentwicklung. Die Kompatibilität der Bibliothek mit diesen Frameworks ermöglicht es den Entwicklern, IronPDF nahtlos in ihre Anwendungen zu integrieren und die Vorteile der leistungsstarken Funktionen zu nutzen.

Eines der Hauptmerkmale von IronPDF ist die Fähigkeit, PDF-Dateien in .NET Blazor und .NET MAUI zu lesen. Diese Funktion ermöglicht es Entwicklern, schnell und einfach Daten aus PDF-Dateien zu lesen und zu extrahieren und sie in .NET-Anwendungen zu verwenden. Diese Funktion kann besonders hilfreich sein, wenn Sie mit großen Datenmengen arbeiten. Entwickler benötigen keine weitere Bibliothek, um IronPDF in ihrem .NET-Projekt zu verwenden.

Erfahren Sie mehr überIronPDF im Einsatz mit .NET Blazor in diesem Tutorial und erfahren Sie mehr überintegration von IronPDF mit .NET MAUI auf der Website von IronPDF.

Schlussfolgerung

Zusammenfassend lässt sich sagen, dass das programmgesteuerte Lesen von PDF-Dateien in verschiedenen Branchen von entscheidender Bedeutung ist. IronPDF bietet eine umfassende Lösung für diese Aufgabe, indem es umfangreiche Funktionen zum Lesen, Ändern und Extrahieren von Inhalten aus einer PDF-Datei bereitstellt. IronPDF ist leicht zu installieren und mit nur wenigen Schritten zu verwenden.

Die Bibliothek bietet Methoden zurtext aus PDF-Dokumenten extrahieren, eine PDF-Datei in ein Bild rastern, Seiten bearbeiten und PDF-Dateien speichern. Egal, ob Sie neu in der programmatischen PDF-Verarbeitung sind oder ein erfahrener Entwickler, IronPDF ist das perfekte Werkzeug, um Ihre Fähigkeiten auf die nächste Stufe zu bringen.

Wenn Sie auf der Suche nach einer zuverlässigen und effizienten Lösung zum Lesen von PDF-Dateien in C# sind, ist IronPDF einen Blick wert, insbesondere mit seinerlizenzoptionen und Preisinformationenund einekostenloser Test verfügbar. Weitere Pläne, die IronPDF zur Verfügung stellt, können Sie in der folgenden Abbildung sehen. Sie können das Paket auswählen, das Ihren Bedürfnissen entspricht.

Wie man PDF-Dateien in C# liest, Abbildung 2: IronPDF-Lizenzierungspreise

IronPDF-Lizenzierungspreise

Regan Pun

Jetzt mit dem Ingenieurteam chatten

Software-Ingenieur

Regan schloss sein Studium an der University of Reading mit einem BA in Elektrotechnik ab. Bevor er zu Iron Software kam, konzentrierte er sich in seinen früheren Jobs auf einzelne Aufgaben. Was ihm bei Iron Software am meisten Spaß macht, ist das Spektrum der Aufgaben, die er übernehmen kann, sei es im Vertrieb, im technischen Support, in der Produktentwicklung oder im Marketing. Es macht ihm Spaß, die Art und Weise zu verstehen, wie Entwickler die Bibliothek von Iron Software nutzen, und dieses Wissen zu nutzen, um die Dokumentation und die Produkte kontinuierlich zu verbessern.

< PREVIOUS
Wie man Word (Docx) in PDF in C# konvertiert (Tutorial)

NÄCHSTES >
Sollten Sie IronPDF kaufen?