IRONPDF VERWENDEN

Wie man PDF-Dateien in C# liest

Die programmatische PDF-Verarbeitung ist in Branchen wie dem Finanz-, Gesundheits-, Rechts- und Bildungswesen von entscheidender Bedeutung, da dort wichtige Informationen verarbeitet, analysiert und aus PDF-Dokumenten extrahiert werden müssen, beispielsweise für die Datenanalyse, die Dokumentenverwaltung und die Automatisierung. Trotz ihrer Bedeutung kann diese Aufgabe eine Herausforderung sein.

IronPDF: Eine C# PDF-Bibliothek

IronPDF ermöglicht es Ihnen, unglaublich schwierige Aufgaben leicht zu bewältigen. Es ermöglicht die einfache Bearbeitung von Text in einem PDF-Dokument, ähnlich wie Sie mit Textdateien in einem Textdokument arbeiten können, und erlaubt Ihnen gleichzeitig, Dateien in jedem Betriebssystem zu exportieren. Die IronPDF-Anwendung deckt den gesamten Prozess des Betrachtens, Änderns und Extrahierens von Inhalten aus einem PDF-Dokument ab.

Machen Sie den richtigen Schritt mit IronPDF

Mit der IronPDF-Software können Texte im PDF-Format schnell und einfach auf jedem Computer gelesen und geschrieben werden. Die Installation ist eine einfache Aufgabe. Dies ist der beste Weg, um das Lesen von PDF-Dateien in C# zu lernen. Sie können IronPDF auch kostenlos für die Entwicklung herunterladen. Wenn Sie IronPDF erkunden, werden Sie feststellen, dass die Bibliothek umfangreiche Funktionen bietet, die den Umgang mit PDFs sehr einfach machen. Erkunden Sie Klassen in Ihrer Freizeit! Es gibt mehrere C#-Beispiele zur Erstellung eines PDFs mit HTML, um zu lernen, wie man eine optimale Ausgabe aus dem Lesen von PDFs erstellt.

PDF-Dateien mit IronPDF lesen

Schritt 1: Installieren Sie das IronPDF-Paket

Um zu beginnen, müssen Sie das IronPDF NuGet-Paket in Ihr .NET-Projekt installieren. Öffnen Sie dazu die Paketmanager-Konsole in Visual Studio und geben Sie den folgenden Befehl ein:

Install-Package IronPdf

Schritt 2: Importieren der IronPDF-Bibliothek

Als nächstes müssen Sie die IronPDF-Bibliothek in Ihren Code importieren, indem Sie die folgende Anweisung am Anfang Ihrer Datei einfügen:

using IronPdf;
using IronPdf;
Imports IronPdf
$vbLabelText   $csharpLabel

Schritt 3: Laden des PDF-Dokuments

Sobald Sie die IronPDF-Bibliothek importiert haben, können Sie mit dem folgenden Code ein PDF-Dokument in Ihren Code laden:

PdfDocument pdf = PdfDocument.FromFile(@"C:\dotnet.pdf");
var outputPath = "Example.pdf";
pdf.SaveAs(outputPath);
PdfDocument pdf = PdfDocument.FromFile(@"C:\dotnet.pdf");
var outputPath = "Example.pdf";
pdf.SaveAs(outputPath);
Dim pdf As PdfDocument = PdfDocument.FromFile("C:\dotnet.pdf")
Dim outputPath = "Example.pdf"
pdf.SaveAs(outputPath)
$vbLabelText   $csharpLabel

Schritt 4: Text aus der PDF-Datei extrahieren

IronPDF bietet eine Reihe von Methoden, um Text aus einer vorhandenen PDF-Datei zu extrahieren. Sie können beispielsweise mit der Extraktion von Text aus einer PDF-Datei beginnen und ihn auf der Konsole ausgeben, indem Sie das folgende Codefragment verwenden:

string text = pdf.ExtractText();
Console.Writeline(text);
string text = pdf.ExtractText();
Console.Writeline(text);
Dim text As String = pdf.ExtractText()
Console.Writeline(text)
$vbLabelText   $csharpLabel

Mit dem obigen Code können Sie Text aus einer PDF-Datei extrahieren.

Wie man PDF-Dateien in C# liest, Abbildung 1: Extrahieren von Text aus einem PDF mit IronPDF

Extrahieren von Text aus einem PDF mit IronPDF

Schritt 5: PDF in Bilder rastern

Lassen Sie uns die PDF-Datei mit IronPDF zu Bildern rasterisieren und IronPDF verwenden. Importieren Sie zunächst die erforderlichen Bibliotheken:

using System.Linq;
using IronPdf;
using IronSoftware.Drawing;
using System.Linq;
using IronPdf;
using IronSoftware.Drawing;
Imports System.Linq
Imports IronPdf
Imports IronSoftware.Drawing
$vbLabelText   $csharpLabel

Der Code verwendet dann die RasterizeToImageFiles-Methode, um alle Seiten des PDF-Dokuments in einem Ordner als Bilddateien zu extrahieren. Die extrahierten Bilder können als PNG- oder JPG-Dateien gespeichert werden, und die Abmessungen und Seitenbereiche der Bilder können ebenfalls angegeben werden.

// Extract all pages to a folder as image files
pdf.RasterizeToImageFiles(@"C:\image\folder\*.png");

// Dimensions and page ranges may be specified
pdf.RasterizeToImageFiles(@"C:\image\folder\example_pdf_image_*.jpg", 100, 80);
// Extract all pages to a folder as image files
pdf.RasterizeToImageFiles(@"C:\image\folder\*.png");

// Dimensions and page ranges may be specified
pdf.RasterizeToImageFiles(@"C:\image\folder\example_pdf_image_*.jpg", 100, 80);
' Extract all pages to a folder as image files
pdf.RasterizeToImageFiles("C:\image\folder\*.png")

' Dimensions and page ranges may be specified
pdf.RasterizeToImageFiles("C:\image\folder\example_pdf_image_*.jpg", 100, 80)
$vbLabelText   $csharpLabel

Schließlich verwendet der Code die ToBitmap-Methode, um alle Seiten des PDF-Dokuments als AnyBitmap-Objekte zu extrahieren, die im Code weiter verarbeitet und bearbeitet werden können.

// Extract all pages as AnyBitmap objects
AnyBitmap [] pdfBitmaps = pdf.ToBitmap();
// Extract all pages as AnyBitmap objects
AnyBitmap [] pdfBitmaps = pdf.ToBitmap();
' Extract all pages as AnyBitmap objects
Dim pdfBitmaps() As AnyBitmap = pdf.ToBitmap()
$vbLabelText   $csharpLabel

Der obige Code demonstriert, wie der Inhalt einer PDF-Datei mit IronPDF extrahiert und die extrahierten Daten als Bilddateien oder AnyBitmap-Objekte zur weiteren Verarbeitung gespeichert werden können.

Schritt 7: PDF-Seiten manipulieren

Lassen Sie uns lernen, wie man die Seiten eines PDF-Dokuments manipuliert, indem wir die PDF-Datei mit IronPDF lesen.

Der Code entfernt zuerst die Seiten zwei und drei aus dem PDF-Dokument mit der RemovePages-Methode:

pdf.RemovePages(1, 2);
pdf.RemovePages(1, 2);
pdf.RemovePages(1, 2)
$vbLabelText   $csharpLabel

Die RemovePages-Methode nimmt zwei Argumente: die Startseite, die entfernt werden soll (in diesem Fall Seite 2, die als 1 dargestellt wird, da die Seitennummerierung bei 0 beginnt) und die Anzahl der Seiten, die entfernt werden sollen (in diesem Fall 2 Seiten).

Schritt 6: Speichern der PDF-Datei

Schließlich können Sie die PDF-Datei mit der SaveAs-Methode auf Ihrem lokalen System speichern. Der Code zum Speichern der PDF-Datei lautet wie folgt:

pdf.SaveAs(OutputPath);
pdf.SaveAs(OutputPath);
pdf.SaveAs(OutputPath)
$vbLabelText   $csharpLabel

IronPDF-Kompatibilität

IronPDF ist in hohem Maße kompatibel mit allen aktuellen .NET-Frameworks, einschließlich .NET 7. Es unterstützt auch .NET Blazor und .NET MAUI, die neuesten Angebote von Microsoft für die Webentwicklung. Die Kompatibilität der Bibliothek mit diesen Frameworks ermöglicht es den Entwicklern, IronPDF nahtlos in ihre Anwendungen zu integrieren und die Vorteile der leistungsstarken Funktionen zu nutzen.

Eines der Hauptmerkmale von IronPDF ist die Fähigkeit, PDF-Dateien in .NET Blazor und .NET MAUI zu lesen. Diese Funktion ermöglicht es Entwicklern, schnell und einfach Daten aus PDF-Dateien zu lesen und zu extrahieren und sie in .NET-Anwendungen zu verwenden. Diese Funktion kann besonders hilfreich sein, wenn Sie mit großen Datenmengen arbeiten. Entwickler benötigen keine weitere Bibliothek, um IronPDF in ihrem .NET-Projekt zu verwenden.

Erhalten Sie mehr Informationen über IronPDF in Verbindung mit .NET Blazor in diesem Tutorial und erfahren Sie mehr über die Integration von IronPDF mit .NET MAUI auf der IronPDF-Website.

Schlussfolgerung

Zusammenfassend lässt sich sagen, dass das programmgesteuerte Lesen von PDF-Dateien in verschiedenen Branchen von entscheidender Bedeutung ist. IronPDF bietet eine umfassende Lösung für diese Aufgabe, indem es umfangreiche Funktionen zum Lesen, Ändern und Extrahieren von Inhalten aus einer PDF-Datei bereitstellt. IronPDF ist leicht zu installieren und mit nur wenigen Schritten zu verwenden.

Die Bibliothek bietet Methoden zum Extrahieren von Text aus PDF-Dokumenten, Rasterisieren eines PDFs zu einem Bild, zum Bearbeiten von Seiten und zum Speichern von PDF-Dateien. Egal, ob Sie neu in der programmatischen PDF-Verarbeitung sind oder ein erfahrener Entwickler, IronPDF ist das perfekte Werkzeug, um Ihre Fähigkeiten auf die nächste Stufe zu bringen.

Wenn Sie nach einer zuverlässigen und effizienten Lösung zum Lesen von PDF-Dateien in C# suchen, ist IronPDF eine Erkundung wert, insbesondere mit seinen Lizenzoptionen und Preisinformationen sowie einer kostenlosen Testversion verfügbar. Weitere Pläne, die IronPDF zur Verfügung stellt, können Sie in der folgenden Abbildung sehen. Sie können das Paket auswählen, das Ihren Bedürfnissen entspricht.

So lesen Sie PDF-Dateien in C#, Abbildung 2: IronPDF-Lizenzpreise

IronPDF-Lizenzpreise

Chipego
Software-Ingenieur
Chipego hat eine natürliche Fähigkeit zum Zuhören, die ihm hilft, Kundenprobleme zu verstehen und intelligente Lösungen anzubieten. Er trat dem Iron Software-Team 2023 bei, nachdem er einen Bachelor of Science in Informationstechnologie erworben hatte. IronPDF und IronOCR sind die beiden Produkte, auf die sich Chipego konzentriert hat, aber sein Wissen über alle Produkte wächst täglich, da er neue Wege findet, Kunden zu unterstützen. Er genießt die Zusammenarbeit bei Iron Software, da Teammitglieder aus dem gesamten Unternehmen ihre unterschiedlichen Erfahrungen einbringen und so zu effektiven, innovativen Lösungen beitragen. Wenn Chipego nicht an seinem Schreibtisch sitzt, kann man ihn oft bei einem guten Buch oder beim Fußballspielen antreffen.
< PREVIOUS
Wie man Word (Docx) in PDF in C# konvertiert (Tutorial)
NÄCHSTES >
Sollten Sie IronPDF kaufen?