IRONPDF VERWENDEN

Wie man PDF-Dateien in C# liest

Aktualisiert 25. Februar 2024
Teilen Sie:

Die programmatische PDF-Verarbeitung ist in Branchen wie dem Finanz-, Gesundheits-, Rechts- und Bildungswesen von entscheidender Bedeutung, da dort wichtige Informationen verarbeitet, analysiert und aus PDF-Dokumenten extrahiert werden müssen, beispielsweise für die Datenanalyse, die Dokumentenverwaltung und die Automatisierung. Trotz ihrer Bedeutung kann diese Aufgabe eine Herausforderung sein.

IronPDF: Eine C# PDF-Bibliothek

IronPDF ermöglicht es Ihnen, unglaublich schwierige Aufgaben leicht zu bewältigen. Es ermöglicht die einfache Bearbeitung von Text in einem PDF-Dokument, ähnlich wie Sie mit Textdateien in einem Textdokument arbeiten können, und erlaubt Ihnen gleichzeitig, Dateien in jedem Betriebssystem zu exportieren. Die IronPDF-Anwendung deckt den gesamten Prozess des Betrachtens, Änderns und Extrahierens von Inhalten aus einem PDF-Dokument ab.

Machen Sie den richtigen Schritt mit IronPDF

Mit der IronPDF-Software können Texte im PDF-Format schnell und einfach auf jedem Computer gelesen und geschrieben werden. Die Installation ist eine einfache Aufgabe. Dies ist der beste Weg, um das Lesen von PDF-Dateien in C# zu lernen. Sie können IronPDF auch kostenlos für die Entwicklung herunterladen. Wenn Sie IronPDF erkunden, werden Sie feststellen, dass die Bibliothek umfangreiche Funktionen bietet, die den Umgang mit PDFs sehr einfach machen. Erkunden Sie den Unterricht in Ihrer Freizeit! Es gibt mehrere C# Beispiele zur Verfügung, um zu lernen, wie man eine optimale Ausgabe beim Lesen von PDFs erzeugt.

PDF-Dateien mit IronPDF lesen

Schritt 1: Installieren Sie das IronPDF-Paket

Um zu beginnen, müssen Sie ironPDF installieren NuGet-Paket in Ihr .NET-Projekt. Öffnen Sie dazu die Paketmanager-Konsole in Visual Studio und geben Sie den folgenden Befehl ein:

Install-Package IronPdf

Schritt 2: Importieren der IronPDF-Bibliothek

Als nächstes müssen Sie die IronPDF-Bibliothek in Ihren Code importieren, indem Sie die folgende Anweisung am Anfang Ihrer Datei einfügen:

using IronPdf;
using IronPdf;
Imports IronPdf
VB   C#

Schritt 3: Laden des PDF-Dokuments

Sobald Sie die IronPDF-Bibliothek importiert haben, können Sie mit dem folgenden Code ein PDF-Dokument in Ihren Code laden:

PdfDocument pdf = PdfDocument.FromFile(@"C:\dotnet.pdf");
var outputPath = "Example.pdf";
pdf.SaveAs(outputPath);
PdfDocument pdf = PdfDocument.FromFile(@"C:\dotnet.pdf");
var outputPath = "Example.pdf";
pdf.SaveAs(outputPath);
Dim pdf As PdfDocument = PdfDocument.FromFile("C:\dotnet.pdf")
Dim outputPath = "Example.pdf"
pdf.SaveAs(outputPath)
VB   C#

Schritt 4: Text aus der PDF-Datei extrahieren

IronPDF bietet eine Reihe von Methoden, um Text aus einer vorhandenen PDF-Datei zu extrahieren. Sie können beispielsweise mit der Extraktion von Text aus einer PDF-Datei beginnen und ihn auf der Konsole ausgeben, indem Sie das folgende Codefragment verwenden:

string text = pdf.ExtractText();
Console.Writeline(text);
string text = pdf.ExtractText();
Console.Writeline(text);
Dim text As String = pdf.ExtractText()
Console.Writeline(text)
VB   C#

Mit dem obigen Code können Sie text aus einer PDF-Datei extrahieren.

Wie man PDF-Dateien in C# liest, Abbildung 1: Extrahieren von Text aus einer PDF-Datei mit IronPDF

**Extrahieren von Text aus einem PDF-Dokument mit IronPDF

Schritt 5: PDF in Bilder rastern

Lasst uns rasterung der PDF-Datei in Bilder ironPDF verwenden. Importieren Sie zunächst die erforderlichen Bibliotheken:

using System.Linq;
using IronPdf;
using IronSoftware.Drawing;
using System.Linq;
using IronPdf;
using IronSoftware.Drawing;
Imports System.Linq
Imports IronPdf
Imports IronSoftware.Drawing
VB   C#

Der Code verwendet dann die rasterizeToImageFiles methode, um alle Seiten des PDF-Dokuments als Bilddateien in einen Ordner zu extrahieren. Die extrahierten Bilder können als PNG- oder JPG-Dateien gespeichert werden, und die Abmessungen und Seitenbereiche der Bilder können ebenfalls angegeben werden.

// Extract all pages to a folder as image files
pdf.RasterizeToImageFiles(@"C:\image\folder\*.png");

// Dimensions and page ranges may be specified
pdf.RasterizeToImageFiles(@"C:\image\folder\example_pdf_image_*.jpg", 100, 80);
// Extract all pages to a folder as image files
pdf.RasterizeToImageFiles(@"C:\image\folder\*.png");

// Dimensions and page ranges may be specified
pdf.RasterizeToImageFiles(@"C:\image\folder\example_pdf_image_*.jpg", 100, 80);
' Extract all pages to a folder as image files
pdf.RasterizeToImageFiles("C:\image\folder\*.png")

' Dimensions and page ranges may be specified
pdf.RasterizeToImageFiles("C:\image\folder\example_pdf_image_*.jpg", 100, 80)
VB   C#

Schließlich verwendet der Code die toBitmap methode, um alle Seiten des PDF-Dokuments als AnyBitmap-Objekte zu extrahieren, die im Code weiterverarbeitet und manipuliert werden können.

// Extract all pages as AnyBitmap objects
AnyBitmap [] pdfBitmaps = pdf.ToBitmap();
// Extract all pages as AnyBitmap objects
AnyBitmap [] pdfBitmaps = pdf.ToBitmap();
' Extract all pages as AnyBitmap objects
Dim pdfBitmaps() As AnyBitmap = pdf.ToBitmap()
VB   C#

Der obige Code demonstriert, wie man den Inhalt einer PDF-Datei mit IronPDF extrahiert und die extrahierten Daten als Bilddateien oder AnyBitmap-Objekte zur weiteren Verarbeitung speichert.

Schritt 7: PDF-Seiten manipulieren

Wir wollen lernen, wie man die Seiten manipulieren eines PDF-Dokuments durch Lesen der PDF-Datei mit IronPDF.

Der Code entfernt zunächst die Seiten zwei und drei aus dem PDF-Dokument, indem er die seiten entfernen methode:

pdf.RemovePages(1, 2);
pdf.RemovePages(1, 2);
pdf.RemovePages(1, 2)
VB   C#

Die Methode RemovePages hat zwei Argumente: die zu entfernende Ausgangsseite (in diesem Fall die Seite 2, dargestellt als 1, da die Seitennummerierung bei 0 beginnt) und die Anzahl der zu entfernenden Seiten (in diesem Fall, 2 Seiten).

Schritt 6: Speichern der PDF-Datei

Schließlich können Sie die PDF-Datei auf Ihrem lokalen System speichern, indem Sie die speichern als methode. Der Code zum Speichern der PDF-Datei lautet wie folgt:

pdf.SaveAs(OutputPath);
pdf.SaveAs(OutputPath);
pdf.SaveAs(OutputPath)
VB   C#

IronPDF-Kompatibilität

IronPDF ist in hohem Maße kompatibel mit allen aktuellen .NET-Frameworks, einschließlich .NET 7. Es unterstützt auch .NET Blazor und .NET MAUI, die neuesten Angebote von Microsoft für die Webentwicklung. Die Kompatibilität der Bibliothek mit diesen Frameworks ermöglicht es den Entwicklern, IronPDF nahtlos in ihre Anwendungen zu integrieren und die Vorteile der leistungsstarken Funktionen zu nutzen.

Eines der Hauptmerkmale von IronPDF ist die Fähigkeit, PDF-Dateien in .NET Blazor und .NET MAUI zu lesen. Diese Funktion ermöglicht es Entwicklern, schnell und einfach Daten aus PDF-Dateien zu lesen und zu extrahieren und sie in .NET-Anwendungen zu verwenden. Diese Funktion kann besonders hilfreich sein, wenn Sie mit großen Datenmengen arbeiten. Entwickler benötigen keine weitere Bibliothek, um IronPDF in ihrem .NET-Projekt zu verwenden.

Erfahren Sie mehr über IronPDF arbeitet mit .NET Blazor und .NET MAUI auf der Website von IronPDF.

Schlussfolgerung

Zusammenfassend lässt sich sagen, dass das programmgesteuerte Lesen von PDF-Dateien in verschiedenen Branchen von entscheidender Bedeutung ist. IronPDF bietet eine umfassende Lösung für diese Aufgabe, indem es umfangreiche Funktionen zum Lesen, Ändern und Extrahieren von Inhalten aus einer PDF-Datei bereitstellt. IronPDF ist leicht zu installieren und mit nur wenigen Schritten zu verwenden.

Die Bibliothek bietet Methoden zur text extrahieren, eine PDF-Datei in ein Bild rastern, Seiten bearbeiten und PDF-Dateien speichern. Egal, ob Sie neu in der programmatischen PDF-Verarbeitung sind oder ein erfahrener Entwickler, IronPDF ist das perfekte Werkzeug, um Ihre Fähigkeiten auf die nächste Stufe zu bringen.

Wenn Sie auf der Suche nach einer zuverlässigen und effizienten Lösung zum Lesen von PDF-Dateien in C# sind, ist IronPDF einen Blick wert, insbesondere mit seiner lizenz ab $749und eine kostenloser Test verfügbar. Weitere Pläne, die IronPDF zur Verfügung stellt, können Sie in der folgenden Abbildung sehen. Sie können das Paket auswählen, das Ihren Bedürfnissen entspricht.

Wie man PDF-Dateien in C# liest, Abbildung 2: IronPDF-Lizenzierungspreise

IronPDF-Lizenzierungspreise

< PREVIOUS
Konvertieren von Word in PDF in C# (Tutorial)
NÄCHSTES >
Sollten Sie IronPDF kaufen?

Sind Sie bereit, loszulegen? Version: 2024.10 gerade veröffentlicht

Gratis NuGet-Download Downloads insgesamt: 11,308,499 Lizenzen anzeigen >