Test in einer Live-Umgebung
Test in der Produktion ohne Wasserzeichen.
Funktioniert überall, wo Sie es brauchen.
Die programmatische PDF-Verarbeitung ist in Branchen wie dem Finanz-, Gesundheits-, Rechts- und Bildungswesen von entscheidender Bedeutung, da dort wichtige Informationen verarbeitet, analysiert und aus PDF-Dokumenten extrahiert werden müssen, beispielsweise für die Datenanalyse, die Dokumentenverwaltung und die Automatisierung. Trotz ihrer Bedeutung kann diese Aufgabe eine Herausforderung sein.
IronPDF ermöglicht es Ihnen, unglaublich schwierige Aufgaben leicht zu bewältigen. Es ermöglicht die einfache Bearbeitung von Text in einem PDF-Dokument, ähnlich wie Sie mit Textdateien in einem Textdokument arbeiten können, und erlaubt Ihnen gleichzeitig, Dateien in jedem Betriebssystem zu exportieren. Die IronPDF-Anwendung deckt den gesamten Prozess des Betrachtens, Änderns und Extrahierens von Inhalten aus einem PDF-Dokument ab.
Mit der IronPDF-Software können Texte im PDF-Format schnell und einfach auf jedem Computer gelesen und geschrieben werden. Die Installation ist eine einfache Aufgabe. Dies ist der beste Weg, um das Lesen von PDF-Dateien in C# zu lernen. Sie können IronPDF auch kostenlos für die Entwicklung herunterladen. Wenn Sie IronPDF erkunden, werden Sie feststellen, dass die Bibliothek umfangreiche Funktionen bietet, die den Umgang mit PDFs sehr einfach machen. Erkunden Sie den Unterricht in Ihrer Freizeit! Es gibt mehrereC#-Beispiele mit HTML zur Erstellung einer PDF-Datei zur Verfügung, um zu lernen, wie man eine optimale Ausgabe beim Lesen von PDFs erzeugt.
Um zu beginnen, müssen Sieinstallieren Sie das IronPDF NuGet-Paket in Ihr .NET-Projekt zu integrieren. Öffnen Sie dazu die Paketmanager-Konsole in Visual Studio und geben Sie den folgenden Befehl ein:
Install-Package IronPdf
Als nächstes müssen Sie die IronPDF-Bibliothek in Ihren Code importieren, indem Sie die folgende Anweisung am Anfang Ihrer Datei einfügen:
using IronPdf;
using IronPdf;
Imports IronPdf
Sobald Sie die IronPDF-Bibliothek importiert haben, können Sie mit dem folgenden Code ein PDF-Dokument in Ihren Code laden:
PdfDocument pdf = PdfDocument.FromFile(@"C:\dotnet.pdf");
var outputPath = "Example.pdf";
pdf.SaveAs(outputPath);
PdfDocument pdf = PdfDocument.FromFile(@"C:\dotnet.pdf");
var outputPath = "Example.pdf";
pdf.SaveAs(outputPath);
Dim pdf As PdfDocument = PdfDocument.FromFile("C:\dotnet.pdf")
Dim outputPath = "Example.pdf"
pdf.SaveAs(outputPath)
IronPDF bietet eine Reihe von Methoden, um Text aus einer vorhandenen PDF-Datei zu extrahieren. Sie können beispielsweise mit der Extraktion von Text aus einer PDF-Datei beginnen und ihn auf der Konsole ausgeben, indem Sie das folgende Codefragment verwenden:
string text = pdf.ExtractText();
Console.Writeline(text);
string text = pdf.ExtractText();
Console.Writeline(text);
Dim text As String = pdf.ExtractText()
Console.Writeline(text)
Mit dem obigen Code können Sietext aus einer PDF-Datei extrahieren.
**Extrahieren von Text aus einem PDF-Dokument mit IronPDF
Lasst unspDF-Datei mit IronPDF in Bilder rastern ironPDF verwenden. Importieren Sie zunächst die erforderlichen Bibliotheken:
using System.Linq;
using IronPdf;
using IronSoftware.Drawing;
using System.Linq;
using IronPdf;
using IronSoftware.Drawing;
Imports System.Linq
Imports IronPdf
Imports IronSoftware.Drawing
Der Code verwendet dann diemethode RasterizeToImageFiles
um alle Seiten des PDF-Dokuments als Bilddateien in einen Ordner zu extrahieren. Die extrahierten Bilder können als PNG- oder JPG-Dateien gespeichert werden, und die Abmessungen und Seitenbereiche der Bilder können ebenfalls angegeben werden.
// Extract all pages to a folder as image files
pdf.RasterizeToImageFiles(@"C:\image\folder\*.png");
// Dimensions and page ranges may be specified
pdf.RasterizeToImageFiles(@"C:\image\folder\example_pdf_image_*.jpg", 100, 80);
// Extract all pages to a folder as image files
pdf.RasterizeToImageFiles(@"C:\image\folder\*.png");
// Dimensions and page ranges may be specified
pdf.RasterizeToImageFiles(@"C:\image\folder\example_pdf_image_*.jpg", 100, 80);
' Extract all pages to a folder as image files
pdf.RasterizeToImageFiles("C:\image\folder\*.png")
' Dimensions and page ranges may be specified
pdf.RasterizeToImageFiles("C:\image\folder\example_pdf_image_*.jpg", 100, 80)
Schließlich verwendet der Code dietoBitmap"-Methode alle Seiten des PDF-Dokuments als `AnyBitmap'-Objekte zu extrahieren, die innerhalb des Codes weiterverarbeitet und manipuliert werden können.
// Extract all pages as AnyBitmap objects
AnyBitmap [] pdfBitmaps = pdf.ToBitmap();
// Extract all pages as AnyBitmap objects
AnyBitmap [] pdfBitmaps = pdf.ToBitmap();
' Extract all pages as AnyBitmap objects
Dim pdfBitmaps() As AnyBitmap = pdf.ToBitmap()
Der obige Code demonstriert, wie man den Inhalt einer PDF-Datei mit IronPDF extrahiert und die extrahierten Daten als Bilddateien oder AnyBitmap
-Objekte zur weiteren Verarbeitung speichert.
Wir wollen lernen, wie mandie Seiten eines PDF-Dokuments manipulieren durch Lesen der PDF-Datei mit IronPDF.
Der Code entfernt zunächst die Seiten zwei und drei aus dem PDF-Dokument, indem er diemethode RemovePages
:
pdf.RemovePages(1, 2);
pdf.RemovePages(1, 2);
pdf.RemovePages(1, 2)
Die Methode RemovePages
hat zwei Argumente: die zu entfernende Ausgangsseite(in diesem Fall die Seite 2, dargestellt als 1, da die Seitennummerierung bei 0 beginnt) und die Anzahl der zu entfernenden Seiten(in diesem Fall, 2 Seiten).
Schließlich können Sie die PDF-Datei auf Ihrem lokalen System speichern, indem Sie dieSaveAs
-Methode. Der Code zum Speichern der PDF-Datei lautet wie folgt:
pdf.SaveAs(OutputPath);
pdf.SaveAs(OutputPath);
pdf.SaveAs(OutputPath)
IronPDF ist in hohem Maße kompatibel mit allen aktuellen .NET-Frameworks, einschließlich .NET 7. Es unterstützt auch .NET Blazor und .NET MAUI, die neuesten Angebote von Microsoft für die Webentwicklung. Die Kompatibilität der Bibliothek mit diesen Frameworks ermöglicht es den Entwicklern, IronPDF nahtlos in ihre Anwendungen zu integrieren und die Vorteile der leistungsstarken Funktionen zu nutzen.
Eines der Hauptmerkmale von IronPDF ist die Fähigkeit, PDF-Dateien in .NET Blazor und .NET MAUI zu lesen. Diese Funktion ermöglicht es Entwicklern, schnell und einfach Daten aus PDF-Dateien zu lesen und zu extrahieren und sie in .NET-Anwendungen zu verwenden. Diese Funktion kann besonders hilfreich sein, wenn Sie mit großen Datenmengen arbeiten. Entwickler benötigen keine weitere Bibliothek, um IronPDF in ihrem .NET-Projekt zu verwenden.
Erfahren Sie mehr überIronPDF im Einsatz mit .NET Blazor in diesem Tutorial und erfahren Sie mehr überintegration von IronPDF mit .NET MAUI auf der Website von IronPDF.
Zusammenfassend lässt sich sagen, dass das programmgesteuerte Lesen von PDF-Dateien in verschiedenen Branchen von entscheidender Bedeutung ist. IronPDF bietet eine umfassende Lösung für diese Aufgabe, indem es umfangreiche Funktionen zum Lesen, Ändern und Extrahieren von Inhalten aus einer PDF-Datei bereitstellt. IronPDF ist leicht zu installieren und mit nur wenigen Schritten zu verwenden.
Die Bibliothek bietet Methoden zurtext aus PDF-Dokumenten extrahieren, eine PDF-Datei in ein Bild rastern, Seiten bearbeiten und PDF-Dateien speichern. Egal, ob Sie neu in der programmatischen PDF-Verarbeitung sind oder ein erfahrener Entwickler, IronPDF ist das perfekte Werkzeug, um Ihre Fähigkeiten auf die nächste Stufe zu bringen.
Wenn Sie auf der Suche nach einer zuverlässigen und effizienten Lösung zum Lesen von PDF-Dateien in C# sind, ist IronPDF einen Blick wert, insbesondere mit seinerlizenzoptionen und Preisinformationenund einekostenloser Test verfügbar. Weitere Pläne, die IronPDF zur Verfügung stellt, können Sie in der folgenden Abbildung sehen. Sie können das Paket auswählen, das Ihren Bedürfnissen entspricht.
IronPDF-Lizenzierungspreise
9 .NET API-Produkte für Ihre Bürodokumente