C# Lesen einer PDF-Datei: Einfaches Tutorial
Wenn Sie ein Entwickler sind, sind Sie wahrscheinlich auf Probleme gestoßen, wenn Sie versucht haben, Text aus einer PDF-Datei zu lesen. Vielleicht trifft eine oder mehrere der folgenden Szenarien auf Sie zu:
- Sie entwickeln eine Anwendung, die zwei PDF-Dokumente als Eingabe nimmt und die Ähnlichkeit zwischen den Dokumenten findet.
- Sie entwickeln eine Anwendung, die PDF-Dokumente mit IronPDF lesen und die Wortanzahl zurückgeben muss.
- Sie entwickeln eine Anwendung, die Daten aus einer PDF-Datei mit IronPDF extrahiert und diese in eine strukturierte Datenbank einfügt.
- Sie entwickeln eine Anwendung, die PDF-Textinhalte extrahieren und in eine Zeichenfolge umwandeln muss.
- Das Extrahieren von Daten aus PDF-Dateien mit C# war eine schwierige und komplexe Aufgabe, bis zur Entwicklung von IronPDF.
IronPDF Library Overview ist eine Bibliothek, die es Entwicklern erheblich erleichtert, PDF-Dateien zu lesen.
Sie können mehr über die Angebote der IronPDF- und Iron Software Suite erkunden.
Sie können PDF-Dateien lesen und die Daten in einem C# Textfeld anzeigen, indem Sie nur zwei Codezeilen verwenden. Ja, nur zwei Codezeilen. Sie können auch alle Bilder aus PDFs extrahieren. Darüber hinaus können Sie ein weiteres Dokument mit diesen Bildern erstellen oder sie je nach Ihren Anforderungen in Ihrer Anwendung anzeigen.
Wir zeigen Ihnen, wie es geht.
Wir können schrittweise mit der Anwendung fortfahren, um beliebige PDF-Dateien auszuwählen und dann deren Inhalt anzuzeigen.
Die folgenden Schritte zeigen Ihnen, wie Sie PDF-Dateien in C# lesen:
Die folgenden Schritte zeigen Ihnen, wie Sie PDF-Dateien in C# lesen können
- Download der Print to PDF C# Library
- Wählen Sie eine PDF-Datei von Ihrem Computer
- Drucker auswählen und Auflösung einstellen
- Überprüfen Sie Ihre PDF-Ausgabe von Ihrem Drucker
- Verfolgen Sie Ihre Druckprozesse mit C#
Vorausgesetztes Wissen:
- Grundkenntnisse der C# Programmierung
- Grundkenntnisse der C# GUI-Steuerelemente
Ich habe dieses Tutorial so gestaltet, dass auch eine Person ohne Programmierhintergrund Fortschritte machen kann.
Wer sollte dies lesen
Jeder Neuling, der C# lernt, sollte wissen, wie man PDF-Dateien mit IronPDF liest, da dies etwas ist, das Sie in Ihrer Karriere definitiv verwenden werden.
Professionelle Entwickler sollten dies ebenfalls lesen, um die IronPDF-Bibliothek verstehen zu können, die uns hilft, PDF-Dokumente zu lesen, zu erstellen und zu manipulieren.
Nun, wie können wir diese Bibliothek in unserem Projekt verwenden, um eine PDF-Datei zu lesen?
Ich verwende eine Windows Forms App zur Demonstration. Sie können eine Konsolenanwendung, eine WPF-Anwendung oder eine ASP.NET-Webanwendung nach Ihrem Belieben verwenden.
Ein weiterer großer Vorteil der IronPDF-Bibliothek ist, dass sie sowohl mit C# als auch mit VB.NET verwendet werden kann.
Beginnen wir die Demonstration ohne weitere Verzögerung.
Step #1: Create a Visual Studio Project
Öffnen Sie Visual Studio. Ich verwende Visual Studio 2019.
Klicken Sie auf 'Neues Projekt erstellen':
Neues Projekt erstellen
Wählen Sie jetzt die Windows Forms App aus der Vorlage, drücken Sie 'Weiter', und das folgende Fenster wird angezeigt. Projektnamen eingeben. Ich habe 'Read Pdf using IronPDF' geschrieben.
Projektkonfiguration über Visual Studio
Klicken Sie nun auf 'Weiter', und das folgende Fenster wird angezeigt. Wählen Sie '.NET Core 3.1' aus dem Dropdown-Menü.
.NET Core 3.1-Version
Klicken Sie auf die Schaltfläche 'Erstellen', und das Projekt wird wie unten gezeigt erstellt.
Anfangsstadium einer neuen Windows Forms-Anwendung
Step #2: Install the IronPDF NuGet Package
Klicken Sie auf das Projektmenü in der Menüleiste und eine Dropdown-Liste wird angezeigt. Wählen Sie NuGet Pakete verwalten aus und klicken Sie darauf. Das folgende Fenster wird angezeigt:
NuGet-Paket-Manager
Jetzt auf 'Durchsuchen' klicken. Das folgende Fenster wird angezeigt:
NuGet-Paketmanager-Benutzeroberfläche
Geben Sie IronPDF in das Suchfeld ein und drücken Sie 'Enter'. Das folgende Fenster wird angezeigt:
NuGet-Lösung
IronPDF auswählen und klicken. Das folgende Fenster wird angezeigt:
Kostenloses IronPDF installieren
Drücken Sie die Schaltfläche 'Installieren' und warten Sie, bis die Installation abgeschlossen ist. Das folgende Fenster wird nach einer erfolgreichen Installation angezeigt:
IronPDF für .NET
Drücken Sie die 'Ok'-Schaltfläche, und Sie sind startklar.
Hinweis: Es gibt andere Möglichkeiten, das NuGet-Paket herunterzuladen. Sie können IronPdf auch über die Paket-Manager-Konsole installieren; Öffnen Sie die Paket-Manager-Konsole und schreiben Sie den folgenden Code:
Install-Package IronPdf
Sie können es auch auf der NuGet-Paketseite von IronPDF herunterladen.
Die folgende Readme.txt-Datei wird geöffnet:
IronPDF's README-Datei mit Code-Beispielen
Ich schlage vor, dass Sie alle Links durchgehen und weitere IronPDF-Codebeispiele zu dieser Bibliothek erkunden.
Step #3: Design a Windows Forms App
Nachdem ein Projekt erstellt und das NuGet-Paket installiert wurde, besteht der nächste Schritt darin, eine Windows Forms-App zu gestalten, die den Benutzer fragt, eine Datei zu durchsuchen und deren Inhalt anzuzeigen.
Form1-Design öffnen:
Form1 Design UI
Klicken Sie auf die Symbolleiste, die sich auf der linken Seite des Fensters befindet:
Toolbox-Benutzeroberfläche für Label und TextBox
Suchen Sie nach 'Label' und ziehen Sie es in das Form-Design
Ziehen Sie als nächstes ein Textfeld (um den Dateipfad anzuzeigen), drei Schaltflächen (eine zum Durchsuchen der Dateien, eine zum Lesen von PDF-Dateien mit IronPDF und eine zum 'Text löschen') und ein RichTextBox (zum Anzeigen der Inhalte). Hier habe ich es 'C# Read Pdf using IronPDF' genannt.
Form1 UI mit hinzugefügtem Label
Ziehen Sie als nächstes ein Textfeld (um den Dateipfad anzuzeigen), drei Schaltflächen (eine zum Durchsuchen der Dateien, eine zum Lesen von PDF-Dateien mit IronPDF und die dritte Schaltfläche zum 'Text löschen'-Felder) und ein RichTextBox (zum Lesen und Anzeigen der Dateiinhalte).
Setzen Sie die Eigenschaft "Nur Lesen" für das Textfeld und das RichTextBox auf "Falsch". Dies soll so sein, dass Benutzer nur die Inhalte und den Dateipfad lesen können.
Vollständig gestaltetes Form1
Step #4: Add the Back-end Code for Browsing PDF Files
Doppelklicken Sie auf die Schaltfläche 'Durchsuchen', und das folgende Fenster wird angezeigt:
private void Browse_Click(object sender, EventArgs e)
{
}
private void Browse_Click(object sender, EventArgs e)
{
}
Private Sub Browse_Click(ByVal sender As Object, ByVal e As EventArgs)
End Sub
Schreiben Sie als Nächstes den folgenden Code in die Funktion Browse_Click:
private void Browse_Click(object sender, EventArgs e)
{
// Initialize and configure OpenFileDialog
OpenFileDialog browseFile = new OpenFileDialog
{
InitialDirectory = @"D:\",
Title = "Browse Pdf Files",
CheckFileExists = true,
CheckPathExists = true,
DefaultExt = "pdf",
Filter = "pdf files (*.pdf)|*.pdf",
FilterIndex = 2,
RestoreDirectory = true,
ReadOnlyChecked = true,
ShowReadOnly = true
};
// Show the dialog and get result
if (browseFile.ShowDialog() == DialogResult.OK)
{
// Set the text box with the selected file path
FilePath.Text = browseFile.FileName;
}
}
private void Browse_Click(object sender, EventArgs e)
{
// Initialize and configure OpenFileDialog
OpenFileDialog browseFile = new OpenFileDialog
{
InitialDirectory = @"D:\",
Title = "Browse Pdf Files",
CheckFileExists = true,
CheckPathExists = true,
DefaultExt = "pdf",
Filter = "pdf files (*.pdf)|*.pdf",
FilterIndex = 2,
RestoreDirectory = true,
ReadOnlyChecked = true,
ShowReadOnly = true
};
// Show the dialog and get result
if (browseFile.ShowDialog() == DialogResult.OK)
{
// Set the text box with the selected file path
FilePath.Text = browseFile.FileName;
}
}
Private Sub Browse_Click(ByVal sender As Object, ByVal e As EventArgs)
' Initialize and configure OpenFileDialog
Dim browseFile As New OpenFileDialog With {
.InitialDirectory = "D:\",
.Title = "Browse Pdf Files",
.CheckFileExists = True,
.CheckPathExists = True,
.DefaultExt = "pdf",
.Filter = "pdf files (*.pdf)|*.pdf",
.FilterIndex = 2,
.RestoreDirectory = True,
.ReadOnlyChecked = True,
.ShowReadOnly = True
}
' Show the dialog and get result
If browseFile.ShowDialog() = DialogResult.OK Then
' Set the text box with the selected file path
FilePath.Text = browseFile.FileName
End If
End Sub
OpenFileDialog erstellt eine Instanz des Dateidialog-Steuerelements der Windows Forms-App.
Initialpfad auf D-Laufwerk gesetzt; ändern Sie nach Bedarf.
Ich habe DefaultExt = "pdf" eingestellt, da wir nur die PDF-Datei lesen müssen.
Ich habe einen Filter verwendet, sodass das Durchsuchen der Datei-Dialog Ihnen nur die PDF-Datei zur Auswahl zeigt.
Wenn der Benutzer auf 'Ok' klickt, wird der Dateipfad im Feld Dateipfad angezeigt.
Lassen Sie uns die Lösung ausführen und die Schaltfläche 'Durchsuchen' testen.
Form1-UI
Drücken Sie die Schaltfläche 'Durchsuchen', und das folgende Fenster wird angezeigt:
Dialog zum Durchsuchen von Dateien, um eine PDF-Datei auszuwählen
Wählen Sie die Datei aus (ich wähle IronPDFTest.pdf) und drücken Sie 'Öffnen'. Das folgende Fenster wird angezeigt.
PDF in C#
Nun lassen Sie uns den Code hinter der 'Lesen'-Schaltfläche schreiben, um die Datei zu lesen.
Step #5: Add the Back-end Code for Reading PDF Documents using IronPDF
Sie denken vielleicht, dass der Code zum Lesen einer PDF-Datei komplex und schwer zu schreiben und zu verstehen wäre.
Keine Sorge. IronPDF hat alles vereinfacht und es so viel einfacher gemacht. Wir können die PDF-Datei einfach mit nur zwei Codezeilen lesen.
Gehen Sie zum Form1-Design und 'doppelklicken' Sie auf die 'Lesen'-Schaltfläche. Das folgende Fenster wird angezeigt:
private void Read_Click(object sender, EventArgs e)
{
}
private void Read_Click(object sender, EventArgs e)
{
}
Private Sub Read_Click(ByVal sender As Object, ByVal e As EventArgs)
End Sub
Fügen Sie einen Namespace using IronPdf hinzu, um die IronPDF Bibliothek zu importieren:
using System;
using IronPdf;
using System;
using IronPdf;
Imports System
Imports IronPdf
Schreiben Sie den folgenden Code in die Funktion Read_Click:
private void Read_Click(object sender, EventArgs e)
{
// Read the PDF file using IronPdf
using PdfDocument pdf = PdfDocument.FromFile(FilePath.Text);
// Extract and display the text from the PDF
FileContent.Text = pdf.ExtractAllText();
}
private void Read_Click(object sender, EventArgs e)
{
// Read the PDF file using IronPdf
using PdfDocument pdf = PdfDocument.FromFile(FilePath.Text);
// Extract and display the text from the PDF
FileContent.Text = pdf.ExtractAllText();
}
Private Sub Read_Click(ByVal sender As Object, ByVal e As EventArgs)
' Read the PDF file using IronPdf
Using pdf As PdfDocument = PdfDocument.FromFile(FilePath.Text)
' Extract and display the text from the PDF
FileContent.Text = pdf.ExtractAllText()
End Using
End Sub
FilePath ist der Name des Textfelds, das den Speicherort des PDF-Dokuments anzeigt, das wir lesen möchten. Wir werden den Speicherort der Datei dynamisch erhalten.
ExtractAllText mit IronPDF ist die IronPDF-Funktion, die alle Daten aus PDF-Seiten extrahiert. Diese Daten werden dann im Rich-Text-Feld angezeigt und als "Dateiinhalt" benannt.
Als nächstes schreiben wir den Code hinter dem "Löschen-Button". Dies ist nur ein zusätzliches Element, wenn Sie den Bildschirm löschen möchten, nachdem Sie das PDF-Dokument gelesen haben.
Doppelklicken Sie auf den "Löschen"-Button, und Sie werden zu folgendem Code weitergeleitet:
void Clear_Click(object sender, EventArgs e)
{
}
void Clear_Click(object sender, EventArgs e)
{
}
Private Sub Clear_Click(ByVal sender As Object, ByVal e As EventArgs)
End Sub
Schreiben Sie den folgenden Code in die Funktion Clear_Click:
void Clear_Click(object sender, EventArgs e)
{
// Clear the file path and content display fields
FileContent.Text = "";
FilePath.Text = "";
}
void Clear_Click(object sender, EventArgs e)
{
// Clear the file path and content display fields
FileContent.Text = "";
FilePath.Text = "";
}
Private Sub Clear_Click(ByVal sender As Object, ByVal e As EventArgs)
' Clear the file path and content display fields
FileContent.Text = ""
FilePath.Text = ""
End Sub
Lösung ausführen
Klicken Sie auf den 'Durchsuchen'-Button und wählen Sie das Dokument aus, das Sie lesen möchten. In meinem Fall lese ich das IronPDF.pdf-Dokument als Beispiel:
PDF-Dokumente
Drücken Sie die Schaltfläche 'Öffnen', und das folgende Fenster wird angezeigt:
Anwendung mit ausgewählter PDF-Datei
Drücken Sie die 'Lesen'-Taste. Es wird die Datei gelesen und der Inhalt wird wie unten angezeigt.
PDF-Textinhalt anzeigen
Zusammenfassung
Dies ist eine Beispiel-Lösung. Egal wie viele Seiten, Bilder oder Texte in Ihren PDF-Dateien enthalten sind, IronPDF wird alle Texte und Bilder extrahieren, damit Sie sie für beliebige Zwecke verwenden können. Sie müssen lediglich die Lizenz für die Bibliothek erhalten und sie verwenden.
Damit ist das Tutorial abgeschlossen. Ich hoffe, Sie haben alles verstanden, und wenn Sie Fragen haben, zögern Sie nicht, sie im Kommentarbereich zu stellen.
Sie können die Projekt-zip-Datei herunterladen. Wenn Sie das komplette Softwarepaket von Iron kaufen möchten, bedeutet unser [Spezialangebot](Iron Suite), dass Sie jetzt alle für den Preis von nur zwei Lite-Lizenzen kaufen können.
Häufig gestellte Fragen
Wie kann ich Text aus einer PDF-Datei mit C# lesen?
Sie können Text aus einer PDF-Datei mit IronPDF lesen, indem Sie die ExtractAllText-Methode verwenden, die es Ihnen ermöglicht, den gesamten Textinhalt leicht aus einem PDF-Dokument zu extrahieren.
Was sind die Vorteile der Verwendung von IronPDF zur PDF-Bearbeitung in C#?
IronPDF bietet einen unkomplizierten Ansatz zum Lesen, Generieren und Manipulieren von PDFs in C#. Es ermöglicht Entwicklern Aufgaben wie Textextraktion und Bildabruf mit minimalem Codeaufwand zu erledigen, was Produktivität und Effizienz steigert.
Wie installiere ich die IronPDF-Bibliothek in meinem C#-Projekt?
Um IronPDF zu installieren, verwenden Sie den NuGet-Paket-Manager in Visual Studio. Suchen Sie einfach nach 'IronPDF' in der Paket-Manager-Konsole und klicken Sie auf 'Installieren', um es in Ihrem Projekt einzuschließen.
Kann IronPDF verwendet werden, um Bilder aus einer PDF-Datei zu extrahieren?
Ja, IronPDF bietet Funktionalität zum Extrahieren von Bildern aus einer PDF-Datei, sodass Entwickler Zugang zu allen im Dokument enthaltenen Bildern haben und sie manipulieren können.
Welche Schritte sind erforderlich, um ein Visual Studio-Projekt zum Lesen von PDF-Dateien einzurichten?
Das Einrichten eines Projekts umfasst das Erstellen eines neuen Visual Studio-Projekts, das Installieren des IronPDF NuGet-Pakets, das Entwerfen einer Windows Forms App und die Implementierung von Back-End-Code zum Durchsuchen und Lesen von PDF-Dateien.
Wie kann ich sicherstellen, dass die Felder in meiner Anwendung nach dem Lesen einer PDF geleert werden?
Sie können eine 'Löschen'-Schaltfläche in Ihrer Anwendung implementieren, die den Inhalt der TextBox und RichTextBox auf eine leere Zeichenfolge zurücksetzt und somit sicherstellt, dass die Felder nach der Verarbeitung einer PDF geleert werden.
Ist es möglich, IronPDF mit VB.NET zu verwenden?
Ja, IronPDF ist sowohl mit C# als auch mit VB.NET kompatibel und bietet Entwicklern, die in verschiedenen .NET-Sprachen arbeiten, eine vielseitige Option.
Wie viele Codezeilen sind erforderlich, um PDF-Inhalte mit IronPDF anzuzeigen?
Sie können PDF-Inhalte mit nur zwei Codezeilen mit IronPDF anzeigen, was seine Fähigkeit zur Vereinfachung von PDF-Verarbeitungsvorgängen hervorhebt.
Für was wird die 'RenderHtmlAsPdf'-Methode in IronPDF verwendet?
Die RenderHtmlAsPdf-Methode in IronPDF wird verwendet, um HTML-Strings in PDF-Dokumente zu konvertieren, sodass Webinhalte nahtlos in PDF-Dateien integriert werden können.
Ist IronPDF vollständig mit .NET 10 kompatibel?
Ja. IronPDF ist vollständig kompatibel mit .NET 10 sowie mit früheren Versionen wie .NET 6–9, .NET Core, .NET Standard und .NET Framework. Es unterstützt die Installation über NuGet und funktioniert nahtlos auf verschiedenen Plattformen, darunter Windows, Linux und macOS.




