Zum Fußzeileninhalt springen
IRONPDF NUTZEN

C# Lesen einer PDF-Datei: Einfaches Tutorial

Wenn Sie ein Entwickler sind, sind Sie wahrscheinlich auf Probleme gestoßen, wenn Sie versucht haben, Text aus einer PDF-Datei zu lesen. Vielleicht trifft eine oder mehrere der folgenden Szenarien auf Sie zu:

  1. Sie entwickeln eine Anwendung, die zwei PDF-Dokumente als Eingabe nimmt und die Ähnlichkeit zwischen den Dokumenten findet.
  2. Sie entwickeln eine Anwendung, die PDF-Dokumente mit IronPDF lesen und die Wortanzahl zurückgeben muss.
  3. Sie entwickeln eine Anwendung, die Daten aus einer PDF-Datei mit IronPDF extrahiert und diese in eine strukturierte Datenbank einfügt.
  4. Sie entwickeln eine Anwendung, die PDF-Textinhalte extrahieren und in eine Zeichenfolge umwandeln muss.
  5. Das Extrahieren von Daten aus PDF-Dateien mit C# war eine schwierige und komplexe Aufgabe, bis zur Entwicklung von IronPDF.

IronPDF Library Overview ist eine Bibliothek, die es Entwicklern erheblich erleichtert, PDF-Dateien zu lesen.

Sie können mehr über die Angebote der IronPDF- und Iron Software Suite erkunden.

Sie können PDF-Dateien lesen und die Daten in einem C# Textfeld anzeigen, indem Sie nur zwei Codezeilen verwenden. Ja, nur zwei Codezeilen. Sie können auch alle Bilder aus PDFs extrahieren. Darüber hinaus können Sie ein weiteres Dokument mit diesen Bildern erstellen oder sie je nach Ihren Anforderungen in Ihrer Anwendung anzeigen.

Lassen Sie uns Ihnen zeigen, wie es gemacht wird.

Wir können schrittweise mit der Anwendung fortfahren, um beliebige PDF-Dateien auszuwählen und dann deren Inhalt anzuzeigen.

Die folgenden Schritte zeigen Ihnen, wie Sie PDF-Dateien in C# lesen:

class="hsg-featured-snippet">

Die folgenden Schritte zeigen Ihnen, wie Sie PDF-Dateien in C# lesen

  1. Laden Sie die Print-to-PDF C# Bibliothek herunter
  2. Wählen Sie eine PDF-Datei von Ihrem Computer
  3. Wählen Sie einen speziellen Drucker aus, um zu drucken, und legen Sie die Auflösung fest
  4. Überprüfen Sie Ihren PDF-Ausdruck von Ihrem Drucker
  5. Verfolgen Sie Ihre Druckprozesse mit C#

Vorausgesetztes Wissen:

  1. Grundkenntnisse der C# Programmierung
  2. Grundkenntnisse der C# GUI-Steuerelemente

Ich habe dieses Tutorial so gestaltet, dass auch eine Person ohne Programmierhintergrund Fortschritte machen kann.

Wer sollte dies lesen

Jeder Neuling, der C# lernt, sollte wissen, wie man PDF-Dateien mit IronPDF liest, da dies etwas ist, das Sie in Ihrer Karriere definitiv verwenden werden.

Professionelle Entwickler sollten dies ebenfalls lesen, um die IronPDF-Bibliothek verstehen zu können, die uns hilft, PDF-Dokumente zu lesen, zu erstellen und zu manipulieren.

Nun, wie können wir diese Bibliothek in unserem Projekt verwenden, um eine PDF-Datei zu lesen?

Ich verwende eine Windows Forms App zur Demonstration. Sie können eine Konsolenanwendung, eine WPF-Anwendung oder eine ASP.NET-Webanwendung nach Ihrem Belieben verwenden.

Ein weiterer großer Vorteil der IronPDF-Bibliothek ist, dass sie sowohl mit C# als auch mit VB.NET verwendet werden kann.

Beginnen wir die Demonstration ohne weitere Verzögerung.


Schritt Nr. 1: Erstellen eines Visual Studio Projekts

Öffnen Sie Visual Studio. Ich verwende Visual Studio 2019.

Klicken Sie auf 'Neues Projekt erstellen':

C# Read PDF File: Einfaches Tutorial, Abbildung 3: Neues Projekt erstellen Neues Projekt erstellen

Wählen Sie jetzt die Windows Forms App aus der Vorlage, drücken Sie 'Weiter', und das folgende Fenster wird angezeigt. Geben Sie einen Projektnamen ein. Ich habe 'Read Pdf using IronPDF' geschrieben.

C# Read PDF File: Einfaches Tutorial, Abbildung 16: Projektkonfiguration über Visual Studio Projektkonfiguration über Visual Studio

Klicken Sie nun auf 'Weiter', und das folgende Fenster wird angezeigt. Wählen Sie '.NET Core 3.1' aus dem Dropdown-Menü.

C# Read PDF File: Einfaches Tutorial, Abbildung 9: .NET Core 3.1-Version .NET Core 3.1-Version

Klicken Sie auf die Schaltfläche 'Erstellen', und das Projekt wird wie unten gezeigt erstellt.

C# Read PDF File: Einfaches Tutorial, Abbildung 6: Anfangsstadium einer neuen Windows Forms-Anwendung Anfangsstadium einer neuen Windows Forms-Anwendung


Schritt Nr. 2: Installieren Sie das IronPDF NuGet-Paket

Klicken Sie auf das Projektmenü in der Menüleiste und eine Dropdown-Liste wird angezeigt. Wählen Sie NuGet Pakete verwalten aus und klicken Sie darauf. Das folgende Fenster wird angezeigt:

C# Read PDF File: Einfaches Tutorial, Abbildung 1: NuGet-Paketmanager NuGet-Paket-Manager

Klicken Sie jetzt auf 'Durchsuchen'. Das folgende Fenster wird angezeigt:

C# Read PDF File: Einfaches Tutorial, Abbildung 2: NuGet-Paketmanager-UI NuGet-Paketmanager-UI

Geben Sie IronPdf in das Suchfeld ein und drücken Sie 'Enter'. Das folgende Fenster wird angezeigt:

C# Read PDF File: Einfaches Tutorial, Abbildung 4: NuGet-Lösung NuGet-Lösung

Wählen Sie IronPdf aus und klicken Sie darauf. Das folgende Fenster wird angezeigt: C# Read PDF File: Einfaches Tutorial, Abbildung 7: Kostenloses IronPdf installieren Kostenloses IronPdf installieren

Drücken Sie die Schaltfläche 'Installieren' und warten Sie, bis die Installation abgeschlossen ist. Das folgende Fenster wird nach einer erfolgreichen Installation angezeigt:

C# Read PDF File: Einfaches Tutorial, Abbildung 5: IronPdf für .NET IronPdf für .NET

Drücken Sie die 'Ok'-Schaltfläche, und Sie sind startklar.

Hinweis: Es gibt andere Möglichkeiten, das NuGet-Paket herunterzuladen. Sie können IronPdf auch mit der Paket-Manager-Konsole installieren; Öffnen Sie die Paket-Manager-Konsole und schreiben Sie den folgenden Code:

Install-Package IronPdf

Sie können es auch auf der NuGet-Paketseite von IronPDF herunterladen.

Die folgende Readme.txt-Datei wird geöffnet:

C# Read PDF File: Einfaches Tutorial, Abbildung 12: IronPdf's README-Datei mit Code-Beispielen IronPdf's README-Datei mit Code-Beispielen

Ich schlage vor, dass Sie alle Links durchgehen und weitere IronPDF-Codebeispiele zu dieser Bibliothek erkunden.


Schritt Nr. 3: Designen Sie eine Windows Forms-App

Nachdem ein Projekt erstellt und das NuGet-Paket installiert wurde, besteht der nächste Schritt darin, eine Windows Forms-App zu gestalten, die den Benutzer fragt, eine Datei zu durchsuchen und deren Inhalt anzuzeigen.

Öffnen Sie das Form1-Design:

C# Read PDF File: Einfaches Tutorial, Abbildung 14: Form1 Design-UI Form1 Design UI

Klicken Sie auf die Symbolleiste, die sich auf der linken Seite des Fensters befindet:

C# Read PDF File: Einfaches Tutorial, Abbildung 15: Werkzeugkasten-UI für Label und TextBox Werkzeugkasten-UI für Label und TextBox

Suchen Sie nach 'Label' und ziehen Sie es in das Form-Design

Benennen Sie das Label. Hier habe ich es 'C# Read Pdf using IronPDF' genannt.

C# Read PDF File: Einfaches Tutorial, Abbildung 20: Form1 UI mit hinzugefügtem Label Form1 UI mit hinzugefügtem Label

Ziehen Sie als nächstes ein Textfeld (um den Dateipfad anzuzeigen), drei Schaltflächen (eine zum Durchsuchen der Dateien, eine zum Lesen von PDF-Dateien mit IronPDF und die dritte Schaltfläche zum 'Text löschen'-Felder) und ein RichTextBox (zum Lesen und Anzeigen der Dateiinhalte).

Setzen Sie die Eigenschaft "Nur Lesen" für das Textfeld und das RichTextBox auf "Falsch". Dies soll so sein, dass Benutzer nur die Inhalte und den Dateipfad lesen können.

C# Read PDF File: Einfaches Tutorial, Abbildung 10: Vollständig gestaltetes Form1 Vollständig gestaltetes Form1


Schritt Nr. 4: Fügen Sie den Backend-Code zum Durchsuchen von PDF-Dateien hinzu

Doppelklicken Sie auf die Schaltfläche 'Durchsuchen', und das folgende Fenster wird angezeigt:

private void Browse_Click(object sender, EventArgs e)
{
}
private void Browse_Click(object sender, EventArgs e)
{
}
Private Sub Browse_Click(ByVal sender As Object, ByVal e As EventArgs)
End Sub
$vbLabelText   $csharpLabel

Schreiben Sie als Nächstes den folgenden Code in die Browse_Click-Funktion:

private void Browse_Click(object sender, EventArgs e)
{
    // Initialize and configure OpenFileDialog
    OpenFileDialog browseFile = new OpenFileDialog
    {
        InitialDirectory = @"D:\",
        Title = "Browse Pdf Files",
        CheckFileExists = true,
        CheckPathExists = true,
        DefaultExt = "pdf",
        Filter = "pdf files (*.pdf)|*.pdf",
        FilterIndex = 2,
        RestoreDirectory = true,
        ReadOnlyChecked = true,
        ShowReadOnly = true
    };

    // Show the dialog and get result
    if (browseFile.ShowDialog() == DialogResult.OK)
    {
        // Set the text box with the selected file path
        FilePath.Text = browseFile.FileName;
    }
}
private void Browse_Click(object sender, EventArgs e)
{
    // Initialize and configure OpenFileDialog
    OpenFileDialog browseFile = new OpenFileDialog
    {
        InitialDirectory = @"D:\",
        Title = "Browse Pdf Files",
        CheckFileExists = true,
        CheckPathExists = true,
        DefaultExt = "pdf",
        Filter = "pdf files (*.pdf)|*.pdf",
        FilterIndex = 2,
        RestoreDirectory = true,
        ReadOnlyChecked = true,
        ShowReadOnly = true
    };

    // Show the dialog and get result
    if (browseFile.ShowDialog() == DialogResult.OK)
    {
        // Set the text box with the selected file path
        FilePath.Text = browseFile.FileName;
    }
}
Private Sub Browse_Click(ByVal sender As Object, ByVal e As EventArgs)
	' Initialize and configure OpenFileDialog
	Dim browseFile As New OpenFileDialog With {
		.InitialDirectory = "D:\",
		.Title = "Browse Pdf Files",
		.CheckFileExists = True,
		.CheckPathExists = True,
		.DefaultExt = "pdf",
		.Filter = "pdf files (*.pdf)|*.pdf",
		.FilterIndex = 2,
		.RestoreDirectory = True,
		.ReadOnlyChecked = True,
		.ShowReadOnly = True
	}

	' Show the dialog and get result
	If browseFile.ShowDialog() = DialogResult.OK Then
		' Set the text box with the selected file path
		FilePath.Text = browseFile.FileName
	End If
End Sub
$vbLabelText   $csharpLabel

OpenFileDialog erstellt eine Instanz der Dateidialogsteuerung der Windows Forms-App.

Ich habe den Initialpfad auf das D-Laufwerk gesetzt; Sie können es auf jeden beliebigen setzen.

Ich habe DefaultExt = "pdf" gesetzt, da wir nur die PDF-Datei lesen müssen.

Ich habe einen Filter verwendet, sodass das Durchsuchen der Datei-Dialog Ihnen nur die PDF-Datei zur Auswahl zeigt.

Wenn der Benutzer auf 'Ok' klickt, wird der Dateipfad im Feld Dateipfad angezeigt.

Lassen Sie uns die Lösung ausführen und die Schaltfläche 'Durchsuchen' testen.

C# Read PDF File: Einfaches Tutorial, Abbildung 10: Form1-UI Form1-UI

Drücken Sie die Schaltfläche 'Durchsuchen', und das folgende Fenster wird angezeigt:

C# Read PDF File: Einfaches Tutorial, Abbildung 11: Dialog zum Durchsuchen von Dateien, um eine PDF-Datei auszuwählen Dialog zum Durchsuchen von Dateien, um eine PDF-Datei auszuwählen

Wählen Sie die Datei aus (ich wähle IronPDFTest.pdf) und drücken Sie 'Öffnen'. Das folgende Fenster wird angezeigt.

C# Read PDF File: Einfaches Tutorial, Abbildung 13: PDF in C# PDF in C#

Nun lassen Sie uns den Code hinter der 'Lesen'-Schaltfläche schreiben, um die Datei zu lesen.


Schritt Nr. 5: Fügen Sie den Backend-Code zum Lesen von PDF-Dokumenten mit IronPDF hinzu

Sie denken vielleicht, dass der Code zum Lesen einer PDF-Datei komplex und schwer zu schreiben und zu verstehen wäre.

Keine Sorge. IronPDF hat alles vereinfacht und es so viel einfacher gemacht. Wir können die PDF-Datei einfach mit nur zwei Codezeilen lesen.

Gehen Sie zum Form1-Design und 'doppelklicken' Sie auf die 'Lesen'-Schaltfläche. Das folgende Fenster wird angezeigt:

private void Read_Click(object sender, EventArgs e)
{
}
private void Read_Click(object sender, EventArgs e)
{
}
Private Sub Read_Click(ByVal sender As Object, ByVal e As EventArgs)
End Sub
$vbLabelText   $csharpLabel

Fügen Sie einen Namensraum using IronPdf hinzu, um die IronPDF-Bibliothek zu importieren:

using System;
using IronPdf;
using System;
using IronPdf;
Imports System
Imports IronPdf
$vbLabelText   $csharpLabel

Schreiben Sie den folgenden Code in die Read_Click-Funktion:

private void Read_Click(object sender, EventArgs e)
{
    // Read the PDF file using IronPdf
    using PdfDocument pdf = PdfDocument.FromFile(FilePath.Text);

    // Extract and display the text from the PDF
    FileContent.Text = pdf.ExtractAllText(); 
}
private void Read_Click(object sender, EventArgs e)
{
    // Read the PDF file using IronPdf
    using PdfDocument pdf = PdfDocument.FromFile(FilePath.Text);

    // Extract and display the text from the PDF
    FileContent.Text = pdf.ExtractAllText(); 
}
Private Sub Read_Click(ByVal sender As Object, ByVal e As EventArgs)
	' Read the PDF file using IronPdf
	Using pdf As PdfDocument = PdfDocument.FromFile(FilePath.Text)
	
		' Extract and display the text from the PDF
		FileContent.Text = pdf.ExtractAllText()
	End Using
End Sub
$vbLabelText   $csharpLabel

FilePath ist der Name des Textfeldes, das den Speicherort des PDF-Dokuments anzeigt, das wir lesen möchten. Wir werden den Speicherort der Datei dynamisch erhalten.

ExtractAllText mit IronPDF ist die IronPDF-Funktion, die alle Daten aus PDF-Seiten extrahiert. Diese Daten werden dann im RichTextBox angezeigt und als 'File Content' benannt.

Als nächstes schreiben wir den Code hinter dem "Löschen-Button". Dies ist nur ein zusätzliches Element, wenn Sie den Bildschirm löschen möchten, nachdem Sie das PDF-Dokument gelesen haben.

Doppelklicken Sie auf die "Löschen-Button", und es führt Sie zu folgendem Code:

void Clear_Click(object sender, EventArgs e)
{
}
void Clear_Click(object sender, EventArgs e)
{
}
Private Sub Clear_Click(ByVal sender As Object, ByVal e As EventArgs)
End Sub
$vbLabelText   $csharpLabel

Schreiben Sie den folgenden Code in die Clear_Click-Funktion:

void Clear_Click(object sender, EventArgs e)
{
    // Clear the file path and content display fields
    FileContent.Text = "";
    FilePath.Text = "";
}
void Clear_Click(object sender, EventArgs e)
{
    // Clear the file path and content display fields
    FileContent.Text = "";
    FilePath.Text = "";
}
Private Sub Clear_Click(ByVal sender As Object, ByVal e As EventArgs)
	' Clear the file path and content display fields
	FileContent.Text = ""
	FilePath.Text = ""
End Sub
$vbLabelText   $csharpLabel

Lauf die Lösung

Klicken Sie auf den 'Durchsuchen'-Button und wählen Sie das Dokument aus, das Sie lesen möchten. In meinem Fall lese ich das IronPDF.pdf-Dokument als Beispiel:

C# Read PDF File: Einfaches Tutorial, Abbildung 8: PDF-Dokumente PDF-Dokumente

Drücken Sie die Schaltfläche 'Öffnen', und das folgende Fenster wird angezeigt:

C# Read PDF File: Einfaches Tutorial, Abbildung 13: Anwendung mit ausgewählter PDF-Datei Anwendung mit ausgewählter PDF-Datei

Drücken Sie die 'Lesen'-Schaltfläche. Es wird die Datei gelesen und den Inhalt wie unten gezeigt anzeigen.

C# Read PDF File: Einfaches Tutorial, Abbildung 19: PDF-Textinhalt anzeigen PDF-Textinhalt anzeigen


Zusammenfassung

Dies ist eine Beispiel-Lösung. Egal wie viele Seiten, Bilder oder Texte in Ihren PDF-Dateien enthalten sind, IronPDF wird alle Texte und Bilder extrahieren, damit Sie sie für beliebige Zwecke verwenden können. Sie müssen lediglich die Lizenz für die Bibliothek erhalten und sie verwenden.

Damit ist das Tutorial abgeschlossen. Ich hoffe, Sie haben alles verstanden, und wenn Sie Fragen haben, zögern Sie nicht, sie im Kommentarbereich zu stellen.

Sie können die Projekt-zip-Datei herunterladen. Wenn Sie das komplette Softwarepaket von Iron kaufen möchten, bedeutet unser Spezialangebot, dass Sie jetzt alle für den Preis von nur zwei Lite-Lizenzen kaufen können.

Häufig gestellte Fragen

Wie kann ich Text aus einer PDF-Datei mit C# lesen?

Sie können Text aus einer PDF-Datei mit IronPDF lesen, indem Sie die ExtractAllText-Methode verwenden, die es Ihnen ermöglicht, den gesamten Textinhalt leicht aus einem PDF-Dokument zu extrahieren.

Was sind die Vorteile der Verwendung von IronPDF zur PDF-Bearbeitung in C#?

IronPDF bietet einen unkomplizierten Ansatz zum Lesen, Generieren und Manipulieren von PDFs in C#. Es ermöglicht Entwicklern Aufgaben wie Textextraktion und Bildabruf mit minimalem Codeaufwand zu erledigen, was Produktivität und Effizienz steigert.

Wie installiere ich die IronPDF-Bibliothek in meinem C#-Projekt?

Um IronPDF zu installieren, verwenden Sie den NuGet-Paket-Manager in Visual Studio. Suchen Sie einfach nach 'IronPdf' in der Paket-Manager-Konsole und klicken Sie auf 'Installieren', um es in Ihrem Projekt einzuschließen.

Kann IronPDF verwendet werden, um Bilder aus einer PDF-Datei zu extrahieren?

Ja, IronPDF bietet Funktionalität zum Extrahieren von Bildern aus einer PDF-Datei, sodass Entwickler Zugang zu allen im Dokument enthaltenen Bildern haben und sie manipulieren können.

Welche Schritte sind erforderlich, um ein Visual Studio-Projekt zum Lesen von PDF-Dateien einzurichten?

Das Einrichten eines Projekts umfasst das Erstellen eines neuen Visual Studio-Projekts, das Installieren des IronPDF NuGet-Pakets, das Entwerfen einer Windows Forms App und die Implementierung von Back-End-Code zum Durchsuchen und Lesen von PDF-Dateien.

Wie kann ich sicherstellen, dass die Felder in meiner Anwendung nach dem Lesen einer PDF geleert werden?

Sie können eine 'Löschen'-Schaltfläche in Ihrer Anwendung implementieren, die den Inhalt der TextBox und RichTextBox auf eine leere Zeichenfolge zurücksetzt und somit sicherstellt, dass die Felder nach der Verarbeitung einer PDF geleert werden.

Ist es möglich, IronPDF mit VB.NET zu verwenden?

Ja, IronPDF ist sowohl mit C# als auch mit VB.NET kompatibel und bietet Entwicklern, die in verschiedenen .NET-Sprachen arbeiten, eine vielseitige Option.

Wie viele Codezeilen sind erforderlich, um PDF-Inhalte mit IronPDF anzuzeigen?

Sie können PDF-Inhalte mit nur zwei Codezeilen mit IronPDF anzeigen, was seine Fähigkeit zur Vereinfachung von PDF-Verarbeitungsvorgängen hervorhebt.

Für was wird die 'RenderHtmlAsPdf'-Methode in IronPDF verwendet?

Die RenderHtmlAsPdf-Methode in IronPDF wird verwendet, um HTML-Strings in PDF-Dokumente zu konvertieren, sodass Webinhalte nahtlos in PDF-Dateien integriert werden können.

Ist IronPDF vollständig mit .NET 10 kompatibel?

Ja. IronPDF ist vollständig kompatibel mit .NET 10 sowie mit früheren Versionen wie .NET 6–9, .NET Core, .NET Standard und .NET Framework. Es unterstützt die Installation über NuGet und funktioniert nahtlos auf verschiedenen Plattformen, darunter Windows, Linux und macOS.

Curtis Chau
Technischer Autor

Curtis Chau hat einen Bachelor-Abschluss in Informatik von der Carleton University und ist spezialisiert auf Frontend-Entwicklung mit Expertise in Node.js, TypeScript, JavaScript und React. Leidenschaftlich widmet er sich der Erstellung intuitiver und ästhetisch ansprechender Benutzerschnittstellen und arbeitet gerne mit modernen Frameworks sowie der Erstellung gut strukturierter, optisch ansprechender ...

Weiterlesen