IRONPDF VERWENDEN

C# PDF-Datei lesen: Einfaches Tutorial

Wenn Sie ein Entwickler sind, sind Sie wahrscheinlich schon einmal auf Probleme beim Lesen von Text aus einer PDF-Datei gestoßen. Vielleicht trifft eines oder mehrere der folgenden Szenarien auf Sie zu.

  1. Sie entwickeln eine Anwendung, die zwei PDF-Dokumente als Input nimmt und die Ähnlichkeit zwischen den Dokumenten findet.

  2. Sie entwickeln eine Anwendung, die PDF-Dokumente mit IronPDF lesen und die Wortanzahl zurückgeben muss.

  3. Sie entwickeln eine Anwendung, die Daten mit IronPDF aus einer PDF-Datei extrahiert und in eine strukturierte Datenbank einfügt.

  4. Sie entwickeln eine Anwendung, die PDF-Textinhalte extrahieren und in eine Zeichenkette umwandeln muss.

  5. Das Extrahieren von Daten aus PDF-Dateien mit C# war bis zur Entwicklung von IronPDF eine schwierige und komplexe Aufgabe.

    IronPDF Library Übersicht ist eine Bibliothek, die es Entwicklern erheblich erleichtert, PDF-Dateien zu lesen.

    Weitere Informationen zu IronPDF und Iron Software Suite Angeboten finden Sie hier.

    Mit nur zwei Codezeilen können Sie PDF-Dateien lesen und die Daten in einer C#-Textbox anzeigen. Ja, nur zwei Zeilen Code. Sie können auch alle Bilder aus PDFs extrahieren. Außerdem können Sie ein weiteres Dokument mit diesen Bildern erstellen oder sie in Ihrer Anwendung nach Ihren Anforderungen anzeigen.

    Wir zeigen Ihnen, wie's geht.

    Wir können mit der Anwendung Schritt für Schritt vorgehen, um beliebige PDF-Dateien auszuwählen und dann deren Inhalt anzuzeigen.

    Die folgenden Schritte zeigen Ihnen, wie Sie PDF-Dateien in C# lesen können:

    Vorausgesetzte Kenntnisse:

  6. Grundkenntnisse der C#-Programmierung

  7. Grundlegende Kenntnisse von C# GUI-Steuerelementen

    Ich habe dieses Tutorial so gestaltet, dass auch Personen, die keine Programmierkenntnisse haben, Fortschritte machen können.

    Wer sollte dies lesen

    Jeder Neuling, der C# lernt, sollte wissen, wie man PDF-Dateien mit IronPDF liest, da dies etwas ist, das Sie definitiv in Ihrer Karriere verwenden werden.

    Professionelle Entwickler sollten dies auch lesen, um die IronPDF Library zu verstehen, die uns hilft, PDF-Dokumente zu lesen, zu erzeugen und zu bearbeiten.

    Wie können wir nun diese Bibliothek in unserem Projekt zum Lesen einer PDF-Datei verwenden?

    Ich verwende eine Windows Forms App zur Demonstration. Sie können eine Konsolenanwendung, eine WPF-Anwendung oder eine ASP.NET-Webanwendung verwenden, je nachdem, was Sie bevorzugen.

    Ein weiterer großer Vorteil der IronPDF-Bibliothek ist, dass sie sowohl mit C# als auch mit VB.NET verwendet werden kann.

    Lassen Sie uns ohne weitere Verzögerung mit der Demonstration beginnen.


Schritt #1: Erstellen eines Visual Studio-Projekts

Öffnen Sie Visual Studio. Ich verwende Visual Studio 2019.

Klicken Sie auf "Neues Projekt erstellen":

C# PDF-Datei lesen: Einfache Anleitung, Abbildung 3: Neues Projekt erstellen

Neues Projekt erstellen

Wählen Sie nun die Windows Forms App aus der Vorlage aus, drücken Sie auf "Weiter", und das folgende Fenster erscheint. Geben Sie einen Projektnamen ein. Ich habe 'Pdf lesen mit IronPDF' geschrieben.

C# PDF-Datei lesen: Einfaches Tutorial, Abbildung 16: Projekt über Visual Studio konfigurieren

Projekt über Visual Studio konfigurieren

Klicken Sie nun auf "Weiter", und das folgende Fenster wird angezeigt. Wählen Sie ".NET Core 3.1" aus dem Dropdown-Menü.

C# Read PDF File: Einfaches Tutorial, Abbildung 9: .NET Core 3.1 Version

.NET Core 3.1-Version

Klicken Sie auf die Schaltfläche "Erstellen", und das Projekt wird wie unten dargestellt erstellt.

C# PDF-Datei lesen: Einfache Anleitung, Abbildung 6: Anfangsphase einer neuen Windows Forms-Anwendung

Anfangsstadium einer neuen Windows Forms-Anwendung


Schritt #2: Installieren Sie das IronPDF NuGet-Paket

Klicken Sie in der Menüleiste auf das Projektmenü, woraufhin eine Dropdown-Liste erscheint. Wählen Sie NuGet-Pakete verwalten, und klicken Sie darauf. Das folgende Fenster wird angezeigt:

C# PDF-Datei lesen: Einfaches Tutorial, Abbildung 1: NuGet-Paket-Manager

NuGet-Paket-Manager

Klicken Sie nun auf "Durchsuchen". Das folgende Fenster wird angezeigt:

C# PDF-Datei lesen: Einfaches Tutorial, Abbildung 2: NuGet Package Manager UI

NuGet-Paket-Manager-UI

Geben Sie IronPDF in das Suchfeld ein und drücken Sie "Enter". Das folgende Fenster wird angezeigt:

C# PDF-Datei lesen: Einfaches Tutorial, Abbildung 4: NuGet-Lösung

NuGet-Lösung

Wählen Sie IronPDF und klicken Sie darauf. Das folgende Fenster wird angezeigt:

C# PDF-Datei lesen: Einfaches Tutorial, Abbildung 7: Installiere kostenlos IronPdf

Kostenloses IronPdf installieren

Drücken Sie die Schaltfläche "Installieren" und warten Sie, bis die Installation abgeschlossen ist. Nach erfolgreicher Installation wird das folgende Fenster angezeigt:

C# PDF-Datei lesen: Einfaches Tutorial, Abbildung 5: IronPdf for .NET

IronPdf for .NET

Drücken Sie die Schaltfläche "Ok", und Sie können loslegen.

Hinweis: Es gibt auch andere Möglichkeiten, das NuGet-Paket herunterzuladen. Sie können IronPdf auch mithilfe der Paket-Manager-Konsole installieren; öffnen Sie dazu die Paketmanager-Konsole und schreiben Sie den folgenden Code:

Install-Package IronPdf

Sie können es auch auf der NuGet-Paketseite für IronPDF herunterladen.

Die folgende Readme.txt-Datei wird geöffnet:

C# PDF-Datei lesen: Einfaches Tutorial, Abbildung 12: IronPDFs README-Datei mit Codebeispielen

IronPdf's README-Datei mit Codebeispielen

Ich schlage vor, dass Sie alle Links durchgehen und weitere IronPDF-Codebeispiele zu dieser Bibliothek erkunden.


Schritt #3: Entwerfen einer Windows Forms-Anwendung

Sobald ein Projekt erstellt und das NuGet-Paket installiert ist, besteht der nächste Schritt darin, eine Windows Forms-Anwendung zu entwerfen, die den Benutzer auffordert, nach einer Datei zu suchen und deren Inhalt anzuzeigen.

Offene Form1 Design:

C# PDF-Datei lesen: Einfaches Tutorial, Abbildung 14: Form1 Design-UI

Form1 Design-Benutzeroberfläche

Klicken Sie auf die Symbolleiste auf der linken Seite des Fensters:

C# PDF-Datei lesen: Einfaches Tutorial, Abbildung 15: Toolbox-Benutzeroberfläche für Label und TextBox

Toolbox-Benutzeroberfläche für Label und TextBox

Suchen Sie nach "Label" und ziehen Sie es per Drag & Drop in den Formularentwurf

Benennen Sie das Etikett. Hier habe ich es "C# Read Pdf using IronPDF" genannt.

C# PDF-Datei lesen: Einfaches Tutorial, Abbildung 20: Form1-UI mit hinzugefügtem Label

Form1-Benutzeroberfläche mit hinzugefügtem Label

Ziehen Sie als Nächstes ein Textfeld (um den Dateipfad anzuzeigen), drei Schaltflächen (eine zum Durchsuchen der Dateien, eine zum Lesen von PDF-Dateien mit IronPDF und die dritte Schaltfläche zum "Löschen der Textfelder") sowie ein RichTextBox (zum Lesen und Anzeigen der Dateiinhalte) per Drag & Drop.

Setzen Sie die "Read Only Property" für die TextBox und RichTextBox auf "False". So können die Benutzer nur den Inhalt und den Dateipfad lesen.

C# PDF-Datei lesen: Einfaches Tutorial, Abbildung 10: Form1 vollständig gestaltet

Form1 vollständig gestaltet


Schritt #4: Hinzufügen des Backend-Codes zum Durchsuchen von PDF-Dateien

Doppelklicken Sie auf die Schaltfläche "Durchsuchen" und das folgende Fenster wird angezeigt:

private void Browse_Click(object sender, EventArgs e)
{
}
private void Browse_Click(object sender, EventArgs e)
{
}
Private Sub Browse_Click(ByVal sender As Object, ByVal e As EventArgs)
End Sub
$vbLabelText   $csharpLabel

Schreiben Sie dann den folgenden Code in die Funktion Browse_Click:

private void Browse_Click(object sender, EventArgs e)
{
    OpenFileDialog browseFile = new OpenFileDialog
    {
        InitialDirectory = @"D:\",
        Title = "Browse Pdf Files",
        CheckFileExists = true,
        CheckPathExists = true,
        DefaultExt = "pdf",
        Filter = "pdf files (*.pdf)
*.pdf",
        FilterIndex = 2,
        RestoreDirectory = true,
        ReadOnlyChecked = true,
        ShowReadOnly = true
    };
    if (browseFile.ShowDialog() == DialogResult.OK)
    {
        FilePath.Text = browseFile.FileName;
    }
}
private void Browse_Click(object sender, EventArgs e)
{
    OpenFileDialog browseFile = new OpenFileDialog
    {
        InitialDirectory = @"D:\",
        Title = "Browse Pdf Files",
        CheckFileExists = true,
        CheckPathExists = true,
        DefaultExt = "pdf",
        Filter = "pdf files (*.pdf)
*.pdf",
        FilterIndex = 2,
        RestoreDirectory = true,
        ReadOnlyChecked = true,
        ShowReadOnly = true
    };
    if (browseFile.ShowDialog() == DialogResult.OK)
    {
        FilePath.Text = browseFile.FileName;
    }
}
Private Sub Browse_Click(ByVal sender As Object, ByVal e As EventArgs)
	Dim browseFile As New OpenFileDialog With {
		.InitialDirectory = "D:\",
		.Title = "Browse Pdf Files",
		.CheckFileExists = True,
		.CheckPathExists = True,
		.DefaultExt = "pdf",
		.Filter = "pdf files (*.pdf) *.pdf",
		.FilterIndex = 2,
		.RestoreDirectory = True,
		.ReadOnlyChecked = True,
		.ShowReadOnly = True
	}
	If browseFile.ShowDialog() = DialogResult.OK Then
		FilePath.Text = browseFile.FileName
	End If
End Sub
$vbLabelText   $csharpLabel

OpenFileDialogue erstellt die Instanz des Datei-Dialogsteuerungselements der Windows Forms App.

Ich habe den Anfangspfad auf Laufwerk D gesetzt; Sie können ihn auf einen beliebigen Wert setzen.

Ich habe DefaultExt = "pdf" festgelegt, da wir nur die PDF-Datei lesen müssen.

Ich habe einen Filter verwendet, damit im Dialogfeld zum Durchsuchen von Dateien nur die PDF-Datei angezeigt wird, die Sie auswählen möchten.

Wenn der Benutzer auf "Ok" klickt, wird der Dateipfad im Feld Dateipfad angezeigt.

Führen wir die Lösung aus und testen wir die Schaltfläche "Durchsuchen".

C# PDF-Datei lesen: Einfache Anleitung, Abbildung 10: Form1-Benutzeroberfläche

Form1-Benutzeroberfläche

Klicken Sie auf die Schaltfläche "Durchsuchen", und das folgende Fenster wird angezeigt:

C# PDF-Datei lesen: Einfache Anleitung, Abbildung 11: Dateiauswahldialog zum Auswählen einer PDF-Datei

Datei-Dialogfeld durchsuchen, um eine PDF-Datei auszuwählen

Wählen Sie die Datei aus (ich wähle IronPDFTest.pdf) und drücken Sie "Öffnen". Das folgende Fenster wird angezeigt.

C# PDF-Datei lesen: Einfaches Tutorial, Abbildung 13: PDF in C#

PDF in C#

Lassen Sie uns nun den Code hinter der Schaltfläche "Lesen" schreiben, um die Datei zu lesen.


Schritt #5: Hinzufügen des Back-End-Codes zum Lesen von PDF-Dokumenten mit IronPDF

Sie denken vielleicht, dass der Code zum Lesen einer PDF-Datei komplex und schwierig zu schreiben und zu verstehen ist.

Machen Sie sich keine Sorgen. IronPDF hat die Dinge vereinfacht und alles so viel einfacher gemacht. Mit nur zwei Codezeilen können wir die PDF-Datei problemlos lesen.

Gehen Sie zu Form1 Design und "doppelklicken" Sie auf die Schaltfläche "Lesen". Das folgende Fenster wird angezeigt:

private void Read_Click(object sender, EventArgs e)
{
}
private void Read_Click(object sender, EventArgs e)
{
}
Private Sub Read_Click(ByVal sender As Object, ByVal e As EventArgs)
End Sub
$vbLabelText   $csharpLabel

Fügen Sie einen Namespace using IronPdf hinzu, um die IronPDF-Bibliothek zu importieren:

using System;
using IronPdf;
using System;
using IronPdf;
Imports System
Imports IronPdf
$vbLabelText   $csharpLabel

Schreiben Sie den folgenden Code in die Read_Click-Funktion:

private void Read_Click(object sender, EventArgs e)
{
    using PdfDocument pdf = PdfDocument.FromFile(FilePath.Text);
    FileContent.Text = pdf.ExtractAllText(); 
}
private void Read_Click(object sender, EventArgs e)
{
    using PdfDocument pdf = PdfDocument.FromFile(FilePath.Text);
    FileContent.Text = pdf.ExtractAllText(); 
}
Private Sub Read_Click(ByVal sender As Object, ByVal e As EventArgs)
	Using pdf As PdfDocument = PdfDocument.FromFile(FilePath.Text)
		FileContent.Text = pdf.ExtractAllText()
	End Using
End Sub
$vbLabelText   $csharpLabel

FilePath ist der Name des Textfelds, das den Speicherort des PDF-Dokuments anzeigt, das wir lesen möchten. Wir werden den Speicherort der Datei dynamisch ermitteln.

ExtractAllText mit IronPDF ist die IronPDF-Funktion, die alle Daten von PDF-Seiten extrahiert. Diese Daten werden dann in der Rich-Text-Box angezeigt und als "Dateiinhalt" bezeichnet.

Als Nächstes schreiben wir den Code für die Schaltfläche "Löschen". Dies ist nur ein zusätzlicher Punkt, wenn Sie den Bildschirm löschen möchten, nachdem Sie das PDF-Dokument gelesen haben.

Doppelklicken Sie auf die Schaltfläche "Löschen", um den folgenden Code aufzurufen:

void Clear_Click(object sender, EventArgs e)
{
}
void Clear_Click(object sender, EventArgs e)
{
}
Private Sub Clear_Click(ByVal sender As Object, ByVal e As EventArgs)
End Sub
$vbLabelText   $csharpLabel

Fügen Sie den folgenden Code in die Funktion Clear_Click ein:

void Clear_Click(object sender, EventArgs e)
{
    FileContent.Text = "";
    FilePath.Text = "";
}
void Clear_Click(object sender, EventArgs e)
{
    FileContent.Text = "";
    FilePath.Text = "";
}
Private Sub Clear_Click(ByVal sender As Object, ByVal e As EventArgs)
	FileContent.Text = ""
	FilePath.Text = ""
End Sub
$vbLabelText   $csharpLabel

Ausführen der Lösung

Klicken Sie auf die Schaltfläche "Durchsuchen" und wählen Sie das Dokument aus, das Sie lesen möchten. In meinem Fall lese ich die Datei IronPDF.pdf als Beispiel:

C# PDF-Datei lesen: Einfaches Tutorial, Abbildung 8: PDF-Dokumente

PDF-Dokumente

Klicken Sie auf die Schaltfläche "Öffnen" und das folgende Fenster wird angezeigt:

C# PDF-Datei lesen: Einfaches Tutorial, Abbildung 13: Anwendung mit ausgewählter PDF-Datei

Anwendung mit einer ausgewählten PDF-Datei

Drücken Sie die Taste "Lesen". Es liest die Datei und zeigt den Inhalt wie unten dargestellt an.

C# PDF-Datei lesen: Einfaches Tutorial, Abbildung 19: Anzeige des PDF-Textinhalts

PDF-Textinhalt anzeigen


Zusammenfassung

Dies ist eine Beispiellösung. Egal wie viele Seiten, Bilder oder Texte Ihre PDF-Dateien enthalten, IronPDF extrahiert alle Texte und Bilder, damit Sie sie für jeden Zweck verwenden können. Sie müssen lediglich die Lizenz für die Bibliothek erwerben und können sie dann nutzen.

Damit ist der Lehrgang abgeschlossen. Ich hoffe, Sie haben alles verstanden, und wenn Sie Fragen haben, können Sie sie gerne in den Kommentaren stellen.

Sie können die Projekt-Zip-Datei herunterladen. Wenn Sie ein komplettes Paket von Iron Software-Produkten kaufen möchten, können Sie mit unserem Sonderangebot jetzt alle Produkte zum Preis von nur zwei Produkten kaufen. Wenn Sie mehr Informationen über die Lizenz und den Support benötigen, klicken Sie bitte auf Preisinformationen von Iron Software. Sie können auch die kostenlosen Testlizenzangebote erhalten.

Chipego
Software-Ingenieur
Chipego hat eine natürliche Fähigkeit zum Zuhören, die ihm hilft, Kundenprobleme zu verstehen und intelligente Lösungen anzubieten. Er trat dem Iron Software-Team 2023 bei, nachdem er einen Bachelor of Science in Informationstechnologie erworben hatte. IronPDF und IronOCR sind die beiden Produkte, auf die sich Chipego konzentriert hat, aber sein Wissen über alle Produkte wächst täglich, da er neue Wege findet, Kunden zu unterstützen. Er genießt die Zusammenarbeit bei Iron Software, da Teammitglieder aus dem gesamten Unternehmen ihre unterschiedlichen Erfahrungen einbringen und so zu effektiven, innovativen Lösungen beitragen. Wenn Chipego nicht an seinem Schreibtisch sitzt, kann man ihn oft bei einem guten Buch oder beim Fußballspielen antreffen.
< PREVIOUS
.NET PDF Generator in 1 Klick
NÄCHSTES >
Wie man ein PDF-Dokument mit einem Passwort schützt