Test in einer Live-Umgebung
Test in der Produktion ohne Wasserzeichen.
Funktioniert überall, wo Sie es brauchen.
Wenn Sie ein Entwickler sind, sind Sie wahrscheinlich schon einmal auf Probleme beim Lesen von Text aus einer PDF-Datei gestoßen. Vielleicht trifft eines oder mehrere der folgenden Szenarien auf Sie zu.
Sie entwickeln eine Anwendung, die zwei PDF-Dokumente als Input nimmt und die Ähnlichkeit zwischen den Dokumenten findet.
Sie entwickeln eine Anwendung, die folgende Anforderungen erfüllen muss pDF-Dokumente lesen und gibt die Anzahl der Wörter zurück.
Sie entwickeln eine Anwendung, die extrahiert Daten aus einer PDF-Datei und speichert sie in einer strukturierten Datenbank.
Sie entwickeln eine Anwendung, die folgende Anforderungen erfüllen muss pDF-Textinhalt extrahieren und konvertiert sie in eine Zeichenkette.
Das Extrahieren von Daten aus PDF-Dateien mit C# war bis zur Entwicklung von IronPDF eine schwierige und komplexe Aufgabe.
IronPDF ist eine Bibliothek, die es Entwicklern erleichtert, PDF-Dateien zu lesen.
Sie können mehr erfahren über IronPDF und Iron Software Suite.
Mit nur zwei Codezeilen können Sie PDF-Dateien lesen und die Daten in einer C#-Textbox anzeigen. Ja, nur zwei Zeilen Code. Sie können auch alle Bilder extrahieren in Ihren PDF-Dateien. Außerdem können Sie ein weiteres Dokument mit diesen Bildern erstellen oder sie in Ihrer Anwendung nach Ihren Anforderungen anzeigen.
Wir zeigen Ihnen, wie's geht.
Wir können mit der Anwendung Schritt für Schritt vorgehen, um beliebige PDF-Dateien auszuwählen und dann deren Inhalt anzuzeigen.
Die folgenden Schritte zeigen Ihnen, wie Sie PDF-Dateien in C# lesen können:
Vorausgesetzte Kenntnisse:
Grundkenntnisse der C#-Programmierung
Grundlegende Kenntnisse von C# GUI-Steuerelementen
Ich habe dieses Tutorial so gestaltet, dass auch Personen, die keine Programmierkenntnisse haben, Fortschritte machen können.
Wer sollte das lesen
Jeder Neuling, der C# lernt, sollte wissen, wie man pDF-Dateien lesen denn das ist etwas, das Sie in Ihrer Karriere auf jeden Fall brauchen werden.
Professionelle Entwickler sollten dies ebenfalls lesen, um die IronPDF Library zu verstehen, die uns hilft, PDF-Dokumente zu lesen, zu erzeugen und zu manipulieren.
Wie können wir nun diese Bibliothek in unserem Projekt verwenden, um eine PDF-Datei zu lesen?
Ich verwende eine Windows Forms App zur Demonstration. Sie können eine Konsolenanwendung, eine WPF-Anwendung oder eine ASP.NET-Webanwendung verwenden, je nachdem, was Sie bevorzugen.
Ein weiterer großer Vorteil der IronPDF-Bibliothek ist, dass sie sowohl mit C# als auch mit VB.NET verwendet werden kann.
Lassen Sie uns ohne weitere Verzögerung mit der Demonstration beginnen.
Öffnen Sie Visual Studio. Ich verwende Visual Studio 2019.
Klicken Sie auf "Neues Projekt erstellen":
Neues Projekt erstellen
Wählen Sie nun die Windows Forms App aus der Vorlage aus, drücken Sie auf "Weiter", und das folgende Fenster erscheint. Geben Sie einen Projektnamen ein. Ich habe 'Pdf lesen mit IronPDF' geschrieben.
Projekt über Visual Studio konfigurieren
Klicken Sie nun auf "Weiter", und das folgende Fenster wird angezeigt. Wählen Sie ".NET Core 3.1" aus dem Dropdown-Menü.
.NET Core 3.1 Version
Klicken Sie auf die Schaltfläche "Erstellen", und das Projekt wird wie unten dargestellt erstellt.
Anfangsphase einer neuen Windows Forms-Anwendung
Klicken Sie in der Menüleiste auf das Projektmenü, woraufhin eine Dropdown-Liste erscheint. Wählen Sie NuGet-Pakete verwalten, und klicken Sie darauf. Das folgende Fenster wird angezeigt:
NuGet Package Manager
Klicken Sie nun auf "Durchsuchen". Das folgende Fenster wird angezeigt:
NuGet Package Manager UI
Geben Sie IronPDF in das Suchfeld ein und drücken Sie "Enter". Das folgende Fenster wird angezeigt:
NuGet Solution
Wählen Sie IronPDF und klicken Sie darauf. Das folgende Fenster wird angezeigt:
Installieren Sie Free IronPDF
Drücken Sie die Schaltfläche "Installieren" und warten Sie, bis die Installation abgeschlossen ist. Nach erfolgreicher Installation wird das folgende Fenster angezeigt:
IronPDF for .NET
Drücken Sie die Schaltfläche "Ok", und Sie können loslegen.
Hinweis: Es gibt auch andere Möglichkeiten, das NuGet-Paket herunterzuladen. Sie können IronPDF
auch über die Paketverwaltungskonsole installieren; öffnen Sie dazu die Paketmanager-Konsole und schreiben Sie den folgenden Code:
Install-Package IronPdf
Sie können es auch herunterladen unter die NuGet-Website.
Die folgende Readme.txt-Datei wird geöffnet:
IronPDFs Readme-Datei mit Code-Beispielen
Ich schlage vor, Sie gehen alle Links durch und mehr Code-Beispiele erkunden über diese Bibliothek.
Sobald ein Projekt erstellt und das NuGet-Paket installiert ist, besteht der nächste Schritt darin, eine Windows Forms-Anwendung zu entwerfen, die den Benutzer auffordert, nach einer Datei zu suchen und deren Inhalt anzuzeigen.
Offene Form1 Design:
Form1 Design UI
Klicken Sie auf die Symbolleiste auf der linken Seite des Fensters:
Toolbox UI für Label und TextBox
Suchen Sie nach "Label" und ziehen Sie es per Drag & Drop in den Formularentwurf
Benennen Sie das Etikett. Hier habe ich es "C# Read Pdf using IronPDF" genannt.
Form1 UI mit hinzugefügtem Label
Ziehen Sie dann ein Textfeld per Drag & Drop (um den Dateipfad anzuzeigen)drei Tasten (eine für das Durchsuchen der Dateien, eine für das Lesen von PDF-Dateien mit IronPDF und die dritte Schaltfläche für "Text löschen"-Felder)und eine RichTextBox (zum Lesen und Anzeigen des Dateiinhalts).
Setzen Sie die "Read Only Property" für die TextBox und RichTextBox auf "False". So können die Benutzer nur den Inhalt und den Dateipfad lesen.
Form1 vollständig ausgefüllt
Doppelklicken Sie auf die Schaltfläche "Durchsuchen" und das folgende Fenster wird angezeigt:
private void Browse_Click(object sender, EventArgs e)
{
}
private void Browse_Click(object sender, EventArgs e)
{
}
Private Sub Browse_Click(ByVal sender As Object, ByVal e As EventArgs)
End Sub
Schreiben Sie dann den folgenden Code in die Funktion Browse_Click:
private void Browse_Click(object sender, EventArgs e)
{
OpenFileDialog browseFile = new OpenFileDialog
{
InitialDirectory = @"D:\",
Title = "Browse Pdf Files",
CheckFileExists = true,
CheckPathExists = true,
DefaultExt = "pdf",
Filter = "pdf files (*.pdf)
*.pdf",
FilterIndex = 2,
RestoreDirectory = true,
ReadOnlyChecked = true,
ShowReadOnly = true
};
if (browseFile.ShowDialog() == DialogResult.OK)
{
FilePath.Text = browseFile.FileName;
}
}
private void Browse_Click(object sender, EventArgs e)
{
OpenFileDialog browseFile = new OpenFileDialog
{
InitialDirectory = @"D:\",
Title = "Browse Pdf Files",
CheckFileExists = true,
CheckPathExists = true,
DefaultExt = "pdf",
Filter = "pdf files (*.pdf)
*.pdf",
FilterIndex = 2,
RestoreDirectory = true,
ReadOnlyChecked = true,
ShowReadOnly = true
};
if (browseFile.ShowDialog() == DialogResult.OK)
{
FilePath.Text = browseFile.FileName;
}
}
Private Sub Browse_Click(ByVal sender As Object, ByVal e As EventArgs)
Dim browseFile As New OpenFileDialog With {
.InitialDirectory = "D:\",
.Title = "Browse Pdf Files",
.CheckFileExists = True,
.CheckPathExists = True,
.DefaultExt = "pdf",
.Filter = "pdf files (*.pdf) *.pdf",
.FilterIndex = 2,
.RestoreDirectory = True,
.ReadOnlyChecked = True,
.ShowReadOnly = True
}
If browseFile.ShowDialog() = DialogResult.OK Then
FilePath.Text = browseFile.FileName
End If
End Sub
openFileDialogue" erstellt eine Instanz des Dateidialog-Steuerelements der Windows Forms App.
Ich habe den Anfangspfad auf Laufwerk D gesetzt; Sie können ihn auf einen beliebigen Wert setzen.
Ich habe DefaultExt = "pdf"
eingestellt, da wir nur die pdf-Datei lesen müssen.
Ich habe einen Filter verwendet, damit im Dialogfeld zum Durchsuchen von Dateien nur die PDF-Datei angezeigt wird, die Sie auswählen möchten.
Wenn der Benutzer auf "Ok" klickt, wird der Dateipfad im Feld Dateipfad angezeigt.
Führen wir die Lösung aus und testen wir die Schaltfläche "Durchsuchen".
Form1 UI
Klicken Sie auf die Schaltfläche "Durchsuchen", und das folgende Fenster wird angezeigt:
Dateiauswahldialog zur Auswahl einer PDF-Datei
Wählen Sie die Datei (Ich wähle IronPDFTest.pdf) und drücken Sie "Öffnen". Das folgende Fenster wird angezeigt.
PDF in C#
Lassen Sie uns nun den Code hinter der Schaltfläche "Lesen" schreiben, um die Datei zu lesen.
Sie denken vielleicht, dass der Code zum Lesen einer PDF-Datei komplex und schwierig zu schreiben und zu verstehen ist.
Machen Sie sich keine Sorgen. IronPDF hat die Dinge vereinfacht und alles so viel einfacher gemacht. Mit nur zwei Codezeilen können wir die PDF-Datei problemlos lesen.
Gehen Sie zu Form1 Design und "doppelklicken" Sie auf die Schaltfläche "Lesen". Das folgende Fenster wird angezeigt:
private void Read_Click(object sender, EventArgs e)
{
}
private void Read_Click(object sender, EventArgs e)
{
}
Private Sub Read_Click(ByVal sender As Object, ByVal e As EventArgs)
End Sub
Fügen Sie einen Namespace using IronPdf
hinzu, um die IronPDF-Bibliothek zu importieren:
using System;
using IronPdf;
using System;
using IronPdf;
Imports System
Imports IronPdf
Schreiben Sie den folgenden Code innerhalb der Funktion "Read_Click":
private void Read_Click(object sender, EventArgs e)
{
using PdfDocument pdf = PdfDocument.FromFile(FilePath.Text);
FileContent.Text = pdf.ExtractAllText();
}
private void Read_Click(object sender, EventArgs e)
{
using PdfDocument pdf = PdfDocument.FromFile(FilePath.Text);
FileContent.Text = pdf.ExtractAllText();
}
Private Sub Read_Click(ByVal sender As Object, ByVal e As EventArgs)
Using pdf As PdfDocument = PdfDocument.FromFile(FilePath.Text)
FileContent.Text = pdf.ExtractAllText()
End Using
End Sub
dateipfad" ist der Name des Textfeldes, das den Speicherort des PDF-Dokuments anzeigt, das wir lesen wollen. Wir werden den Speicherort der Datei dynamisch ermitteln.
ExtractAllText ist die IronPDF-Funktion, die alle Daten aus PDF-Seiten extrahiert. Diese Daten werden dann in der Rich-Text-Box angezeigt und als "Dateiinhalt" bezeichnet.
Als Nächstes schreiben wir den Code für die Schaltfläche "Löschen". Dies ist nur ein zusätzlicher Punkt, wenn Sie den Bildschirm löschen möchten, nachdem Sie das PDF-Dokument gelesen haben.
Doppelklicken Sie auf die Schaltfläche "Löschen", um den folgenden Code aufzurufen:
void Clear_Click(object sender, EventArgs e)
{
}
void Clear_Click(object sender, EventArgs e)
{
}
Private Sub Clear_Click(ByVal sender As Object, ByVal e As EventArgs)
End Sub
Schreiben Sie den folgenden Code in die Funktion Clear_Click
:
void Clear_Click(object sender, EventArgs e)
{
FileContent.Text = "";
FilePath.Text = "";
}
void Clear_Click(object sender, EventArgs e)
{
FileContent.Text = "";
FilePath.Text = "";
}
Private Sub Clear_Click(ByVal sender As Object, ByVal e As EventArgs)
FileContent.Text = ""
FilePath.Text = ""
End Sub
Klicken Sie auf die Schaltfläche "Durchsuchen" und wählen Sie das Dokument aus, das Sie lesen möchten. In meinem Fall lese ich die Datei IronPDF.pdf als Beispiel:
PDF-Dokumente
Klicken Sie auf die Schaltfläche "Öffnen" und das folgende Fenster wird angezeigt:
Anwendung mit einer ausgewählten PDF-Datei
Drücken Sie die Taste "Lesen". Es liest die Datei und zeigt den Inhalt wie unten dargestellt an.
Anzeigen von PDF-Textinhalten
Dies ist eine Beispiellösung. Egal wie viele Seiten, Bilder oder Texte Ihre PDF-Dateien enthalten, IronPDF extrahiert alle Texte und Bilder, damit Sie sie für jeden Zweck verwenden können. Sie müssen lediglich die Lizenz für die Bibliothek erwerben und können sie dann nutzen.
Damit ist der Lehrgang abgeschlossen. Ich hoffe, Sie haben alles verstanden, und wenn Sie Fragen haben, können Sie sie gerne in den Kommentaren stellen.
Sie können herunterladen die Zip-Datei des Projekts. Wenn Sie ein komplettes Paket von Iron Software-Produkten kaufen möchten, können Sie mit unserem Sonderangebot jetzt alle Produkte zum Preis von nur zwei Produkten kaufen. Wenn Sie weitere Informationen über die Lizenz und den Support benötigen, klicken Sie bitte auf diese Preisseite. Sie können auch erhalten die kostenlose Testlizenz
9 .NET API-Produkte für Ihre Bürodokumente