using IronPdf;
// Disable local disk access or cross-origin requests
Installation.EnableWebSecurity = true;
// Instantiate Renderer
var renderer = new ChromePdfRenderer();
// Create a PDF from a HTML string using C#
var pdf = renderer.RenderHtmlAsPdf("<h1>Hello World</h1>");
// Export to a file or Stream
pdf.SaveAs("output.pdf");
// Advanced Example with HTML Assets
// Load external html assets: Images, CSS and JavaScript.
// An optional BasePath 'C:\site\assets\' is set as the file location to load assets from
var myAdvancedPdf = renderer.RenderHtmlAsPdf("<img src='icons/iron.png'>", @"C:\site\assets\");
myAdvancedPdf.SaveAs("html-with-assets.pdf");
C#-Tutorial: Erstellen eines PDF-Textanzeigers mit IronPDF (Windows Forms)
Chipego Kalinda
21. August 2024
Aktualisiert 19. Mai 2025
Teilen Sie:
Im heutigen digitalen Zeitalter sind PDF-Dateien integraler Bestandteil vieler Arbeitsabläufe in Bildung, Wirtschaft und im persönlichen Gebrauch. Sie sind ein Standardformat zum Teilen und Präsentieren verschiedener Daten, einschließlich Texten, Bildern und Tabellen.
Während die Anzeige kompletter PDF-Dokumente mit vollständiger visueller Wiedergabetreue in einer C# Windows Forms-Anwendung spezielle Rendering-Komponenten erfordern kann, haben Entwickler oft andere Bedürfnisse. Manchmal besteht das Ziel darin, PDF-Text in C# zu lesen, Daten zu extrahieren oder den Textinhalt eines PDFs zur schnellen Durchsicht, Indexierung oder Barrierefreiheit anzuzeigen.
Dieser Artikel führt Sie durch die Erstellung einer Anwendung, die sich auf diese spezielle Aufgabe konzentriert: den Bau eines einfachen C#-PDF-Textinhaltsbetrachters unter Verwendung von IronPDF, einer leistungsstarken .NET-Bibliothek. Sie lernen, wie Sie IronPDF verwenden, um eine PDF-Datei zu laden und ihren Textinhalt effektiv in einer Windows Forms-Anwendung zu extrahieren und anzuzeigen.
Was ist IronPDF?
IronPDF ist eine umfassende C#-Bibliothek, die .NET-Entwickler dabei unterstützt, PDF-Dateien innerhalb ihrer Anwendungen zu erstellen, zu bearbeiten und zu verarbeiten. Es ermöglicht Benutzern, HTML, Bilder und SVG in PDF-Dokumente zu konvertieren und, was für dieses Tutorial wichtig ist, Inhalte aus bestehenden PDFs zu lesen und zu extrahieren. IronPDF ist für einfache Bedienung konzipiert und bietet eine breite Palette an Funktionen zur Bearbeitung von PDF-Dateien.
Verwenden Sie den IronPDFWindows Installer für die direkte Produktinstallation.
Anforderungen für den Aufbau eines PDF-Text-Viewers
Um diese C#-PDF-Textanzeigeanwendung zu erstellen, benötigen Sie:
Visual Studio: Eine Integrierte Entwicklungsumgebung (IDE) zur Erstellung von Windows Forms-Anwendungen.
IronPDF: Ein NuGet-Paket, das die Funktionalität zum Lesen, Erstellen und Bearbeiten von PDF-Dokumenten bietet, einschließlich der Textextraktion.
IronPDF kann auch PDFs aus HTML erstellen, eine separate Funktion zur Textextraktion, die in diesem Tutorial gezeigt wird.
Schritte zur Erstellung eines PDF-Textanzeigers in C# mit IronPDF
Schritt 1: Erstellen Sie eine neue Windows Forms-Anwendung in Visual Studio
Um zu beginnen, starten Sie Visual Studio und klicken Sie auf "Create a new project". Wählen Sie "Windows Forms App (.NET Framework)" oder ein ähnliches .NET-Template aus der Liste aus.
Erstellung eines neuen Projekts in Visual Studio
Geben Sie als Nächstes einen Namen für Ihr Projekt an (z. B. CSharpPdfTextReader) und klicken Sie auf die Schaltfläche Erstellen. Dies wird ein neues Windows Forms-Anwendungsprojekt einrichten.
Schritt 2: Installieren Sie die IronPDF-Bibliothek
Verwendung des NuGet-Paket-Manager-GUI
Im Projektmappen-Explorer klicken Sie mit der rechten Maustaste auf Ihr Projekt und wählen Sie "NuGet-Pakete verwalten..."
Gehen Sie zum Tab „Durchsuchen“ und suchen Sie nach „IronPdf“.
Wählen Sie das IronPdf-Paket aus und klicken Sie auf "Installieren".
Installation von IronPDF über den NuGet-Paket-Manager
Installation mit NuGet
PM > Install-Package IronPdf
Schauen Sie sich IronPDF auf NuGet für eine schnelle Installation an. Mit über 10 Millionen Downloads revolutioniert es die PDF-Entwicklung mit C#. Sie können auch die DLL oder den Windows-Installer herunterladen.
NuGet-Paketmanager-Konsole verwenden
Alternativ können Sie die Paket-Manager-Konsole öffnen (Tools > NuGet-Paket-Manager > Paket-Manager-Konsole) und den Befehl ausführen:
Install-Package IronPdf
Install-Package IronPdf
SHELL
Dies wird IronPDF und seine Abhängigkeiten in Ihr Projekt herunterladen und installieren.
Schritt 3: Fügen Sie ein RichTextBox in Ihr Formular zur Textanzeige hinzu
Wir werden ein RichTextBox-Steuerelement verwenden, um den extrahierten Textinhalt aus der PDF anzuzeigen. Ein RichTextBox eignet sich zur Anzeige von formatiertem Text, obwohl es in diesem Tutorial seine Hauptrolle darin besteht, den von IronPDF extrahierten Klartext darzustellen. Es zeigt effektiv die Textinformationen, ohne den ursprünglichen visuellen Layout des PDFs darzustellen.
Um ein RichTextBox hinzuzufügen:
Öffnen Sie Ihr Formular in der Designeransicht.
Gehen Sie zum Toolbox (Ansicht > Toolbox).
Finden Sie RichTextBox unter "Allgemeine Steuerelemente" und ziehen Sie es auf Ihr Formular.
Passen Sie die Größe und Position bei Bedarf an. Im Eigenschaftenfenster können Sie den Name (z.B. pdfDataRichTextBox) festlegen und die Dock-Eigenschaft auf Fill setzen, wenn es den größten Teil des Formulars einnehmen soll.
Hinzufügen eines RichTextBox zu Form1 zur Anzeige von extrahiertem PDF-Text
Schritt 4: Fügen Sie eine Schaltfläche zum Auswählen der PDF-Datei hinzu
Fügen Sie Ihrer Form ein Button-Steuerelement hinzu. Benutzer klicken auf diese Schaltfläche, um einen Dateidialog zu öffnen und eine PDF-Datei zur Textextraktion auszuwählen.
Ziehen Sie ein Button aus der Toolbox auf Ihr Formular.
Im Eigenschaftenfenster setzen Sie seinen Name (z.B. openBtn) und Text (z.B. "PDF öffnen & Text anzeigen").
Hinzufügen einer Schaltfläche zu Form1, um die PDF-Auswahl zu starten
Schritt 5: C#-Code hinzufügen, um PDF zu laden und Text zu extrahieren
Doppelklicken Sie auf die Schaltfläche, die Sie gerade hinzugefügt haben ("Open PDF & Display Text"), um den Click-Ereignishandler in Form1.cs zu erstellen.
Zuerst stellen Sie sicher, dass Sie den IronPDF-Namespace am Anfang Ihrer Form1.cs-Datei importiert haben:
using IronPdf;
using System; // For EventArgs, Exception
using System.Windows.Forms; // For OpenFileDialog, MessageBox, DialogResult, etc.
using IronPdf;
using System; // For EventArgs, Exception
using System.Windows.Forms; // For OpenFileDialog, MessageBox, DialogResult, etc.
Imports IronPdf
Imports System ' For EventArgs, Exception
Imports System.Windows.Forms ' For OpenFileDialog, MessageBox, DialogResult, etc.
$vbLabelText $csharpLabel
Implementieren Sie nun den Ereignishandler für den Button-Klick. Dieser Code wird:
Fordern Sie den Benutzer auf, eine PDF-Datei auszuwählen.
Verwenden Sie IronPDF, um die ausgewählte PDF-Datei zu laden.
Verwenden Sie die ExtractAllText()-Methode von IronPDF, um den gesamten Text aus dem PDF zu extrahieren.
Zeigen Sie diesen extrahierten Text im RichTextBox an.
private void openBtn_Click(object sender, EventArgs e)
{
var openFileDialog = new OpenFileDialog();
openFileDialog.Filter = "PDF files (*.pdf)
*.pdf
All files (*.*)
*.*";
openFileDialog.Title = "Select a PDF file to extract text from";
if (openFileDialog.ShowDialog() == DialogResult.OK)
{
try
{
// It's recommended to set your license key once at application startup.
// License.LicenseKey = "YourIronPdfLicenseKey";
// If no key is set, IronPDF runs in trial mode (watermarks on output, time limits).
// For text extraction, the trial is fully functional for development.
// Load the selected PDF using IronPDF
var pdf = PdfDocument.FromFile(openFileDialog.FileName);
// Extract all text content from the PDF
string extractedText = pdf.ExtractAllText();
// Display the extracted text in the RichTextBox
// (Assuming your RichTextBox is named pdfDataRichTextBox, change if different)
pdfDataRichTextBox.Text = extractedText;
}
catch (Exception ex)
{
MessageBox.Show("An error occurred while processing the PDF file: " + ex.Message, "Error", MessageBoxButtons.OK, MessageBoxIcon.Error);
}
}
}
private void openBtn_Click(object sender, EventArgs e)
{
var openFileDialog = new OpenFileDialog();
openFileDialog.Filter = "PDF files (*.pdf)
*.pdf
All files (*.*)
*.*";
openFileDialog.Title = "Select a PDF file to extract text from";
if (openFileDialog.ShowDialog() == DialogResult.OK)
{
try
{
// It's recommended to set your license key once at application startup.
// License.LicenseKey = "YourIronPdfLicenseKey";
// If no key is set, IronPDF runs in trial mode (watermarks on output, time limits).
// For text extraction, the trial is fully functional for development.
// Load the selected PDF using IronPDF
var pdf = PdfDocument.FromFile(openFileDialog.FileName);
// Extract all text content from the PDF
string extractedText = pdf.ExtractAllText();
// Display the extracted text in the RichTextBox
// (Assuming your RichTextBox is named pdfDataRichTextBox, change if different)
pdfDataRichTextBox.Text = extractedText;
}
catch (Exception ex)
{
MessageBox.Show("An error occurred while processing the PDF file: " + ex.Message, "Error", MessageBoxButtons.OK, MessageBoxIcon.Error);
}
}
}
Private Sub openBtn_Click(ByVal sender As Object, ByVal e As EventArgs)
Dim openFileDialog As New OpenFileDialog()
openFileDialog.Filter = "PDF files (*.pdf) *.pdf All files (*.*) *.*"
openFileDialog.Title = "Select a PDF file to extract text from"
If openFileDialog.ShowDialog() = DialogResult.OK Then
Try
' It's recommended to set your license key once at application startup.
' License.LicenseKey = "YourIronPdfLicenseKey";
' If no key is set, IronPDF runs in trial mode (watermarks on output, time limits).
' For text extraction, the trial is fully functional for development.
' Load the selected PDF using IronPDF
Dim pdf = PdfDocument.FromFile(openFileDialog.FileName)
' Extract all text content from the PDF
Dim extractedText As String = pdf.ExtractAllText()
' Display the extracted text in the RichTextBox
' (Assuming your RichTextBox is named pdfDataRichTextBox, change if different)
pdfDataRichTextBox.Text = extractedText
Catch ex As Exception
MessageBox.Show("An error occurred while processing the PDF file: " & ex.Message, "Error", MessageBoxButtons.OK, MessageBoxIcon.Error)
End Try
End If
End Sub
$vbLabelText $csharpLabel
Code-Aufschlüsselung:
openFileDialog: Ein Standarddialog zur Dateiauswahl, gefiltert für PDF-Dateien.
PdfDocument.FromFile(openFileDialog.FileName): Diese IronPDF-Methode lädt das ausgewählte PDF in ein PdfDocument-Objekt.
pdf.ExtractAllText(): Dies ist die wichtigste Funktion von IronPDF für dieses Tutorial. Es liest den gesamten PDF und extrahiert alle erkennbaren Textinhalte in einen einzigen String. Dies ist unglaublich nützlich für C# parse PDF text-Szenarien.
pdfDataRichTextBox.Text = extractedText;: Der extrahierte Text wird dann der Text-Eigenschaft Ihres RichTextBox zugewiesen (stellen Sie sicher, dass der Name pdfDataRichTextBox mit dem übereinstimmt, den Sie Ihrem RichTextBox-Steuerelement gegeben haben).
Dies demonstriert, wie IronPDF das Lesen von PDF-Text in C# vereinfacht und es Entwicklern ermöglicht, auf PDF-Inhalte programmatisch mit minimalem Aufwand zuzugreifen.
Schritt 6: Bauen und Führen Sie Ihre C# PDF-Textanzeige-Anwendung aus
In Visual Studio gehen Sie zum Menü "Erstellen" und wählen Sie "Lösung erstellen".
Nach erfolgreichem Build drücken Sie "F5" oder klicken Sie auf die Schaltfläche "Start", um die Anwendung auszuführen.
Ihr Anwendungsfenster wird angezeigt. Klicken Sie auf die Schaltfläche „PDF öffnen & Text anzeigen“, wählen Sie eine PDF-Datei von Ihrem Computer und klicken Sie auf „Öffnen“.
Ausführen der C# PDF Textanzeigeanwendung
Das RichTextBox zeigt dann den aus der ausgewählten PDF-Datei extrahierten Textinhalt an.
Textinhalt aus der PDF extrahiert und im RichTextBox angezeigt
Für Informationen zum visuellen Rendern von PDFs in MAUI-Anwendungen (was sich von diesem Tutorial zum Textextraktionsfokus unterscheidet), können Sie das "PDF Viewing in MAUI Tutorial" erkunden.
Fazit: Einfacher Zugriff auf PDF-Textinhalte mit C# und IronPDF
Indem Sie diese Schritte befolgen, haben Sie eine C# Windows Forms-Anwendung erstellt, die effektiv Textinhalte aus PDF-Dateien unter Verwendung von IronPDF extrahiert und anzeigt. Dieser Ansatz ist wertvoll, wenn Sie programmatisch auf die Textinformationen innerhalb von PDFs zugreifen müssen, um sie in Ihren .NET-Anwendungen anzuzeigen, zu analysieren oder weiter zu verarbeiten.
IronPDF bietet leistungsstarke Funktionen für die Textextraktion von C#-PDFs und ist nur ein Teil seines umfassenden Funktionsumfangs. Sie können IronPDF auch für fortgeschrittenere Aufgaben verwenden, wie z.B. die Textsuche in PDFs, Bearbeiten von PDF-Formularen.
Denken Sie daran, dass sich dieses Tutorial auf einen spezifischen Anwendungsfall konzentrierte: das Zugänglichmachen von PDF-Text in einer C#-Anwendung. Sie können diese Grundlage anpassen und erweitern, um komplexere Anforderungen zu erfüllen.
Wenn Sie daran interessiert sind, das volle Potenzial von IronPDF zu erkunden:
Vertiefen Sie sich in die IronPDF-Dokumentation für detaillierte Anleitungen und Beispiele.
Um IronPDF in Ihren Produktionsanwendungen ohne Testeinschränkungen zu verwenden, ist ein Lizenzschlüssel erforderlich. Sie können eine Lizenz von der IronPDF-Website erwerben. Lizenzen beginnen ab $749.
Sie können auch die volle kommerzielle Version mit einer kostenlosen Testversion evaluieren.
Chipego hat eine natürliche Fähigkeit zum Zuhören, die ihm hilft, Kundenprobleme zu verstehen und intelligente Lösungen anzubieten. Er trat dem Iron Software-Team 2023 bei, nachdem er einen Bachelor of Science in Informationstechnologie erworben hatte. IronPDF und IronOCR sind die beiden Produkte, auf die sich Chipego konzentriert hat, aber sein Wissen über alle Produkte wächst täglich, da er neue Wege findet, Kunden zu unterstützen. Er genießt die Zusammenarbeit bei Iron Software, da Teammitglieder aus dem gesamten Unternehmen ihre unterschiedlichen Erfahrungen einbringen und so zu effektiven, innovativen Lösungen beitragen. Wenn Chipego nicht an seinem Schreibtisch sitzt, kann man ihn oft bei einem guten Buch oder beim Fußballspielen antreffen.