Zum Fußzeileninhalt springen
IRONPDF NUTZEN

C#-Tutorial: Erstellen Sie einen PDF-Textinhalt-Viewer mit IronPDF (Windows-Forms)

Im heutigen digitalen Zeitalter sind PDF-Dateien integraler Bestandteil vieler Arbeitsabläufe in Bildung, Wirtschaft und persönlicher Nutzung. Sie sind ein Standardformat für das Teilen und Präsentieren verschiedener Daten, einschließlich Text, Bilder und Tabellen.

Der vollständige visuelle Wiedergabetreue innerhalb einer C# Windows Forms-Anwendung anzuzeigen, kann dedizierte Rendering-Komponenten erfordern, oft haben Entwickler jedoch andere Bedürfnisse. Manchmal ist das Ziel, PDF-Text in C# zu lesen, Daten zu extrahieren oder den Textinhalt eines PDFs zur schnellen Überprüfung, Indizierung oder Zugänglichkeit anzuzeigen.

Dieser Artikel wird Sie durch die Erstellung einer Anwendung führen, die sich auf diese spezielle Aufgabe konzentriert: den Bau eines einfachen C# PDF-Textanzeigebetrachters mithilfe von IronPDF, einer leistungsstarken .NET-Bibliothek. Sie werden lernen, wie man IronPDF verwendet, um ein PDF zu laden und seinen Textinhalt effektiv in einer Windows Forms-Anwendung zu extrahieren und anzuzeigen.

Was ist IronPDF?

IronPDF ist eine umfassende C# Bibliothek, die .NET-Entwickler in die Lage versetzt, PDF-Dateien innerhalb ihrer Anwendungen zu erstellen, zu bearbeiten und zu verarbeiten. Es ermöglicht Benutzern, HTML, Bilder und SVG in PDF-Dokumente zu konvertieren und, für dieses Tutorial wichtig, Inhalte aus bestehenden PDFs zu lesen und zu extrahieren. IronPDF ist für Benutzerfreundlichkeit ausgelegt und bietet eine breite Palette von Funktionen zur Manipulation von PDF-Dateien.

Anforderungen zum Erstellen eines PDF-Textbetrachters

Um diese C# PDF-Textanzeigeanwendung zu erstellen, benötigen Sie:

  • Visual Studio: Eine integrierte Entwicklungsumgebung (IDE) zur Erstellung von Windows Forms-Anwendungen.
  • IronPDF: Ein NuGet-Paket, das die Funktionalität zum Lesen, Erstellen und Manipulieren von PDF-Dokumenten, einschließlich Textextraktion, bietet.

Illustration, die das Konzept der HTML-zu-PDF-Konvertierung zeigt IronPDF kann auch PDFs aus HTML erstellen, eine separate Funktion von der in diesem Tutorial gezeigten Textextraktion.

Schritte zum Erstellen eines PDF-Textanzeigebetrachters in C# mit IronPDF

Schritt 1: Erstellen Sie eine neue Windows Forms-Anwendung in Visual Studio

Starten Sie Visual Studio und klicken Sie auf "Create a new project". Wählen Sie "Windows Forms App (.NET Framework)" oder eine ähnliche .NET-Vorlage aus der Liste.

Visual Studio Neuer Projekt-Dialog Visual Studio Neue Projekterstellung

Geben Sie dann Ihrem Projekt einen Namen (z.B. CSharpPdfTextReader) und klicken Sie auf die Schaltfläche Erstellen. Dies richtet ein neues Windows Forms Anwendungsprojekt ein.

Schritt 2: Installation der IronPDF-Bibliothek

Verwendung der NuGet-Paketmanager-GUI

  1. Klicken Sie im Projektmappen-Explorer mit der rechten Maustaste auf Ihr Projekt und wählen Sie "Manage NuGet Packages..."
  2. Gehen Sie zum "Browse"-Tab und suchen Sie nach "IronPdf".
  3. Wählen Sie das IronPdf Paket und klicken Sie auf "Install".

NuGet-Paketmanager in Visual Studio, in dem nach IronPDF gesucht wird Installation von IronPDF über den NuGet-Paketmanager

Verwendung der NuGet-Paketmanager-Konsole

Alternativ öffnen Sie die Paketmanager-Konsole (Tools > NuGet Package Manager > Package Manager Console) und führen Sie den Befehl aus:

Install-Package IronPdf

Dies wird IronPDF und seine Abhängigkeiten in Ihr Projekt herunterladen und installieren.

Schritt 3: Hinzufügen eines RichTextBox zu Ihrem Formular zur Textanzeige

Wir werden ein RichTextBox-Steuerelement verwenden, um den extrahierten Textinhalt aus dem PDF darzustellen. Ein RichTextBox ist gut geeignet für die Anzeige formatierten Textes, wobei seine Hauptaufgabe in diesem Tutorial besteht, den von IronPDF extrahierten einfachen Text anzuzeigen. Es zeigt effektiv die Textinformationen an, ohne zu versuchen, das originale visuelle Layout des PDFs darzustellen.

Um ein RichTextBox hinzuzufügen:

  1. Öffnen Sie Ihr Formular in der Designeransicht.
  2. Gehen Sie zur Toolbox (Ansicht > Toolbox).
  3. Finden Sie RichTextBox unter "Common Controls" und ziehen Sie es auf Ihr Formular.
  4. Passen Sie seine Größe und Position nach Bedarf an. Im Eigenschaftenfenster können Sie seinen Name (z.B. pdfDataRichTextBox) einstellen und seine Dock-Eigenschaft auf Fill setzen, wenn Sie möchten, dass es den größten Teil des Formulars einnimmt.

PDF Viewer C# Windows Anwendung (Tutorial), Abbildung 4: Zugriff auf das RichTextBox in Form1 Hinzufügen eines RichTextBox zu Form1 zur Anzeige des extrahierten PDF-Textes

Schritt 4: Hinzufügen einer Schaltfläche zum Auswählen der PDF-Datei

Fügen Sie ein Button-Steuerelement zu Ihrem Formular hinzu. Benutzer werden auf diese Schaltfläche klicken, um einen Dateidialog zu öffnen und eine PDF-Datei zur Textextraktion auszuwählen.

  1. Ziehen Sie ein Button aus der Toolbox auf Ihr Formular.
  2. Stellen Sie im Eigenschaftenfenster seinen Name (z.B. openBtn) und Text (z.B. "Open PDF & Display Text") ein.

PDF Viewer C# Windows Anwendung (Tutorial), Abbildung 5: Hinzufügen einer neuen Schaltfläche zu Form1 Hinzufügen einer Schaltfläche zu Form1 zum Auslösen der PDF-Auswahl

Schritt 5: Hinzufügen von C#-Code zum Laden von PDF und Extrahieren von Text

Doppelklicken Sie auf die soeben hinzugefügte Schaltfläche ("Open PDF & Display Text"), um deren Click-Ereignishandler in Form1.cs zu erstellen.

Stellen Sie zunächst sicher, dass Sie den IronPDF-Namespace am Anfang Ihrer Form1.cs-Datei importiert haben:

using IronPdf;
using System; // For EventArgs, Exception
using System.Windows.Forms; // For OpenFileDialog, MessageBox, DialogResult, etc.
using IronPdf;
using System; // For EventArgs, Exception
using System.Windows.Forms; // For OpenFileDialog, MessageBox, DialogResult, etc.
Imports IronPdf
Imports System ' For EventArgs, Exception
Imports System.Windows.Forms ' For OpenFileDialog, MessageBox, DialogResult, etc.
$vbLabelText   $csharpLabel

Implementieren Sie nun den Ereignishandler für den Schaltflächenklick. Dieser Code wird:

  1. Den Benutzer auffordern, eine PDF-Datei auszuwählen.
  2. IronPDF verwenden, um das ausgewählte PDF zu laden.
  3. Die ExtractAllText()-Methode von IronPDF verwenden, um den gesamten Text aus dem PDF zu extrahieren.
  4. Dieser extrahierte Text wird im RichTextBox angezeigt.
private void openBtn_Click(object sender, EventArgs e)
{
    // Create an OpenFileDialog to open PDF files
    var openFileDialog = new OpenFileDialog
    {
        Filter = "PDF files (*.pdf)|*.pdf|All files (*.*)|*.*", // Filter to show only PDFs
        Title = "Select a PDF file to extract text from" // Dialog title
    };

    // Show dialog and check if the user selected a file
    if (openFileDialog.ShowDialog() == DialogResult.OK)
    {
        try
        {
            // It's recommended to set your license key once at application startup.
            // License.LicenseKey = "YourIronPdfLicenseKey"; 
            // If no key is set, IronPDF runs in trial mode (watermarks on output, time limits).
            // For text extraction, the trial is fully functional for development.

            // Load the selected PDF using IronPDF
            var pdf = PdfDocument.FromFile(openFileDialog.FileName);

            // Extract all text content from the PDF using IronPDF
            string extractedText = pdf.ExtractAllText();

            // Display the extracted text in the RichTextBox
            // (Assuming your RichTextBox is named pdfDataRichTextBox, change if different)
            pdfDataRichTextBox.Text = extractedText; 
        }
        catch (Exception ex)
        {
            // Show error message if an exception occurs
            MessageBox.Show("An error occurred while processing the PDF file: " + ex.Message, "Error", MessageBoxButtons.OK, MessageBoxIcon.Error);
        }
    }
}
private void openBtn_Click(object sender, EventArgs e)
{
    // Create an OpenFileDialog to open PDF files
    var openFileDialog = new OpenFileDialog
    {
        Filter = "PDF files (*.pdf)|*.pdf|All files (*.*)|*.*", // Filter to show only PDFs
        Title = "Select a PDF file to extract text from" // Dialog title
    };

    // Show dialog and check if the user selected a file
    if (openFileDialog.ShowDialog() == DialogResult.OK)
    {
        try
        {
            // It's recommended to set your license key once at application startup.
            // License.LicenseKey = "YourIronPdfLicenseKey"; 
            // If no key is set, IronPDF runs in trial mode (watermarks on output, time limits).
            // For text extraction, the trial is fully functional for development.

            // Load the selected PDF using IronPDF
            var pdf = PdfDocument.FromFile(openFileDialog.FileName);

            // Extract all text content from the PDF using IronPDF
            string extractedText = pdf.ExtractAllText();

            // Display the extracted text in the RichTextBox
            // (Assuming your RichTextBox is named pdfDataRichTextBox, change if different)
            pdfDataRichTextBox.Text = extractedText; 
        }
        catch (Exception ex)
        {
            // Show error message if an exception occurs
            MessageBox.Show("An error occurred while processing the PDF file: " + ex.Message, "Error", MessageBoxButtons.OK, MessageBoxIcon.Error);
        }
    }
}
Private Sub openBtn_Click(ByVal sender As Object, ByVal e As EventArgs)
	' Create an OpenFileDialog to open PDF files
	Dim openFileDialog As New OpenFileDialog With {
		.Filter = "PDF files (*.pdf)|*.pdf|All files (*.*)|*.*",
		.Title = "Select a PDF file to extract text from"
	}

	' Show dialog and check if the user selected a file
	If openFileDialog.ShowDialog() = DialogResult.OK Then
		Try
			' It's recommended to set your license key once at application startup.
			' License.LicenseKey = "YourIronPdfLicenseKey"; 
			' If no key is set, IronPDF runs in trial mode (watermarks on output, time limits).
			' For text extraction, the trial is fully functional for development.

			' Load the selected PDF using IronPDF
			Dim pdf = PdfDocument.FromFile(openFileDialog.FileName)

			' Extract all text content from the PDF using IronPDF
			Dim extractedText As String = pdf.ExtractAllText()

			' Display the extracted text in the RichTextBox
			' (Assuming your RichTextBox is named pdfDataRichTextBox, change if different)
			pdfDataRichTextBox.Text = extractedText
		Catch ex As Exception
			' Show error message if an exception occurs
			MessageBox.Show("An error occurred while processing the PDF file: " & ex.Message, "Error", MessageBoxButtons.OK, MessageBoxIcon.Error)
		End Try
	End If
End Sub
$vbLabelText   $csharpLabel

Code Erklärung:

  • openFileDialog: Ein Standard-Dialog zur Dateiauswahl, gefiltert für PDF-Dateien.
  • PdfDocument.FromFile(openFileDialog.FileName): Diese IronPDF-Methode lädt das ausgewählte PDF in ein PdfDocument-Objekt.
  • pdf.ExtractAllText(): Dies ist die Schlüssel-IronPDF-Funktion für dieses Tutorial. Es liest das gesamte PDF und extrahiert allen erkennbaren Textinhalt in einen einzigen String. Dies ist unglaublich nützlich für C# parse PDF text-Szenarien.
  • pdfDataRichTextBox.Text = extractedText;: Der extrahierte Text wird dann der Text-Eigenschaft Ihres RichTextBox zugewiesen (stellen Sie sicher, dass der Name pdfDataRichTextBox mit dem von Ihnen Ihrem RichTextBox-Steuerelement vergebenen Namen übereinstimmt).

Dies demonstriert, wie IronPDF das Lesen von PDF-Text in C# vereinfacht, indem es Entwicklern ermöglicht, auf PDF-Inhalte programmatisch mit minimalem Aufwand zuzugreifen.

Schritt 6: Erstellen und Ausführen Ihrer C# PDF Text Viewer Anwendung

  1. Gehen Sie in Visual Studio zum Menü "Build" und wählen Sie "Build Solution".
  2. Sobald der Build erfolgreich ist, drücken Sie "F5" oder klicken Sie auf die Schaltfläche "Start", um die Anwendung auszuführen.

Ihr Anwendungsfenster wird erscheinen. Klicken Sie auf die Schaltfläche "Open PDF & Display Text", wählen Sie eine PDF-Datei von Ihrem Computer aus und klicken Sie auf "Open".

PDF Viewer C# Windows Anwendung (Tutorial), Abbildung 6: Führen Sie die Anwendung aus Laufen der C# PDF Text Viewer Anwendung

Das RichTextBox wird dann den Textinhalt anzeigen, der aus der ausgewählten PDF-Datei extrahiert wurde.

PDF Viewer C# Windows Anwendung (Tutorial), Abbildung 7: Anzeigung des Textinhalts nach Auswahl einer PDF-Datei Aus dem PDF extrahierter Textinhalt und Anzeige im RichTextBox

Für Informationen zur visuellen Darstellung von PDFs in MAUI-Anwendungen (was von diesem Tutorial's Textextraktionsfokus unterschiedlich ist) könnten Sie "PDF Viewing in MAUI Tutorial" erforschen.

Fazit: Zugriff auf PDF-Textinhalt einfach gemacht mit C# und IronPDF

Durch die Befolgung dieser Schritte haben Sie eine C# Windows Forms-Anwendung erstellt, die Textinhalte aus PDF-Dateien effektiv extrahiert und anzeigt, indem Sie IronPDF verwenden. Dieser Ansatz ist wertvoll, wenn Sie die Textinformationen innerhalb von PDFs programmgesteuert für die Anzeige, Analyse oder Weiterbearbeitung in Ihren .NET-Anwendungen zugänglich machen müssen.

IronPDF bietet robuste Fähigkeiten zur C# PDF-Textextraktion, und es ist nur ein Teil seines umfassenden Funktionsumfangs. You can also use IronPDF for more advanced tasks like text searching within PDFs, adding annotations, printing PDF documents, PDF encryption and decryption, and editing PDF forms.

Denken Sie daran, dass sich dieses Tutorial auf einen spezifischen Anwendungsfall konzentrierte: das Zugänglichmachen von PDF-Text in einer C#-Anwendung. Sie können auf dieser Grundlage adaptieren und erweitern, um komplexeren Anforderungen gerecht zu werden.

Wenn Sie daran interessiert sind, das gesamte Potenzial von IronPDF zu erkunden:

  • Tauchen Sie in die IronPDF-Dokumentation für detaillierte Anleitungen und Beispiele ein.
  • Um IronPDF in Ihren Produktionsanwendungen ohne Testeinschränkungen zu verwenden, wird ein Lizenzschlüssel benötigt. Sie können eine Lizenz von der IronPDF-Website erwerben. Lizenzen beginnen ab $799.
  • Sie können auch die vollständige kommerzielle Version mit einer kostenlosen Testversion evaluieren.

Häufig gestellte Fragen

Wie kann ich Text aus einem PDF in einer C#-Anwendung extrahieren?

Sie können die Methode ExtractAllText() von IronPDF verwenden, um effizient alle erkennbaren Textinhalte aus einem PDF-Dokument in Ihrer C#-Anwendung zu extrahieren.

Welche Werkzeuge benötige ich, um einen PDF-Textviewer in C# zu erstellen?

Um einen PDF-Textviewer in C# zu erstellen, benötigen Sie Visual Studio als Ihre Entwicklungsumgebung und die IronPDF-Bibliothek, die Sie über den NuGet Package Manager installieren können.

Wie zeige ich extrahierten PDF-Text in einer Windows Forms-Anwendung an?

Sie können ein RichTextBox-Steuerelement in Ihrer Windows Forms-Anwendung verwenden, um den extrahierten Textinhalt aus einem PDF anzuzeigen, was eine formatierte Textanzeige ermöglicht.

Wie wählt man eine PDF-Datei in einer C#-Anwendung aus?

Um eine PDF-Datei auszuwählen, fügen Sie Ihrem Formular ein Button-Steuerelement hinzu, das einen Dateidialog öffnet. Dies ermöglicht Benutzern, die PDF-Datei, die sie verarbeiten möchten, zu durchsuchen und auszuwählen.

Wie kann ich Fehler während der PDF-Verarbeitung in C# behandeln?

Sie können Fehler behandeln, indem Sie Ihren PDF-Verarbeitungscode in einem try-catch-Block kapseln und Fehlermeldungen mit MessageBox.Show anzeigen, wenn Ausnahmen auftreten.

Welche zusätzlichen Funktionen bietet IronPDF?

IronPDF bietet Funktionen über die Textextraktion hinaus, einschließlich der Umwandlung von HTML in PDF, Hinzufügen von Anmerkungen, Textsuche, Verschlüsseln und Entschlüsseln von PDFs, Drucken und Bearbeiten von PDF-Formularen.

Wie richte ich ein neues Windows Forms-Projekt in Visual Studio für die PDF-Verarbeitung ein?

Wählen Sie in Visual Studio 'Neues Projekt erstellen' und wählen Sie 'Windows Forms-App (.NET Framework)'. Benennen Sie Ihr Projekt und klicken Sie auf 'Erstellen', um das Projekt für die PDF-Verarbeitung einzurichten.

Welche Schritte sind erforderlich, um die PDF-Textviewer-Anwendung in C# auszuführen?

Wählen Sie 'Lösung erstellen' aus dem Menü Erstellen in Visual Studio, dann drücken Sie F5 oder klicken Sie auf 'Start', um die Anwendung auszuführen. Verwenden Sie den Button, um eine PDF-Datei auszuwählen und ihren Text anzuzeigen.

Kann IronPDF zur Umwandlung von HTML in PDF verwendet werden?

Ja, IronPDF kann HTML in PDF umwandeln, indem Methoden wie RenderHtmlAsPdf für HTML-Strings oder RenderHtmlFileAsPdf für HTML-Dateien verwendet werden.

Was sind einige häufige Fehlerszenarien bei der PDF-Textextraktion?

Häufige Probleme sind das Umgang mit nicht standardmäßigen Schriftarten oder verschlüsselten PDFs. Stellen Sie sicher, dass die PDF-Datei nicht passwortgeschützt ist und überprüfen Sie die Schriftartkompatibilität, wenn die Textextraktion fehlschlägt.

Ist IronPDF mit .NET 10 kompatibel?

Ja – IronPDF unterstützt .NET 10 sowie frühere Versionen (wie .NET 9, 8, 7, 6, .NET Core, .NET Standard und .NET Framework), was bedeutet, dass Sie Ihren Windows Forms Textviewer mit IronPDF in einem .NET 10-Projekt ohne Kompatibilitätsprobleme erstellen können.

Curtis Chau
Technischer Autor

Curtis Chau hat einen Bachelor-Abschluss in Informatik von der Carleton University und ist spezialisiert auf Frontend-Entwicklung mit Expertise in Node.js, TypeScript, JavaScript und React. Leidenschaftlich widmet er sich der Erstellung intuitiver und ästhetisch ansprechender Benutzerschnittstellen und arbeitet gerne mit modernen Frameworks sowie der Erstellung gut strukturierter, optisch ansprechender ...

Weiterlesen