Zum Fußzeileninhalt springen
IRONPDF NUTZEN

C#-Tutorial: Erstellen Sie einen PDF-Textinhalt-Viewer mit IronPDF (Windows-Forms)

Im heutigen digitalen Zeitalter sind PDF-Dateien integraler Bestandteil vieler Arbeitsabläufe in Bildung, Wirtschaft und persönlicher Nutzung. Sie sind ein Standardformat für das Teilen und Präsentieren verschiedener Daten, einschließlich Text, Bilder und Tabellen.

Der vollständige visuelle Wiedergabetreue innerhalb einer C# Windows Forms-Anwendung anzuzeigen, kann dedizierte Rendering-Komponenten erfordern, oft haben Entwickler jedoch andere Bedürfnisse. Manchmal ist das Ziel, PDF-Text in C# zu lesen, Daten zu extrahieren oder den Textinhalt eines PDFs zur schnellen Überprüfung, Indizierung oder Zugänglichkeit anzuzeigen.

Dieser Artikel wird Sie durch die Erstellung einer Anwendung führen, die sich auf diese spezielle Aufgabe konzentriert: den Bau eines einfachen C# PDF-Textanzeigebetrachters mithilfe von IronPDF, einer leistungsstarken .NET-Bibliothek. Sie werden lernen, wie man IronPDF verwendet, um ein PDF zu laden und seinen Textinhalt effektiv in einer Windows Forms-Anwendung zu extrahieren und anzuzeigen.

Was ist IronPDF?

IronPDF ist eine umfassende C# Bibliothek, die .NET-Entwickler in die Lage versetzt, PDF-Dateien innerhalb ihrer Anwendungen zu erstellen, zu bearbeiten und zu verarbeiten. Es ermöglicht Benutzern, HTML, Bilder und SVG in PDF-Dokumente zu konvertieren und, für dieses Tutorial wichtig, Inhalte aus bestehenden PDFs zu lesen und zu extrahieren. IronPDF ist für Benutzerfreundlichkeit ausgelegt und bietet eine breite Palette von Funktionen zur Manipulation von PDF-Dateien.

Anforderungen zum Erstellen eines PDF-Textbetrachters

Um diese C# PDF-Textanzeigeanwendung zu erstellen, benötigen Sie:

  • Visual Studio: Eine integrierte Entwicklungsumgebung (IDE) zur Erstellung von Windows Forms-Anwendungen.
  • IronPDF: Ein NuGet Paket, das die Funktionalität zum Lesen, Erstellen und Bearbeiten von PDF-Dokumenten, einschließlich der Textextraktion, bietet.

Illustration zur Veranschaulichung des HTML-zu-PDF-Konvertierungskonzepts IronPDF kann auch PDFs aus HTML erstellen, eine separate Funktion von der in diesem Tutorial gezeigten Textextraktion.

Schritte zum Erstellen eines PDF-Textanzeigebetrachters in C# mit IronPDF

Schritt 1: Erstellen Sie eine neue Windows Forms-Anwendung in Visual Studio

Starten Sie Visual Studio und klicken Sie auf "Create a new project". Wählen Sie "Windows Forms App (.NET Framework)" oder eine ähnliche .NET-Vorlage aus der Liste.

Visual Studio Dialog für ein neues Projekt Visual Studio Neue Projekterstellung

Geben Sie anschließend einen Namen für Ihr Projekt ein (z. B. CSharpPdfTextReader) und klicken Sie auf die Schaltfläche "Erstellen". Dies richtet ein neues Windows Forms Anwendungsprojekt ein.

Schritt 2: Installation der IronPDF-Bibliothek

Verwendung der NuGet-Paketmanager-GUI

  1. Klicken Sie im Projektmappen-Explorer mit der rechten Maustaste auf Ihr Projekt und wählen Sie "Manage NuGet Packages..."
  2. Gehen Sie zum "Browse"-Tab und suchen Sie nach "IronPDF".
  3. Wählen Sie das Paket IronPdf aus und klicken Sie auf "Installieren".

 Der NuGet Paketmanager in Visual Studio sucht nach IronPDF Installation von IronPDF über den NuGet-Paketmanager

Verwendung der NuGet-Paketmanager-Konsole

Alternativ öffnen Sie die Paketmanager-Konsole (Tools > NuGet Package Manager > Package Manager Console) und führen Sie den Befehl aus:

Install-Package IronPdf

Dies wird IronPDF und seine Abhängigkeiten in Ihr Projekt herunterladen und installieren.

Schritt 3: Hinzufügen eines RichTextBox zu Ihrem Formular zur Textanzeige

Wir verwenden ein RichTextBox Steuerelement, um den aus der PDF-Datei extrahierten Textinhalt anzuzeigen. Ein RichTextBox eignet sich zur Anzeige von formatiertem Text, seine Hauptaufgabe in diesem Tutorial besteht jedoch darin, den von IronPDF extrahierten Klartext darzustellen. Es zeigt effektiv die Textinformationen an, ohne zu versuchen, das originale visuelle Layout des PDFs darzustellen.

Um einen RichTextBox hinzuzufügen:

  1. Öffnen Sie Ihr Formular in der Designeransicht.
  2. Gehen Sie zur Toolbox (Ansicht > Toolbox).
  3. Suchen Sie unter "Allgemeine Steuerelemente" nach RichTextBox und ziehen Sie es auf Ihr Formular.
  4. Passen Sie seine Größe und Position nach Bedarf an. Im Eigenschaftenfenster können Sie die Eigenschaft Name (z. B. pdfDataRichTextBox) festlegen und die Eigenschaft Dock auf Fill setzen, wenn diese den größten Teil des Formulars einnehmen soll.

PDF Viewer C# Windows-Anwendung (Tutorial), Abbildung 4: Zugriff auf das RickTextBox in Form1 Hinzufügen eines RichTextBox zu Form1 zur Anzeige des extrahierten PDF-Textes

Schritt 4: Hinzufügen einer Schaltfläche zum Auswählen der PDF-Datei

Fügen Sie Ihrem Formular ein Button-Steuerelement hinzu. Benutzer werden auf diese Schaltfläche klicken, um einen Dateidialog zu öffnen und eine PDF-Datei zur Textextraktion auszuwählen.

  1. Ziehen Sie ein Button aus der Toolbox auf Ihr Formular.
  2. Stellen Sie im Eigenschaftenfenster Name (z. B. openBtn) und Text (z. B. "PDF öffnen & Text anzeigen") ein.

PDF Viewer C# Windows-Anwendung (Tutorial), Abbildung 5: Hinzufügen einer neuen Schaltfläche zu Form1 Hinzufügen einer Schaltfläche zu Form1 zum Auslösen der PDF-Auswahl

Schritt 5: Hinzufügen von C#-Code zum Laden von PDF und Extrahieren von Text

Doppelklicken Sie auf die soeben hinzugefügte Schaltfläche ("PDF öffnen & Text anzeigen"), um ihren Click-Ereignishandler in Form1.cs zu erstellen.

Stellen Sie zunächst sicher, dass Sie den IronPDF Namensraum am Anfang Ihrer Form1.cs-Datei importiert haben:

using IronPdf;
using System; // For EventArgs, Exception
using System.Windows.Forms; // For OpenFileDialog, MessageBox, DialogResult, etc.
using IronPdf;
using System; // For EventArgs, Exception
using System.Windows.Forms; // For OpenFileDialog, MessageBox, DialogResult, etc.
$vbLabelText   $csharpLabel

Implementieren Sie nun den Ereignishandler für den Schaltflächenklick. Dieser Code wird:

  1. Den Benutzer auffordern, eine PDF-Datei auszuwählen.
  2. IronPDF verwenden, um das ausgewählte PDF zu laden.
  3. Verwenden Sie die ExtractAllText()-Methode von IronPDF, um den gesamten Text aus der PDF-Datei zu extrahieren.
  4. Zeigen Sie diesen extrahierten Text in RichTextBox an.
private void openBtn_Click(object sender, EventArgs e)
{
    // Create an OpenFileDialog to open PDF files
    var openFileDialog = new OpenFileDialog
    {
        Filter = "PDF files (*.pdf)|*.pdf|All files (*.*)|*.*", // Filter to show only PDFs
        Title = "Select a PDF file to extract text from" // Dialog title
    };

    // Show dialog and check if the user selected a file
    if (openFileDialog.ShowDialog() == DialogResult.OK)
    {
        try
        {
            // It's recommended to set your license key once at application startup.
            // License.LicenseKey = "YourIronPdfLicenseKey"; 
            // If no key is set, IronPDF runs in trial mode (watermarks on output, time limits).
            // For text extraction, the trial is fully functional for development.

            // Load the selected PDF using IronPDF
            var pdf = PdfDocument.FromFile(openFileDialog.FileName);

            // Extract all text content from the PDF using IronPDF
            string extractedText = pdf.ExtractAllText();

            // Display the extracted text in the RichTextBox
            // (Assuming your RichTextBox is named pdfDataRichTextBox, change if different)
            pdfDataRichTextBox.Text = extractedText; 
        }
        catch (Exception ex)
        {
            // Show error message if an exception occurs
            MessageBox.Show("An error occurred while processing the PDF file: " + ex.Message, "Error", MessageBoxButtons.OK, MessageBoxIcon.Error);
        }
    }
}
private void openBtn_Click(object sender, EventArgs e)
{
    // Create an OpenFileDialog to open PDF files
    var openFileDialog = new OpenFileDialog
    {
        Filter = "PDF files (*.pdf)|*.pdf|All files (*.*)|*.*", // Filter to show only PDFs
        Title = "Select a PDF file to extract text from" // Dialog title
    };

    // Show dialog and check if the user selected a file
    if (openFileDialog.ShowDialog() == DialogResult.OK)
    {
        try
        {
            // It's recommended to set your license key once at application startup.
            // License.LicenseKey = "YourIronPdfLicenseKey"; 
            // If no key is set, IronPDF runs in trial mode (watermarks on output, time limits).
            // For text extraction, the trial is fully functional for development.

            // Load the selected PDF using IronPDF
            var pdf = PdfDocument.FromFile(openFileDialog.FileName);

            // Extract all text content from the PDF using IronPDF
            string extractedText = pdf.ExtractAllText();

            // Display the extracted text in the RichTextBox
            // (Assuming your RichTextBox is named pdfDataRichTextBox, change if different)
            pdfDataRichTextBox.Text = extractedText; 
        }
        catch (Exception ex)
        {
            // Show error message if an exception occurs
            MessageBox.Show("An error occurred while processing the PDF file: " + ex.Message, "Error", MessageBoxButtons.OK, MessageBoxIcon.Error);
        }
    }
}
$vbLabelText   $csharpLabel

Code Erklärung:

  • openFileDialog: Ein Standarddialog zur Dateiauswahl, gefiltert nach PDF-Dateien.
  • PdfDocument.FromFile(openFileDialog.FileName): Diese IronPDF Methode lädt die ausgewählte PDF-Datei in ein PdfDocument-Objekt.
  • pdf.ExtractAllText(): Dies ist die wichtigste IronPDF Funktion für dieses Tutorial. Es liest das gesamte PDF und extrahiert allen erkennbaren Textinhalt in einen einzigen String. Dies ist unglaublich nützlich für C# parse PDF text-Szenarien.
  • pdfDataRichTextBox.Text = extractedText;: Der extrahierte Text wird dann der Text Eigenschaft Ihres RichTextBox zugewiesen (stellen Sie sicher, dass der Name pdfDataRichTextBox mit dem Namen übereinstimmt, den Sie Ihrem RichTextBox-Steuerelement gegeben haben).

Dies demonstriert, wie IronPDF das Lesen von PDF-Text in C# vereinfacht, indem es Entwicklern ermöglicht, auf PDF-Inhalte programmatisch mit minimalem Aufwand zuzugreifen.

Schritt 6: Erstellen und Ausführen Ihrer C# PDF Text Viewer Anwendung

  1. Gehen Sie in Visual Studio zum Menü "Build" und wählen Sie "Build Solution".
  2. Sobald der Build erfolgreich ist, drücken Sie "F5" oder klicken Sie auf die Schaltfläche "Start", um die Anwendung auszuführen.

Ihr Anwendungsfenster wird erscheinen. Klicken Sie auf die Schaltfläche "Open PDF & Display Text", wählen Sie eine PDF-Datei von Ihrem Computer aus und klicken Sie auf "Open".

PDF Viewer C# Windows-Anwendung (Tutorial), Abbildung 6: Ausführen der Anwendung Ausführen der C# PDF Text Viewer-Anwendung

Anschließend wird der aus der ausgewählten PDF-Datei extrahierte Textinhalt angezeigt.

PDF Viewer C# Windows-Anwendung (Tutorial), Abbildung 7: Anzeigen des Textinhalts nach Auswahl einer PDF-Datei Textinhalt, extrahiert aus der PDF-Datei und angezeigt in RichTextBox

Für Informationen zur visuellen Darstellung von PDFs in MAUI-Anwendungen (was von diesem Tutorial's Textextraktionsfokus unterschiedlich ist) könnten Sie "PDF Viewing in MAUI Tutorial" erforschen.

Fazit: Zugriff auf PDF-Textinhalt einfach gemacht mit C# und IronPDF

Durch die Befolgung dieser Schritte haben Sie eine C# Windows Forms-Anwendung erstellt, die Textinhalte aus PDF-Dateien effektiv extrahiert und anzeigt, indem Sie IronPDF verwenden. Dieser Ansatz ist wertvoll, wenn Sie die Textinformationen innerhalb von PDFs programmgesteuert für die Anzeige, Analyse oder Weiterbearbeitung in Ihren .NET-Anwendungen zugänglich machen müssen.

IronPDF bietet robuste Fähigkeiten zur C# PDF-Textextraktion, und es ist nur ein Teil seines umfassenden Funktionsumfangs. Sie können IronPDF auch für fortgeschrittenere Aufgaben nutzen, wie Textsuche innerhalb von PDFs, Hinzufügen von Anmerkungen, Drucken von PDF-Dokumenten, PDF-Verschlüsselung und -entschlüsselung und Bearbeiten von PDF-Formularen.

Denken Sie daran, dass sich dieses Tutorial auf einen spezifischen Anwendungsfall konzentrierte: das Zugänglichmachen von PDF-Text in einer C#-Anwendung. Sie können auf dieser Grundlage adaptieren und erweitern, um komplexeren Anforderungen gerecht zu werden.

Wenn Sie daran interessiert sind, das gesamte Potenzial von IronPDF zu erkunden:

  • Tauchen Sie in die IronPDF-Dokumentation für detaillierte Anleitungen und Beispiele ein.
  • Um IronPDF in Ihren Produktionsanwendungen ohne Testeinschränkungen zu verwenden, wird ein Lizenzschlüssel benötigt. Sie können eine Lizenz von der IronPDF-Website erwerben. Lizenzen beginnen bei $799.
  • Sie können auch die vollständige kommerzielle Version mit einer kostenlosen Testversion evaluieren.

Häufig gestellte Fragen

Wie kann ich Text aus einem PDF in einer C#-Anwendung extrahieren?

Sie können die Methode ExtractAllText() von IronPDF verwenden, um effizient alle erkennbaren Textinhalte aus einem PDF-Dokument in Ihrer C#-Anwendung zu extrahieren.

Welche Werkzeuge benötige ich, um einen PDF-Textviewer in C# zu erstellen?

Um einen PDF-Textviewer in C# zu erstellen, benötigen Sie Visual Studio als Ihre Entwicklungsumgebung und die IronPDF-Bibliothek, die Sie über den NuGet Package Manager installieren können.

Wie zeige ich extrahierten PDF-Text in einer Windows Forms-Anwendung an?

Sie können ein RichTextBox-Steuerelement in Ihrer Windows Forms-Anwendung verwenden, um den extrahierten Textinhalt aus einem PDF anzuzeigen, was eine formatierte Textanzeige ermöglicht.

Wie wählt man eine PDF-Datei in einer C#-Anwendung aus?

Um eine PDF-Datei auszuwählen, fügen Sie Ihrem Formular ein Button-Steuerelement hinzu, das einen Dateidialog öffnet. Dies ermöglicht Benutzern, die PDF-Datei, die sie verarbeiten möchten, zu durchsuchen und auszuwählen.

Wie kann ich Fehler während der PDF-Verarbeitung in C# behandeln?

Sie können Fehler behandeln, indem Sie Ihren PDF-Verarbeitungscode in einem try-catch-Block kapseln und Fehlermeldungen mit MessageBox.Show anzeigen, wenn Ausnahmen auftreten.

Welche zusätzlichen Funktionen bietet IronPDF?

IronPDF bietet Funktionen über die Textextraktion hinaus, einschließlich der Umwandlung von HTML in PDF, Hinzufügen von Anmerkungen, Textsuche, Verschlüsseln und Entschlüsseln von PDFs, Drucken und Bearbeiten von PDF-Formularen.

Wie richte ich ein neues Windows Forms-Projekt in Visual Studio für die PDF-Verarbeitung ein?

Wählen Sie in Visual Studio 'Neues Projekt erstellen' und wählen Sie 'Windows Forms-App (.NET Framework)'. Benennen Sie Ihr Projekt und klicken Sie auf 'Erstellen', um das Projekt für die PDF-Verarbeitung einzurichten.

Welche Schritte sind erforderlich, um die PDF-Textviewer-Anwendung in C# auszuführen?

Wählen Sie 'Lösung erstellen' aus dem Menü Erstellen in Visual Studio, dann drücken Sie F5 oder klicken Sie auf 'Start', um die Anwendung auszuführen. Verwenden Sie den Button, um eine PDF-Datei auszuwählen und ihren Text anzuzeigen.

Kann IronPDF zur Umwandlung von HTML in PDF verwendet werden?

Ja, IronPDF kann HTML in PDF umwandeln, indem Methoden wie RenderHtmlAsPdf für HTML-Strings oder RenderHtmlFileAsPdf für HTML-Dateien verwendet werden.

Was sind einige häufige Fehlerszenarien bei der PDF-Textextraktion?

Häufige Probleme sind das Umgang mit nicht standardmäßigen Schriftarten oder verschlüsselten PDFs. Stellen Sie sicher, dass die PDF-Datei nicht passwortgeschützt ist und überprüfen Sie die Schriftartkompatibilität, wenn die Textextraktion fehlschlägt.

Ist IronPDF mit .NET 10 kompatibel?

Ja – IronPDF unterstützt .NET 10 sowie frühere Versionen (wie .NET 9, 8, 7, 6, .NET Core, .NET Standard und .NET Framework), was bedeutet, dass Sie Ihren Windows Forms Textviewer mit IronPDF in einem .NET 10-Projekt ohne Kompatibilitätsprobleme erstellen können.

Curtis Chau
Technischer Autor

Curtis Chau hat einen Bachelor-Abschluss in Informatik von der Carleton University und ist spezialisiert auf Frontend-Entwicklung mit Expertise in Node.js, TypeScript, JavaScript und React. Leidenschaftlich widmet er sich der Erstellung intuitiver und ästhetisch ansprechender Benutzerschnittstellen und arbeitet gerne mit modernen Frameworks sowie der Erstellung gut strukturierter, optisch ansprechender ...

Weiterlesen

Iron Support Team

We're online 24 hours, 5 days a week.
Chat
Email
Call Me