Passer au contenu du pied de page
UTILISATION DE IRONPDF

Tutoriel C# : Construire un Visualiseur de Contenu de Texte PDF avec IronPDF (Windows Forms)

Dans l'ère numérique actuelle, les fichiers PDF sont intégrés dans de nombreux flux de travail à travers l'éducation, les affaires et l'utilisation personnelle. Ils sont un format standard pour partager et présenter des données diverses, y compris du texte, des images et des tableaux.

Bien que l'affichage de documents PDF complets avec une fidélité visuelle complète dans une application C# Windows Forms puisse impliquer des composants de rendu dédiés, les développeurs ont souvent d'autres besoins. Parfois, l'objectif est de lire le texte PDF en C#, d'extraire des données ou d'afficher le contenu textuel d'un PDF pour un examen rapide, l'indexation ou l'accessibilité.

Cet article vous guidera à travers la création d'une application qui se concentre sur cette tâche spécifique : construire un simple visualiseur de contenu texte PDF C# utilisant IronPDF, une bibliothèque .NET puissante. Vous apprendrez à utiliser IronPDF pour charger un PDF et extraire et afficher efficacement son contenu textuel dans une application Windows Forms.

Qu'est-ce que IronPDF?

IronPDF est une bibliothèque C# complète qui permet aux développeurs .NET de créer, éditer et traiter des fichiers PDF dans leurs applications. Elle permet aux utilisateurs de convertir du HTML, des images et des SVG en documents PDF, et surtout pour ce tutoriel, de lire et d'extraire du contenu des PDFs existants. IronPDF est conçu pour être facile à utiliser et offre un large éventail de fonctionnalités pour manipuler les fichiers PDF.

Exigences pour Construire un Visualiseur de Texte PDF

Pour créer cette application d'affichage de texte PDF C#, vous aurez besoin de :

  • Visual Studio : Un Environnement de Développement Intégré (IDE) pour créer des applications Windows Forms.
  • IronPDF : Un package NuGet qui fournit la fonctionnalité de lire, créer et manipuler des documents PDF, y compris l'extraction de texte.

Illustration montrant le concept de conversion HTML en PDF IronPDF peut également créer des PDFs à partir de HTML, une fonctionnalité distincte de l'extraction de texte montrée dans ce tutoriel.

Étapes pour Créer un Visualiseur de Contenu Texte PDF en C# avec IronPDF

Étape 1 : Créer une Nouvelle Application Windows Forms dans Visual Studio

Pour commencer, lancez Visual Studio et cliquez sur "Créer un nouveau projet". Sélectionnez "Windows Forms App (.NET Framework)" ou un modèle .NET similaire dans la liste.

Dialogue de nouveau projet Visual Studio Création de Nouveau Projet de Visual Studio

Ensuite, fournissez un nom pour votre projet (par exemple, CSharpPdfTextReader) et cliquez sur le bouton Créer. Cela configure un nouveau projet d'application Windows Forms.

Étape 2 : Installer la bibliothèque IronPDF

Utilisation de l'interface graphique de Gestionnaire de Packages NuGet

  1. Dans l'Explorateur de Solutions, cliquez droit sur votre projet et sélectionnez "Gérer les Packages NuGet..."
  2. Allez à l'onglet "Parcourir" et recherchez "IronPdf".
  3. Sélectionnez le package IronPdf et cliquez sur "Installer".

Gestionnaire de Packages NuGet dans Visual Studio recherchant IronPDF Installer IronPDF via le Gestionnaire de Packages NuGet

Utilisation de la Console du Gestionnaire de Packages NuGet

Alternativement, ouvrez la Console du Gestionnaire de Packages (Outils > Gestionnaire de Packages NuGet > Console du Gestionnaire de Packages) et exécutez la commande :

Install-Package IronPdf

Cela téléchargera et installera IronPDF et ses dépendances dans votre projet.

Étape 3 : Ajouter un RichTextBox à Votre Formulaire pour l'Affichage du Texte

Nous utiliserons un contrôle RichTextBox pour afficher le contenu texte extrait du PDF. Un RichTextBox est adapté pour montrer du texte formaté, bien que pour ce tutoriel, son rôle principal soit de présenter le texte brut extrait par IronPDF. Il montre efficacement les informations textuelles sans tenter de rendre la mise en page visuelle originale du PDF.

Pour ajouter un RichTextBox :

  1. Ouvrez votre formulaire en mode Design.
  2. Allez à la Boîte à Outils (Affichage > Boîte à Outils).
  3. Trouvez RichTextBox sous "Contrôles Communs", glissez-le sur votre formulaire.
  4. Ajustez sa taille et sa position selon les besoins. Dans la fenêtre des Propriétés, vous pouvez définir son Nom (par exemple, pdfDataRichTextBox) et régler sa propriété Dock sur Fill si vous voulez qu'il occupe la majeure partie du formulaire.

Application Windows C# PDF Viewer (Tutoriel), Figure 4 : Accéder à RickTextBox dans Form1 Ajouter un RichTextBox à Form1 pour afficher le texte PDF extrait

Étape 4 : Ajouter un Bouton pour Sélectionner le Fichier PDF

Ajoutez un contrôle Button à votre formulaire. Les utilisateurs cliqueront sur ce bouton pour ouvrir une boîte de dialogue de fichiers et sélectionner un fichier PDF pour l'extraction de texte.

  1. Glissez un Button depuis la Boîte à Outils sur votre formulaire.
  2. Dans la fenêtre des Propriétés, définissez son Nom (par exemple, openBtn) et son Text (par exemple, "Ouvrir PDF & Afficher Texte").

Application Windows C# PDF Viewer (Tutoriel), Figure 5 : Ajouter un nouveau Bouton à Form1 Ajouter un Bouton à Form1 pour déclencher la sélection PDF

Étape 5 : Ajouter du Code C# pour Charger le PDF et Extraire le Texte

Double-cliquez sur le bouton que vous venez d'ajouter ("Ouvrir PDF & Afficher Texte") pour créer son gestionnaire d'événements Click dans Form1.cs.

Tout d'abord, assurez-vous d'avoir l'espace de noms IronPDF importé en haut de votre fichier Form1.cs :

using IronPdf;
using System; // For EventArgs, Exception
using System.Windows.Forms; // For OpenFileDialog, MessageBox, DialogResult, etc.
using IronPdf;
using System; // For EventArgs, Exception
using System.Windows.Forms; // For OpenFileDialog, MessageBox, DialogResult, etc.
Imports IronPdf
Imports System ' For EventArgs, Exception
Imports System.Windows.Forms ' For OpenFileDialog, MessageBox, DialogResult, etc.
$vbLabelText   $csharpLabel

Maintenant, implémentez le gestionnaire d'événement pour le clic du bouton. Ce code :

  1. Invite l'utilisateur à sélectionner un fichier PDF.
  2. Utilise IronPDF pour charger le PDF sélectionné.
  3. Utilise la méthode ExtractAllText() d'IronPDF pour obtenir tout le texte du PDF.
  4. Affiche ce texte extrait dans le RichTextBox.
private void openBtn_Click(object sender, EventArgs e)
{
    // Create an OpenFileDialog to open PDF files
    var openFileDialog = new OpenFileDialog
    {
        Filter = "PDF files (*.pdf)|*.pdf|All files (*.*)|*.*", // Filter to show only PDFs
        Title = "Select a PDF file to extract text from" // Dialog title
    };

    // Show dialog and check if the user selected a file
    if (openFileDialog.ShowDialog() == DialogResult.OK)
    {
        try
        {
            // It's recommended to set your license key once at application startup.
            // License.LicenseKey = "YourIronPdfLicenseKey"; 
            // If no key is set, IronPDF runs in trial mode (watermarks on output, time limits).
            // For text extraction, the trial is fully functional for development.

            // Load the selected PDF using IronPDF
            var pdf = PdfDocument.FromFile(openFileDialog.FileName);

            // Extract all text content from the PDF using IronPDF
            string extractedText = pdf.ExtractAllText();

            // Display the extracted text in the RichTextBox
            // (Assuming your RichTextBox is named pdfDataRichTextBox, change if different)
            pdfDataRichTextBox.Text = extractedText; 
        }
        catch (Exception ex)
        {
            // Show error message if an exception occurs
            MessageBox.Show("An error occurred while processing the PDF file: " + ex.Message, "Error", MessageBoxButtons.OK, MessageBoxIcon.Error);
        }
    }
}
private void openBtn_Click(object sender, EventArgs e)
{
    // Create an OpenFileDialog to open PDF files
    var openFileDialog = new OpenFileDialog
    {
        Filter = "PDF files (*.pdf)|*.pdf|All files (*.*)|*.*", // Filter to show only PDFs
        Title = "Select a PDF file to extract text from" // Dialog title
    };

    // Show dialog and check if the user selected a file
    if (openFileDialog.ShowDialog() == DialogResult.OK)
    {
        try
        {
            // It's recommended to set your license key once at application startup.
            // License.LicenseKey = "YourIronPdfLicenseKey"; 
            // If no key is set, IronPDF runs in trial mode (watermarks on output, time limits).
            // For text extraction, the trial is fully functional for development.

            // Load the selected PDF using IronPDF
            var pdf = PdfDocument.FromFile(openFileDialog.FileName);

            // Extract all text content from the PDF using IronPDF
            string extractedText = pdf.ExtractAllText();

            // Display the extracted text in the RichTextBox
            // (Assuming your RichTextBox is named pdfDataRichTextBox, change if different)
            pdfDataRichTextBox.Text = extractedText; 
        }
        catch (Exception ex)
        {
            // Show error message if an exception occurs
            MessageBox.Show("An error occurred while processing the PDF file: " + ex.Message, "Error", MessageBoxButtons.OK, MessageBoxIcon.Error);
        }
    }
}
Private Sub openBtn_Click(ByVal sender As Object, ByVal e As EventArgs)
	' Create an OpenFileDialog to open PDF files
	Dim openFileDialog As New OpenFileDialog With {
		.Filter = "PDF files (*.pdf)|*.pdf|All files (*.*)|*.*",
		.Title = "Select a PDF file to extract text from"
	}

	' Show dialog and check if the user selected a file
	If openFileDialog.ShowDialog() = DialogResult.OK Then
		Try
			' It's recommended to set your license key once at application startup.
			' License.LicenseKey = "YourIronPdfLicenseKey"; 
			' If no key is set, IronPDF runs in trial mode (watermarks on output, time limits).
			' For text extraction, the trial is fully functional for development.

			' Load the selected PDF using IronPDF
			Dim pdf = PdfDocument.FromFile(openFileDialog.FileName)

			' Extract all text content from the PDF using IronPDF
			Dim extractedText As String = pdf.ExtractAllText()

			' Display the extracted text in the RichTextBox
			' (Assuming your RichTextBox is named pdfDataRichTextBox, change if different)
			pdfDataRichTextBox.Text = extractedText
		Catch ex As Exception
			' Show error message if an exception occurs
			MessageBox.Show("An error occurred while processing the PDF file: " & ex.Message, "Error", MessageBoxButtons.OK, MessageBoxIcon.Error)
		End Try
	End If
End Sub
$vbLabelText   $csharpLabel

Analyse du Code :

  • openFileDialog : Un dialogue standard pour la sélection de fichiers, filtré pour les fichiers PDF.
  • PdfDocument.FromFile(openFileDialog.FileName) : Cette méthode IronPDF charge le PDF choisi dans un objet PdfDocument.
  • pdf.ExtractAllText() : C'est la fonction clé d'IronPDF pour ce tutoriel. Elle lit tout le PDF et extrait tout le contenu textuel discernable dans une seule chaîne de caractères. C'est incroyablement utile pour les scénarios de parse du texte PDF en C#.
  • pdfDataRichTextBox.Text = extractedText; : Le texte extrait est ensuite assigné à la propriété Text de votre RichTextBox (assurez-vous que le nom pdfDataRichTextBox correspond au nom que vous avez donné à votre contrôle RichTextBox).

Cela montre comment IronPDF simplifie la lecture du texte PDF en C#, permettant aux développeurs d'accéder au contenu PDF de manière programmatique avec un effort minimal.

Étape 6 : Construire et Exécuter Votre Application de Visualisation de Texte PDF C#

  1. Dans Visual Studio, allez dans le menu "Build" et sélectionnez "Build Solution".
  2. Une fois la construction réussie, appuyez sur "F5" ou cliquez sur le bouton "Démarrer" pour exécuter l'application.

La fenêtre de votre application apparaîtra. Cliquez sur le bouton "Ouvrir PDF & Afficher Texte", sélectionnez un fichier PDF depuis votre ordinateur, et cliquez sur "Ouvrir".

Application Windows C# PDF Viewer (Tutoriel), Figure 6 : Exécuter l'Application Exécuter l'Application de Visualisation de Texte PDF C#

Le RichTextBox affichera ensuite le contenu texte extrait du fichier PDF sélectionné.

Application Windows C# PDF Viewer (Tutoriel), Figure 7 : Afficher le contenu texte après sélection d'un fichier PDF Contenu texte extrait du PDF et affiché dans le RichTextBox

Pour obtenir des informations sur le rendu visuel des PDFs dans des applications MAUI (qui est différent de l'objectif d'extraction de texte de ce tutoriel), vous pourriez explorer "Tutoriel de Visualisation PDF dans MAUI".

Conclusion : Accéder au Contenu Texte PDF Simplifié avec C# et IronPDF

En suivant ces étapes, vous avez créé une application Windows Forms C# qui extrait et affiche efficacement le contenu texte des fichiers PDF en utilisant IronPDF. Cette approche est précieuse lorsque vous avez besoin d'accéder de manière programmatique aux informations textuelles à l'intérieur des PDFs pour les afficher, les analyser ou les traiter davantage dans vos applications .NET.

IronPDF offre des capacités robustes pour l'extraction de texte PDF C# et ce n'est qu'une partie de son ensemble de fonctionnalités complet. You can also use IronPDF for more advanced tasks like text searching within PDFs, adding annotations, printing PDF documents, PDF encryption and decryption, and editing PDF forms.

Rappelez-vous, ce tutoriel s'est concentré sur un cas d'utilisation spécifique : rendre le texte PDF accessible dans une application C#. Vous pouvez adapter et développer cette base pour répondre à des exigences plus complexes.

Si vous êtes intéressé à explorer le plein potentiel d'IronPDF :

  • Plongez dans la documentation d'IronPDF pour des guides détaillés et des exemples.
  • Pour utiliser IronPDF dans vos applications de production sans limitations d'essai, une clé de licence est requise. Vous pouvez acheter une licence depuis le site Web d'IronPDF. Les licences commencent à partir de $799.
  • Vous pouvez également évaluer la version commerciale complète avec un essai gratuit.

Questions Fréquemment Posées

Comment puis-je extraire du texte d'un PDF dans une application C# ?

Vous pouvez utiliser la méthode ExtractAllText() d'IronPDF pour extraire efficacement tout le contenu textuel discernable d'un document PDF dans votre application C#.

Quels outils me faut-il pour créer un visionneur de texte PDF en C# ?

Pour créer un visualiseur de texte PDF en C#, vous avez besoin de Visual Studio comme environnement de développement et de la bibliothèque IronPDF, que vous pouvez installer via le gestionnaire de paquets NuGet.

Comment afficher le texte extrait du PDF dans une application Windows Forms ?

Vous pouvez utiliser un contrôle RichTextBox dans votre application Windows Forms pour afficher le contenu textuel extrait d'un PDF, ce qui permet l'affichage de texte formaté.

Quel est le processus pour sélectionner un fichier PDF dans une application C# ?

Pour sélectionner un fichier PDF, ajoutez un contrôle de bouton à votre formulaire qui ouvre une boîte de dialogue de fichier. Cela permet aux utilisateurs de parcourir et de sélectionner le fichier PDF qu'ils souhaitent traiter.

Comment puis-je gérer les erreurs lors du traitement de PDF en C# ?

Vous pouvez gérer les erreurs en encapsulant votre code de traitement de PDF dans un bloc try-catch et afficher les messages d'erreur en utilisant MessageBox.Show si des exceptions se produisent.

Quelles capacités supplémentaires offre IronPDF ?

IronPDF offre des capacités au-delà de l'extraction de texte, notamment la conversion HTML en PDF, l'ajout d'annotations, la recherche de texte, le chiffrement et le déchiffrement de PDF, l'impression et l'édition de formulaires PDF.

Comment configurer un nouveau projet Windows Forms dans Visual Studio pour le traitement de PDF ?

Dans Visual Studio, sélectionnez 'Créer un nouveau projet' et choisissez 'Windows Forms App (.NET Framework).' Nommez votre projet et cliquez sur 'Créer' pour configurer le projet pour le traitement PDF.

Quelles étapes sont nécessaires pour exécuter l'application de visualisation de texte PDF en C# ?

Sélectionnez 'Build Solution' dans le menu Build de Visual Studio, puis appuyez sur F5 ou cliquez sur 'Start' pour exécuter l'application. Utilisez le bouton pour sélectionner un fichier PDF et en afficher le texte.

IronPDF peut-il être utilisé pour la conversion HTML en PDF ?

Oui, IronPDF peut convertir HTML en PDF en utilisant des méthodes comme RenderHtmlAsPdf pour les chaînes HTML ou RenderHtmlFileAsPdf pour les fichiers HTML.

Quels sont les scénarios de dépannage courants lors de l'extraction de texte PDF ?

Les problèmes courants incluent la gestion des polices non standard ou des PDF cryptés. Assurez-vous que le fichier PDF n'est pas protégé par mot de passe et vérifiez la compatibilité des polices si l'extraction du texte échoue.

IronPDF est-il compatible avec .NET 10 ?

Oui — IronPDF prend en charge .NET 10 ainsi que les versions antérieures (comme .NET 9, 8, 7, 6, .NET Core, .NET Standard et .NET Framework), ce qui signifie que vous pouvez créer votre visionneuse de texte Windows Forms à l'aide d'IronPDF sur un projet .NET 10 sans problèmes de compatibilité.

Curtis Chau
Rédacteur technique

Curtis Chau détient un baccalauréat en informatique (Université de Carleton) et se spécialise dans le développement front-end avec expertise en Node.js, TypeScript, JavaScript et React. Passionné par la création d'interfaces utilisateur intuitives et esthétiquement plaisantes, Curtis aime travailler avec des frameworks modernes ...

Lire la suite