UTILISATION D'IRONPDF

Tutoriel C#: Construire un visualiseur de contenu texte PDF avec IronPDF (Windows Forms)

Dans l'ère numérique d'aujourd'hui, les fichiers PDF sont intégrés à de nombreux flux de travail dans les domaines de l'éducation, des affaires et de l'usage personnel. Ils sont un format standard pour partager et présenter des données diverses, y compris du texte, des images et des tableaux.

Bien que l'affichage de documents PDF complets avec une fidélité visuelle complète dans une application Windows Forms en C# puisse impliquer des composants de rendu dédiés, les développeurs ont souvent d'autres besoins. Parfois, l'objectif est de lire le texte d'un PDF en C#, d'extraire des données, ou d'afficher le contenu textuel d'un PDF pour un examen rapide, un indexage ou une accessibilité.

Cet article vous guidera dans la création d'une application se concentrant sur cette tâche spécifique : construire un visualiseur de contenu texte PDF simple en C# utilisant IronPDF, une puissante bibliothèque .NET. Vous apprendrez à utiliser IronPDF pour charger un PDF et extraire et afficher efficacement son contenu textuel dans une application Windows Forms.

Qu'est-ce qu'IronPDF ?

IronPDF est une bibliothèque C# complète qui permet aux développeurs .NET de créer, éditer et traiter des fichiers PDF au sein de leurs applications. Il permet aux utilisateurs de convertir du HTML, des images et des SVG en documents PDF, et surtout pour ce tutoriel, de lire et d'extraire le contenu des PDF existants. IronPDF est conçu pour être facile à utiliser et offre une large gamme de fonctionnalités pour manipuler les fichiers PDF.

Windows Installateur Windows
Utilisez le IronPDF programme d'installation Windows pour une installation directe du produit.

Exigences pour créer un visualiseur de texte PDF

Pour créer cette application d'affichage de texte PDF en C#, vous aurez besoin :

  • Visual Studio : Un environnement de développement intégré (IDE) pour créer des applications Windows Forms.
  • IronPDF : Un package NuGet qui offre la fonctionnalité de lire, créer et manipuler des documents PDF, y compris l'extraction de texte.

    Illustration montrant le concept de conversion HTML en PDF

    IronPDF peut également créer des PDFs à partir de HTML, une fonctionnalité distincte de l'extraction de texte présentée dans ce tutoriel.

Étapes pour créer un visualisateur de contenu texte PDF en C# avec IronPDF

Étape 1 : Créez une nouvelle application Windows Forms dans Visual Studio

Pour commencer, lancez Visual Studio et cliquez sur "Créer un nouveau projet". Sélectionnez "Windows Forms App (.NET Framework)" ou un modèle .NET similaire dans la liste.

Boîte de dialogue Nouveau projet de Visual Studio

Création d'un nouveau projet Visual Studio

Ensuite, fournissez un nom pour votre projet (par exemple, CSharpPdfTextReader) et cliquez sur le bouton Créer. Cela configurera un nouveau projet d'application Windows Forms.

Étape 2 : Installer la bibliothèque IronPDF

Utilisation de l'interface graphique du gestionnaire de packages NuGet

  1. Dans l'Explorateur de solutions, faites un clic droit sur votre projet et sélectionnez "Gérer les packages NuGet..."

  2. Allez dans l'onglet "Parcourir" et recherchez "IronPdf".

  3. Sélectionnez le package IronPdf et cliquez sur "Installer".

    Gestionnaire de packages NuGet dans Visual Studio recherchant IronPDF

    Installation d'IronPDF via le gestionnaire de packages NuGet

    NuGet Installer avec NuGet

    PM >  Install-Package IronPdf

    Découvrez IronPDF sur NuGet pour une installation rapide. Avec plus de 10 millions de téléchargements, il transforme le développement de PDF avec C#. Vous pouvez également télécharger le DLL ou l'installateur Windows.

Utilisation de la console NuGet Package Manager

Sinon, ouvrez la Console du gestionnaire de packages (Outils > Gestionnaire de packages NuGet > Console du gestionnaire de packages) et exécutez la commande :

Install-Package IronPdf
Install-Package IronPdf
SHELL

Cela téléchargera et installera IronPDF et ses dépendances dans votre projet.

Étape 3 : Ajoutez une RichTextBox à votre formulaire pour l'affichage du texte

Nous utiliserons un contrôle RichTextBox pour afficher le contenu texte extrait du PDF. Un RichTextBox est adapté pour afficher du texte formaté, bien que pour ce tutoriel, son rôle principal soit de présenter le texte brut extrait par IronPDF. Il présente efficacement les informations textuelles sans essayer de reproduire la mise en page visuelle originale du PDF.

Pour ajouter un RichTextBox :

  1. Ouvrez votre formulaire dans la vue Concepteur.

  2. Accédez à la Boîte à outils (Affichage > Boîte à outils).

  3. Trouvez RichTextBox sous "Contrôles Communs", faites-le glisser sur votre formulaire.

  4. Ajustez sa taille et sa position selon les besoins. Dans la fenêtre Propriétés, vous pouvez définir son Name (par exemple, pdfDataRichTextBox) et définir sa propriété Dock sur Fill si vous souhaitez qu'il occupe la majeure partie du formulaire.

    Visualiseur PDF Application Windows C# (Tutoriel), Figure 4 : Accéder au RickTextBox dans Form1

    Ajout d'une RichTextBox à Form1 pour afficher le texte extrait du PDF

Étape 4 : Ajouter un bouton pour sélectionner le fichier PDF

Ajoutez un contrôle Button à votre formulaire. Les utilisateurs cliqueront sur ce bouton pour ouvrir une boîte de dialogue de fichiers et sélectionner un fichier PDF pour l'extraction de texte.

  1. Faites glisser un Button depuis la boîte à outils vers votre formulaire.

  2. Dans la fenêtre des propriétés, définissez son Name (par exemple, openBtn) et son Text (par exemple, "Ouvrir le PDF et afficher le texte").

    Visionneuse PDF Application Windows C# (Tutoriel), Figure 5 : Ajouter un nouveau bouton à Form1

    Ajouter un bouton à Form1 pour déclencher la sélection du PDF

Étape 5 : Ajouter du code C# pour charger le PDF et extraire le texte

Double-cliquez sur le bouton que vous venez d'ajouter ("Open PDF & Display Text") pour créer son gestionnaire d'événements Click dans Form1.cs.

Tout d'abord, assurez-vous que l'espace de noms IronPDF est importé en haut de votre fichier Form1.cs :

using IronPdf;
using System; // For EventArgs, Exception
using System.Windows.Forms; // For OpenFileDialog, MessageBox, DialogResult, etc.
using IronPdf;
using System; // For EventArgs, Exception
using System.Windows.Forms; // For OpenFileDialog, MessageBox, DialogResult, etc.
Imports IronPdf
Imports System ' For EventArgs, Exception
Imports System.Windows.Forms ' For OpenFileDialog, MessageBox, DialogResult, etc.
$vbLabelText   $csharpLabel

Maintenant, implémentez le gestionnaire d'événements pour le clic sur le bouton. Ce code va :

  1. Demandez à l'utilisateur de sélectionner un fichier PDF.

  2. Utilisez IronPDF pour charger le PDF sélectionné.

  3. Utilisez la méthode ExtractAllText() de IronPDF pour extraire tout le texte du PDF.

  4. Afficher ce texte extrait dans le RichTextBox.
private void openBtn_Click(object sender, EventArgs e)
{
    var openFileDialog = new OpenFileDialog();
    openFileDialog.Filter = "PDF files (*.pdf)
*.pdf
All files (*.*)
*.*";
    openFileDialog.Title = "Select a PDF file to extract text from";

    if (openFileDialog.ShowDialog() == DialogResult.OK)
    {
        try
        {
            // It's recommended to set your license key once at application startup.
            // License.LicenseKey = "YourIronPdfLicenseKey"; 
            // If no key is set, IronPDF runs in trial mode (watermarks on output, time limits).
            // For text extraction, the trial is fully functional for development.

            // Load the selected PDF using IronPDF
            var pdf = PdfDocument.FromFile(openFileDialog.FileName);

            // Extract all text content from the PDF
            string extractedText = pdf.ExtractAllText();

            // Display the extracted text in the RichTextBox
            // (Assuming your RichTextBox is named pdfDataRichTextBox, change if different)
            pdfDataRichTextBox.Text = extractedText; 
        }
        catch (Exception ex)
        {
            MessageBox.Show("An error occurred while processing the PDF file: " + ex.Message, "Error", MessageBoxButtons.OK, MessageBoxIcon.Error);
        }
    }
}
private void openBtn_Click(object sender, EventArgs e)
{
    var openFileDialog = new OpenFileDialog();
    openFileDialog.Filter = "PDF files (*.pdf)
*.pdf
All files (*.*)
*.*";
    openFileDialog.Title = "Select a PDF file to extract text from";

    if (openFileDialog.ShowDialog() == DialogResult.OK)
    {
        try
        {
            // It's recommended to set your license key once at application startup.
            // License.LicenseKey = "YourIronPdfLicenseKey"; 
            // If no key is set, IronPDF runs in trial mode (watermarks on output, time limits).
            // For text extraction, the trial is fully functional for development.

            // Load the selected PDF using IronPDF
            var pdf = PdfDocument.FromFile(openFileDialog.FileName);

            // Extract all text content from the PDF
            string extractedText = pdf.ExtractAllText();

            // Display the extracted text in the RichTextBox
            // (Assuming your RichTextBox is named pdfDataRichTextBox, change if different)
            pdfDataRichTextBox.Text = extractedText; 
        }
        catch (Exception ex)
        {
            MessageBox.Show("An error occurred while processing the PDF file: " + ex.Message, "Error", MessageBoxButtons.OK, MessageBoxIcon.Error);
        }
    }
}
Private Sub openBtn_Click(ByVal sender As Object, ByVal e As EventArgs)
	Dim openFileDialog As New OpenFileDialog()
	openFileDialog.Filter = "PDF files (*.pdf) *.pdf All files (*.*) *.*"
	openFileDialog.Title = "Select a PDF file to extract text from"

	If openFileDialog.ShowDialog() = DialogResult.OK Then
		Try
			' It's recommended to set your license key once at application startup.
			' License.LicenseKey = "YourIronPdfLicenseKey"; 
			' If no key is set, IronPDF runs in trial mode (watermarks on output, time limits).
			' For text extraction, the trial is fully functional for development.

			' Load the selected PDF using IronPDF
			Dim pdf = PdfDocument.FromFile(openFileDialog.FileName)

			' Extract all text content from the PDF
			Dim extractedText As String = pdf.ExtractAllText()

			' Display the extracted text in the RichTextBox
			' (Assuming your RichTextBox is named pdfDataRichTextBox, change if different)
			pdfDataRichTextBox.Text = extractedText
		Catch ex As Exception
			MessageBox.Show("An error occurred while processing the PDF file: " & ex.Message, "Error", MessageBoxButtons.OK, MessageBoxIcon.Error)
		End Try
	End If
End Sub
$vbLabelText   $csharpLabel

Analyse du Code :

  • openFileDialog : Une boîte de dialogue standard pour la sélection de fichiers, filtrée pour les fichiers PDF.
  • PdfDocument.FromFile(openFileDialog.FileName) : Cette méthode IronPDF charge le PDF choisi dans un objet PdfDocument.
  • pdf.ExtractAllText() : C'est la fonction clé d'IronPDF pour ce tutoriel. Il lit l'intégralité du PDF et extrait tout le contenu textuel discernable en une seule chaîne. C'est incroyablement utile pour les scénarios de parsing de texte PDF en C#.
  • pdfDataRichTextBox.Text = extractedText; : Le texte extrait est ensuite attribué à la propriété Text de votre RichTextBox (assurez-vous que le nom pdfDataRichTextBox correspond au nom que vous avez donné à votre contrôle RichTextBox).

    Cela démontre comment IronPDF simplifie la lecture de texte PDF en C#, permettant aux développeurs d'accéder au contenu PDF par programmation avec un minimum d'effort.

Étape 6 : Créez et exécutez votre application de visualisation de texte PDF C#

  1. Dans Visual Studio, allez dans le menu "Build" et sélectionnez "Build Solution".

  2. Une fois la construction réussie, appuyez sur "F5" ou cliquez sur le bouton "Démarrer" pour exécuter l'application.

    Votre fenêtre d'application apparaîtra. Cliquez sur le bouton "Ouvrir PDF et afficher le texte", sélectionnez un fichier PDF sur votre ordinateur, puis cliquez sur "Ouvrir".

    Visionneuse PDF C# Application Windows (Tutoriel), Figure 6 : Exécuter l'application

    Exécution de l'application Visualiseur de texte PDF en C#

    Le RichTextBox affichera ensuite le contenu texte extrait du fichier PDF sélectionné.

    Visionneuse PDF Application Windows en C# (Tutoriel), Figure 7 : Afficher le contenu texte après sélection d'un fichier PDF

    Contenu textuel extrait du PDF et affiché dans le RichTextBox

    Pour des informations sur le rendu visuel des PDF dans les applications MAUI (ce qui est différent de l'extraction de texte de ce tutoriel), vous pourriez explorer le "Tutoriel de Visualisation de PDF dans MAUI".

Conclusion : L'accès au contenu texte PDF facilité avec C# et IronPDF

En suivant ces étapes, vous avez créé une application Windows Forms en C# qui extrait et affiche efficacement le contenu texte des fichiers PDF à l'aide de IronPDF. Cette approche est précieuse lorsque vous avez besoin d'accéder de manière programmatique aux informations textuelles contenues dans des PDF pour l'affichage, l'analyse ou un traitement ultérieur dans vos applications .NET.

IronPDF offre des capacités robustes d'extraction de texte PDF en C#, et ce n'est qu'une partie de son ensemble de fonctionnalités complet. Vous pouvez également utiliser IronPDF pour des tâches plus avancées telles que la recherche de texte dans les PDF, la modification de formulaires PDF.

Rappelez-vous, ce tutoriel était axé sur un cas d'utilisation spécifique : rendre le texte PDF accessible dans une application C#. Vous pouvez adapter et développer cette base pour répondre à des exigences plus complexes.

Si vous êtes intéressé à explorer tout le potentiel d'IronPDF :

  • Plongez dans la documentation IronPDF pour des guides détaillés et des exemples.
  • Pour utiliser IronPDF dans vos applications de production sans les limitations de la version d'essai, une clé de licence est requise. Vous pouvez acheter une licence sur le site IronPDF. Les licences commencent à partir de $749.
  • Vous pouvez également évaluer la version commerciale complète avec un essai gratuit.

    BIBLIOTHÈQUE_COMMENCER_AVEC_UNE_EXTENSION_D'ESSAI_DU_PRODUIT_BLOC

Chaknith Bin
Ingénieur logiciel
Chaknith travaille sur IronXL et IronBarcode. Il possède une expertise approfondie en C# et .NET, aidant à améliorer le logiciel et à soutenir les clients. Ses idées issues des interactions avec les utilisateurs contribuent à de meilleurs produits, une documentation améliorée et une expérience globale enrichie.
< PRÉCÉDENT
Comment lire un tableau PDF en C#
SUIVANT >
Comment convertir un fichier Word (Docx) en PDF en C# (Tutoriel)