UTILISATION D'IRONPDF

C# Lire un fichier PDF : Tutoriel facile

Si vous êtes un développeur, vous avez probablement rencontré des problèmes en essayant de lire du texte dans un fichier PDF. Peut-être qu'un ou plusieurs des scénarios suivants s'appliquent à vous.

  1. Vous développez une application qui prend deux documents PDF en entrée et trouve la similarité entre les documents.

  2. Vous développez une application qui a besoin de lire des documents PDF avec IronPDF et de retourner le nombre de mots.

  3. Vous développez une application qui extrait des données d'un fichier PDF à l'aide de IronPDF et les place dans une base de données structurée.

  4. Vous développez une application qui doit extraire le contenu textuel d'un PDF et le convertir en chaîne de caractères.

  5. L'extraction de données à partir de fichiers PDF à l'aide de C# était une tâche difficile et complexe jusqu'au développement d'IronPDF.

    Présentation de la bibliothèque IronPDF est une bibliothèque qui facilite grandement la lecture des fichiers PDF pour les développeurs.

    Vous pouvez en savoir plus sur IronPDF et les offres de la suite Iron Software.

    Vous pouvez lire des fichiers PDF et afficher les données dans une zone de texte C# en utilisant seulement deux lignes de code. Oui, juste deux lignes de code. Vous pouvez également extraire toutes les images des PDF. En outre, vous pouvez créer un autre document avec ces images ou les afficher dans votre application en fonction de vos besoins.

    Laissez-nous vous montrer comment faire.

    Nous pouvons procéder étape par étape avec l'application pour sélectionner n'importe quel fichier PDF et afficher son contenu.

    Les étapes suivantes vous montrent comment lire des fichiers PDF en C# :

    Connaissances Préalables :

  6. Connaissance de base de la programmation C#

  7. Connaissance de base des contrôles d'interface graphique C#

    J'ai conçu ce tutoriel de manière à ce que même une personne n'ayant aucune formation en programmation puisse progresser.

    Qui devrait lire ceci

    Tout nouvel arrivant apprenant le C# devrait savoir lire des fichiers PDF en utilisant IronPDF car c'est quelque chose que vous allez certainement utiliser dans votre carrière.

    Les développeurs professionnels devraient également lire ce document pour être en mesure de comprendre la bibliothèque IronPDF, qui nous aide à lire, générer et manipuler des documents PDF.

    Maintenant, comment pouvons-nous utiliser cette bibliothèque dans notre projet pour lire un fichier PDF ?

    J'utilise une application Windows Forms pour la démonstration. Vous pouvez utiliser une application console, une application WPF ou une application web ASP.NET selon vos préférences.

    Un autre avantage majeur de la bibliothèque IronPDF est qu'elle peut être utilisée à la fois avec C# et VB.NET.

    Commençons la démonstration sans plus attendre.


Étape #1 : Créer un projet Visual Studio

Ouvrez Visual Studio. J'utilise Visual Studio 2019.

Cliquez sur "Créer un nouveau projet" :

C# Lire un fichier PDF : Tutoriel facile, Figure 3 : Créer un nouveau projet

Créer un nouveau projet

Sélectionnez maintenant l'application Windows Forms dans le modèle, appuyez sur "Next", et la fenêtre suivante apparaîtra. Saisissez un nom de projet. J'ai écrit 'Read Pdf using IronPDF'.

C# Lire un fichier PDF : Tutoriel facile, Figure 16 : Configurer le projet via Visual Studio

Configurer le projet via Visual Studio

Cliquez ensuite sur "Suivant", et la fenêtre suivante apparaîtra. Sélectionnez '.NET Core 3.1' dans le menu déroulant.

C# Lire un fichier PDF : Tutoriel facile, Figure 9 : version .NET Core 3.1

Version .NET Core 3.1

Cliquez sur le bouton "Créer" et le projet sera créé comme indiqué ci-dessous.

C# Lire un fichier PDF : Tutoriel facile, Figure 6 : Étape initiale d'une nouvelle application Windows Forms

Étape initiale d'une nouvelle application Windows Forms


Étape #2 : Installer le package NuGet IronPDF

Cliquez sur le menu Projet dans la barre de menu, et une liste déroulante apparaît. Sélectionnez Manage NuGet Packages, et cliquez dessus. La fenêtre suivante apparaît :

Lire un fichier PDF en C# : Tutoriel facile, Figure 1 : Gestionnaire de packages NuGet

Gestionnaire de packages NuGet

Cliquez ensuite sur "Parcourir". La fenêtre suivante apparaît :

Lecture du fichier PDF en C# : Tutoriel facile, Figure 2 : Interface utilisateur du gestionnaire de packages NuGet

Interface utilisateur du gestionnaire de packages NuGet

Tapez IronPDF dans la boîte de recherche et appuyez sur "Enter". La fenêtre suivante apparaît :

C# Lire un fichier PDF : Tutoriel facile, Figure 4 : Solution NuGet

Solution NuGet

Sélectionnez et cliquez sur IronPDF. La fenêtre suivante apparaît :

C# Lire un fichier PDF : Tutoriel facile, Figure 7 : Installer IronPdf gratuit

Installer gratuitement IronPdf

Appuyez sur le bouton "Installer" et attendez la fin de l'installation. La fenêtre suivante apparaît après une installation réussie :

C# Lire un fichier PDF : Tutoriel facile, Figure 5 : IronPdf for .NET

IronPdf for .NET

Appuyez sur le bouton "Ok" et vous pouvez commencer.

Note : Il existe d'autres moyens de télécharger le paquet NuGet. Vous pouvez également installer IronPdf en utilisant la Console du Gestionnaire de Packages ; pour ce faire, ouvrez la console du gestionnaire de paquets et écrivez le code suivant :

Install-Package IronPdf

Vous pouvez également le télécharger sur la page du package NuGet pour IronPDF.

Le fichier Readme.txt suivant s'ouvre :

C# Lire un fichier PDF : Tutoriel facile, Figure 12 : Fichier readme d'IronPdf avec des exemples de code

Fichier readme d'IronPdf avec des exemples de code

Je vous suggère de parcourir tous les liens et d'explorer plus d'exemples de code IronPDF à propos de cette bibliothèque.


Étape #3 : Concevoir une application Windows Forms

Une fois le projet créé et le paquet NuGet installé, l'étape suivante consiste à concevoir une application Windows Forms qui demandera à l'utilisateur de rechercher un fichier et d'en afficher le contenu.

Forme ouverte1 Conception :

Lire un fichier PDF en C#: Tutoriel facile, Figure 14 : Interface utilisateur de conception Form1

Conception de l'interface utilisateur Form1

Cliquez sur la barre d'outils située à gauche de la fenêtre :

C# Lire un fichier PDF : Tutoriel facile, Figure 15 : Interface de la boîte à outils pour Label et TextBox

Boîte à outils UI pour Label et TextBox

Recherchez Label, et glissez-déposez-le dans la conception du formulaire

Nommez l'étiquette. Ici, je l'ai nommé "C# Read Pdf using IronPDF".

C# Lire un fichier PDF : Tutoriel facile, Figure 20 : Interface de Form1 avec étiquette ajoutée

Interface Form1 avec étiquette ajoutée

Ensuite, glissez-déposez une zone de texte (pour afficher le chemin du fichier), trois boutons (un pour parcourir les fichiers, un pour lire les fichiers PDF à l'aide d'IronPDF, et le troisième bouton pour "Effacer le texte"), et une RichTextBox (pour lire et afficher le contenu du fichier).

Définissez la "propriété de lecture seule" de la TextBox et de la RichTextBox sur "False". Ainsi, les utilisateurs ne peuvent lire que le contenu et le chemin d'accès du fichier.

Lecture de fichier PDF en C#: Tutoriel facile, Figure 10 : Form1 entièrement conçu

Form1 entièrement conçu


Étape #4 : Ajouter le code back-end pour la navigation dans les fichiers PDF

Double-cliquez sur le bouton "Parcourir" et la fenêtre suivante apparaîtra :

private void Browse_Click(object sender, EventArgs e)
{
}
private void Browse_Click(object sender, EventArgs e)
{
}
Private Sub Browse_Click(ByVal sender As Object, ByVal e As EventArgs)
End Sub
$vbLabelText   $csharpLabel

Ensuite, écrivez le code suivant dans la fonction Browse_Click :

private void Browse_Click(object sender, EventArgs e)
{
    OpenFileDialog browseFile = new OpenFileDialog
    {
        InitialDirectory = @"D:\",
        Title = "Browse Pdf Files",
        CheckFileExists = true,
        CheckPathExists = true,
        DefaultExt = "pdf",
        Filter = "pdf files (*.pdf)
*.pdf",
        FilterIndex = 2,
        RestoreDirectory = true,
        ReadOnlyChecked = true,
        ShowReadOnly = true
    };
    if (browseFile.ShowDialog() == DialogResult.OK)
    {
        FilePath.Text = browseFile.FileName;
    }
}
private void Browse_Click(object sender, EventArgs e)
{
    OpenFileDialog browseFile = new OpenFileDialog
    {
        InitialDirectory = @"D:\",
        Title = "Browse Pdf Files",
        CheckFileExists = true,
        CheckPathExists = true,
        DefaultExt = "pdf",
        Filter = "pdf files (*.pdf)
*.pdf",
        FilterIndex = 2,
        RestoreDirectory = true,
        ReadOnlyChecked = true,
        ShowReadOnly = true
    };
    if (browseFile.ShowDialog() == DialogResult.OK)
    {
        FilePath.Text = browseFile.FileName;
    }
}
Private Sub Browse_Click(ByVal sender As Object, ByVal e As EventArgs)
	Dim browseFile As New OpenFileDialog With {
		.InitialDirectory = "D:\",
		.Title = "Browse Pdf Files",
		.CheckFileExists = True,
		.CheckPathExists = True,
		.DefaultExt = "pdf",
		.Filter = "pdf files (*.pdf) *.pdf",
		.FilterIndex = 2,
		.RestoreDirectory = True,
		.ReadOnlyChecked = True,
		.ShowReadOnly = True
	}
	If browseFile.ShowDialog() = DialogResult.OK Then
		FilePath.Text = browseFile.FileName
	End If
End Sub
$vbLabelText   $csharpLabel

OpenFileDialogue créera l'instance du contrôle de dialogue de fichier de l'application Windows Forms.

J'ai défini le chemin d'accès initial sur le lecteur D ; vous pouvez le définir sur n'importe quel lecteur.

J'ai défini DefaultExt = "pdf" car nous n'avons qu'à lire le fichier PDF.

J'ai utilisé un filtre pour que la boîte de dialogue Parcourir le fichier n'affiche que le fichier PDF à sélectionner.

Lorsque l'utilisateur clique sur "Ok", le chemin d'accès au fichier s'affiche dans le champ Chemin d'accès au fichier.

Exécutons la solution et testons le bouton "Parcourir".

Lecture de fichier PDF en C#: Tutoriel facile, Figure 10 : Form1 UI

Interface utilisateur Form1

Appuyez sur le bouton "Parcourir" et la fenêtre suivante s'affiche :

C# Lire un fichier PDF : Tutoriel facile, Figure 11 : Dialogue de navigation pour sélectionner un fichier PDF

Parcourir la boîte de dialogue de fichier pour sélectionner un fichier PDF

Sélectionnez le fichier (je sélectionne IronPDFTest.pdf) et appuyez sur "Ouvrir". La fenêtre suivante apparaît.

C# Lire un fichier PDF : Tutoriel facile, Figure 13 : PDF en C#

PDF en C#

Écrivons maintenant le code derrière le bouton "Lire" pour lire le fichier.


Étape #5 : Ajouter le code back-end pour lire les documents PDF à l'aide d'IronPDF

Vous pensez peut-être que le code de lecture d'un fichier PDF est complexe et difficile à écrire et à comprendre.

Ne vous inquiétez pas. IronPDF a simplifié les choses et les a rendues tellement plus faciles. Nous pouvons facilement lire le fichier PDF en utilisant seulement deux lignes de code.

Allez dans le formulaire 1 Design et "double-cliquez" sur le bouton "Lire". La fenêtre suivante apparaît :

private void Read_Click(object sender, EventArgs e)
{
}
private void Read_Click(object sender, EventArgs e)
{
}
Private Sub Read_Click(ByVal sender As Object, ByVal e As EventArgs)
End Sub
$vbLabelText   $csharpLabel

Ajoutez un espace de noms using IronPdf pour importer la bibliothèque IronPDF :

using System;
using IronPdf;
using System;
using IronPdf;
Imports System
Imports IronPdf
$vbLabelText   $csharpLabel

Écrivez le code suivant à l'intérieur de la fonction Read_Click :

private void Read_Click(object sender, EventArgs e)
{
    using PdfDocument pdf = PdfDocument.FromFile(FilePath.Text);
    FileContent.Text = pdf.ExtractAllText(); 
}
private void Read_Click(object sender, EventArgs e)
{
    using PdfDocument pdf = PdfDocument.FromFile(FilePath.Text);
    FileContent.Text = pdf.ExtractAllText(); 
}
Private Sub Read_Click(ByVal sender As Object, ByVal e As EventArgs)
	Using pdf As PdfDocument = PdfDocument.FromFile(FilePath.Text)
		FileContent.Text = pdf.ExtractAllText()
	End Using
End Sub
$vbLabelText   $csharpLabel

FilePath est le nom du champ de texte qui affiche l'emplacement du document PDF que nous voulons lire. Nous obtiendrons l'emplacement du fichier de manière dynamique.

ExtractAllText avec IronPDF est la fonction IronPDF qui extraira toutes les données des pages PDF. Ces données seront ensuite affichées dans la zone de texte enrichi et nommées "Contenu du fichier".

Ensuite, écrivons le code derrière le "bouton d'effacement". Il s'agit d'un élément supplémentaire si vous souhaitez effacer l'écran après avoir lu le document PDF.

Double-cliquez sur le "bouton d'effacement", et vous obtiendrez le code suivant :

void Clear_Click(object sender, EventArgs e)
{
}
void Clear_Click(object sender, EventArgs e)
{
}
Private Sub Clear_Click(ByVal sender As Object, ByVal e As EventArgs)
End Sub
$vbLabelText   $csharpLabel

Écrivez le code suivant à l'intérieur de la fonction Clear_Click :

void Clear_Click(object sender, EventArgs e)
{
    FileContent.Text = "";
    FilePath.Text = "";
}
void Clear_Click(object sender, EventArgs e)
{
    FileContent.Text = "";
    FilePath.Text = "";
}
Private Sub Clear_Click(ByVal sender As Object, ByVal e As EventArgs)
	FileContent.Text = ""
	FilePath.Text = ""
End Sub
$vbLabelText   $csharpLabel

Exécuter la solution

Cliquez sur le bouton "Parcourir" et sélectionnez le document que vous souhaitez lire. Dans mon cas, je lis le fichier IronPDF.pdf à titre d'exemple :

Lire un fichier PDF en C# : Tutoriel facile, Figure 8 : Documents PDF

Documents PDF

Appuyez sur le bouton "Ouvrir" et la fenêtre suivante apparaîtra :

Lecture de fichier PDF C#: Tutoriel facile, Figure 13 : Application avec un fichier PDF sélectionné

Application avec un fichier PDF sélectionné

Appuyez sur le bouton "Lire". Il lira le fichier et affichera le contenu comme indiqué ci-dessous.

C# Lire le fichier PDF : Tutoriel facile, Figure 19 : Afficher le contenu du texte PDF

Afficher le contenu texte du PDF


Résumé

Il s'agit d'un exemple de solution. Quel que soit le nombre de pages, d'images ou de textes contenus dans vos fichiers PDF, IronPDF extraira tous les textes et toutes les images pour que vous puissiez les utiliser à n'importe quelle fin. Il vous suffit d'obtenir la licence de la bibliothèque et de commencer à l'utiliser.

Ceci complète le tutoriel. J'espère que vous avez tout compris, et si vous avez des questions, n'hésitez pas à les poser dans la section des commentaires.

Vous pouvez télécharger le fichier zip du projet. Si vous souhaitez acheter l'ensemble des logiciels Iron Software, notre offre spéciale vous permet de les acheter tous pour le prix de deux seulement. Si vous avez besoin de plus de détails sur la licence et le support, veuillez cliquer sur les informations tarifaires d'Iron Software. Vous pouvez également obtenir les offres de licence d'essai gratuit.

Chaknith Bin
Ingénieur logiciel
Chaknith travaille sur IronXL et IronBarcode. Il possède une expertise approfondie en C# et .NET, aidant à améliorer le logiciel et à soutenir les clients. Ses idées issues des interactions avec les utilisateurs contribuent à de meilleurs produits, une documentation améliorée et une expérience globale enrichie.
< PRÉCÉDENT
.NET Générateur de PDF en 1 clic
SUIVANT >
Comment protéger un document PDF par un mot de passe