Passer au contenu du pied de page
UTILISATION DE IRONPDF

C# Lire un Fichier PDF : Tutoriel Facile

Si vous êtes développeur, vous avez probablement rencontré des problèmes en essayant de lire du texte à partir d'un fichier PDF. Peut-être que l'un ou plusieurs des scénarios suivants s'appliquent à vous :

  1. Vous développez une application qui prend deux documents PDF en entrée et trouve la similitude entre les documents.
  2. Vous développez une application qui doit lire des documents PDF avec IronPDF et renvoyer le nombre de mots.
  3. Vous développez une application qui extrait des données d'un fichier PDF en utilisant IronPDF et les place dans une base de données structurée.
  4. Vous développez une application qui doit extraire le contenu texte d'un PDF et le convertir en chaîne.
  5. Extraire des données de fichiers PDF en utilisant C# était une tâche difficile et complexe jusqu'au développement d'IronPDF.

La vue d'ensemble de la bibliothèque IronPDF est une bibliothèque qui facilite tellement la lecture de fichiers PDF pour les développeurs.

Vous pouvez explorer davantage sur IronPDF et les offres de la suite Iron Software.

Vous pouvez lire des fichiers PDF et afficher les données dans une boîte à texte C# en utilisant seulement deux lignes de code. Oui, seulement deux lignes de code. Vous pouvez également extraire toutes les images des PDF. En outre, vous pouvez créer un autre document avec ces images ou les afficher dans votre application selon vos besoins.

Laissez-nous vous montrer comment c'est fait.

Nous pouvons procéder étape par étape avec l'application pour sélectionner des fichiers PDF et ensuite afficher leur contenu.

Les étapes suivantes vous montrent comment lire des fichiers PDF en C# :

class="hsg-featured-snippet">

Les étapes suivantes vous montrent comment lire des fichiers PDF en C#

  1. Télécharger la bibliothèque d'impression en PDF C#
  2. Choisissez un fichier PDF sur votre ordinateur
  3. Sélectionnez une imprimante spécifique pour imprimer et définir la résolution
  4. Vérifiez votre sortie PDF depuis votre imprimante
  5. Suivez vos processus d'impression en utilisant C#

Connaissances préalables :

  1. Connaissance de base de la programmation en C#
  2. Connaissance de base des contrôles d'interface utilisateur C#

J'ai conçu ce tutoriel de manière à ce que même une personne sans bagage en programmation puisse progresser.

Qui devrait lire ceci

Tout nouvel apprenant de C# devrait savoir comment lire des fichiers PDF en utilisant IronPDF car c'est quelque chose que vous utiliserez définitivement dans votre carrière.

Les développeurs professionnels devraient également lire ceci pour être capables de comprendre la bibliothèque IronPDF, qui nous aide à lire, générer et manipuler des documents PDF.

Maintenant, comment pouvons-nous utiliser cette bibliothèque dans notre projet pour lire un fichier PDF ?

J'utilise une application Windows Forms pour la démonstration. Vous pouvez utiliser une application console, une application WPF, ou une application web ASP.NET selon votre préférence.

Un autre avantage majeur de la bibliothèque IronPDF est qu'elle peut être utilisée avec à la fois C# et VB.NET.

Commençons la démonstration sans plus tarder.


Étape n°1 : Créer un projet Visual Studio

Ouvrir Visual Studio. J'utilise Visual Studio 2019.

Cliquez sur "Créer un nouveau projet" :

C# Lire un fichier PDF : Tutoriel facile, Figure 3 : Créer un nouveau projet Créer un nouveau projet

Maintenant, sélectionnez Windows Forms App à partir du modèle, appuyez sur "Suivant", et la fenêtre suivante apparaîtra. Entrez un nom de projet. J'ai écrit 'Lire Pdf avec IronPDF'.

C# Lire un fichier PDF : Tutoriel facile, Figure 16 : Configurer le projet via Visual Studio Configurer le projet via Visual Studio

Maintenant, cliquez sur "Suivant", et la fenêtre suivante apparaîtra. Sélectionnez '.NET Core 3.1' dans le menu déroulant.

C# Lire un fichier PDF : Tutoriel facile, Figure 9 : Version .NET Core 3.1 Version .NET Core 3.1

Cliquez sur le bouton "Créer", et le projet sera créé comme montré ci-dessous.

C# Lire un fichier PDF : Tutoriel facile, Figure 6 : Étape initiale d'une nouvelle application Windows Forms Étape initiale d'une nouvelle application Windows Forms


Étape n°2 : Installer le paquet NuGet IronPDF

Cliquez sur le Menu Projet dans la barre de menu, et une liste déroulante apparaîtra. Sélectionnez Gérer les paquets NuGet, et cliquez dessus. La fenêtre suivante apparaîtra :

C# Lire un fichier PDF : Tutoriel facile, Figure 1 : Gestionnaire de paquets NuGet Gestionnaire de paquets NuGet

Maintenant, cliquez sur "Parcourir". La fenêtre suivante apparaîtra :

C# Lire un fichier PDF : Tutoriel facile, Figure 2 : Interface utilisateur du gestionnaire de paquets NuGet Interface utilisateur du gestionnaire de paquets NuGet

Tapez IronPdf dans la boîte de recherche et appuyez sur "Entrer". La fenêtre suivante apparaîtra :

C# Lire un fichier PDF : Tutoriel facile, Figure 4 : Solution NuGet Solution NuGet

Sélectionnez et cliquez sur IronPdf. La fenêtre suivante apparaîtra : C# Lire un fichier PDF : Tutoriel facile, Figure 7 : Installer IronPdf gratuit Installer IronPdf gratuit

Appuyez sur le bouton "Installer" et attendez que l'installation soit terminée. La fenêtre suivante apparaîtra après une installation réussie :

C# Lire un fichier PDF : Tutoriel facile, Figure 5 : IronPdf for .NET IronPdf pour .NET

Appuyez sur le bouton "Ok", et vous êtes prêt à commencer.

Remarque : Il y a d'autres moyens de télécharger le paquet NuGet. Vous pouvez également installer IronPdf en utilisant la console du gestionnaire de paquets ; Pour ce faire, ouvrez la console du gestionnaire de paquets et écrivez le code suivant :

Install-Package IronPdf

Vous pouvez également le télécharger sur la page de paquet NuGet pour IronPDF.

Le fichier Readme.txt suivant va s'ouvrir :

C# Lire un fichier PDF : Tutoriel facile, Figure 12 : Fichier readme d'IronPdf avec exemples de code Fichier readme d'IronPdf avec exemples de code

Je vous suggère de parcourir tous les liens et d'explorer plus d'échantillons de code IronPDF concernant cette bibliothèque.


Étape n°3 : Concevoir une application Windows Forms

Une fois qu'un projet est créé et que le paquet NuGet est installé, l'étape suivante consiste à concevoir une application Windows Forms qui demandera à l'utilisateur de parcourir un fichier et d'afficher son contenu.

Ouvrir Conception Form1 :

C# Lire un fichier PDF : Tutoriel facile, Figure 14 : Interface utilisateur de conception de Form1 Interface utilisateur de conception de Form1

Cliquez sur la barre d'outils qui se trouve à gauche de la fenêtre :

C# Lire un fichier PDF : Tutoriel facile, Figure 15 : Interface utilisateur de la boîte à outils pour l'étiquette et la zone de texte Interface utilisateur de la boîte à outils pour l'étiquette et la zone de texte

Recherchez "Label", et faites-le glisser et déposez-le dans la conception du formulaire

Nommez l'étiquette. Ici, je l'ai nommé "Lire un PDF en C# avec IronPDF".

C# Lire un fichier PDF : Tutoriel facile, Figure 20 : Interface utilisateur de Form1 avec étiquette ajoutée Interface utilisateur de Form1 avec étiquette ajoutée

Ensuite, faites glisser et déposez une zone de texte (pour afficher le chemin du fichier), trois boutons (un pour parcourir les fichiers, un pour lire les fichiers PDF avec IronPDF, et le troisième bouton pour "Effacer les champs de texte"), et une RichTextBox (pour lire et afficher le contenu du fichier).

Définissez la "propriété Lecture seule" de la zone de texte et de la RichTextBox sur "Faux". C'est pour que les utilisateurs ne puissent que lire le contenu et le chemin du fichier.

C# Lire un fichier PDF : Tutoriel facile, Figure 10 : Form1 entièrement conçu Form1 entièrement conçu


Étape n°4 : Ajouter le code Back-end pour parcourir les fichiers PDF

Double-cliquez sur le bouton "Parcourir", et la fenêtre suivante apparaîtra :

private void Browse_Click(object sender, EventArgs e)
{
}
private void Browse_Click(object sender, EventArgs e)
{
}
Private Sub Browse_Click(ByVal sender As Object, ByVal e As EventArgs)
End Sub
$vbLabelText   $csharpLabel

Ensuite, écrivez le code suivant à l'intérieur de la fonction Browse_Click :

private void Browse_Click(object sender, EventArgs e)
{
    // Initialize and configure OpenFileDialog
    OpenFileDialog browseFile = new OpenFileDialog
    {
        InitialDirectory = @"D:\",
        Title = "Browse Pdf Files",
        CheckFileExists = true,
        CheckPathExists = true,
        DefaultExt = "pdf",
        Filter = "pdf files (*.pdf)|*.pdf",
        FilterIndex = 2,
        RestoreDirectory = true,
        ReadOnlyChecked = true,
        ShowReadOnly = true
    };

    // Show the dialog and get result
    if (browseFile.ShowDialog() == DialogResult.OK)
    {
        // Set the text box with the selected file path
        FilePath.Text = browseFile.FileName;
    }
}
private void Browse_Click(object sender, EventArgs e)
{
    // Initialize and configure OpenFileDialog
    OpenFileDialog browseFile = new OpenFileDialog
    {
        InitialDirectory = @"D:\",
        Title = "Browse Pdf Files",
        CheckFileExists = true,
        CheckPathExists = true,
        DefaultExt = "pdf",
        Filter = "pdf files (*.pdf)|*.pdf",
        FilterIndex = 2,
        RestoreDirectory = true,
        ReadOnlyChecked = true,
        ShowReadOnly = true
    };

    // Show the dialog and get result
    if (browseFile.ShowDialog() == DialogResult.OK)
    {
        // Set the text box with the selected file path
        FilePath.Text = browseFile.FileName;
    }
}
Private Sub Browse_Click(ByVal sender As Object, ByVal e As EventArgs)
	' Initialize and configure OpenFileDialog
	Dim browseFile As New OpenFileDialog With {
		.InitialDirectory = "D:\",
		.Title = "Browse Pdf Files",
		.CheckFileExists = True,
		.CheckPathExists = True,
		.DefaultExt = "pdf",
		.Filter = "pdf files (*.pdf)|*.pdf",
		.FilterIndex = 2,
		.RestoreDirectory = True,
		.ReadOnlyChecked = True,
		.ShowReadOnly = True
	}

	' Show the dialog and get result
	If browseFile.ShowDialog() = DialogResult.OK Then
		' Set the text box with the selected file path
		FilePath.Text = browseFile.FileName
	End If
End Sub
$vbLabelText   $csharpLabel

OpenFileDialog crée une instance du contrôle de boîte de dialogue de fichier de l'application Windows Forms.

J'ai défini le chemin initial sur le lecteur D ; vous pouvez le définir sur n'importe quel autre.

J'ai défini DefaultExt = "pdf" car nous devons uniquement lire le fichier PDF.

J'ai utilisé un filtre pour que la boîte de dialogue de fichier parcouru ne vous montre que le fichier PDF à sélectionner.

Lorsque l'utilisateur clique sur "Ok", il affichera le chemin du fichier dans le champ Chemin de Fichier.

Exécutons la solution et testons le bouton "Parcourir".

C# Lire un fichier PDF : Tutoriel facile, Figure 10 : Interface utilisateur de Form1 Interface utilisateur de Form1

Appuyez sur le bouton "Parcourir" et la fenêtre suivante apparaîtra :

C# Lire un fichier PDF : Tutoriel facile, Figure 11 : boîte de dialogue de fichier parcouru pour sélectionner un fichier PDF boîte de dialogue de fichier parcouru pour sélectionner un fichier PDF

Sélectionnez le fichier (je choisis IronPDFTest.pdf) et appuyez sur "Ouvrir". La fenêtre suivante apparaîtra.

C# Lire un fichier PDF : Tutoriel facile, Figure 13 : PDF en C# PDF en C#

Écrivons maintenant le code derrière le bouton "Lire" pour lire le fichier.


Étape n°5 : Ajouter le code de Back-end pour lire des documents PDF en utilisant IronPDF

Vous pourriez penser que le code pour lire un fichier PDF serait complexe et difficile à écrire et à comprendre.

Ne vous inquiétez pas. IronPDF a simplifié les choses et rendu tout cela beaucoup plus facile. Nous pouvons facilement lire le fichier PDF en utilisant seulement deux lignes de code.

Allez dans la conception de Form1 et "double-cliquez" sur le bouton "Lire". La fenêtre suivante apparaîtra :

private void Read_Click(object sender, EventArgs e)
{
}
private void Read_Click(object sender, EventArgs e)
{
}
Private Sub Read_Click(ByVal sender As Object, ByVal e As EventArgs)
End Sub
$vbLabelText   $csharpLabel

Ajouter un espace de nom using IronPdf pour importer la bibliothèque IronPDF :

using System;
using IronPdf;
using System;
using IronPdf;
Imports System
Imports IronPdf
$vbLabelText   $csharpLabel

Écrivez le code suivant à l'intérieur de la fonction Read_Click :

private void Read_Click(object sender, EventArgs e)
{
    // Read the PDF file using IronPdf
    using PdfDocument pdf = PdfDocument.FromFile(FilePath.Text);

    // Extract and display the text from the PDF
    FileContent.Text = pdf.ExtractAllText(); 
}
private void Read_Click(object sender, EventArgs e)
{
    // Read the PDF file using IronPdf
    using PdfDocument pdf = PdfDocument.FromFile(FilePath.Text);

    // Extract and display the text from the PDF
    FileContent.Text = pdf.ExtractAllText(); 
}
Private Sub Read_Click(ByVal sender As Object, ByVal e As EventArgs)
	' Read the PDF file using IronPdf
	Using pdf As PdfDocument = PdfDocument.FromFile(FilePath.Text)
	
		' Extract and display the text from the PDF
		FileContent.Text = pdf.ExtractAllText()
	End Using
End Sub
$vbLabelText   $csharpLabel

FilePath est le nom du champ de texte qui affiche l'emplacement du document PDF que nous voulons lire. Nous allons obtenir l'emplacement du fichier dynamiquement.

ExtractAllText avec IronPDF est la fonction IronPDF qui extraira toutes les données des pages PDF. Ces données seront ensuite affichées dans la boîte de texte enrichie et nommées "Contenu du fichier".

Ensuite, écrivons le code derrière le bouton "Effacer". Ceci est juste un élément supplémentaire si vous souhaitez effacer l'écran une fois que vous avez lu le document PDF.

Double-cliquez sur le bouton "Effacer", et il vous mènera au code suivant :

void Clear_Click(object sender, EventArgs e)
{
}
void Clear_Click(object sender, EventArgs e)
{
}
Private Sub Clear_Click(ByVal sender As Object, ByVal e As EventArgs)
End Sub
$vbLabelText   $csharpLabel

Écrivez le code suivant à l'intérieur de la fonction Clear_Click :

void Clear_Click(object sender, EventArgs e)
{
    // Clear the file path and content display fields
    FileContent.Text = "";
    FilePath.Text = "";
}
void Clear_Click(object sender, EventArgs e)
{
    // Clear the file path and content display fields
    FileContent.Text = "";
    FilePath.Text = "";
}
Private Sub Clear_Click(ByVal sender As Object, ByVal e As EventArgs)
	' Clear the file path and content display fields
	FileContent.Text = ""
	FilePath.Text = ""
End Sub
$vbLabelText   $csharpLabel

Exécuter la solution

Cliquez sur le bouton "Parcourir" et sélectionnez le document que vous souhaitez lire. Dans mon cas, je lis le fichier IronPDF.pdf à titre d'exemple :

C# Lire un fichier PDF : Tutoriel facile, Figure 8 : Documents PDF Documents PDF

Appuyez sur le bouton "Ouvrir" et la fenêtre suivante apparaîtra :

C# Lire un fichier PDF : Tutoriel facile, Figure 13 : Application avec un fichier PDF sélectionné Application avec un fichier PDF sélectionné

Appuyez sur le bouton "Lire". Il lira le fichier et affichera le contenu comme indiqué ci-dessous.

C# Lire un fichier PDF : Tutoriel facile, Figure 19 : Afficher le contenu texte du PDF Afficher le contenu texte du PDF


Résumé

C'est une solution d'exemple. Peu importe le nombre de pages, d'images, ou de textes dans vos fichiers PDF, IronPDF extraira tous les textes et images pour que vous puissiez les utiliser à n'importe quelle fin. Vous devez simplement obtenir la licence pour la bibliothèque et commencer à l'utiliser.

Cela termine le tutoriel. J'espère que vous avez tout compris, et si vous avez des questions, n'hésitez pas à les poster dans la section des commentaires.

Vous pouvez télécharger le fichier zip du projet. Si vous souhaitez acheter le paquet complet de produits logiciels Iron, notre offre spéciale signifie que vous pouvez maintenant les acheter tous pour le prix de seulement deux licences Lite.

Questions Fréquemment Posées

Comment puis-je lire du texte à partir d'un fichier PDF en utilisant C# ?

Vous pouvez lire du texte à partir d'un fichier PDF en utilisant IronPDF en utilisant la méthode ExtractAllText, qui vous permet d'extraire facilement tout le contenu textuel d'un document PDF.

Quels sont les avantages d'utiliser IronPDF pour la manipulation de PDF en C# ?

IronPDF propose une approche simple pour la lecture, la génération et la manipulation de PDF en C#. Il permet aux développeurs d'accomplir des tâches comme l'extraction de texte et la récupération d'images avec un minimum de lignes de code, améliorant la productivité et l'efficacité.

Comment installer la bibliothèque IronPDF dans mon projet C# ?

Pour installer IronPDF, utilisez le gestionnaire de packages NuGet dans Visual Studio. Il suffit de rechercher 'IronPdf' dans la console de gestion des packages et de cliquer sur 'Installer' pour l'inclure dans votre projet.

IronPDF peut-il être utilisé pour extraire des images d'un fichier PDF ?

Oui, IronPDF offre des fonctionnalités pour extraire des images d'un fichier PDF, permettant aux développeurs d'accéder et de manipuler toutes les images contenues dans le document.

Quelles étapes sont impliquées dans la configuration d'un projet Visual Studio pour lire des fichiers PDF ?

La configuration d'un projet implique de créer un nouveau projet Visual Studio, d'installer le package NuGet IronPDF, de concevoir une application Forms Windows et de mettre en œuvre du code back-end pour parcourir et lire les fichiers PDF.

Comment puis-je m'assurer que les champs de mon application sont effacés après la lecture d'un PDF ?

Vous pouvez implémenter un bouton 'Effacer' dans votre application, qui réinitialise le contenu du TextBox et du RichTextBox à une chaîne vide, garantissant que les champs sont effacés après le traitement d'un PDF.

Est-il possible d'utiliser IronPDF avec VB.NET ?

Oui, IronPDF est compatible à la fois avec C# et VB.NET, ce qui en fait une option polyvalente pour les développeurs travaillant dans différents langages .NET.

Combien de lignes de code sont nécessaires pour afficher le contenu d'un PDF en utilisant IronPDF ?

Vous pouvez afficher le contenu d'un PDF avec seulement deux lignes de code en utilisant IronPDF, soulignant sa capacité à simplifier les tâches de traitement PDF.

À quoi sert la méthode 'RenderHtmlAsPdf' dans IronPDF ?

La méthode RenderHtmlAsPdf dans IronPDF est utilisée pour convertir des chaînes HTML en documents PDF, permettant une intégration transparente du contenu Web dans des fichiers PDF.

IronPDF est-il entièrement compatible avec .NET 10 ?

Oui. IronPDF est conçu pour être entièrement compatible avec .NET 10, ainsi qu'avec les versions antérieures telles que .NET 6 à 9, .NET Core, .NET Standard et .NET Framework. Il prend en charge l'installation via NuGet et fonctionne parfaitement sur de nombreuses plateformes, notamment Windows, Linux et macOS.

Curtis Chau
Rédacteur technique

Curtis Chau détient un baccalauréat en informatique (Université de Carleton) et se spécialise dans le développement front-end avec expertise en Node.js, TypeScript, JavaScript et React. Passionné par la création d'interfaces utilisateur intuitives et esthétiquement plaisantes, Curtis aime travailler avec des frameworks modernes ...

Lire la suite