C# Lire un Fichier PDF : Tutoriel Facile
Si vous êtes développeur, vous avez probablement rencontré des problèmes en essayant de lire du texte à partir d'un fichier PDF. Peut-être que l'un ou plusieurs des scénarios suivants s'appliquent à vous :
- Vous développez une application qui prend deux documents PDF en entrée et trouve la similitude entre les documents.
- Vous développez une application qui doit lire des documents PDF avec IronPDF et retourner le nombre de mots.
- Vous développez une application qui extrait des données d'un fichier PDF à l'aide d'IronPDF et les met dans une base de données structurée.
- Vous développez une application qui doit extraire le contenu textuel d'un PDF et le convertir en une chaîne.
- Extraire des données de fichiers PDF en utilisant C# était une tâche difficile et complexe jusqu'au développement d'IronPDF.
Aperçu de la bibliothèque IronPDF est une bibliothèque qui facilite énormément la tâche des développeurs pour lire des fichiers PDF.
Vous pouvez explorer davantage sur les offres d'IronPDF et de la suite Iron Software.
Vous pouvez lire des fichiers PDF et afficher les données dans une boîte à texte C# en utilisant seulement deux lignes de code. Oui, seulement deux lignes de code. Vous pouvez également extraire toutes les images des PDF. En outre, vous pouvez créer un autre document avec ces images ou les afficher dans votre application selon vos besoins.
Laissez-nous vous montrer comment c'est fait.
Nous pouvons procéder étape par étape avec l'application pour sélectionner des fichiers PDF et ensuite afficher leur contenu.
Les étapes suivantes vous montrent comment lire des fichiers PDF en C# :
Les étapes suivantes vous montrent comment lire des fichiers PDF en C#
- Télécharger la bibliothèque Print to PDF C#
- Choisissez un fichier PDF depuis votre ordinateur
- Sélectionnez une imprimante spécifique pour imprimer et définissez la résolution
- Vérifiez la sortie de votre imprimante pour votre PDF
- Suivez vos processus d'impression en utilisant C#
Connaissances préalables :
- Connaissance de base de la programmation en C#
- Connaissance de base des contrôles d'interface utilisateur C#
J'ai conçu ce tutoriel de manière à ce que même une personne sans bagage en programmation puisse progresser.
Qui devrait lire ceci
Tout nouvel apprenant en C# devrait savoir comment lire des fichiers PDF avec IronPDF car c'est quelque chose que vous allez certainement utiliser dans votre carrière.
Les développeurs professionnels devraient également lire ceci pour être capables de comprendre la bibliothèque IronPDF, qui nous aide à lire, générer et manipuler des documents PDF.
Maintenant, comment pouvons-nous utiliser cette bibliothèque dans notre projet pour lire un fichier PDF ?
J'utilise une application Windows Forms pour la démonstration. Vous pouvez utiliser une application console, une application WPF, ou une application web ASP.NET selon votre préférence.
Un autre avantage majeur de la bibliothèque IronPDF est qu'elle peut être utilisée avec à la fois C# et VB.NET.
Commençons la démonstration sans plus tarder.
Step #1: Create a Visual Studio Project
Ouvrir Visual Studio. J'utilise Visual Studio 2019.
Cliquez sur "Créer un nouveau projet" :
Créer un nouveau projet
Maintenant, sélectionnez Windows Forms App à partir du modèle, appuyez sur "Suivant", et la fenêtre suivante apparaîtra. Entrez un nom de projet. J'ai écrit 'Lire Pdf avec IronPDF'.
Configurer le projet via Visual Studio
Maintenant, cliquez sur "Suivant", et la fenêtre suivante apparaîtra. Sélectionnez '.NET Core 3.1' dans le menu déroulant.
Version .NET Core 3.1
Cliquez sur le bouton "Créer", et le projet sera créé comme montré ci-dessous.
Étape initiale d'une nouvelle application Windows Forms
Step #2: Install the IronPDF NuGet Package
Cliquez sur le Menu Projet dans la barre de menu, et une liste déroulante apparaîtra. Sélectionnez Gérer les paquets NuGet, et cliquez dessus. La fenêtre suivante apparaîtra :
Package Manager NuGet
Maintenant, cliquez sur "Parcourir". La fenêtre suivante apparaîtra :
Interface utilisateur du gestionnaire de packages NuGet
Tapez IronPDF dans la boîte de recherche et appuyez sur "Entrer". La fenêtre suivante apparaîtra :
Solution NuGet
Sélectionnez et cliquez sur IronPDF. La fenêtre suivante apparaîtra :
Installer IronPDF gratuit
Appuyez sur le bouton "Installer" et attendez que l'installation soit terminée. La fenêtre suivante apparaîtra après une installation réussie :
IronPDF pour .NET
Appuyez sur le bouton "Ok", et vous êtes prêt à commencer.
Remarque : Il y a d'autres moyens de télécharger le paquet NuGet. Vous pouvez également installer IronPdf en utilisant la console du gestionnaire de packages ; Pour ce faire, ouvrez la console du Package Manager et écrivez le code suivant :
Install-Package IronPdf
Vous pouvez également le télécharger sur la page de téléchargement du package NuGet pour IronPDF.
Le fichier Readme.txt suivant va s'ouvrir :
Fichier readme d'IronPDF avec exemples de code
Je vous suggère de parcourir tous les liens et d'explorer plus d'exemples de code IronPDF concernant cette bibliothèque.
Step #3: Design a Windows Forms App
Une fois qu'un projet est créé et que le paquet NuGet est installé, l'étape suivante consiste à concevoir une application Windows Forms qui demandera à l'utilisateur de parcourir un fichier et d'afficher son contenu.
Ouvrir Conception Form1 :
Interface utilisateur de conception de Form1
Cliquez sur la barre d'outils qui se trouve à gauche de la fenêtre :
Interface utilisateur de la boîte à outils pour l'étiquette et la zone de texte
Recherchez "Label", et faites-le glisser et déposez-le dans la conception du formulaire
Nommez l'étiquette. Ici, je l'ai nommé "Lire un PDF en C# avec IronPDF".
Interface utilisateur de Form1 avec étiquette ajoutée
Ensuite, faites glisser et déposez une zone de texte (pour afficher le chemin du fichier), trois boutons (un pour parcourir les fichiers, un pour lire les fichiers PDF avec IronPDF, et le troisième bouton pour "Effacer les champs de texte"), et une RichTextBox (pour lire et afficher le contenu du fichier).
Définissez la "propriété Lecture seule" de la zone de texte et de la RichTextBox sur "Faux". C'est pour que les utilisateurs ne puissent que lire le contenu et le chemin du fichier.
Form1 entièrement conçu
Step #4: Add the Back-end Code for Browsing PDF Files
Double-cliquez sur le bouton "Parcourir", et la fenêtre suivante apparaîtra :
private void Browse_Click(object sender, EventArgs e)
{
}
private void Browse_Click(object sender, EventArgs e)
{
}
Private Sub Browse_Click(ByVal sender As Object, ByVal e As EventArgs)
End Sub
Ensuite, écrivez le code suivant à l'intérieur de la fonction Browse_Click :
private void Browse_Click(object sender, EventArgs e)
{
// Initialize and configure OpenFileDialog
OpenFileDialog browseFile = new OpenFileDialog
{
InitialDirectory = @"D:\",
Title = "Browse Pdf Files",
CheckFileExists = true,
CheckPathExists = true,
DefaultExt = "pdf",
Filter = "pdf files (*.pdf)|*.pdf",
FilterIndex = 2,
RestoreDirectory = true,
ReadOnlyChecked = true,
ShowReadOnly = true
};
// Show the dialog and get result
if (browseFile.ShowDialog() == DialogResult.OK)
{
// Set the text box with the selected file path
FilePath.Text = browseFile.FileName;
}
}
private void Browse_Click(object sender, EventArgs e)
{
// Initialize and configure OpenFileDialog
OpenFileDialog browseFile = new OpenFileDialog
{
InitialDirectory = @"D:\",
Title = "Browse Pdf Files",
CheckFileExists = true,
CheckPathExists = true,
DefaultExt = "pdf",
Filter = "pdf files (*.pdf)|*.pdf",
FilterIndex = 2,
RestoreDirectory = true,
ReadOnlyChecked = true,
ShowReadOnly = true
};
// Show the dialog and get result
if (browseFile.ShowDialog() == DialogResult.OK)
{
// Set the text box with the selected file path
FilePath.Text = browseFile.FileName;
}
}
Private Sub Browse_Click(ByVal sender As Object, ByVal e As EventArgs)
' Initialize and configure OpenFileDialog
Dim browseFile As New OpenFileDialog With {
.InitialDirectory = "D:\",
.Title = "Browse Pdf Files",
.CheckFileExists = True,
.CheckPathExists = True,
.DefaultExt = "pdf",
.Filter = "pdf files (*.pdf)|*.pdf",
.FilterIndex = 2,
.RestoreDirectory = True,
.ReadOnlyChecked = True,
.ShowReadOnly = True
}
' Show the dialog and get result
If browseFile.ShowDialog() = DialogResult.OK Then
' Set the text box with the selected file path
FilePath.Text = browseFile.FileName
End If
End Sub
OpenFileDialog crée une instance du contrôle File Dialog de l'application Windows Forms.
J'ai défini le chemin initial sur le lecteur D ; vous pouvez le définir sur n'importe quel autre.
J'ai configuré DefaultExt = "pdf" car nous n'avons qu'à lire le fichier PDF.
J'ai utilisé un filtre pour que la boîte de dialogue de fichier parcouru ne vous montre que le fichier PDF à sélectionner.
Lorsque l'utilisateur clique sur "Ok", il affichera le chemin du fichier dans le champ Chemin de Fichier.
Exécutons la solution et testons le bouton "Parcourir".
Interface utilisateur de Form1
Appuyez sur le bouton "Parcourir" et la fenêtre suivante apparaîtra :
boîte de dialogue de fichier parcouru pour sélectionner un fichier PDF
Sélectionnez le fichier (je choisis IronPDFTest.pdf) et appuyez sur "Ouvrir". La fenêtre suivante apparaîtra.
PDF en C#
Écrivons maintenant le code derrière le bouton "Lire" pour lire le fichier.
Step #5: Add the Back-end Code for Reading PDF Documents using IronPDF
Vous pourriez penser que le code pour lire un fichier PDF serait complexe et difficile à écrire et à comprendre.
Ne vous inquiétez pas. IronPDF a simplifié les choses et rendu tout cela beaucoup plus facile. Nous pouvons facilement lire le fichier PDF en utilisant seulement deux lignes de code.
Allez dans la conception de Form1 et "double-cliquez" sur le bouton "Lire". La fenêtre suivante apparaîtra :
private void Read_Click(object sender, EventArgs e)
{
}
private void Read_Click(object sender, EventArgs e)
{
}
Private Sub Read_Click(ByVal sender As Object, ByVal e As EventArgs)
End Sub
Ajoutez un espace de noms using IronPdf pour importer la bibliothèque IronPDF :
using System;
using IronPdf;
using System;
using IronPdf;
Imports System
Imports IronPdf
Écrivez le code suivant à l'intérieur de la fonction Read_Click :
private void Read_Click(object sender, EventArgs e)
{
// Read the PDF file using IronPdf
using PdfDocument pdf = PdfDocument.FromFile(FilePath.Text);
// Extract and display the text from the PDF
FileContent.Text = pdf.ExtractAllText();
}
private void Read_Click(object sender, EventArgs e)
{
// Read the PDF file using IronPdf
using PdfDocument pdf = PdfDocument.FromFile(FilePath.Text);
// Extract and display the text from the PDF
FileContent.Text = pdf.ExtractAllText();
}
Private Sub Read_Click(ByVal sender As Object, ByVal e As EventArgs)
' Read the PDF file using IronPdf
Using pdf As PdfDocument = PdfDocument.FromFile(FilePath.Text)
' Extract and display the text from the PDF
FileContent.Text = pdf.ExtractAllText()
End Using
End Sub
FilePath est le nom du champ de texte qui affiche l'emplacement du document PDF que nous voulons lire. Nous allons obtenir l'emplacement du fichier dynamiquement.
ExtractAllText avec IronPDF est la fonction IronPDF qui extraira toutes les données des pages PDF. Ces données seront ensuite affichées dans la boîte de texte enrichie et nommées "Contenu du fichier".
Ensuite, écrivons le code derrière le bouton "Effacer". Ceci est juste un élément supplémentaire si vous souhaitez effacer l'écran une fois que vous avez lu le document PDF.
Double-cliquez sur le bouton "Effacer", et il vous mènera au code suivant :
void Clear_Click(object sender, EventArgs e)
{
}
void Clear_Click(object sender, EventArgs e)
{
}
Private Sub Clear_Click(ByVal sender As Object, ByVal e As EventArgs)
End Sub
Écrivez le code suivant à l'intérieur de la fonction Clear_Click :
void Clear_Click(object sender, EventArgs e)
{
// Clear the file path and content display fields
FileContent.Text = "";
FilePath.Text = "";
}
void Clear_Click(object sender, EventArgs e)
{
// Clear the file path and content display fields
FileContent.Text = "";
FilePath.Text = "";
}
Private Sub Clear_Click(ByVal sender As Object, ByVal e As EventArgs)
' Clear the file path and content display fields
FileContent.Text = ""
FilePath.Text = ""
End Sub
Exécuter la solution
Cliquez sur le bouton "Parcourir" et sélectionnez le document que vous souhaitez lire. Dans mon cas, je lis le fichier IronPDF.pdf à titre d'exemple :
Documents PDF
Appuyez sur le bouton "Ouvrir" et la fenêtre suivante apparaîtra :
Application avec un fichier PDF sélectionné
Appuyez sur le bouton "Lire". Il lira le fichier et affichera le contenu comme indiqué ci-dessous.
Afficher le contenu texte du PDF
Résumé
C'est une solution d'exemple. Peu importe le nombre de pages, d'images, ou de textes dans vos fichiers PDF, IronPDF extraira tous les textes et images pour que vous puissiez les utiliser à n'importe quelle fin. Vous devez simplement obtenir la licence pour la bibliothèque et commencer à l'utiliser.
Cela termine le tutoriel. J'espère que vous avez tout compris, et si vous avez des questions, n'hésitez pas à les poster dans la section des commentaires.
Vous pouvez télécharger le fichier zip du projet. Si vous souhaitez acheter l'ensemble du package de produits Iron Software, notre [offre spéciale](Iron Suite) signifie que vous pouvez maintenant tous les acheter pour le prix de seulement deux licences Lite.
Questions Fréquemment Posées
Comment puis-je lire du texte à partir d'un fichier PDF en utilisant C# ?
Vous pouvez lire du texte à partir d'un fichier PDF en using IronPDF en utilisant la méthode ExtractAllText, qui vous permet d'extraire facilement tout le contenu textuel d'un document PDF.
Quels sont les avantages d'utiliser IronPDF pour la manipulation de PDF en C# ?
IronPDF propose une approche simple pour la lecture, la génération et la manipulation de PDF en C#. Il permet aux développeurs d'accomplir des tâches comme l'extraction de texte et la récupération d'images avec un minimum de lignes de code, améliorant la productivité et l'efficacité.
Comment installer la bibliothèque IronPDF dans mon projet C# ?
Pour installer IronPDF, utilisez le gestionnaire de packages NuGet dans Visual Studio. Il suffit de rechercher 'IronPDF' dans la console de gestion des packages et de cliquer sur 'Installer' pour l'inclure dans votre projet.
IronPDF peut-il être utilisé pour extraire des images d'un fichier PDF ?
Oui, IronPDF offre des fonctionnalités pour extraire des images d'un fichier PDF, permettant aux développeurs d'accéder et de manipuler toutes les images contenues dans le document.
Quelles étapes sont impliquées dans la configuration d'un projet Visual Studio pour lire des fichiers PDF ?
La configuration d'un projet implique de créer un nouveau projet Visual Studio, d'installer le package NuGet IronPDF, de concevoir une application Forms Windows et de mettre en œuvre du code back-end pour parcourir et lire les fichiers PDF.
Comment puis-je m'assurer que les champs de mon application sont effacés après la lecture d'un PDF ?
Vous pouvez implémenter un bouton 'Effacer' dans votre application, qui réinitialise le contenu du TextBox et du RichTextBox à une chaîne vide, garantissant que les champs sont effacés après le traitement d'un PDF.
Est-il possible d'utiliser IronPDF avec VB.NET ?
Oui, IronPDF est compatible à la fois avec C# et VB.NET, ce qui en fait une option polyvalente pour les développeurs travaillant dans différents langages .NET.
Combien de lignes de code sont nécessaires pour afficher le contenu d'un PDF en using IronPDF ?
Vous pouvez afficher le contenu d'un PDF avec seulement deux lignes de code en using IronPDF, soulignant sa capacité à simplifier les tâches de traitement PDF.
À quoi sert la méthode 'RenderHtmlAsPdf' dans IronPDF ?
La méthode RenderHtmlAsPdf dans IronPDF est utilisée pour convertir des chaînes HTML en documents PDF, permettant une intégration transparente du contenu Web dans des fichiers PDF.
IronPDF est-il entièrement compatible avec .NET 10 ?
Oui. IronPDF est conçu pour être entièrement compatible avec .NET 10, ainsi qu'avec les versions antérieures telles que .NET 6 à 9, .NET Core, .NET Standard et .NET Framework. Il prend en charge l'installation via NuGet et fonctionne parfaitement sur de nombreuses plateformes, notamment Windows, Linux et macOS.



