UTILISATION D'IRONPDF

Comment lire des fichiers PDF en C#

Mise à jour mars 24, 2024
Partager:

Cet article utilisera IronPDF pour .NET, une bibliothèque PDF C# pour lire les fichiers PDF.

Comment lire des fichiers PDF à l'aide d'IronPDF

  1. Téléchargez Visual Studio, si ce n'est pas déjà fait. Configurez l'environnement et installez la bibliothèque IronPDF.

  2. Utilisation PdfDocument.FromFile (Document PDF.Du Fichier) (Document PDF.Du Fichier) pour ouvrir et charger le fichier PDF souhaité.

  3. Utilisez la méthode ExtractAllText d'IronPDF pour récupérer le contenu.

  4. Analyser ou manipuler le texte extrait si nécessaire.

  5. Imprimer le texte extrait dans la Console pour le lire.

IronPDF

IronPDFc#, une bibliothèque de lecture de PDF robuste, permet aux développeurs de travailler sans effort avec des documents PDF. Grâce à ses nombreuses fonctionnalités et capacités, IronPDF simplifie la manipulation des documents PDF, permettant aux utilisateurs de lire, d'extraire et de manipuler le contenu PDF en toute simplicité. Qu'il s'agisse d'automatiser des processus documentaires, d'extraire des données et des images à des fins d'analyse ou de créer des PDF à partir de zéro, IronPDF propose un ensemble complet d'outils pour rationaliser ces tâches.

Cet article explore le monde du traitement efficace des PDF en C# à l'aide de IronPDFqui montre sa polyvalence et sa valeur en tant qu'outil essentiel pour les développeurs dans leur parcours de développement de logiciels.

Création d'un nouveau projet Visual Studio

Avant de plonger dans l'aspect codage, commençons par créer un nouveau fichier Visual Studio Projet d'application console C#. Ce projet servira d'espace de travail dédié au développement et aux exemples pratiques.

  1. Pour initier ce processus, lancez Visual Studio et créez un nouveau projet en accédant au menu "Fichier" et en sélectionnant "Nouveau" puis "Projet"

    Comment lire des fichiers PDF en C#, Figure 1 : Accéder à la boîte de dialogue Créer un projet dans Visual Studio

    Naviguer vers la boîte de dialogue Créer un projet dans Visual Studio

  2. Cette action fait apparaître une nouvelle fenêtre qui vous permet de spécifier les modèles de projet. Pour des raisons de simplicité, optez pour le modèle "Application console" et cliquez sur le bouton Suivant, judicieusement placé dans le coin inférieur gauche de la fenêtre.

    Comment lire des fichiers PDF en C#, Figure 2 : Créer un nouveau projet dans Visual Studio

    Créer un nouveau projet dans Visual Studio

  3. Dans la fenêtre suivante, vous serez invité à donner un nom à votre projet et à spécifier son emplacement. Une fois que ces détails sont en place, cliquez sur le bouton Suivant pour continuer.

    Comment lire des fichiers PDF en C#, Figure 3 : Configuration du projet

    Configurer le projet

  4. Dans cette étape, sélectionnez votre cadre cible préféré et terminez le processus de création du projet en cliquant sur le bouton Créer.

    Comment lire des fichiers PDF en C#, Figure 4 : Sélection du Framework .NET

    Sélection du Framework .NET

    Votre projet étant désormais solidement établi, l'étape suivante consiste à installer les éléments suivants IronPDF.

Installation d'IronPDF

IronPDF offre une multitude d'options pour télécharger et installer la bibliothèque PDF. Dans le cadre de ce guide, nous nous concentrerons sur l'installation d'IronPDF à l'aide du gestionnaire de paquets NuGet, une méthode efficace et largement adoptée.

  1. Dans Visual Studio, allez dans le menu "Outils" et passez élégamment votre curseur sur l'option "NuGet Package Manager".

  2. Dans le menu étendu, sélectionnez "NuGet Package Manager for Solutions"

    Comment lire des fichiers PDF en C#, Figure 5 : Naviguer vers le gestionnaire de paquets NuGet

    Naviguer vers le gestionnaire de paquets NuGet

  3. En sélectionnant cette option, une nouvelle fenêtre s'ouvre. Dans cette fenêtre affinée, naviguez jusqu'au menu "Parcourir" et tapez "IronPDF" dans la barre de recherche.

  4. L'écran affiche alors les paquets IronPDF disponibles. Pour continuer, sélectionnez le dernier paquet dans la liste et exécutez ce choix en cliquant sur l'option "Installer".

    Comment lire des fichiers PDF en C#, Figure 6 : Rechercher et installer le package IronPDF dans l'interface utilisateur du gestionnaire de packages NuGet

    Rechercher et installer le paquetage IronPDF dans l'interface utilisateur du gestionnaire de paquets NuGet

    Pour ceux qui préfèrent une approche en ligne de commande, la console du gestionnaire de paquets NuGet offre une solution élégante. Il suffit d'ouvrir cette console, de saisir la commande suivante et d'appuyer sur "Entrée" :

Install-Package IronPdf

Vous avez également la possibilité d'acquérir directement le paquet auprès de la Site web de NuGet lien.

Lire des fichiers PDF à l'aide d'IronPDF

Cette section montre comment ouvrir et lire des fichiers PDF complets en utilisant le langage de programmation C# à l'aide d'IronPDF.

using IronPdf;
using System;

IronPdf.License.LicenseKey = "";
//raw text string path
var pdf = PdfDocument.FromFile("document_scaled_compressed.pdf");

string text = pdf.ExtractAllText();

Console.WriteLine(text);
using IronPdf;
using System;

IronPdf.License.LicenseKey = "";
//raw text string path
var pdf = PdfDocument.FromFile("document_scaled_compressed.pdf");

string text = pdf.ExtractAllText();

Console.WriteLine(text);
Imports IronPdf
Imports System

IronPdf.License.LicenseKey = ""
'raw text string path
Dim pdf = PdfDocument.FromFile("document_scaled_compressed.pdf")

Dim text As String = pdf.ExtractAllText()

Console.WriteLine(text)
VB   C#

1. Importation des bibliothèques nécessaires

Pour commencer, vous devez importer les espaces de noms requis. Dans l'exemple de code ci-dessus, l'espace de noms IronPDF est importé, qui contient les fonctions essentielles pour travailler avec les PDF. En outre, l'espace de noms System est également importé pour les opérations générales au niveau du système.

using IronPdf;
using System;
using IronPdf;
using System;
Imports IronPdf
Imports System
VB   C#

2. Définition de la clé de licence IronPDF

IronPDF nécessite une clé de licence valide pour être utilisé dans un environnement de production. Dans l'exemple de code, il y a une ligne où la clé de licence doit être définie. Cependant, dans le code que vous avez fourni, la clé de licence est laissée vide "". Veillez à remplacer la chaîne vide par une clé de licence valide d'IronPDF lorsque vous l'utilisez dans un environnement de production.

IronPdf.License.LicenseKey = "Your_License_Key_Here";
IronPdf.License.LicenseKey = "Your_License_Key_Here";
IronPdf.License.LicenseKey = "Your_License_Key_Here"
VB   C#

3. Chargement d'un document PDF

L'étape suivante consiste à charger et à analyser le fichier PDF. Dans le code fourni, la méthode PdfDocument.FromFile est utilisée pour charger un PDF dont le nom de fichier est "document_scaled_compressed.pdf" et l'assigner à la variable pdf. Ce fichier PDF sera utilisé pour l'extraction du texte.

var pdf = PdfDocument.FromFile("document_scaled_compressed.pdf");
var pdf = PdfDocument.FromFile("document_scaled_compressed.pdf");
Dim pdf = PdfDocument.FromFile("document_scaled_compressed.pdf")
VB   C#

4. Extraction du texte du document PDF

IronPDF offre un moyen simple d'extraire du texte du document PDF chargé. Les ExtraireToutTexte peut extraire tout le contenu textuel de chaque page du PDF et le stocker dans une variable string nommée text, qui fonctionne comme un convertisseur de PDF ****to Text.

string text = pdf.ExtractAllText();
string text = pdf.ExtractAllText();
Dim text As String = pdf.ExtractAllText()
VB   C#

5. Affichage du texte extrait

La dernière étape consiste à afficher le texte extrait. Dans le code, Console.WriteLine imprime et écrit le texte extrait dans la console. Il s'agit d'une méthode utile pour le débogage ou la présentation du texte à l'utilisateur.

Console.WriteLine(text);
Console.WriteLine(text);
Console.WriteLine(text)
VB   C#

OUTPUT Texte extrait du fichier PDF

Comment lire des fichiers PDF en C#, Figure 7 : Le texte extrait du fichier PDF

Le texte extrait du fichier PDF

Conclusion

Cet article a guidé les développeurs tout au long du processus permettant de travailler efficacement avec des fichiers PDF en C# à l'aide de la fonction IronPDF bibliothèque. Elle commence par illustrer la mise en place d'un projet Visual Studio dédié et se poursuit par l'installation directe d'IronPDF via le gestionnaire de paquets NuGet. L'article explique ensuite, étape par étape, comment importer les bibliothèques nécessaires, définir la clé de licence d'IronPDF, charger un fichier PDF, extraire le contenu textuel et afficher le texte extrait de toutes les pages. Vous pouvez également enregistrer le texte extrait dans un fichier TXT à l'aide de C#.

Grâce à son approche conviviale et à ses fonctionnalités complètes, IronPDF est un outil indispensable pour automatiser les processus documentaires, l'extraction de données et la création de PDF à partir de HTML, d'URL et d'images, ce qui en fait un atout précieux pour améliorer les projets de développement de logiciels impliquant la manipulation de fichiers PDF en C#.

L'article complet sur Lire des fichiers PDF en utilisant IronPDF peut être consultée sur le site suivant page de conseils. L'exemple de code sur la page Lecteur de PDF C# est également disponible. Pour d'autres exemples de code utilisant IronPDF, veuillez consulter ce site Web exemple de page. IronPDF propose également une documentation complète pour répondre aux questions de tous les développeurs et fournir une assistance pratique complète. IronPDF offre un service gratuit de licence d'essai afin que les utilisateurs puissent en explorer toutes les fonctionnalités avant de décider d'en acheter un licence perpétuelle.

< PRÉCÉDENT
Comment ajouter un estampilleur de PDF en C#
SUIVANT >
Comment compresser les fichiers PDF dans la bibliothèque .NET