UTILISATION D'IRONPDF

C# Convertir un PDF en texte (exemple de code)

Mise à jour février 8, 2024
Partager:

Cet article décrit le processus permettant aux développeurs .NET de convertir des fichiers PDF au format TXT pour un accès plus efficace.

Thèmes abordés dans le didacticiel

  • IronPDF
  • Étapes à suivre pour créer des fichiers PDF de manière programmatique
  • Étape 1 : Créer un projet C#
  • Étape 2 : Installer la bibliothèque IronPDF

    • Méthode 1 : NuGet Package Manager

    • Méthode 2 : Console du gestionnaire de paquets NuGet
  • Méthode 3 : Utilisation du fichier DLL
  • Étape 3 : Ajouter l'espace de noms IronPDF
  • Étape 4 : Convertir le PDF en texte
  • Sortie
  • Conclusion

IronPDF

IronPDF est une bibliothèque .NET pour la génération de PDF. Il s'agit d'une bibliothèque .NET native qui ne dépend pas de DLL externes ou d'autres outils. IronPDF est une bibliothèque multiplateforme écrite en C# et .NET qui offre toutes les fonctionnalités nécessaires pour travailler avec des documents PDF. Il contient des fonctions de rendu de documents, d'édition de formulaires, d'extraction de texte, de cryptage de fichiers ainsi que d'autres fonctions. Toutes ces opérations peuvent être effectuées par le biais d'une API intuitive qui a été largement testée sur diverses plateformes telles que Windows Forms, WPF, ASP.NET MVC, etc.

La version actuelle d'IronPDF permet d'accéder facilement à ces fonctionnalités :

Etapes pour convertir un document PDF en fichier texte

La première étape consiste à créer un projet C# dans Visual Studio. Vous pouvez choisir n'importe quel modèle d'application C# en fonction de vos besoins. Pour des raisons de simplicité, ce tutoriel utilisera le modèle d'application console. Vous pouvez utiliser un projet C# déjà existant pour convertir des fichiers PDF en fichiers TXT.

Étape 1 : Créer un projet C

Créez un projet C# dans Visual Studio ou ouvrez un projet existant. Il est recommandé d'utiliser la dernière version de Visual Studio pour travailler sans problème. Suivez les étapes indiquées pour créer un projet C# dans Visual Studio.

  1. Ouvrez Visual Studio.

  2. Sélectionnez le modèle d'application de console C# ou ouvrez un projet existant.

  3. Donner un nom propre au projet.

  4. Sélectionnez la version 6.0 du Framework .NET. Il s'agit du Framework .NET le plus récent et le plus stable, mais vous pouvez choisir n'importe quel autre Framework .NET en fonction de vos besoins.

Étape 2 : Installer la bibliothèque IronPDF

IronPDF se caractérise également par un processus d'installation facile qui accélère le temps de développement et réduit la confusion. La bibliothèque IronPDF propose plusieurs modes d'installation :

  • Utilisation du gestionnaire de paquets NuGet
  • Utilisation de la console NuGet Package Manager
  • Par DLL File

Méthode 1 : NuGet Package Manager

Pour utiliser le gestionnaire de paquets NuGet, suivez les étapes indiquées pour ouvrir l'onglet Gestionnaire de paquets.

Ouvrez le projet C# et cliquez sur Outils > NuGet Package Manager > Gestion de NuGet Packaged pour la solution.

C# Convertir un PDF en texte(Exemple de code), Figure 0 : Naviguer vers le gestionnaire de paquets NuGet

Naviguer vers le gestionnaire de paquets NuGet

  • Allez maintenant dans l'onglet Parcourir et recherchez IronPDF.
  • Sélectionnez IronPDF dans les résultats de la recherche et cliquez sur Installer. Cette opération installe la bibliothèque IronPDF, ce qui permet d'utiliser le projet avec la bibliothèque IronPDF.

    C# Convertir un PDF en texte(Exemple de code), Figure 1 : Paquet IronPDF à partir du résultat de recherche du NuGet Package Manager

    Paquet IronPDF à partir du résultat de la recherche du gestionnaire de paquets NuGet

Méthode 2 : Console du gestionnaire de paquets NuGet

L'installation de la bibliothèque IronPDF à l'aide de la console du gestionnaire de paquets est la méthode la plus simple. Suivez ces étapes simples :

  • Ouvrez la console du gestionnaire de paquets.
  • Écrivez la ligne suivante dans la console et appuyez sur Entrée. Cela installera immédiatement la bibliothèque IronPDF.
Install-Package IronPdf

C# Convertir un PDF en texte(Exemple de code), Figure 2 : La progression de l'installation affichée dans l'interface utilisateur de la console NuGet Package Manager

La progression de l'installation est affichée dans l'interface utilisateur de la console NuGet Package Manager

Méthode 3 : Utilisation d'un fichier DLL

Vous pouvez télécharger leFichier DLL IronPDF sur le site web d'Iron Software. Une fois le téléchargement terminé, utilisez-le dans votre projet comme référence.

Visitez le siteGuide d'installation d'IronPDF pour un guide d'installation plus détaillé.

L'installation de la bibliothèque IronPDF est maintenant terminée. Les étapes suivantes vous guideront pour convertir un fichier PDF en fichier texte.

Étape 3 : Ajouter l'espace de noms IronPDF

Pour utiliser IronPDF, il est nécessaire d'ajouter l'espace de noms IronPDF à chaque fichier de code. Ecrivez la ligne de code suivante au début de chaque fichier de code correspondant. Elle vous permettra d'utiliser les fonctionnalités d'IronPDF dans votre programme.

using IronPdf;
using IronPdf;
Imports IronPdf
VB   C#

Étape 4 : Convertir le document PDF en fichier texte

Nous devons maintenant convertir le fichier PDF en fichier TXT ou extraire uniquement le texte. Inscrivez donc l'exemple de code suivant dans votre fichier de code :

using IronPdf;
using System.Drawing;

// Extracting image and text content from PDF Document

// Open a 128-bit encrypted PDF
using PdfDocument pdf = PdfDocument.FromFile("encrypted.pdf", "password");
// Get all text to put in a search index
string allText = pdf.ExtractAllText();
Console.WriteLine(allText);
using IronPdf;
using System.Drawing;

// Extracting image and text content from PDF Document

// Open a 128-bit encrypted PDF
using PdfDocument pdf = PdfDocument.FromFile("encrypted.pdf", "password");
// Get all text to put in a search index
string allText = pdf.ExtractAllText();
Console.WriteLine(allText);
Imports IronPdf
Imports System.Drawing

' Extracting image and text content from PDF Document

' Open a 128-bit encrypted PDF
Private PdfDocument As using
' Get all text to put in a search index
Private allText As String = pdf.ExtractAllText()
Console.WriteLine(allText)
VB   C#

Tout d'abord, ouvrez le document PDF à l'aide de la fonctionfonction FromFile de laclasse PDFDocument. Dans les paramètres, indiquez le nom du fichier et le mot de passe(le cas échéant). Ensuite, utilisez la fonctionfonction ExtractAllText (Extraire tout le texte) pour extraire tout le texte du fichier PDF et le stocker dans une variable nommée allText. Ensuite, affichez le texte de sortie dans la console

Sortie

C# Convertir un PDF en texte(Exemple de code), Figure 3 : Le texte extrait du document PDF

Le texte extrait du document PDF

Il s'agit du texte de sortie extrait par IronPDF. Il s'agit du même texte que celui figurant sur le fichier PDF, ce qui montre que la précision d'IronPDF est très élevée.

Conclusion

Cet article montre comment extraire facilement du texte de fichiers PDF à l'aide de la bibliothèque PDF IronPDF for .NET. Ce résultat a été obtenu en n'écrivant que quelques lignes de code et avec un pourcentage élevé de précision. En outre, IronPDF dispose de nombreuses fonctionnalités utiles telles que la conversion de HTML en PDF, des outils de formatage de PDF et de nombreuses autres fonctionnalités PDF essentielles à l'édition de PDF. IronPDF élimine également la dépendance à l'égard d'Adobe Acrobat.

IronPDF est gratuit à des fins de développement et offre également un service d'assistance techniqueessai gratuit pour les tests de production. IronPDF propose une variété de plans tarifaires que vous pouvez obtenir en fonction de vos besoins. Le prix d'IronPDF est relativement inférieur à celui de ses concurrents. Les prix variant d'une entreprise à l'autre, il s'agit d'un achat convaincant, avec des performances impressionnantes.

C# Convertir un PDF en texte(Exemple de code), Figure 4 : Les plans de tarification pour la Suite d'Iron Software

Les plans tarifaires de la Suite d'Iron Software

En outre, Iron Software propose une suite de cinq logiciels Iron Software pour le prix de deux seulement. Veuillez consulter le siteDétails de la licence d'Iron Software pour plus d'informations.

< PRÉCÉDENT
Enregistrer un tableau d'octets au format PDF C# (exemple de code)
SUIVANT >
Comment numériser plusieurs pages dans un fichier PDF