Test dans un environnement réel
Test en production sans filigrane.
Fonctionne partout où vous en avez besoin.
Cet article décrit le processus permettant aux développeurs .NET de convertir des fichiers PDF au format TXT pour un accès plus efficace.
Étape 2 : Installer la bibliothèque IronPDF
Méthode 1 : NuGet Package Manager
IronPDF est une bibliothèque .NET pour la génération de PDF. Il s'agit d'une bibliothèque .NET native qui ne dépend pas de DLL externes ou d'autres outils. IronPDF est une bibliothèque multiplateforme écrite en C# et .NET qui offre toutes les fonctionnalités nécessaires pour travailler avec des documents PDF. Il contient des fonctions de rendu de documents, d'édition de formulaires, d'extraction de texte, de cryptage de fichiers ainsi que d'autres fonctions. Toutes ces opérations peuvent être effectuées par le biais d'une API intuitive qui a été largement testée sur diverses plateformes telles que Windows Forms, WPF, ASP.NET MVC, etc.
La version actuelle d'IronPDF permet d'accéder facilement à ces fonctionnalités :
Formulaires à remplir
Accès en lecture seule à l'intérieur du document(vue, navigation, annotations):
L'accès à lamétadonnées et propriétés des documents (titre, mots-clés, auteur, sujet):
IronPDF contient également des classes d'aide supplémentaires qui facilitent les opérations suivantesconvertir des documents HTML en fichiers PDF entièrement formatés avec l'extraction de texte. IronPDF fournit des API très simples pour convertir un fichier PDF en fichier texte.
Commençons par l'utilisation de la bibliothèque IronPDF pour convertir un document PDF en fichier texte.
La première étape consiste à créer un projet C# dans Visual Studio. Vous pouvez choisir n'importe quel modèle d'application C# en fonction de vos besoins. Pour des raisons de simplicité, ce tutoriel utilisera le modèle d'application console. Vous pouvez utiliser un projet C# déjà existant pour convertir des fichiers PDF en fichiers TXT.
Créez un projet C# dans Visual Studio ou ouvrez un projet existant. Il est recommandé d'utiliser la dernière version de Visual Studio pour travailler sans problème. Suivez les étapes indiquées pour créer un projet C# dans Visual Studio.
Ouvrez Visual Studio.
Sélectionnez le modèle d'application de console C# ou ouvrez un projet existant.
Donner un nom propre au projet.
IronPDF se caractérise également par un processus d'installation facile qui accélère le temps de développement et réduit la confusion. La bibliothèque IronPDF propose plusieurs modes d'installation :
Pour utiliser le gestionnaire de paquets NuGet, suivez les étapes indiquées pour ouvrir l'onglet Gestionnaire de paquets.
Ouvrez le projet C# et cliquez sur Outils > NuGet Package Manager > Gestion de NuGet Packaged pour la solution.
Naviguer vers le gestionnaire de paquets NuGet
Sélectionnez IronPDF dans les résultats de la recherche et cliquez sur Installer. Cette opération installe la bibliothèque IronPDF, ce qui permet d'utiliser le projet avec la bibliothèque IronPDF.
Paquet IronPDF à partir du résultat de la recherche du gestionnaire de paquets NuGet
L'installation de la bibliothèque IronPDF à l'aide de la console du gestionnaire de paquets est la méthode la plus simple. Suivez ces étapes simples :
Install-Package IronPdf
La progression de l'installation est affichée dans l'interface utilisateur de la console NuGet Package Manager
Vous pouvez télécharger leFichier DLL IronPDF sur le site web d'Iron Software. Une fois le téléchargement terminé, utilisez-le dans votre projet comme référence.
Visitez le siteGuide d'installation d'IronPDF pour un guide d'installation plus détaillé.
L'installation de la bibliothèque IronPDF est maintenant terminée. Les étapes suivantes vous guideront pour convertir un fichier PDF en fichier texte.
Pour utiliser IronPDF, il est nécessaire d'ajouter l'espace de noms IronPDF à chaque fichier de code. Ecrivez la ligne de code suivante au début de chaque fichier de code correspondant. Elle vous permettra d'utiliser les fonctionnalités d'IronPDF dans votre programme.
using IronPdf;
using IronPdf;
Imports IronPdf
Étape 4 : Convertir le document PDF en fichier texte
Nous devons maintenant convertir le fichier PDF en fichier TXT ou extraire uniquement le texte. Inscrivez donc l'exemple de code suivant dans votre fichier de code :
using IronPdf;
using System.Drawing;
// Extracting image and text content from PDF Document
// Open a 128-bit encrypted PDF
using PdfDocument pdf = PdfDocument.FromFile("encrypted.pdf", "password");
// Get all text to put in a search index
string allText = pdf.ExtractAllText();
Console.WriteLine(allText);
using IronPdf;
using System.Drawing;
// Extracting image and text content from PDF Document
// Open a 128-bit encrypted PDF
using PdfDocument pdf = PdfDocument.FromFile("encrypted.pdf", "password");
// Get all text to put in a search index
string allText = pdf.ExtractAllText();
Console.WriteLine(allText);
Imports IronPdf
Imports System.Drawing
' Extracting image and text content from PDF Document
' Open a 128-bit encrypted PDF
Private PdfDocument As using
' Get all text to put in a search index
Private allText As String = pdf.ExtractAllText()
Console.WriteLine(allText)
Tout d'abord, ouvrez le document PDF à l'aide de la fonctionfonction FromFile
de laclasse PDFDocument. Dans les paramètres, indiquez le nom du fichier et le mot de passe(le cas échéant). Ensuite, utilisez la fonctionfonction ExtractAllText
(Extraire tout le texte) pour extraire tout le texte du fichier PDF et le stocker dans une variable nommée allText
. Ensuite, affichez le texte de sortie dans la console
Le texte extrait du document PDF
Il s'agit du texte de sortie extrait par IronPDF. Il s'agit du même texte que celui figurant sur le fichier PDF, ce qui montre que la précision d'IronPDF est très élevée.
Cet article montre comment extraire facilement du texte de fichiers PDF à l'aide de la bibliothèque PDF IronPDF for .NET. Ce résultat a été obtenu en n'écrivant que quelques lignes de code et avec un pourcentage élevé de précision. En outre, IronPDF dispose de nombreuses fonctionnalités utiles telles que la conversion de HTML en PDF, des outils de formatage de PDF et de nombreuses autres fonctionnalités PDF essentielles à l'édition de PDF. IronPDF élimine également la dépendance à l'égard d'Adobe Acrobat.
IronPDF est gratuit à des fins de développement et offre également un service d'assistance techniqueessai gratuit pour les tests de production. IronPDF propose une variété de plans tarifaires que vous pouvez obtenir en fonction de vos besoins. Le prix d'IronPDF est relativement inférieur à celui de ses concurrents. Les prix variant d'une entreprise à l'autre, il s'agit d'un achat convaincant, avec des performances impressionnantes.
Les plans tarifaires de la Suite d'Iron Software
En outre, Iron Software propose une suite de cinq logiciels Iron Software pour le prix de deux seulement. Veuillez consulter le siteDétails de la licence d'Iron Software pour plus d'informations.
9 produits de l'API .NET pour vos documents de bureau