using IronPdf;
// Disable local disk access or cross-origin requests
Installation.EnableWebSecurity = true;
// Instantiate Renderer
var renderer = new ChromePdfRenderer();
// Create a PDF from a HTML string using C#
var pdf = renderer.RenderHtmlAsPdf("<h1>Hello World</h1>");
// Export to a file or Stream
pdf.SaveAs("output.pdf");
// Advanced Example with HTML Assets
// Load external html assets: Images, CSS and JavaScript.
// An optional BasePath 'C:\site\assets\' is set as the file location to load assets from
var myAdvancedPdf = renderer.RenderHtmlAsPdf("<img src='icons/iron.png'>", @"C:\site\assets\");
myAdvancedPdf.SaveAs("html-with-assets.pdf");
Ouvrir le document PDF à l'aide de la fonction PdfDocument.FromFile
Voir le texte de sortie extrait
Thèmes abordés dans le didacticiel
IronPDF
Étapes à suivre pour créer des fichiers PDF de manière programmatique
Étape 1 : Créer un projet C#
Étape 2 : Installer la bibliothèque IronPDF
Méthode 1 : NuGet Package Manager
Méthode 2 : Console du gestionnaire de paquets NuGet
Méthode 3 : Utilisation du fichier DLL
Étape 3 : Ajouter l'espace de noms IronPDF
Étape 4 : Convertir le PDF en texte
Sortie
Conclusion
IronPDF
IronPDF est une bibliothèque .NET pour la génération de PDF. Il s'agit d'une bibliothèque .NET native qui ne dépend pas de DLL externes ou d'autres outils. IronPDF est une bibliothèque multiplateforme écrite en C# et .NET qui offre toutes les fonctionnalités nécessaires pour travailler avec des documents PDF. Il contient des fonctions de rendu de documents, d'édition de formulaires, d'extraction de texte, de cryptage de fichiers ainsi que d'autres fonctions. Toutes ces opérations peuvent être effectuées par le biais d'une API intuitive qui a été largement testée sur diverses plateformes telles que Windows Forms, WPF, ASP.NET MVC, etc.
La version actuelle d'IronPDF permet d'accéder facilement à ces fonctionnalités :
IronPDF contient également des classes d'aide supplémentaires qui facilitent les opérations suivantesconvertir des documents HTML en fichiers PDF entièrement formatés avec l'extraction de texte. IronPDF fournit des API très simples pour convertir un fichier PDF en fichier texte.
Commençons par l'utilisation de la bibliothèque IronPDF pour convertir un document PDF en fichier texte.
Etapes pour convertir un document PDF en fichier texte
La première étape consiste à créer un projet C# dans Visual Studio. Vous pouvez choisir n'importe quel modèle d'application C# en fonction de vos besoins. Pour des raisons de simplicité, ce tutoriel utilisera le modèle d'application console. Vous pouvez utiliser un projet C# déjà existant pour convertir des fichiers PDF en fichiers TXT.
Étape 1 : Créer un projet C
Créez un projet C# dans Visual Studio ou ouvrez un projet existant. Il est recommandé d'utiliser la dernière version de Visual Studio pour travailler sans problème. Suivez les étapes indiquées pour créer un projet C# dans Visual Studio.
Ouvrez Visual Studio.
Sélectionnez le modèle d'application de console C# ou ouvrez un projet existant.
Donner un nom propre au projet.
Sélectionnez la version 6.0 du Framework .NET. Il s'agit du Framework .NET le plus récent et le plus stable, mais vous pouvez choisir n'importe quel autre Framework .NET en fonction de vos besoins.
Étape 2 : Installer la bibliothèque IronPDF
IronPDF se caractérise également par un processus d'installation facile qui accélère le temps de développement et réduit la confusion. La bibliothèque IronPDF propose plusieurs modes d'installation :
Utilisation du gestionnaire de paquets NuGet
Utilisation de la console NuGet Package Manager
Par DLL File
Méthode 1 : NuGet Package Manager
Pour utiliser le gestionnaire de paquets NuGet, suivez les étapes indiquées pour ouvrir l'onglet Gestionnaire de paquets.
Ouvrez le projet C# et cliquez sur Outils > NuGet Package Manager > Gestion de NuGet Packaged pour la solution.
Naviguer vers le gestionnaire de paquets NuGet
Allez maintenant dans l'onglet Parcourir et recherchez IronPDF.
Sélectionnez IronPDF dans les résultats de la recherche et cliquez sur Installer. Cette opération installe la bibliothèque IronPDF, ce qui permet d'utiliser le projet avec la bibliothèque IronPDF.
Paquet IronPDF à partir du résultat de la recherche du gestionnaire de paquets NuGet
Méthode 2 : Console du gestionnaire de paquets NuGet
L'installation de la bibliothèque IronPDF à l'aide de la console du gestionnaire de paquets est la méthode la plus simple. Suivez ces étapes simples :
Ouvrez la console du gestionnaire de paquets.
Écrivez la ligne suivante dans la console et appuyez sur Entrée. Cela installera immédiatement la bibliothèque IronPDF.
Install-Package IronPdf
La progression de l'installation est affichée dans l'interface utilisateur de la console NuGet Package Manager
Méthode 3 : Utilisation d'un fichier DLL
Vous pouvez télécharger leFichier DLL IronPDF sur le site web d'Iron Software. Une fois le téléchargement terminé, utilisez-le dans votre projet comme référence.
L'installation de la bibliothèque IronPDF est maintenant terminée. Les étapes suivantes vous guideront pour convertir un fichier PDF en fichier texte.
Étape 3 : Ajouter l'espace de noms IronPDF
Pour utiliser IronPDF, il est nécessaire d'ajouter l'espace de noms IronPDF à chaque fichier de code. Ecrivez la ligne de code suivante au début de chaque fichier de code correspondant. Elle vous permettra d'utiliser les fonctionnalités d'IronPDF dans votre programme.
using IronPdf;
using IronPdf;
Imports IronPdf
Étape 4 : Convertir le document PDF en fichier texte
Nous devons maintenant convertir le fichier PDF en fichier TXT ou extraire uniquement le texte. Inscrivez donc l'exemple de code suivant dans votre fichier de code :
using IronPdf;
using System.Drawing;
// Extracting image and text content from PDF Document
// Open a 128-bit encrypted PDF
using PdfDocument pdf = PdfDocument.FromFile("encrypted.pdf", "password");
// Get all text to put in a search index
string allText = pdf.ExtractAllText();
Console.WriteLine(allText);
using IronPdf;
using System.Drawing;
// Extracting image and text content from PDF Document
// Open a 128-bit encrypted PDF
using PdfDocument pdf = PdfDocument.FromFile("encrypted.pdf", "password");
// Get all text to put in a search index
string allText = pdf.ExtractAllText();
Console.WriteLine(allText);
Imports IronPdf
Imports System.Drawing
' Extracting image and text content from PDF Document
' Open a 128-bit encrypted PDF
Private PdfDocument As using
' Get all text to put in a search index
Private allText As String = pdf.ExtractAllText()
Console.WriteLine(allText)
Tout d'abord, ouvrez le document PDF à l'aide de la fonctionfonction FromFile de laclasse PDFDocument. Dans les paramètres, indiquez le nom du fichier et le mot de passe(le cas échéant). Ensuite, utilisez la fonctionfonction ExtractAllText (Extraire tout le texte) pour extraire tout le texte du fichier PDF et le stocker dans une variable nommée allText. Ensuite, affichez le texte de sortie dans la console
Sortie
Le texte extrait du document PDF
Il s'agit du texte de sortie extrait par IronPDF. Il s'agit du même texte que celui figurant sur le fichier PDF, ce qui montre que la précision d'IronPDF est très élevée.
Conclusion
Cet article montre comment extraire facilement du texte de fichiers PDF à l'aide de la bibliothèque PDF IronPDF for .NET. Ce résultat a été obtenu en n'écrivant que quelques lignes de code et avec un pourcentage élevé de précision. En outre, IronPDF dispose de nombreuses fonctionnalités utiles telles que la conversion de HTML en PDF, des outils de formatage de PDF et de nombreuses autres fonctionnalités PDF essentielles à l'édition de PDF. IronPDF élimine également la dépendance à l'égard d'Adobe Acrobat.
IronPDF est gratuit à des fins de développement et offre également un service d'assistance techniqueessai gratuit pour les tests de production. IronPDF propose une variété de plans tarifaires que vous pouvez obtenir en fonction de vos besoins. Le prix d'IronPDF est relativement inférieur à celui de ses concurrents. Les prix variant d'une entreprise à l'autre, il s'agit d'un achat convaincant, avec des performances impressionnantes.
Les plans tarifaires de la Suite d'Iron Software
En outre, Iron Software propose une suite de cinq logiciels Iron Software pour le prix de deux seulement. Veuillez consulter le siteDétails de la licence d'Iron Software pour plus d'informations.
Avant de devenir ingénieur logiciel, Kannapat a obtenu un doctorat en ressources environnementales à l'université d'Hokkaido au Japon. Tout en poursuivant ses études, Kannapat est également devenu membre du Vehicle Robotics Laboratory, qui fait partie du Department of Bioproduction Engineering (département d'ingénierie de la bioproduction). En 2022, il a mis à profit ses compétences en C# pour rejoindre l'équipe d'ingénieurs d'Iron Software, où il se concentre sur IronPDF. Kannapat apprécie son travail car il apprend directement auprès du développeur qui écrit la majeure partie du code utilisé dans IronPDF. Outre l'apprentissage par les pairs, Kannapat apprécie l'aspect social du travail chez Iron Software. Lorsqu'il n'écrit pas de code ou de documentation, Kannapat peut généralement être trouvé en train de jouer sur sa PS5 ou de revoir The Last of Us.
< PRÉCÉDENT Enregistrer un tableau d'octets au format PDF C# (exemple de code)
SUIVANT > Comment numériser plusieurs pages dans un fichier PDF
Des millions d'ingénieurs dans le monde entier lui font confiance
Réservez une démo en direct gratuite
Réservez une démonstration personnelle de 30 minutes.
Pas de contrat, pas de détails de carte, pas d'engagements.
Voici ce à quoi vous pouvez vous attendre :
Une démonstration en direct de notre produit et de ses principales fonctionnalités
Obtenez des recommandations de fonctionnalités spécifiques au projet
Toutes vos questions trouvent réponse pour vous assurer de disposer de toutes les informations dont vous avez besoin. (Aucun engagement de votre part.)
CHOISIR L'HEURE
VOS INFORMATIONS
Réservez votre démo en direct gratuite
Fiable par plus de 2 millions d'ingénieurs dans le monde entier