using IronPdf; // Disable local disk access or cross-origin requests Installation.EnableWebSecurity = true; // Instantiate Renderer var renderer = new ChromePdfRenderer(); // Create a PDF from a HTML string using C# var pdf = renderer.RenderHtmlAsPdf("<h1>Hello World</h1>"); // Export to a file or Stream pdf.SaveAs("output.pdf"); // Advanced Example with HTML Assets // Load external html assets: Images, CSS and JavaScript. // An optional BasePath 'C:\site\assets\' is set as the file location to load assets from var myAdvancedPdf = renderer.RenderHtmlAsPdf("<img src='icons/iron.png'>", @"C:\site\assets\"); myAdvancedPdf.SaveAs("html-with-assets.pdf");

UTILISATION DE IRONPDF

Comment extraire des données d'un PDF en C#

Q: Comment puis-je extraire du texte d'un PDF en C# ?

Vous pouvez utiliser la méthode ExtractAllText d'IronPDF pour extraire tout le texte d'un document PDF. Cette méthode simplifie le processus en permettant un accès facile au contenu textuel du PDF.

Q: Comment puis-je convertir HTML en PDF en C# ?

Vous pouvez utiliser la méthode RenderHtmlAsPdf d'IronPDF pour convertir des chaînes HTML en PDF, ce qui est particulièrement utile pour créer des documents PDF à partir de contenu web.

Curtis Chau

Mis à jour:20 août 2025

Votre entreprise dépense trop en abonnements annuels pour la sécurité et la conformité des PDF. Pensez à IronSecureDoc, qui propose des solutions de gestion de services SaaS tels que la signature numérique, la rédaction, le cryptage et la protection, le tout pour un paiement unique. En savoir plus sur IronSecureDoc

Extraire des données des PDF est crucial pour gagner du temps sur la saisie manuelle. Cet article explique comment les développeurs peuvent utiliser la bibliothèque IronPDF pour extraire du texte et des images des documents PDF.

Comment extraire des données d'un PDF en C#

Téléchargement de la bibliothèque Extract Data from PDF C#
Créer un Nouveau Projet dans Visual Studio
Installer la Bibliothèque dans votre Projet
Extraire les données de pages spécifiques et extraire des données spécifiques d'un PDF
Voir la sortie des données du document PDF

IronPDF : Bibliothèque PDF C

IronPDF est une bibliothèque .NET qui peut être utilisée pour créer, éditer et convertir des fichiers PDF. Elle offre une API facile à utiliser pour les développeurs à utiliser dans leurs applications. C'est l'une des bibliothèques les plus populaires pour créer, éditer et convertir des fichiers PDF à l'échelle mondiale. Avec IronPDF, vous pouvez créer une solution simple et rapide pour les PDF. Votre texte sera personnalisé pour chaque document, votre mise en page sera configurée pour une lecture facile, et vos graphiques seront conçus avec l'aide du programme .NET accompagnant.

La bibliothèque IronPDF a une fonctionnalité fantastique pour extraire des données des fichiers PDF. Cet article examinera comment extraire des données à l'aide de IronPDF. Tout d'abord, un Projet C# doit être créé ou ouvert. Passons à la section suivante.

Créer ou Ouvrir un Projet C# dans Visual Studio

Ce tutoriel recommande d'utiliser la dernière version de Visual Studio.

Une fois Visual Studio ouvert, suivez les étapes ci-dessous pour créer un nouveau Projet C#. Si vous avez un projet existant que vous souhaitez utiliser, alors passez ces prochaines étapes et passez directement à la section suivante.

Ouvrir Visual Studio
Cliquez sur le bouton "Créer un nouveau projet".

Comment extraire des données de fichiers PDF en C#, Figure 1 : Interface utilisateur d'ouverture de Visual Studio Interface d'ouverture de Visual Studio

Sélectionnez l'"Application Console C#" parmi les modèles.

Comment extraire des données de fichiers PDF en C#, Figure 2 : Créer un nouveau projet Créer un nouveau projet

Donnez un nom au Projet et cliquez sur le bouton Suivant.
Sélectionnez un Framework .NET selon les besoins de votre projet et cliquez sur le bouton Créer.

Comment extraire des données de fichiers PDF en C#, Figure 3 : Sélection du .NET Framework Sélection du framework .NET

Visual Studio va maintenant générer un nouveau projet C# .NET.

Installer la Bibliothèque IronPDF

La bibliothèque IronPDF peut être installée de plusieurs manières.

Utilisation de la console du gestionnaire de packages

Ouvrez la Console du Package Manager en allant dans Outils > Package Manager NuGet > Console du Package Manager.
Exécutez la commande suivante pour installer la bibliothèque IronPDF :

Install-Package IronPdf

Comment extraire des données de fichiers PDF en C#, Figure 4 : Progression de l'installation dans l'onglet Console du gestionnaire de packages Progression de l'installation dans l'onglet Console du Package Manager

Après l'installation, vous verrez la dépendance IronPDF dans la section dependencies de l'explorateur de solutions, comme indiqué ci-dessous.

Comment extraire des données de fichiers PDF en C#, Figure 5 : Référence au package IronPDF dans l'Explorateur de solutions Référence du package IronPDF dans l'Explorateur de Solution

Utilisation du Package Manager NuGet

Une autre manière d'installer la bibliothèque IronPDF est d'utiliser l'interface utilisateur intégrée du Package Manager NuGet dans Visual Studio.

Allez dans les Outils du menu principal. Passez la souris sur "Package Manager NuGet" dans le menu déroulant et sélectionnez "Gérer les Packages NuGet pour la Solution...".

Comment extraire des données de fichiers PDF en C#, Figure 6 : Accéder au gestionnaire de packages NuGet Accéder au gestionnaire de package NuGet

Cela ouvrira la fenêtre du gestionnaire de packages NuGet. Allez dans l'onglet Parcourir, saisissez IronPdf dans la barre de recherche et appuyez sur Entrée.
Sélectionnez IronPDF parmi les résultats de recherche et cliquez sur le bouton "Installer" pour commencer l'installation.

Comment extraire des données de fichiers PDF en C#, Figure 7 : Installez le package IronPDF depuis le gestionnaire de packages NuGet Installer le package IronPDF depuis le gestionnaire de packages NuGet

Extraire les Données des Fichiers PDF

Voyons le code suivant pour extraire des données à l'aide d'IronPDF :

// Import necessary namespaces
using IronPdf;
using System.Collections.Generic;
using System.Drawing;

public class PDFExtractor
{
    public void ExtractDataFromPDF()
    {
        // Open a 128-bit encrypted PDF file by providing the filename and password
        using PdfDocument pdf = PdfDocument.FromFile("encrypted.pdf", "password");

        // Extract all text from the PDF document
        string allText = pdf.ExtractAllText();

        // Extract all images from the PDF document
        IEnumerable<Image> allImages = pdf.ExtractAllImages();

        // Iterate over each page in the PDF document
        for (var index = 0; index < pdf.PageCount; index++)
        {
            int pageNumber = index + 1;

            // Extract text from the specific page
            string text = pdf.ExtractTextFromPage(index);

            // Extract images from the specific page
            IEnumerable<Image> images = pdf.ExtractImagesFromPage(index);

            // Code to process the extracted text and images
            //...
        }
    }
}

// Import necessary namespaces
using IronPdf;
using System.Collections.Generic;
using System.Drawing;

public class PDFExtractor
{
    public void ExtractDataFromPDF()
    {
        // Open a 128-bit encrypted PDF file by providing the filename and password
        using PdfDocument pdf = PdfDocument.FromFile("encrypted.pdf", "password");

        // Extract all text from the PDF document
        string allText = pdf.ExtractAllText();

        // Extract all images from the PDF document
        IEnumerable<Image> allImages = pdf.ExtractAllImages();

        // Iterate over each page in the PDF document
        for (var index = 0; index < pdf.PageCount; index++)
        {
            int pageNumber = index + 1;

            // Extract text from the specific page
            string text = pdf.ExtractTextFromPage(index);

            // Extract images from the specific page
            IEnumerable<Image> images = pdf.ExtractImagesFromPage(index);

            // Code to process the extracted text and images
            //...
        }
    }
}

' Import necessary namespaces
Imports IronPdf
Imports System.Collections.Generic
Imports System.Drawing

Public Class PDFExtractor
	Public Sub ExtractDataFromPDF()
		' Open a 128-bit encrypted PDF file by providing the filename and password
		Using pdf As PdfDocument = PdfDocument.FromFile("encrypted.pdf", "password")
	
			' Extract all text from the PDF document
			Dim allText As String = pdf.ExtractAllText()
	
			' Extract all images from the PDF document
			Dim allImages As IEnumerable(Of Image) = pdf.ExtractAllImages()
	
			' Iterate over each page in the PDF document
			For index = 0 To pdf.PageCount - 1
				Dim pageNumber As Integer = index + 1
	
				' Extract text from the specific page
				Dim text As String = pdf.ExtractTextFromPage(index)
	
				' Extract images from the specific page
				Dim images As IEnumerable(Of Image) = pdf.ExtractImagesFromPage(index)
	
				' Code to process the extracted text and images
				'...
			Next index
		End Using
	End Sub
End Class

$vbLabelText $csharpLabel

Dans cet exemple de code :

La méthode FromFile est utilisée pour charger le document PDF d'entrée, qui est chiffré et nécessite un mot de passe.
La méthode ExtractAllText extrait tout le contenu textuel du PDF.
La méthode ExtractAllImages récupère toutes les images intégrées.
Une boucle parcourt chaque page du document pour extraire le texte et les images de cette page spécifique en utilisant ExtractTextFromPage et ExtractImagesFromPage.

Conclusion

IronPDF permet aux développeurs d'extraire facilement du texte et des images des fichiers PDF. En utilisant ExtractAllText et ExtractAllImages, le contenu entier d'un fichier PDF peut être extrait instantanément. Alternativement, ces méthodes peuvent être utilisées pour extraire le contenu d'une page spécifique. Le code précédent a démontré comment utiliser les deux méthodes pour lire texte et images sur un ensemble de pages.

De plus, IronPDF offre des fonctionnalités comme rendre des graphiques, ajouter des codes-barres, améliorer la sécurité avec des mots de passe, ajouter des filigranes, et gérer des formulaires PDF de manière programmée.

IronPDF est disponible gratuitement pendant le développement, avec paiement requis pour un usage commercial. Une version d'essai gratuite de IronPDF est disponible pour une utilisation en production sans paiement.

Achetez la suite complète des bibliothèques de documents de Iron Software pour le coût de deux Licences IronPDF Lite.

Téléchargez IronPDF maintenant pour commencer à extraire des données des PDF aujourd'hui !

Questions Fréquemment Posées

Comment puis-je extraire du texte d'un PDF en C# ?

Vous pouvez utiliser la méthode ExtractAllText d'IronPDF pour extraire tout le texte d'un document PDF. Cette méthode simplifie le processus en permettant un accès facile au contenu textuel du PDF.

Quel est le processus pour extraire des images d'un PDF utilisant C# ?

Avec IronPDF, vous pouvez extraire des images d'un PDF en utilisant la méthode ExtractAllImages. Cette méthode récupère efficacement toutes les images intégrées dans le fichier PDF.

Comment installer une bibliothèque de manipulation de PDF dans un projet C# ?

Pour installer IronPDF dans un projet C#, vous pouvez utiliser la Console du Package Manager avec la commande Install-Package IronPDF ou naviguer à travers l'interface utilisateur du Package Manager NuGet dans Visual Studio pour installer le package.

Est-il possible de gérer des fichiers PDF chiffrés en C# ?

Oui, IronPDF vous permet d'ouvrir et de manipuler des fichiers PDF chiffrés en utilisant la méthode FromFile, où vous pouvez fournir le nom de fichier et le mot de passe pour accéder au contenu.

Puis-je extraire des données à partir de pages spécifiques d'un PDF en C# ?

IronPDF vous permet de parcourir les pages d'un PDF et d'utiliser ExtractTextFromPage et ExtractImagesFromPage.

Quelles fonctionnalités supplémentaires pour la bibliothèque PDF C# ?

En plus de l'extraction de données, IronPDF offre des fonctionnalités telles que le rendu de graphiques, l'ajout de codes-barres, l'amélioration de la sécurité des documents avec des mots de passe, le filigrane et la gestion des formulaires PDF par programmation.

Comment puis-je convertir HTML en PDF en C# ?

Vous pouvez utiliser la méthode RenderHtmlAsPdf d'IronPDF pour convertir des chaînes HTML en PDF, ce qui est particulièrement utile pour créer des documents PDF à partir de contenu web.

Existe-t-il une version d'essai disponible pour la bibliothèque PDF pour C# ?

IronPDF est gratuit à utiliser pendant le développement, vous permettant de tester ses capacités. Pour l'utilisation en production, une licence commerciale est requise, mais une version d'essai gratuite est également disponible.

Comment puis-je commencer à utiliser la bibliothèque C# pour l'extraction de données de PDF ?

Pour commencer à utiliser IronPDF pour l'extraction de données, téléchargez la bibliothèque, créez ou ouvrez un projet C# dans Visual Studio, installez IronPDF, et suivez les exemples de code pour extraire efficacement du texte et des images de PDFs.

Compatibilité .NET 10 : Puis-je utiliser les fonctionnalités d’extraction de données d’IronPDF avec .NET 10 ?

Oui, IronPDF est entièrement compatible avec .NET 10, y compris ses fonctionnalités d'extraction de données telles que l'extraction de texte et d'images. Vous pouvez utiliser IronPDF dans vos projets .NET 10 sans configuration particulière. Il prend en charge .NET 10, .NET 9, .NET 8 et les versions antérieures, ainsi que .NET Standard et .NET Framework. (ironpdf.com)

Curtis Chau

Discutez maintenant avec l'équipe d'ingénierie

Rédacteur technique

Curtis Chau détient un baccalauréat en informatique (Université de Carleton) et se spécialise dans le développement front-end avec expertise en Node.js, TypeScript, JavaScript et React. Passionné par la création d'interfaces utilisateur intuitives et esthétiquement plaisantes, Curtis aime travailler avec des frameworks modernes ...

Mise en avant du client :

Projecteur sur les Développeurs:

Webinaires:

Essai gratuit de 30 jours

Comment extraire des données d'un PDF en C#

Comment extraire des données d'un PDF en C#

IronPDF : Bibliothèque PDF C

Créer ou Ouvrir un Projet C# dans Visual Studio

Installer la Bibliothèque IronPDF

Utilisation de la console du gestionnaire de packages

Utilisation du Package Manager NuGet

Extraire les Données des Fichiers PDF

Conclusion

Questions Fréquemment Posées

Comment puis-je extraire du texte d'un PDF en C# ?

Quel est le processus pour extraire des images d'un PDF utilisant C# ?

Comment installer une bibliothèque de manipulation de PDF dans un projet C# ?

Est-il possible de gérer des fichiers PDF chiffrés en C# ?

Puis-je extraire des données à partir de pages spécifiques d'un PDF en C# ?

Quelles fonctionnalités supplémentaires pour la bibliothèque PDF C# ?

Comment puis-je convertir HTML en PDF en C# ?

Existe-t-il une version d'essai disponible pour la bibliothèque PDF pour C# ?

Comment puis-je commencer à utiliser la bibliothèque C# pour l'extraction de données de PDF ?

Compatibilité .NET 10 : Puis-je utiliser les fonctionnalités d’extraction de données d’IronPDF avec .NET 10 ?

Équipe de soutien Iron

Essai gratuit de 30 jours

Comment extraire des données d'un PDF en C#

Comment extraire des données d'un PDF en C#

IronPDF : Bibliothèque PDF C

Créer ou Ouvrir un Projet C# dans Visual Studio

Installer la Bibliothèque IronPDF

Utilisation de la console du gestionnaire de packages

Utilisation du Package Manager NuGet

Extraire les Données des Fichiers PDF

Conclusion

Questions Fréquemment Posées

Comment puis-je extraire du texte d'un PDF en C# ?

Quel est le processus pour extraire des images d'un PDF utilisant C# ?

Comment installer une bibliothèque de manipulation de PDF dans un projet C# ?

Est-il possible de gérer des fichiers PDF chiffrés en C# ?

Puis-je extraire des données à partir de pages spécifiques d'un PDF en C# ?

Quelles fonctionnalités supplémentaires pour la bibliothèque PDF C# ?

Comment puis-je convertir HTML en PDF en C# ?

Existe-t-il une version d'essai disponible pour la bibliothèque PDF pour C# ?

Comment puis-je commencer à utiliser la bibliothèque C# pour l'extraction de données de PDF ?

Compatibilité .NET 10 : Puis-je utiliser les fonctionnalités d’extraction de données d’IronPDF avec .NET 10 ?

Articles connexes

Générer des relevés de compte mensuels au format PDF

Transformer des formulaires de demande en ligne en résumés PDF à l'aide d'IronPDF

Reçus et relevés de transactions au format PDF en C# pour les applications FinTech

Obtenez votre GRATUIT

Étape suivante : Commencer l'essai gratuit de 30 jours

Thank You

Étape suivante : Commencer l'essai gratuit de 30 jours

Want to deploy IronSuite to a live project for FREE?

What’s included?

De confiance par des millions d'ingénieurs dans le monde entier

Équipe de soutien Iron