Passer au contenu du pied de page
UTILISATION DE IRONPDF

Comment lire les fichiers PDF en C#

Le traitement PDF programmatique est crucial dans des secteurs comme la finance, la santé, le juridique et l'éducation, où des informations critiques doivent être traitées, analysées et extraites de documents PDF à des fins telles que l'analyse de données, la gestion de documents et l'automatisation. Malgré son importance, cette tâche peut être difficile.

IronPDF : Une Bibliothèque PDF C

IronPDF vous permet de gérer des tâches incroyablement difficiles facilement. Il permet la modification facile de texte dans un document PDF, de manière similaire à la façon dont vous pouvez travailler avec des fichiers texte dans un document texte, tout en vous permettant d'exporter des fichiers dans n'importe quel système d'exploitation. L'application IronPDF couvre le processus complet de visualisation, de modification et d'extraction de contenu d'un PDF.

Faites le bon pas avec IronPDF

Le texte peut être lu et écrit dans le format de fichier PDF rapidement et facilement en utilisant n'importe quel ordinateur avec le logiciel IronPDF. L'installation est une tâche simple. C'est le meilleur moyen d'apprendre à lire des fichiers PDF en C#. Vous pouvez également télécharger IronPDF gratuitement pour le développement. Si vous explorez IronPDF, vous remarquerez que la bibliothèque offre une fonctionnalité étendue qui rend très facile l'utilisation des PDF. Explorez les classes pendant votre temps libre ! Il existe plusieurs exemples C# utilisant HTML pour créer un PDF disponibles pour apprendre à créer une sortie optimale à partir de la lecture de PDF.

Lire des fichiers PDF en utilisant IronPDF

Étape 1 : Installer le package IronPDF

Pour commencer, vous devrez installer le package NuGet IronPDF dans votre projet .NET. Vous pouvez le faire en ouvrant la console du gestionnaire de packages dans Visual Studio et en entrant la commande suivante :

Install-Package IronPdf

Étape 2 : Importer la bibliothèque IronPDF

Ensuite, vous devez importer la bibliothèque IronPDF dans votre code en ajoutant l'instruction suivante en haut de votre fichier :

using IronPdf;
using IronPdf;
Imports IronPdf
$vbLabelText   $csharpLabel

Étape 3 : Charger le document PDF

Une fois que vous avez importé la bibliothèque IronPDF, vous pouvez charger un document PDF dans votre code en utilisant le code suivant :

// Load the PDF document from file path
PdfDocument pdf = PdfDocument.FromFile(@"C:\dotnet.pdf");

// Define the output path for the saved PDF
var outputPath = "Example.pdf";

// Save the PDF document to the specified output path
pdf.SaveAs(outputPath);
// Load the PDF document from file path
PdfDocument pdf = PdfDocument.FromFile(@"C:\dotnet.pdf");

// Define the output path for the saved PDF
var outputPath = "Example.pdf";

// Save the PDF document to the specified output path
pdf.SaveAs(outputPath);
' Load the PDF document from file path
Dim pdf As PdfDocument = PdfDocument.FromFile("C:\dotnet.pdf")

' Define the output path for the saved PDF
Dim outputPath = "Example.pdf"

' Save the PDF document to the specified output path
pdf.SaveAs(outputPath)
$vbLabelText   $csharpLabel

Étape 4 : Extraire le texte du PDF

IronPDF fournit une gamme de méthodes pour extraire du texte d'un fichier PDF existant. Par exemple, vous pouvez commencer à extraire du texte d'un PDF et l'imprimer sur la console en utilisant le code suivant :

// Extract text from the loaded PDF document
string text = pdf.ExtractText();

// Print the extracted text to the console
Console.WriteLine(text);
// Extract text from the loaded PDF document
string text = pdf.ExtractText();

// Print the extracted text to the console
Console.WriteLine(text);
' Extract text from the loaded PDF document
Dim text As String = pdf.ExtractText()

' Print the extracted text to the console
Console.WriteLine(text)
$vbLabelText   $csharpLabel

En utilisant le code ci-dessus, vous pouvez extraire du texte d'un fichier PDF.

Comment lire des fichiers PDF en C#, Figure 1 : Extraction de texte d'un PDF en utilisant IronPDF Extraction de texte d'un PDF en utilisant IronPDF

Étape 5 : Rasteriser un PDF en images

Voyons comment rasteriser le fichier PDF en images avec IronPDF en utilisant IronPDF. Tout d'abord, importez les bibliothèques nécessaires :

using System.Linq;
using IronPdf;
using IronSoftware.Drawing;
using System.Linq;
using IronPdf;
using IronSoftware.Drawing;
Imports System.Linq
Imports IronPdf
Imports IronSoftware.Drawing
$vbLabelText   $csharpLabel

Le code utilise ensuite la méthode RasterizeToImageFiles pour extraire toutes les pages du document PDF vers un dossier sous forme de fichiers image. Les images extraites peuvent être enregistrées sous forme de fichiers PNG ou JPG, et les dimensions et les plages de pages des images peuvent également être spécifiées.

// Extract all pages to a folder as image files with PNG format
pdf.RasterizeToImageFiles(@"C:\image\folder\*.png");

// Extract all pages to JPG images with specified dimensions
pdf.RasterizeToImageFiles(@"C:\image\folder\example_pdf_image_*.jpg", 100, 80);
// Extract all pages to a folder as image files with PNG format
pdf.RasterizeToImageFiles(@"C:\image\folder\*.png");

// Extract all pages to JPG images with specified dimensions
pdf.RasterizeToImageFiles(@"C:\image\folder\example_pdf_image_*.jpg", 100, 80);
' Extract all pages to a folder as image files with PNG format
pdf.RasterizeToImageFiles("C:\image\folder\*.png")

' Extract all pages to JPG images with specified dimensions
pdf.RasterizeToImageFiles("C:\image\folder\example_pdf_image_*.jpg", 100, 80)
$vbLabelText   $csharpLabel

Enfin, le code utilise la méthode ToBitmap pour extraire toutes les pages du document PDF sous forme d'objets AnyBitmap, qui peuvent être traités et manipulés ultérieurement dans le code.

// Extract all pages as AnyBitmap objects for further processing
AnyBitmap[] pdfBitmaps = pdf.ToBitmap();
// Extract all pages as AnyBitmap objects for further processing
AnyBitmap[] pdfBitmaps = pdf.ToBitmap();
' Extract all pages as AnyBitmap objects for further processing
Dim pdfBitmaps() As AnyBitmap = pdf.ToBitmap()
$vbLabelText   $csharpLabel

Le code ci-dessus démontre comment extraire le contenu d'un fichier PDF en utilisant IronPDF et enregistrer les données extraites sous forme de fichiers image ou d'objets AnyBitmap pour un traitement ultérieur.

Étape 7 : Manipuler les pages PDF

Apprenons à manipuler les pages d'un document PDF en travaillant avec IronPDF.

Le code supprime d'abord les pages deux et trois du document PDF en utilisant la méthode RemovePages :

// Remove pages two and three from the PDF document
pdf.RemovePages(1, 2);
// Remove pages two and three from the PDF document
pdf.RemovePages(1, 2);
' Remove pages two and three from the PDF document
pdf.RemovePages(1, 2)
$vbLabelText   $csharpLabel

La méthode RemovePages prend deux arguments : la page de départ à supprimer (dans ce cas, la page 2, représentée par 1 car la numérotation des pages commence à 0) et le nombre de pages à supprimer (dans ce cas, 2 pages).

Étape 6 : Enregistrer le PDF

Enfin, vous pouvez enregistrer le fichier PDF sur votre système local en utilisant la méthode SaveAs. Le code pour enregistrer le fichier PDF est le suivant :

// Save the PDF document to a specified output path
pdf.SaveAs(outputPath);
// Save the PDF document to a specified output path
pdf.SaveAs(outputPath);
' Save the PDF document to a specified output path
pdf.SaveAs(outputPath)
$vbLabelText   $csharpLabel

Compatibilité d'IronPDF

IronPDF est hautement compatible avec tous les derniers frameworks .NET, y compris le .NET 7. Il prend également en charge .NET Blazor et .NET MAUI, qui sont les dernières offres de Microsoft pour le développement web. La compatibilité de la bibliothèque avec ces frameworks permet aux développeurs d'intégrer facilement IronPDF dans leurs applications et de profiter de ses fonctionnalités puissantes.

L'une des principales fonctionnalités d'IronPDF est sa capacité à lire des fichiers PDF dans .NET Blazor et .NET MAUI. Cette fonctionnalité permet aux développeurs de lire et d'extraire rapidement et facilement des données à partir de fichiers PDF et de les utiliser dans les applications .NET. Cette capacité peut être particulièrement utile lors de la gestion d'un grand volume de données. Les développeurs n'ont besoin d'aucune autre bibliothèque pour utiliser IronPDF dans leur projet .NET.

Get more information about IronPDF working with .NET Blazor in this tutorial and learn about integrating IronPDF with .NET MAUI on IronPDF's website.

Conclusion

En conclusion, la lecture de fichiers PDF programmatiquement est cruciale dans divers secteurs. IronPDF fournit une solution complète pour gérer cette tâche en offrant des fonctionnalités étendues pour lire, modifier et extraire du contenu d'un fichier PDF. IronPDF est facile à installer et à utiliser avec quelques étapes simples.

The library offers methods to extract text from PDF documents, rasterize a PDF to an image, manipulate pages, and save PDF files. Que vous soyez nouveau dans le traitement programmatique des PDF ou un développeur expérimenté, IronPDF est l'outil parfait pour faire passer vos compétences au niveau supérieur.

If you are looking for a reliable and efficient solution for reading PDF files in C#, IronPDF is worth exploring, especially with its license options and pricing information, and a free trial available. Vous pouvez voir plus de plans fournis par IronPDF dans l'image ci-dessous. Vous pouvez sélectionner le package qui correspond à vos besoins.

Comment lire des fichiers PDF en C#, Figure 2 : Prix des licences IronPDF Prix des licences IronPDF

Questions Fréquemment Posées

Comment puis-je lire des fichiers PDF en C#?

Vous pouvez utiliser IronPDF en l'installant d'abord via le gestionnaire de packages NuGet dans votre projet .NET. Ensuite, importez la bibliothèque et utilisez-la pour charger et lire des documents PDF, extraire le texte et l'afficher dans la console.

Quels secteurs bénéficient du traitement programmatique des PDF ?

Des secteurs tels que la finance, la santé, le juridique et l'éducation profitent grandement du traitement programmatique des PDF car il permet une analyse de données efficace, une gestion de documents et une automatisation des tâches en utilisant des outils comme IronPDF.

Comment extraire des données d'un document PDF en utilisant C# ?

En utilisant IronPDF, vous pouvez extraire des données d'un document PDF en chargeant le PDF et en utilisant des méthodes comme ExtractText pour lire et traiter le contenu de manière programmatique.

Puis-je convertir des fichiers PDF en images en C# ?

Oui, avec IronPDF, vous pouvez convertir des fichiers PDF en images en utilisant la méthode RasterizeToImageFiles, vous permettant de sauvegarder les pages sous forme de fichiers image dans des formats tels que PNG ou JPG.

IronPDF est-il compatible avec les derniers frameworks .NET ?

IronPDF est compatible avec tous les derniers frameworks .NET, y compris .NET 7. Il prend également en charge .NET Blazor et .NET MAUI, permettant l'intégration dans divers types d'applications.

Comment puis-je modifier et enregistrer un fichier PDF en utilisant C# ?

Après avoir apporté des modifications à un fichier PDF en utilisant IronPDF, vous pouvez enregistrer les modifications en utilisant la méthode SaveAs, en spécifiant le chemin de sortie pour le document modifié.

Quelles sont les étapes à suivre pour utiliser une bibliothèque PDF dans un projet .NET ?

Pour utiliser IronPDF dans un projet .NET, installez la bibliothèque via NuGet, importez-la dans votre projet, puis utilisez ses fonctionnalités pour charger, lire et manipuler des documents PDF de manière programmatique.

IronPDF nécessite-t-il d'autres bibliothèques pour le traitement des PDF en .NET ?

Non, IronPDF est une bibliothèque autonome qui ne nécessite pas de bibliothèques supplémentaires, ce qui rend son intégration simple dans votre projet .NET pour un traitement PDF complet.

Quelles sont les principales fonctionnalités d'IronPDF pour le traitement des PDF ?

IronPDF offre des fonctionnalités telles que l'extraction de texte, la rasterisation des PDF en images, la manipulation de pages, et la compatibilité avec les derniers frameworks .NET, en faisant un outil puissant pour la gestion des fichiers PDF en C#.

IronPDF est-il entièrement compatible avec .NET 10 ?

Oui, IronPDF est compatible nativement avec .NET 10 (ainsi qu'avec les versions précédentes comme .NET 9, 8, 7 et 6). Vous pouvez donc créer des applications IronPDF sous .NET 10 sans configuration particulière ni contournement.

Curtis Chau
Rédacteur technique

Curtis Chau détient un baccalauréat en informatique (Université de Carleton) et se spécialise dans le développement front-end avec expertise en Node.js, TypeScript, JavaScript et React. Passionné par la création d'interfaces utilisateur intuitives et esthétiquement plaisantes, Curtis aime travailler avec des frameworks modernes ...

Lire la suite