using IronPdf; // Disable local disk access or cross-origin requests Installation.EnableWebSecurity = true; // Instantiate Renderer var renderer = new ChromePdfRenderer(); // Create a PDF from a HTML string using C# var pdf = renderer.RenderHtmlAsPdf("<h1>Hello World</h1>"); // Export to a file or Stream pdf.SaveAs("output.pdf"); // Advanced Example with HTML Assets // Load external html assets: Images, CSS and JavaScript. // An optional BasePath 'C:\site\assets\' is set as the file location to load assets from var myAdvancedPdf = renderer.RenderHtmlAsPdf("<img src='icons/iron.png'>", @"C:\site\assets\"); myAdvancedPdf.SaveAs("html-with-assets.pdf");

UTILISATION D'IRONPDF

Comment lire des fichiers PDF en C#

Kannapat Udonpant

février 22, 2023

Mise à jour février 25, 2024

Le traitement programmatique des PDF est essentiel dans des secteurs tels que la finance, la santé, le droit et l'éducation, où des informations critiques doivent être traitées, analysées et extraites de documents PDF à des fins d'analyse de données, de gestion de documents et d'automatisation. Malgré son importance, cette tâche peut s'avérer difficile.

IronPDF : Une bibliothèque PDF C

IronPDF vous permet de réaliser facilement des tâches incroyablement difficiles. Il permet d'éditer facilement du texte dans un document PDF, de la même manière que vous pouvez travailler avec des fichiers texte dans un document texte, tout en vous permettant d'exporter des fichiers dans n'importe quel système d'exploitation. L'application IronPDF couvre l'ensemble du processus de visualisation, de modification et d'extraction du contenu d'un PDF.

Prenez la bonne décision avec IronPDF

Le texte peut être lu et écrit au format PDF rapidement et facilement à l'aide de n'importe quel ordinateur équipé du logiciel IronPDF. L'installation est simple. C'est la meilleure façon d'apprendre à lire les fichiers PDF en C#. Vous pouvez également télécharger gratuitement IronPDF pour le développement. Si vous explorez IronPDF, vous remarquerez que la bibliothèque offre des fonctionnalités étendues qui facilitent grandement l'utilisation des PDF. Explorez les cours pendant votre temps libre! Il existe plusieursExemples en C# utilisant HTML pour créer un PDF disponible pour apprendre à créer un résultat optimal à partir de la lecture des PDF.

Lire des fichiers PDF à l'aide d'IronPDF

Étape 1 : Installer le paquetage IronPDF

Pour commencer, vous devezinstaller le package NuGet IronPDF la traduction doit être intégrée à votre projet .NET. Pour ce faire, ouvrez la console du gestionnaire de paquets dans Visual Studio et entrez la commande suivante :

Install-Package IronPdf

Étape 2 : Importer la bibliothèque IronPDF

Ensuite, vous devez importer la bibliothèque IronPDF dans votre code en ajoutant la déclaration suivante au début de votre fichier :

using IronPdf;

using IronPdf;

Imports IronPdf

Étape 3 : Charger le document PDF

Une fois que vous avez importé la bibliothèque IronPDF, vous pouvez charger un document PDF dans votre code en utilisant le code suivant :

PdfDocument pdf = PdfDocument.FromFile(@"C:\dotnet.pdf");
var outputPath = "Example.pdf";
pdf.SaveAs(outputPath);

PdfDocument pdf = PdfDocument.FromFile(@"C:\dotnet.pdf");
var outputPath = "Example.pdf";
pdf.SaveAs(outputPath);

Dim pdf As PdfDocument = PdfDocument.FromFile("C:\dotnet.pdf")
Dim outputPath = "Example.pdf"
pdf.SaveAs(outputPath)

Étape 4 : Extraire le texte du PDF

IronPDF propose une série de méthodes pour extraire du texte d'un fichier PDF existant. Par exemple, vous pouvez commencer à extraire du texte d'un PDF et l'imprimer sur la console en utilisant l'extrait de code suivant :

string text = pdf.ExtractText();
Console.Writeline(text);

string text = pdf.ExtractText();
Console.Writeline(text);

Dim text As String = pdf.ExtractText()
Console.Writeline(text)

En utilisant le code ci-dessus, vous pouvezextraire du texte d'un fichier PDF.

Comment lire des fichiers PDF en C#, Figure 1 : Extraction de texte à partir d'un PDF à l'aide d'IronPDF

Extraire du texte d'un PDF à l'aide d'IronPDF

Étape 5 : Rastériser un PDF en images

Nous allonsrastériser le fichier PDF en images avec IronPDF en utilisant IronPDF. Commencez par importer les bibliothèques nécessaires :

using System.Linq;
using IronPdf;
using IronSoftware.Drawing;

using System.Linq;
using IronPdf;
using IronSoftware.Drawing;

Imports System.Linq
Imports IronPdf
Imports IronSoftware.Drawing

Le code utilise ensuite la fonctionla méthode RasterizeToImageFiles (Rastériser vers des fichiers d'images) pour extraire toutes les pages du document PDF dans un dossier sous forme de fichiers images. Les images extraites peuvent être enregistrées sous forme de fichiers PNG ou JPG, et les dimensions et les intervalles de pages des images peuvent également être spécifiés.

// Extract all pages to a folder as image files
pdf.RasterizeToImageFiles(@"C:\image\folder\*.png");

// Dimensions and page ranges may be specified
pdf.RasterizeToImageFiles(@"C:\image\folder\example_pdf_image_*.jpg", 100, 80);

// Extract all pages to a folder as image files
pdf.RasterizeToImageFiles(@"C:\image\folder\*.png");

// Dimensions and page ranges may be specified
pdf.RasterizeToImageFiles(@"C:\image\folder\example_pdf_image_*.jpg", 100, 80);

' Extract all pages to a folder as image files
pdf.RasterizeToImageFiles("C:\image\folder\*.png")

' Dimensions and page ranges may be specified
pdf.RasterizeToImageFiles("C:\image\folder\example_pdf_image_*.jpg", 100, 80)

Enfin, le code utilise la fonctionméthode `ToBitmap pour extraire toutes les pages du document PDF en tant qu'objets AnyBitmap, qui peuvent être traités et manipulés dans le code.

// Extract all pages as AnyBitmap objects
AnyBitmap [] pdfBitmaps = pdf.ToBitmap();

// Extract all pages as AnyBitmap objects
AnyBitmap [] pdfBitmaps = pdf.ToBitmap();

' Extract all pages as AnyBitmap objects
Dim pdfBitmaps() As AnyBitmap = pdf.ToBitmap()

Le code ci-dessus montre comment extraire le contenu d'un fichier PDF à l'aide d'IronPDF et enregistrer les données extraites sous forme de fichiers images ou d'objets AnyBitmap en vue d'un traitement ultérieur.

Étape 7 : Manipulation des pages PDF

Apprenons àmanipuler les pages d'un document PDF en lisant le fichier PDF à l'aide d'IronPDF.

Le code supprime d'abord les pages deux et trois du document PDF à l'aide de la fonctionméthode `RemovePages:

pdf.RemovePages(1, 2);

pdf.RemovePages(1, 2);

pdf.RemovePages(1, 2)

La méthode RemovePages prend deux arguments : la page de départ à supprimer(dans ce cas, la page 2, représentée par 1 puisque la numérotation des pages commence à 0) et le nombre de pages à supprimer(dans ce cas, 2 pages).

Étape 6 : Enregistrer le PDF

Enfin, vous pouvez enregistrer le fichier PDF sur votre système local à l'aide de la fonctionméthode `SaveAs. Le code d'enregistrement du fichier PDF est le suivant :

pdf.SaveAs(OutputPath);

pdf.SaveAs(OutputPath);

pdf.SaveAs(OutputPath)

Compatibilité avec IronPDF

IronPDF est hautement compatible avec tous les derniers Frameworks .NET, y compris .NET 7. Il prend également en charge .NET Blazor et .NET MAUI, qui sont les dernières offres de Microsoft pour le développement web. La compatibilité de la bibliothèque avec ces frameworks permet aux développeurs d'intégrer IronPDF en toute transparence dans leurs applications et de tirer parti de ses puissantes fonctionnalités.

L'une des principales caractéristiques d'IronPDF est sa capacité à lire les fichiers PDF dans .NET Blazor et .NET MAUI. Cette fonction permet aux développeurs de lire et d'extraire rapidement et facilement des données de fichiers PDF et de les utiliser dans les applications .NET. Cette capacité peut s'avérer particulièrement utile lorsque l'on travaille avec un grand volume de données. Les développeurs n'ont besoin d'aucune autre bibliothèque pour utiliser IronPDF dans leur projet .NET.

Plus d'informations surIronPDF pour .NET Blazor dans ce tutoriel et en savoir plus surintégrer IronPDF for .NET MAUI sur le site web d'IronPDF.

Conclusion

En conclusion, la lecture programmatique de fichiers PDF est cruciale dans divers secteurs d'activité. IronPDF fournit une solution complète pour gérer cette tâche en offrant des fonctionnalités étendues pour lire, modifier et extraire le contenu d'un fichier PDF. IronPDF est facile à installer et à utiliser en quelques étapes simples.

La bibliothèque propose des méthodes pourextraire du texte à partir de documents PDF, rastériser un PDF en une image, manipuler des pages et enregistrer des fichiers PDF. Que vous soyez novice en matière de traitement PDF programmatique ou développeur expérimenté, IronPDF est l'outil idéal pour faire passer vos compétences au niveau supérieur.

Si vous êtes à la recherche d'une solution fiable et efficace pour lire des fichiers PDF en C#, IronPDF vaut la peine d'être exploré, en particulier avec sonoptions de licence et informations sur les prixet unessai gratuit disponible. Vous pouvez voir d'autres plans fournis par IronPDF dans l'image ci-dessous. Vous pouvez choisir le forfait qui correspond à vos besoins.

Comment lire des fichiers PDF en C#, Figure 2 : Prix des licences IronPDF

Prix des licences IronPDF

Kannapat Udonpant

Discutez avec l'équipe d'ingénierie maintenant

Ingénieur logiciel

Avant de devenir ingénieur logiciel, Kannapat a obtenu un doctorat en ressources environnementales à l'université d'Hokkaido au Japon. Tout en poursuivant ses études, Kannapat est également devenu membre du Vehicle Robotics Laboratory, qui fait partie du Department of Bioproduction Engineering (département d'ingénierie de la bioproduction). En 2022, il a mis à profit ses compétences en C# pour rejoindre l'équipe d'ingénieurs d'Iron Software, où il se concentre sur IronPDF. Kannapat apprécie son travail car il apprend directement auprès du développeur qui écrit la majeure partie du code utilisé dans IronPDF. Outre l'apprentissage par les pairs, Kannapat apprécie l'aspect social du travail chez Iron Software. Lorsqu'il n'écrit pas de code ou de documentation, Kannapat peut généralement être trouvé en train de jouer sur sa PS5 ou de revoir The Last of Us.

< PRÉCÉDENT
Comment convertir un fichier Word (Docx) en PDF en C# (Tutoriel)

SUIVANT >
Devriez-vous acheter IronPDF ?