Test dans un environnement réel
Test en production sans filigrane.
Fonctionne partout où vous en avez besoin.
Le traitement programmatique des PDF est essentiel dans des secteurs tels que la finance, la santé, le droit et l'éducation, où des informations critiques doivent être traitées, analysées et extraites de documents PDF à des fins d'analyse de données, de gestion de documents et d'automatisation. Malgré son importance, cette tâche peut s'avérer difficile.
IronPDF vous permet de réaliser facilement des tâches incroyablement difficiles. Il permet d'éditer facilement du texte dans un document PDF, de la même manière que vous pouvez travailler avec des fichiers texte dans un document texte, tout en vous permettant d'exporter des fichiers dans n'importe quel système d'exploitation. L'application IronPDF couvre l'ensemble du processus de visualisation, de modification et d'extraction du contenu d'un PDF.
Le texte peut être lu et écrit au format PDF rapidement et facilement à l'aide de n'importe quel ordinateur équipé du logiciel IronPDF. L'installation est simple. C'est la meilleure façon d'apprendre à lire les fichiers PDF en C#. Vous pouvez également télécharger gratuitement IronPDF pour le développement. Si vous explorez IronPDF, vous remarquerez que la bibliothèque offre des fonctionnalités étendues qui facilitent grandement l'utilisation des PDF. Explorez les cours pendant votre temps libre! Il existe plusieursExemples en C# utilisant HTML pour créer un PDF disponible pour apprendre à créer un résultat optimal à partir de la lecture des PDF.
Pour commencer, vous devezinstaller le package NuGet IronPDF la traduction doit être intégrée à votre projet .NET. Pour ce faire, ouvrez la console du gestionnaire de paquets dans Visual Studio et entrez la commande suivante :
Install-Package IronPdf
Ensuite, vous devez importer la bibliothèque IronPDF dans votre code en ajoutant la déclaration suivante au début de votre fichier :
using IronPdf;
using IronPdf;
Imports IronPdf
Une fois que vous avez importé la bibliothèque IronPDF, vous pouvez charger un document PDF dans votre code en utilisant le code suivant :
PdfDocument pdf = PdfDocument.FromFile(@"C:\dotnet.pdf");
var outputPath = "Example.pdf";
pdf.SaveAs(outputPath);
PdfDocument pdf = PdfDocument.FromFile(@"C:\dotnet.pdf");
var outputPath = "Example.pdf";
pdf.SaveAs(outputPath);
Dim pdf As PdfDocument = PdfDocument.FromFile("C:\dotnet.pdf")
Dim outputPath = "Example.pdf"
pdf.SaveAs(outputPath)
IronPDF propose une série de méthodes pour extraire du texte d'un fichier PDF existant. Par exemple, vous pouvez commencer à extraire du texte d'un PDF et l'imprimer sur la console en utilisant l'extrait de code suivant :
string text = pdf.ExtractText();
Console.Writeline(text);
string text = pdf.ExtractText();
Console.Writeline(text);
Dim text As String = pdf.ExtractText()
Console.Writeline(text)
En utilisant le code ci-dessus, vous pouvezextraire du texte d'un fichier PDF.
Extraire du texte d'un PDF à l'aide d'IronPDF
Nous allonsrastériser le fichier PDF en images avec IronPDF en utilisant IronPDF. Commencez par importer les bibliothèques nécessaires :
using System.Linq;
using IronPdf;
using IronSoftware.Drawing;
using System.Linq;
using IronPdf;
using IronSoftware.Drawing;
Imports System.Linq
Imports IronPdf
Imports IronSoftware.Drawing
Le code utilise ensuite la fonctionla méthode RasterizeToImageFiles
(Rastériser vers des fichiers d'images) pour extraire toutes les pages du document PDF dans un dossier sous forme de fichiers images. Les images extraites peuvent être enregistrées sous forme de fichiers PNG ou JPG, et les dimensions et les intervalles de pages des images peuvent également être spécifiés.
// Extract all pages to a folder as image files
pdf.RasterizeToImageFiles(@"C:\image\folder\*.png");
// Dimensions and page ranges may be specified
pdf.RasterizeToImageFiles(@"C:\image\folder\example_pdf_image_*.jpg", 100, 80);
// Extract all pages to a folder as image files
pdf.RasterizeToImageFiles(@"C:\image\folder\*.png");
// Dimensions and page ranges may be specified
pdf.RasterizeToImageFiles(@"C:\image\folder\example_pdf_image_*.jpg", 100, 80);
' Extract all pages to a folder as image files
pdf.RasterizeToImageFiles("C:\image\folder\*.png")
' Dimensions and page ranges may be specified
pdf.RasterizeToImageFiles("C:\image\folder\example_pdf_image_*.jpg", 100, 80)
Enfin, le code utilise la fonctionméthode `ToBitmap pour extraire toutes les pages du document PDF en tant qu'objets AnyBitmap
, qui peuvent être traités et manipulés dans le code.
// Extract all pages as AnyBitmap objects
AnyBitmap [] pdfBitmaps = pdf.ToBitmap();
// Extract all pages as AnyBitmap objects
AnyBitmap [] pdfBitmaps = pdf.ToBitmap();
' Extract all pages as AnyBitmap objects
Dim pdfBitmaps() As AnyBitmap = pdf.ToBitmap()
Le code ci-dessus montre comment extraire le contenu d'un fichier PDF à l'aide d'IronPDF et enregistrer les données extraites sous forme de fichiers images ou d'objets AnyBitmap
en vue d'un traitement ultérieur.
Apprenons àmanipuler les pages d'un document PDF en lisant le fichier PDF à l'aide d'IronPDF.
Le code supprime d'abord les pages deux et trois du document PDF à l'aide de la fonctionméthode `RemovePages:
pdf.RemovePages(1, 2);
pdf.RemovePages(1, 2);
pdf.RemovePages(1, 2)
La méthode RemovePages
prend deux arguments : la page de départ à supprimer(dans ce cas, la page 2, représentée par 1 puisque la numérotation des pages commence à 0) et le nombre de pages à supprimer(dans ce cas, 2 pages).
Enfin, vous pouvez enregistrer le fichier PDF sur votre système local à l'aide de la fonctionméthode `SaveAs. Le code d'enregistrement du fichier PDF est le suivant :
pdf.SaveAs(OutputPath);
pdf.SaveAs(OutputPath);
pdf.SaveAs(OutputPath)
IronPDF est hautement compatible avec tous les derniers Frameworks .NET, y compris .NET 7. Il prend également en charge .NET Blazor et .NET MAUI, qui sont les dernières offres de Microsoft pour le développement web. La compatibilité de la bibliothèque avec ces frameworks permet aux développeurs d'intégrer IronPDF en toute transparence dans leurs applications et de tirer parti de ses puissantes fonctionnalités.
L'une des principales caractéristiques d'IronPDF est sa capacité à lire les fichiers PDF dans .NET Blazor et .NET MAUI. Cette fonction permet aux développeurs de lire et d'extraire rapidement et facilement des données de fichiers PDF et de les utiliser dans les applications .NET. Cette capacité peut s'avérer particulièrement utile lorsque l'on travaille avec un grand volume de données. Les développeurs n'ont besoin d'aucune autre bibliothèque pour utiliser IronPDF dans leur projet .NET.
Plus d'informations surIronPDF pour .NET Blazor dans ce tutoriel et en savoir plus surintégrer IronPDF for .NET MAUI sur le site web d'IronPDF.
En conclusion, la lecture programmatique de fichiers PDF est cruciale dans divers secteurs d'activité. IronPDF fournit une solution complète pour gérer cette tâche en offrant des fonctionnalités étendues pour lire, modifier et extraire le contenu d'un fichier PDF. IronPDF est facile à installer et à utiliser en quelques étapes simples.
La bibliothèque propose des méthodes pourextraire du texte à partir de documents PDF, rastériser un PDF en une image, manipuler des pages et enregistrer des fichiers PDF. Que vous soyez novice en matière de traitement PDF programmatique ou développeur expérimenté, IronPDF est l'outil idéal pour faire passer vos compétences au niveau supérieur.
Si vous êtes à la recherche d'une solution fiable et efficace pour lire des fichiers PDF en C#, IronPDF vaut la peine d'être exploré, en particulier avec sonoptions de licence et informations sur les prixet unessai gratuit disponible. Vous pouvez voir d'autres plans fournis par IronPDF dans l'image ci-dessous. Vous pouvez choisir le forfait qui correspond à vos besoins.
Prix des licences IronPDF
9 produits de l'API .NET pour vos documents de bureau