COMPARAISON DES PRODUITS

alternatives à iTextSharp Read PDF (Tutoriel du développeur)

Publié avril 3, 2024
Partager:

PDF (EN ANGLAIS)(Format de document portable) est un format de fichier largement utilisé pour partager des documents de manière cohérente et sécurisée. La lecture et la manipulation de tels fichiers en C# est une exigence courante dans diverses applications, telles que les systèmes de gestion de documents, les outils de reporting, etc. Dans cet article, nous allons comparer deux bibliothèques populaires pour la lecture de fichiers PDF en C# : IronPDF et iTextSharp(la dernière bibliothèque .NET iText).

IronPDF est une bibliothèque C# complète deIron Software qui offre un large éventail de fonctionnalités permettant de travailler avec des fichiers PDF. Il permet aux développeurs de créer, d'éditer et de manipuler des documents PDF de manière transparente. IronPDF est connu pour sa simplicité et sa facilité d'utilisation, ce qui en fait un excellent choix pour les développeurs qui ont besoin d'intégrer rapidement des fonctionnalités PDF dans leurs applications.

iTextSharp est une autre bibliothèque populaire permettant de travailler avec des fichiers PDF en C#. Il existe depuis un certain temps et est largement utilisé dans l'industrie. iText offre un ensemble riche de fonctionnalités pour créer et manipuler des documents PDF. Il est connu pour sa flexibilité et son extensibilité, ce qui le rend adapté aux tâches complexes liées aux PDF.

Comment utiliser IronPDF Vs iTextSharp pour lire des PDF en C# ;

  1. Créez un nouveau projet C# dans Visual Studio pour comparer IronPDF et iTextSharp pour la lecture de fichiers PDF.

  2. Installez les bibliothèques IronPDF et iTextSharp dans le projet.

  3. Lire des fichiers PDF à l'aide d'IronPDF.

  4. Lire des fichiers PDF à l'aide d'iTextSharp.

Conditions préalables

  1. Visual Studio: Assurez-vous que Visual Studio ou tout autre environnement de développement C# est installé.

  2. NuGet Package Manager: Assurez-vous que vous pouvez utiliser NuGet pour gérer les paquets dans votre projet.

Étape 1 : Créer un nouveau projet C# ; dans Visual Studio pour comparer IronPDF Vs iTextSharp lire les fichiers PDF

Commencez par mettre en place une application console C#. Ouvrez Visual Studio et sélectionnez Créer un nouveau projet. Sélectionnez le type d'application de la console.

alternatives à la lecture de PDF par iTextSharp (Tutoriel du développeur) : Figure 1 - Application console

Indiquez le nom du projet comme indiqué ci-dessous.

alternatives à la lecture de PDF par iTextSharp (Tutoriel du développeur) : Figure 2 - Configuration du projet

Sélectionnez la version .NET requise pour le projet.

alternatives à la lecture de PDF par iTextSharp (Tutoriel du développeur) : Figure 3 - Cadre de travail

Une fois cette opération effectuée, Visual Studio génère un nouveau projet.

Étape 2 : Installer les bibliothèques IronPDF et iTextSharp dans le projet

iTextSharp peut être installé à partir de la pageNuGet Package Manager pour iText Gestionnaire de paquets. La dernière version est disponible sous forme de paquet iText.

alternatives à la lecture de PDF par iTextSharp (Tutoriel du développeur) : Figure 4 - iText

Ou à partir du gestionnaire de paquets de Visual Studio, comme indiqué ci-dessous. Recherchez iText dans le Gestionnaire de paquets et cliquez sur Installer.

alternatives à la lecture de PDF par iTextSharp (Tutoriel du développeur) : Figure 5 - Gestionnaire de paquets NuGet

IronPDF peut être installé à partir de la pageNuGet Package Manager pour IronPDF comme indiqué ci-dessous.

alternatives à la lecture de PDF par iTextSharp (Tutoriel du développeur) : Figure 6 - IronPDF

Ou à partir du gestionnaire de paquets de Visual Studio, comme indiqué ci-dessous. RechercherIronPDF : Bibliothèque PDF C# dans le Gestionnaire de paquets et cliquez sur Installer.

alternatives à la lecture de PDF par iTextSharp (Tutoriel du développeur) : Figure 7 - Installer IronPDF

Étape 3 : Lire le texte d'un fichier PDF à l'aide d'IronPDF

Ajoutez le code ci-dessous au fichier program.cs et fournissez un exemple de document PDF dont le contenu est le suivant.

alternatives à la lecture de PDF par iTextSharp (Tutoriel du développeur) : Figure 8 - Entrée PDF

using IronPdf;
Console.WriteLine("Comparison of IronPDF And iTextSharp Read PDF Files in C#");
// pdfreader reader
ReadUsingIronPDF.Read();
public class ReadUsingIronPDF
{
    public static void Read()
    {
        // read from specific location
        string filename = "C:\\code\\articles\\ITextSharp\\ITextSharpIronPdfDemo\\Example.pdf";
        var pdfReader = PdfDocument.FromFile(filename);
        // Get all text to put in a search index using new simpletextextractionstrategy
        var allText = pdfReader.ExtractAllText();
        Console.WriteLine("------------------Text From PDF-----------------");
        Console.WriteLine(allText);
        Console.WriteLine("------------------Text From PDF-----------------");
        var allIMages = pdfReader.ExtractAllImages();
        Console.WriteLine("------------------Image Count From PDF-----------------");
        Console.WriteLine($"Total Images={allIMages.Count()}");
        Console.WriteLine("------------------Image Count From PDF-----------------");
        Console.WriteLine("------------------one Page Text From PDF page-----------------");
        var pageCount = pdfReader.PageCount;
        for (int page = 0; page < pageCount; page++)
        {
            string Text = pdfReader.ExtractTextFromPage(page);
            Console.WriteLine(Text);
        }
    }
}
using IronPdf;
Console.WriteLine("Comparison of IronPDF And iTextSharp Read PDF Files in C#");
// pdfreader reader
ReadUsingIronPDF.Read();
public class ReadUsingIronPDF
{
    public static void Read()
    {
        // read from specific location
        string filename = "C:\\code\\articles\\ITextSharp\\ITextSharpIronPdfDemo\\Example.pdf";
        var pdfReader = PdfDocument.FromFile(filename);
        // Get all text to put in a search index using new simpletextextractionstrategy
        var allText = pdfReader.ExtractAllText();
        Console.WriteLine("------------------Text From PDF-----------------");
        Console.WriteLine(allText);
        Console.WriteLine("------------------Text From PDF-----------------");
        var allIMages = pdfReader.ExtractAllImages();
        Console.WriteLine("------------------Image Count From PDF-----------------");
        Console.WriteLine($"Total Images={allIMages.Count()}");
        Console.WriteLine("------------------Image Count From PDF-----------------");
        Console.WriteLine("------------------one Page Text From PDF page-----------------");
        var pageCount = pdfReader.PageCount;
        for (int page = 0; page < pageCount; page++)
        {
            string Text = pdfReader.ExtractTextFromPage(page);
            Console.WriteLine(Text);
        }
    }
}
Imports IronPdf
Console.WriteLine("Comparison of IronPDF And iTextSharp Read PDF Files in C#")
' pdfreader reader
ReadUsingIronPDF.Read()
'INSTANT VB TODO TASK: Local functions are not converted by Instant VB:
'public class ReadUsingIronPDF
'{
'	public static void Read()
'	{
'		' read from specific location
'		string filename = "C:\code\articles\ITextSharp\ITextSharpIronPdfDemo\Example.pdf";
'		var pdfReader = PdfDocument.FromFile(filename);
'		' Get all text to put in a search index using new simpletextextractionstrategy
'		var allText = pdfReader.ExtractAllText();
'		Console.WriteLine("------------------Text From PDF-----------------");
'		Console.WriteLine(allText);
'		Console.WriteLine("------------------Text From PDF-----------------");
'		var allIMages = pdfReader.ExtractAllImages();
'		Console.WriteLine("------------------Image Count From PDF-----------------");
'		Console.WriteLine(string.Format("Total Images={0}", allIMages.Count()));
'		Console.WriteLine("------------------Image Count From PDF-----------------");
'		Console.WriteLine("------------------one Page Text From PDF page-----------------");
'		var pageCount = pdfReader.PageCount;
'		for (int page = 0; page < pageCount; page++)
'		{
'			string Text = pdfReader.ExtractTextFromPage(page);
'			Console.WriteLine(Text);
'		}
'	}
'}
VB   C#

Explication du code

  1. Pour créer un texte PDF, créez un document Word, ajoutez-y le texte ci-dessus et enregistrez-le en tant que document PDF nommé Exemple.pdf

  2. Dans le code, nous créons un PDFReader à partir du chemin du fichier PDF et extrayons tout le texte

  3. Les images du PDF peuvent être extraites à l'aide de la méthode ExtractImages

  4. Chaque page d'un document PDF peut être lue à l'aide de la méthode ExtractTextFromPage

Sortie

alternatives à la lecture de PDF avec iTextSharp (Tutoriel du développeur) : Figure 9 - Lire le PDF en utilisant la sortie IronPDF

Étape 3 : Lire le texte d'un fichier PDF avec iTextSharp

Pour comparer le texte lu par iTextSharp, ajoutez le code ci-dessous au même fichier program.cs. Pour des raisons de simplicité, nous n'avons pas séparé les classes dans des fichiers différents.

using IronPdf;
using iText.Kernel.Pdf;
using iText.Kernel.Pdf.Canvas.Parser.Listener;
using iText.Kernel.Pdf.Canvas.Parser;
Console.WriteLine("Comparison of IronPDF And iTextSharp Read PDF Files in C#");
//ReadUsingIronPDF.Read();
ReadUsingITextSharp.Read();
public class ReadUsingITextSharp
{
    public static void Read()
    {
        string pdfFile = "C:\\code\\articles\\ITextSharp\\ITextSharpIronPdfDemo\\Example.pdf";
        // Create a PDF reader
        PdfReader pdfReader = new PdfReader(pdfFile);
        iText.Kernel.Pdf.PdfDocument pdfDocument = new iText.Kernel.Pdf.PdfDocument(pdfReader);
        // Extract plain text from the PDF
        LocationTextExtractionStrategy strategy = new LocationTextExtractionStrategy();
        string pdfText = PdfTextExtractor.GetTextFromPage(pdfDocument.GetPage(1), strategy);
        // Display or manipulate the extracted text as needed
        Console.WriteLine(pdfText);
    }
}
using IronPdf;
using iText.Kernel.Pdf;
using iText.Kernel.Pdf.Canvas.Parser.Listener;
using iText.Kernel.Pdf.Canvas.Parser;
Console.WriteLine("Comparison of IronPDF And iTextSharp Read PDF Files in C#");
//ReadUsingIronPDF.Read();
ReadUsingITextSharp.Read();
public class ReadUsingITextSharp
{
    public static void Read()
    {
        string pdfFile = "C:\\code\\articles\\ITextSharp\\ITextSharpIronPdfDemo\\Example.pdf";
        // Create a PDF reader
        PdfReader pdfReader = new PdfReader(pdfFile);
        iText.Kernel.Pdf.PdfDocument pdfDocument = new iText.Kernel.Pdf.PdfDocument(pdfReader);
        // Extract plain text from the PDF
        LocationTextExtractionStrategy strategy = new LocationTextExtractionStrategy();
        string pdfText = PdfTextExtractor.GetTextFromPage(pdfDocument.GetPage(1), strategy);
        // Display or manipulate the extracted text as needed
        Console.WriteLine(pdfText);
    }
}
Imports IronPdf
Imports iText.Kernel.Pdf
Imports iText.Kernel.Pdf.Canvas.Parser.Listener
Imports iText.Kernel.Pdf.Canvas.Parser
Console.WriteLine("Comparison of IronPDF And iTextSharp Read PDF Files in C#")
'ReadUsingIronPDF.Read();
ReadUsingITextSharp.Read()
'INSTANT VB TODO TASK: Local functions are not converted by Instant VB:
'public class ReadUsingITextSharp
'{
'	public static void Read()
'	{
'		string pdfFile = "C:\code\articles\ITextSharp\ITextSharpIronPdfDemo\Example.pdf";
'		' Create a PDF reader
'		PdfReader pdfReader = New PdfReader(pdfFile);
'		iText.Kernel.Pdf.PdfDocument pdfDocument = New iText.Kernel.Pdf.PdfDocument(pdfReader);
'		' Extract plain text from the PDF
'		LocationTextExtractionStrategy strategy = New LocationTextExtractionStrategy();
'		string pdfText = PdfTextExtractor.GetTextFromPage(pdfDocument.GetPage(1), strategy);
'		' Display or manipulate the extracted text as needed
'		Console.WriteLine(pdfText);
'	}
'}
VB   C#

Sortie

alternatives à la lecture de PDF avec iTextSharp (Tutoriel du développeur) : Figure 10 - Lire un PDF en utilisant la sortie iTextSharp

limites d'iTextSharp

  1. Courbe d'apprentissage : iTextSharp a une courbe d'apprentissage plus raide, en particulier pour les débutants.

  2. Licence : Le modèle de licence d'iTextSharp peut ne pas convenir à tous les projets, en particulier ceux qui sont soumis à des contraintes budgétaires.

Avantages d'IronPDF

  1. Facilité d'utilisation : IronPDF est réputé pour la simplicité de son API, ce qui facilite la prise en main par les développeurs.

  2. Rendu des documents : IronPDF assure un rendu précis des documents PDF, garantissant que le texte extrait est fidèle à l'original.

Licence (essai gratuit disponible)

Insérez votreClé de licence IronPDF cette clé doit être insérée dans le fichier appsettings.json.

"IronPdf.LicenseKey": "your license key"

Pour recevoir une licence d'essai, veuillez indiquer votre adresse électronique.

Conclusion

Choisir entreIronPDF et iTextSharp dépend des exigences spécifiques de votre projet. Si vous avez besoin d'une bibliothèque simple et facile à utiliser pour les opérations PDF courantes, IronPDF est peut-être le meilleur choix. Prenez en compte des facteurs tels que la complexité de votre application, votre budget et la courbe d'apprentissage avant de prendre votre décision.

IronPDF est conçu pour intégrer de manière transparente la génération de PDF dans votre application, en gérant sans effort la conversion de documents formatés en PDF. Cet outil polyvalent vous permet de convertir des formulaires Web, des pages HTML locales et d'autres contenus Web en PDF à l'aide de .NET. Les utilisateurs peuvent télécharger, envoyer par courrier électronique ou stocker des documents dans le nuage. Que vous ayez besoin de produire des factures, des devis, des rapports, des contrats ou d'autres documents professionnels,Capacités de génération de PDF d'IronPDF nous vous couvrons. Améliorez votre application grâce aux capacités de génération de PDF intuitives et efficaces d'IronPDF.

< PRÉCÉDENT
Comment lire des documents PDF en C# en utilisant iTextSharp :
SUIVANT >
PDFsharp vs iTextSharp (Comparaison des bibliothèques PDF C#)