C# Read PDF Walkthrough (en anglais)

This article was translated from English: Does it need improvement?
Translated
View the article in English

Aujourd'hui, nous allons découvrir une méthode simple pour lire le contenu des PDF et extraire le texte dans son format d'origine. Cette opération peut être effectuée pour des documents entiers ou des pages spécifiques, le tout dans le cadre de votre projet C#.

Csharp Parse Pdf1 related to C# Read PDF Walkthrough (en anglais)
Csharp Parse Pdf2 related to C# Read PDF Walkthrough (en anglais)
Csharp Parse Pdf3 related to C# Read PDF Walkthrough (en anglais)

Commencez avec IronPDF

Commencez à utiliser IronPDF dans votre projet dès aujourd'hui avec un essai gratuit.

Première étape :
green arrow pointer


Lire le fichier PDF en C# ;

Cette bibliothèque C# permet de lire les fichiers PDF, d'en extraire le contenu et même d'en extraire des images originales de haute qualité. Les exemples ci-dessous illustrent les nombreuses façons dont nous pouvons utiliser différentes fonctions pour répondre à nos besoins en matière de lecture de PDF dans un environnement .NET.

:path=/static-assets/pdf/content-code-examples/how-to/csharp-read-pdf-read-pdf.cs
using IronPdf;
using IronSoftware.Drawing;
using System.Collections.Generic;

// Select the desired PDF File
PdfDocument pdf = PdfDocument.FromFile("sample.pdf");

// Extract all text from an pdf
string allText = pdf.ExtractAllText();

// Get all Images
IEnumerable<AnyBitmap> AllImages = pdf.ExtractAllImages();

// Else combine above both functionality using PageCount
for (var index = 0; index < pdf.PageCount; index++)
{
    string Text = pdf.ExtractTextFromPage(index);
    IEnumerable<AnyBitmap> Images = pdf.ExtractImagesFromPage(index);
}
Imports IronPdf
Imports IronSoftware.Drawing
Imports System.Collections.Generic

' Select the desired PDF File
Private pdf As PdfDocument = PdfDocument.FromFile("sample.pdf")

' Extract all text from an pdf
Private allText As String = pdf.ExtractAllText()

' Get all Images
Private AllImages As IEnumerable(Of AnyBitmap) = pdf.ExtractAllImages()

' Else combine above both functionality using PageCount
For index = 0 To pdf.PageCount - 1
	Dim Text As String = pdf.ExtractTextFromPage(index)
	Dim Images As IEnumerable(Of AnyBitmap) = pdf.ExtractImagesFromPage(index)
Next index
VB   C#

Sortie

Nous avons utilisé un formulaire C# pour vous montrer le résultat parfait de la lecture du contenu du PDF. Avec cette approche, tout est question de simplicité et d'utilisation d'un minimum de code pour répondre aux besoins de votre projet.

~ PDF ~

~ C# Form ~


Accès rapide à la bibliothèque

Documentation related to Accès rapide à la bibliothèque

Documentation de la bibliothèque

La documentation relative à la bibliothèque IronPDF est disponible dans la référence API, que vous pouvez explorer et partager.

Documentation de référence de l'API IronPDF