Lire les fichiers PDF en C#

La méthode PdfDocument.ExtractAllText de la bibliothèque PDF IronPDF C# est parfaite pour les tâches de lecture de texte PDF basiques. Cette méthode gère les écarts d'espacement et de codage dans les documents PDF source sans aucun problème.

PdfDocument.ExtractTextFromPage lit le texte à partir de pages spécifiques d'un PDF. Dans l'exemple ci-dessous, nous le voyons utilisé de manière itérative pour récupérer le contenu textuel d'une plage spécifique de pages.

IronPDF peut également extraire des images brutes à partir de PDFs. Pour cela, utilisez l'une des méthodes de la classe PdfDocument ci-dessous :

  • ExtractAllImages : retourne toutes les images intégrées dans un PDF sous forme d'objets IronSoftware.Drawing.AnyBitmap.
  • ExtractAllRawImages : récupère toutes les images intégrées sous forme de liste d'octets bruts (byte[]).
  • ExtractImagesFromPage : extrait les images contenues sur une page indexée.
  • ExtractImagesFromPages : identique à ExtractImagesFromPage, mais à partir d'un intervalle de pages spécifique ou d'une liste de pages individuelles.
  • ExtractRawImagesFromPage et ExtractRawImagesFromPages : fonctionne de la même manière que les deux méthodes précédentes, mais retourne les images extraites sous forme de tableaux d'octets au lieu d'objets IronSoftware.Drawing.AnyBitmap.
class="hsg-featured-snippet">

Comment lire des fichiers PDF en C#

  1. Téléchargez la bibliothèque IronPDF pour C#
  2. Extraire des images ou du texte d'un PDF
  3. Lire et trouver des mots dans des documents spécifiques
  4. Afficher la sortie PDF de votre document original

En savoir plus sur la méthode ExtractTextFromPage

Prêt à commencer?
Nuget Téléchargements 16,154,058 | Version : 2025.11 vient de sortir