Extraire du texte d'un PDF

Dans le cadre de la vaste collection de fonctions de création et d'édition de PDF d'IronPDF, IronPDF facilite également le traitement granulaire du contenu d'un document PDF grâce à ses méthodes d'extraction de contenu.

La méthode extractAllText est disponible sur tous les objets PdfDocument. Le String renvoyé par extractAllText contient tout le texte présent sur chaque page du PDF.

Cette méthode est un moyen pratique d'effectuer l'extraction de texte de niveau document à partir de PDF contenant de nombreuses pages. Pour extraire du texte au niveau d'une page (c'est-à-dire uniquement à partir d'un ensemble spécifique de pages), utilisez plutôt la méthode extractTextFromPage.

Le court extrait de code ci-dessous extrait le texte de la première page d'un document PDF.

Explore the extractAllText Method in IronPDF Java Docs

Prêt à commencer?
Version : 2026.5 just released
Still Scrolling Icon

Vous faites encore défiler ?

Vous voulez une preuve rapidement ?
exécuter un échantillon Regardez votre code HTML se transformer en PDF.