UTILISATION D'IRONPDF FOR JAVA

Comment lire un fichier PDF en Java ?

Mise à jour août 25, 2024
Partager:

La lecture d'un document PDF en Java peut faire partie intégrante de n'importe quel projet, qu'il s'agisse d'applications commerciales ou d'analyses de données. Avec la bibliothèque IronPDF, il est devenu plus facile que jamais d'intégrer des capacités de traitement de fichiers PDF dans vos projets Java.

IronPDF : Importation de la bibliothèque Java PDF

IronPDF for Java PDF library (bibliothèque PDF Java) est la solution parfaite pour les développeurs de logiciels qui ont besoin de produire des des PDF prêts à l'utilisation rapidement à partir de HTML. La bibliothèque fournit également des outils puissants de manipulation de documents permettant un contrôle dynamique sur mise en page, contenu et mise en forme.

Voyons comment lire un fichier PDF stocké à un chemin dans un programme Java en utilisant la bibliothèque IronPDF.

Lire des PDF à l'aide d'IronPDF

La première étape consiste à installer IronPDF en utilisant Maven, plus de détails peuvent être trouvés dans cette guide d'installation.

Installer IronPDF dans Maven

Voici les étapes pour installer IronPDF dans un projet Maven :

  1. Ouvrez votre projet Maven dans votre IDE préféré.
  2. Dans le fichier pom.xml, ajoutez la dépendance de la bibliothèque IronPDF dans la section dependencies.
    :ProductInstall
  1. Enregistrez le fichier pom.xml et laissez Maven télécharger et installer la bibliothèque IronPDF.

    Une fois l'installation terminée, vous devriez pouvoir importer et utiliser les classes suivantes d'IronPDF et les analyseurs Apache Tika dans votre projet.

Code Java pour lire un document PDF

Voici le code que vous pouvez utiliser pour lire le nouveau fichier avec ou sans limites tabulaires en utilisant la bibliothèque IronPDF.

import com.ironsoftware.ironpdf.*;
import java.io.IOException;
import java.nio.file.Paths;
public class Test {
    public static void main(String[] args) throws IOException {
    PdfDocument pdf = PdfDocument.fromFile(Paths.get("C:\\sample.pdf"));  
    String text = pdf.extractAllText();
    System.out.println(text);
    }
}
JAVA

Dans ce programme, le PdfDocument La classe de la bibliothèque IronPDF est utilisée pour lire le contenu d'un fichier PDF. La première ligne du programme importe les classes nécessaires de la bibliothèque IronPDF. La deuxième ligne importe la classe IOException de la bibliothèque standard de Java.

Le programme définit une classe publique nommée Test. Dans la classe, il y a une méthode public static nommée main qui prend un tableau de chaînes de caractères comme argument.


La méthode `main` utilise le 
``` [`fromFile`](/java/object-reference/api/com/ironsoftware/ironpdf/PdfDocument.html#fromFile(java.nio.file.Path)) méthode de la classe `PdfDocument` pour charger un fichier PDF situé à "C:\\sample.pdf". Cette méthode renvoie un objet `PdfDocument` qui représente le fichier PDF.

Une fois que le fichier PDF est chargé, le programme appelle le [`extraireToutLeTexte`](/java/object-reference/api/com/ironsoftware/ironpdf/PdfDocument.html#extractAllText()) méthode de la classe `PdfDocument` pour extraire tout le texte du fichier PDF. Cette méthode renvoie une `String` qui contient tout le texte du fichier PDF.

Le texte extrait est ensuite stocké dans une variable `String` nommée "text". Cette variable peut être utilisée pour traiter ou afficher le contenu du fichier PDF.

Enfin, le programme imprime le texte extrait sur la console à l'aide de la méthode `System.out.println`.

![Comment lire un fichier PDF en Java, Figure 1 : Résultat du programme](/static-assets/pdf/blog/java-read-pdf-tutorial/java-read-pdf-tutorial-1.webp) **Sortie du programme**

### Conclusion

IronPDF est une excellente solution pour lire des fichiers PDF dans le même chemin ou dans plusieurs chemins différents en Java, car il offre des performances élevées et de nombreuses fonctionnalités qui facilitent le développement de PDF. Sa syntaxe est simple et conviviale. Son API permet aux développeurs de créer rapidement le code dont ils ont besoin pour leurs projets.

[Licence d'IronPDF](/java/licensing/)  commencent à partir de $749, ce qui rend l'extraction de contenu accessible aux personnes disposant d'un budget limité. Dans l'ensemble, IronPDF constitue une excellente option pour tout développeur Java souhaitant travailler avec des PDF dans le cadre de la programmation d'applications Java.
< PRÉCÉDENT
Comment ajouter des signatures numériques aux PDF en Java
SUIVANT >
Comment faire pivoter un fichier PDF en Java

Installer avec Maven

Version : 2024.9.1

<dependency>
  <groupId>com.ironsoftware</groupId>
  <artifactId>ironpdf</artifactId>
  <version>2024.9.1</version>
</dependency>

Prêt à commencer ? Version : 2024.9 vient de paraître

Téléchargement gratuit de Maven Voir les licences > ;