UTILISATION D'IRONPDF FOR JAVA

Comment lire un fichier PDF en Java ?

Mise à jour septembre 1, 2024
Partager:

Cet article explorera comment créer un lecteur PDF pour ouvrir un fichier PDF dans votre application logicielle par programmation. Pour accomplir cette tâche efficacement, IronPDF for Java est l'une de ces bibliothèques système qui permet d'ouvrir et de lire des fichiers PDF à l'aide du nom de fichier dans les programmes Java.

IronPDF

LesIronPDF for Java - Bibliothèque Javaest construit sur le cadre déjà réussi de .NET Framework. Cela fait de IronPDF un outil polyvalent pour travailler avec des documents PDF par rapport à d'autres bibliothèques de classes telles qu'Apache PDFBox. Il offre la possibilité deextraire et analyser le contenu, charger du texte et charger des images. Il offre également des options pour personnaliser les pages PDF telles quemise en page, marges,l'en-tête et le pied de page, orientation des pageset bien d'autres choses encore.

En plus de cela, IronPDF prend également en charge la conversion d'autres formats de fichiers, la protection des PDFs par mot de passe, la signature numérique, la fusion et la division des documents PDF.

Comment lire des fichiers PDF en Java ?

Conditions préalables

Pour utiliser IronPDF afin de créer un lecteur PDF Java, il est nécessaire de s'assurer que les composants suivants sont installés sur l'ordinateur :

  1. JDK - Le kit de développement Java est nécessaire pour construire et exécuter des programmes Java. S'il n'est pas installé, téléchargez-le depuis leSite web d'Oracle.

  2. IDE - Un environnement de développement intégré est un logiciel qui aide à écrire, éditer et déboguer un programme. Téléchargez n'importe quel IDE pour Java, par exemple Eclipse, NetBeans, IntelliJ.

  3. Maven - Maven est un outil d'automatisation qui aide à télécharger des bibliothèques depuis le Central Repository. Téléchargez-le à partir de la pageSite web d'Apache Maven.

  4. IronPDF - Enfin, IronPDF est nécessaire pour lire le fichier PDF en Java. Il doit être ajouté en tant que dépendance dans votre projet Java Maven. Incluez l'artefact IronPDF ainsi que la dépendance slf4j dans le fichier pom.xml comme indiqué dans l'exemple ci-dessous :
<dependency>
   <groupId>com.ironsoftware</groupId>
   <artifactId>com.ironsoftware</artifactId>
   <version>2024.11.4</version>
</dependency>

Ajout des importations nécessaires

Tout d'abord, ajoutez le code suivant au fichier source Java pour référencer toutes les méthodes requises d'IronPDF. L'importation d'org est facultative dans cet exemple.

import com.ironsoftware.ironpdf.*;
JAVA

Ensuite, configurez IronPDF avec une clé de licence valide pour utiliser sa méthode. Invoquez la méthode setLicenseKey dans la méthode principale.

License.setLicenseKey("Your license key");
JAVA

Remarque : Vous pouvez obtenir une clé de licence d'essai gratuite pour créer, lire et imprimer des PDF.

Lire un fichier PDF existant en Java

Pourlire des fichiers PDFles fichiers PDF doivent être disponibles ou peuvent être créés. Cet article utilisera un fichier PDF déjà créé. Le code est simple et consiste en un processus en deux étapes pour extraire le texte du document.

PdfDocument pdf = PdfDocument.fromFile(Paths.get("assets/sample.pdf"));
String text = pdf.extractAllText();
System.out.println(text);
JAVA

Dans le code ci-dessus,fromFileouvre un document PDF. La méthode Paths.get obtient le répertoire du fichier et est prête à extraire le contenu du fichier. Ensuite,[extraireToutLeTexte](/java/object-reference/api/com/ironsoftware/ironpdf/PdfDocument.html#extractAllText())lit tout le texte du document.

Le résultat est le suivant :

Comment lire un fichier PDF en Java, Figure 1 : Sortie du texte de lecture PDF

Lecture de la sortie de texte PDF

Lire le texte d'une page spécifique

IronPDF peut également lire le contenu d'une page spécifique d'un PDF. La méthode extractTextFromPage utilise un objet PageSelection pour accepter une série de pages(s) à partir duquel le texte sera lu.

Dans l'exemple suivant, le texte est extrait de la deuxième page du document PDF. PageSelection.singlePage prend l'index de la page à extraire.

PdfDocument pdf = PdfDocument.fromFile(Paths.get("assets/sample.pdf"));
String text = pdf.extractTextFromPage(PageSelection.singlePage(1));
System.out.println(text);
JAVA

Comment lire un fichier PDF en Java, Figure 2 : Lecture de texte PDF

Lecture de la sortie de texte PDF

D'autres méthodes disponibles dans la classe PageSelection qui peuvent être utilisées pour extraire du texte de différentes pages incluent :[firstPage](/java/objet-reference/api/com/ironsoftware/ironpdf/edit/PageSelection.html#lastPage()), [lastPage](/java/objet-reference/api/com/ironsoftware/ironpdf/edit/PageSelection.html#firstPage()), pageRangeet[allPages](/java/objet-reference/api/com/ironsoftware/ironpdf/edit/PageSelection.html#allPages()).

Lire le texte d'un fichier PDF nouvellement généré

Le texte de recherche peut également être effectué à partir d'un fichier PDF nouvellement généré à partir d'un fichier HTML ou d'une URL. L'exemple de code suivant génère des PDF à partir d'une URL et extrait tout le texte du site web.

PdfDocument pdf = PdfDocument.renderUrlAsPdf("https://unsplash.com/");
String text = pdf.extractAllText();
System.out.println("Text extracted from the website: " + text);
JAVA

Comment lire un fichier PDF en Java, Figure 2 : Lire depuis un nouveau fichier

Lire depuis un nouveau fichier

IronPDF peut également être utilisé pourextraire des images à partir de fichiers PDF.

Le code complet est le suivant :

import com.ironsoftware.ironpdf.License;
import com.ironsoftware.ironpdf.PdfDocument;
import com.ironsoftware.ironpdf.edit.PageSelection;

import java.io.IOException;
import java.nio.file.Paths;

public class Main {
    public static void main(String[] args) throws IOException {

        License.setLicenseKey("YOUR LICENSE KEY HERE");

        PdfDocument pdf = PdfDocument.fromFile(Paths.get("assets/sample.pdf"));
        String text = pdf.extractTextFromPage(PageSelection.singlePage(1));
        System.out.println(text);

        pdf = PdfDocument.renderUrlAsPdf("https://unsplash.com/");
        text = pdf.extractAllText();
        System.out.println("Text extracted from the website: " + text);

    }
}
JAVA

Résumé

Cet article explique comment ouvrir et lire des PDF en Java en utilisant IronPDF.

IronPDF permet de créer facilement des PDF à partir de HTML ou d'URL et de les convertir à partir de différents formats de fichiers. Il permet également d'effectuer des tâches PDF rapidement et facilement.

Essayez IronPDF pour30 jours d'essai gratuitet découvrez comment cela fonctionne pour vous en production. Explorer les options de licences commerciales pour IronPDF qui ne commencent qu'à partir de $749.

< PRÉCÉDENT
Comment diviser des fichiers PDF en Java
SUIVANT >
HTML2PDF Java (Tutoriel d'exemple de code)

Prêt à commencer ? Version : 2024.11 vient de paraître

Téléchargement gratuit de Maven Voir les licences > ;