UTILISATION D'IRONPDF FOR JAVA

Comment extraire une image d'un fichier PDF en Java ?

Mise à jour septembre 1, 2024
Partager:

Cet article explorera comment extraire des images d'un document PDF existant et les enregistrer dans un seul dossier en utilisant le langage de programmation Java. À cet effet, la bibliothèque IronPDF for Java est utilisée pour extraire des images.

IronPDF for Java PDF Library (Bibliothèque PDF Java)

IronPDF est une bibliothèque Java conçue pour aider les développeurs à générer, modifier etextraire des données à partir de fichiers PDFdans leurs applications Java. Avec IronPDF, vous pouvez créer des documents PDF à partir de diverses sources, telles que HTML, des images, et plus encore. De plus, vous avez la possibilité defusionner, diviser, et manipuler des PDF existants. IronPDF inclut également des fonctionnalités de sécurité, telles queprotection par mot de passe etsignatures numériques.

Développé et maintenu par Iron Software, IronPDF est connu pour sa capacité à extraire du texte à partir de PDF, HTML et URL. Il s'agit donc d'un outil polyvalent et puissant pour un grand nombre d'applications, que vous créiez des PDF à partir de zéro ou que vous travailliez sur des PDF existants.

Conditions préalables

Avant d'utiliser IronPDF pour extraire des données d'un fichier PDF, quelques conditions préalables doivent être remplies :

  1. Installation de Java: Assurez-vous que Java est installé sur votre système et que son chemin d'accès a été défini dans les variables d'environnement. Si vous n'avez pas encore installé Java, suivez les instructions à l'adresse suivantepage de téléchargement du site Java.

  2. Java IDE: Avoir soit Eclipse soit IntelliJ installé comme votre IDE Java. Vous pouvez télécharger Eclipse à partir de ce lienprivilège et IntelliJ à partir de ceciPage de téléchargement.

  3. Bibliothèque IronPDF: Téléchargez et ajoutez la bibliothèque IronPDF à votre projet en tant que dépendance. Pour les instructions d'installation, visitez le siteSite web d'IronPDF.

  4. Installation de Maven: Assurez-vous que Maven est installé et intégré à votre IDE avant de commencer le processus de conversion PDF. Suivez le tutoriel à l'adresse suivanteguide de JetBrains pour obtenir de l'aide sur l'installation et l'intégration de Maven.

Installation d'IronPDF for Java

L'installation d'IronPDF for Java est un processus simple, à condition que toutes les conditions requises soient remplies. Ce guide utilisera JetBrains IntelliJ IDEA pour démontrer l'installation et exécuter du code exemple.

Voici ce qu'il faut faire :

Lancer IntelliJ IDEA : Ouvrez JetBrains IntelliJ IDEA sur votre système.

Créer un projet Maven : Dans IntelliJ IDEA, créer un nouveau projet Maven. Ceci fournira un environnement approprié pour l'installation d'IronPDF for Java.

Comment extraire une image d'un PDF en Java, Figure 1 : Créer un nouveau projet Maven

Créer un nouveau projet Maven

Une nouvelle fenêtre apparaît. Saisissez le nom du projet et cliquez sur Terminer.

Comment extraire une image d'un PDF en Java, Figure 2 : Entrez le nom du projet

Entrez le nom du projet

Après avoir cliqué sur Terminer, un nouveau projet s'ouvrira sur un fichier pom.xml pour ajouter les dépendances Maven de IronPDF for Java.

Ensuite, ajoutez les dépendances suivantes dans le fichier pom.xml ou vous pouvez télécharger le fichier JAR depuis le lien suivantDépôt Maven.

<dependency>
   <groupId>com.ironsoftware</groupId>
   <artifactId>com.ironsoftware</artifactId>
   <version>2024.11.4</version>
</dependency>

Une fois que vous placez les dépendances dans le fichier pom.xml, une petite icône apparaîtra dans le coin supérieur droit du fichier.

Comment extraire une image d’un PDF en Java, Figure 3 : Le fichier pom.xml avec une petite icône pour installer les dépendances

Le fichier pom.xml avec une petite icône pour installer les dépendances

Cliquez sur cette icône pour installer les dépendances Maven d'IronPDF for Java. Cela ne prendra que quelques minutes en fonction de votre connexion internet.

Extraire des images

Vous pouvez extraire des images d'un document PDF en utilisant IronPDF avec une seule méthode appelée.[extractAllImages](/java/object-reference/api/com/ironsoftware/ironpdf/PdfDocument.html#extractAllImages()). Cette méthode renvoie toutes les images disponibles dans un fichier PDF. Ensuite, vous pouvez enregistrer toutes les images extraites dans le chemin de fichier de votre choix à l'aide de la méthode ImageIO.write en fournissant le chemin et le format de l'image de sortie.

5.1. Extraire des images d'un document PDF

Dans l'exemple ci-dessous, les images d'un document PDF seront extraites et sauvegardées dans le système de fichiers en tant qu'images PNG.

import com.ironsoftware.ironpdf.PdfDocument;

import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.nio.file.Files;
import java.nio.file.Paths;
import java.util.List;

public class main {
    public static void main(String[] args) throws Exception {
        PdfDocument pdf = PdfDocument.fromFile(Paths.get("Final Project Report Craft Arena.pdf"));

        List<BufferedImage> images = pdf.extractAllImages();
        int i = 0;
        for (BufferedImage image : images) {
            ImageIO.write(image, "PNG", Files.newOutputStream(Paths.get("image" + ++i + ".png")));
        }
    }
}
JAVA

Le programme ci-dessus ouvre le fichier "Final Project Report Craft Arena.pdf" et utilise la méthode extractAllImages pour extraire toutes les images du fichier dans une liste d'objets BufferedImage. Il enregistre ensuite chaque nouvelle image dans des fichiers PNG distincts portant un nom unique.

Comment extraire une image d'un PDF en Java, Figure 4 : Extraction d'image à partir du rendu PDF

Extraction d'images à partir du fichier PDF

Extraire les images à partir de l'URL

Cette section expliquera comment extraire des images directement à partir des URLs. Dans le code ci-dessous, l'URL est convertie en page PDF, puis la navigation est basculée pour extraire les images du PDF.

import com.ironsoftware.ironpdf.PdfDocument;

import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.io.IOException;
import java.nio.file.Files;
import java.nio.file.Paths;
import java.util.List;

public class main {
    public static void main(String[] args) throws IOException {
        PdfDocument pdf = PdfDocument.renderUrlAsPdf("https://www.amazon.com/?tag=hp2-brobookmark-us-20");

        List<BufferedImage> images = pdf.extractAllImages();
        int i = 0;
        for (BufferedImage image : images) {
            ImageIO.write(image, "PNG", Files.newOutputStream(Paths.get("image" + ++i + ".png")));
        }
    }
}
JAVA

Dans le code ci-dessus, l'URL de la page d'accueil d'Amazon est fournie en entrée, et elle renvoie 74 images.

Comment extraire une image d'un PDF en Java, Figure 5 : Extraction d'image à partir du résultat PDF

Extraction d'images à partir du fichier PDF

Conclusion

L'extraction d'images d'un document PDF peut être réalisée en Java à l'aide de la bibliothèque IronPDF. Pour installer IronPDF, vous devez disposer de Java, d'un IDE Java(Eclipse ou IntelliJ)maven, et la bibliothèque IronPDF installée et intégrée à votre projet. Le processus d'extraction des images d'un document PDF à l'aide d'IronPDF est simple et ne nécessite qu'un seul appel à la méthode extractAllImages. Vous pouvez ensuite enregistrer les images dans un fichier de votre choix en utilisant la méthode ImageIO.write.

Cet article fournit un guide étape par étape pourcomment extraire des images à partir d'un document PDF à l'aide de Java et de la bibliothèque IronPDF. De plus amples informations, notamment sur la manière d'extraire du texte des PDF, sont disponibles dans la rubriqueExemple de code d'extraction de texte.

IronPDF est une bibliothèque dotée d'unlicence commercialeà partir de $749. Cependant, vous pouvez l'évaluer en production avecun essai gratuit.

< PRÉCÉDENT
Comment générer un fichier PDF en Java ?
SUIVANT >
Comment extraire des données d'un fichier PDF en Java ?

Prêt à commencer ? Version : 2024.11 vient de paraître

Téléchargement gratuit de Maven Voir les licences > ;