Test dans un environnement réel
Test en production sans filigrane.
Fonctionne partout où vous en avez besoin.
Cet article explorera comment extraire des images d'un document PDF existant et les enregistrer dans un seul dossier en utilisant le langage de programmation Java. À cet effet, la bibliothèque IronPDF for Java est utilisée pour extraire des images.
IronPDF est une bibliothèque Java conçue pour aider les développeurs à générer, modifier etextraire des données à partir de fichiers PDFdans leurs applications Java. Avec IronPDF, vous pouvez créer des documents PDF à partir de diverses sources, telles que HTML, des images, et plus encore. De plus, vous avez la possibilité defusionner, diviser, et manipuler des PDF existants. IronPDF inclut également des fonctionnalités de sécurité, telles queprotection par mot de passe etsignatures numériques.
Développé et maintenu par Iron Software, IronPDF est connu pour sa capacité à extraire du texte à partir de PDF, HTML et URL. Il s'agit donc d'un outil polyvalent et puissant pour un grand nombre d'applications, que vous créiez des PDF à partir de zéro ou que vous travailliez sur des PDF existants.
Avant d'utiliser IronPDF pour extraire des données d'un fichier PDF, quelques conditions préalables doivent être remplies :
Installation de Java: Assurez-vous que Java est installé sur votre système et que son chemin d'accès a été défini dans les variables d'environnement. Si vous n'avez pas encore installé Java, suivez les instructions à l'adresse suivantepage de téléchargement du site Java.
Java IDE: Avoir soit Eclipse soit IntelliJ installé comme votre IDE Java. Vous pouvez télécharger Eclipse à partir de ce lienprivilège et IntelliJ à partir de ceciPage de téléchargement.
Bibliothèque IronPDF: Téléchargez et ajoutez la bibliothèque IronPDF à votre projet en tant que dépendance. Pour les instructions d'installation, visitez le siteSite web d'IronPDF.
L'installation d'IronPDF for Java est un processus simple, à condition que toutes les conditions requises soient remplies. Ce guide utilisera JetBrains IntelliJ IDEA pour démontrer l'installation et exécuter du code exemple.
Voici ce qu'il faut faire :
Lancer IntelliJ IDEA : Ouvrez JetBrains IntelliJ IDEA sur votre système.
Créer un projet Maven : Dans IntelliJ IDEA, créer un nouveau projet Maven. Ceci fournira un environnement approprié pour l'installation d'IronPDF for Java.
Créer un nouveau projet Maven
Une nouvelle fenêtre apparaît. Saisissez le nom du projet et cliquez sur Terminer.
Entrez le nom du projet
Après avoir cliqué sur Terminer, un nouveau projet s'ouvrira sur un fichier pom.xml
pour ajouter les dépendances Maven de IronPDF for Java.
Ensuite, ajoutez les dépendances suivantes dans le fichier pom.xml
ou vous pouvez télécharger le fichier JAR depuis le lien suivantDépôt Maven.
<dependency>
<groupId>com.ironsoftware</groupId>
<artifactId>com.ironsoftware</artifactId>
<version>2024.11.4</version>
</dependency>
Une fois que vous placez les dépendances dans le fichier pom.xml
, une petite icône apparaîtra dans le coin supérieur droit du fichier.
Le fichier pom.xml avec une petite icône pour installer les dépendances
Cliquez sur cette icône pour installer les dépendances Maven d'IronPDF for Java. Cela ne prendra que quelques minutes en fonction de votre connexion internet.
Vous pouvez extraire des images d'un document PDF en utilisant IronPDF avec une seule méthode appelée.[extractAllImages
](/java/object-reference/api/com/ironsoftware/ironpdf/PdfDocument.html#extractAllImages()). Cette méthode renvoie toutes les images disponibles dans un fichier PDF. Ensuite, vous pouvez enregistrer toutes les images extraites dans le chemin de fichier de votre choix à l'aide de la méthode ImageIO.write
en fournissant le chemin et le format de l'image de sortie.
Dans l'exemple ci-dessous, les images d'un document PDF seront extraites et sauvegardées dans le système de fichiers en tant qu'images PNG.
import com.ironsoftware.ironpdf.PdfDocument;
import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.nio.file.Files;
import java.nio.file.Paths;
import java.util.List;
public class main {
public static void main(String[] args) throws Exception {
PdfDocument pdf = PdfDocument.fromFile(Paths.get("Final Project Report Craft Arena.pdf"));
List<BufferedImage> images = pdf.extractAllImages();
int i = 0;
for (BufferedImage image : images) {
ImageIO.write(image, "PNG", Files.newOutputStream(Paths.get("image" + ++i + ".png")));
}
}
}
Le programme ci-dessus ouvre le fichier "Final Project Report Craft Arena.pdf" et utilise la méthode extractAllImages
pour extraire toutes les images du fichier dans une liste d'objets BufferedImage
. Il enregistre ensuite chaque nouvelle image dans des fichiers PNG distincts portant un nom unique.
Extraction d'images à partir du fichier PDF
Cette section expliquera comment extraire des images directement à partir des URLs. Dans le code ci-dessous, l'URL est convertie en page PDF, puis la navigation est basculée pour extraire les images du PDF.
import com.ironsoftware.ironpdf.PdfDocument;
import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.io.IOException;
import java.nio.file.Files;
import java.nio.file.Paths;
import java.util.List;
public class main {
public static void main(String[] args) throws IOException {
PdfDocument pdf = PdfDocument.renderUrlAsPdf("https://www.amazon.com/?tag=hp2-brobookmark-us-20");
List<BufferedImage> images = pdf.extractAllImages();
int i = 0;
for (BufferedImage image : images) {
ImageIO.write(image, "PNG", Files.newOutputStream(Paths.get("image" + ++i + ".png")));
}
}
}
Dans le code ci-dessus, l'URL de la page d'accueil d'Amazon est fournie en entrée, et elle renvoie 74 images.
Extraction d'images à partir du fichier PDF
L'extraction d'images d'un document PDF peut être réalisée en Java à l'aide de la bibliothèque IronPDF. Pour installer IronPDF, vous devez disposer de Java, d'un IDE Java(Eclipse ou IntelliJ)maven, et la bibliothèque IronPDF installée et intégrée à votre projet. Le processus d'extraction des images d'un document PDF à l'aide d'IronPDF est simple et ne nécessite qu'un seul appel à la méthode extractAllImages
. Vous pouvez ensuite enregistrer les images dans un fichier de votre choix en utilisant la méthode ImageIO.write
.
Cet article fournit un guide étape par étape pourcomment extraire des images à partir d'un document PDF à l'aide de Java et de la bibliothèque IronPDF. De plus amples informations, notamment sur la manière d'extraire du texte des PDF, sont disponibles dans la rubriqueExemple de code d'extraction de texte.
IronPDF est une bibliothèque dotée d'unlicence commercialeà partir de $749. Cependant, vous pouvez l'évaluer en production avecun essai gratuit.
9 produits de l'API .NET pour vos documents de bureau