import com.ironsoftware.ironpdf.*;
import java.io.IOException;
import java.nio.file.Paths;
// Apply your license key
License.setLicenseKey("YOUR-LICENSE-KEY");
// Set a log path
Settings.setLogPath(Paths.get("C:/tmp/IronPdfEngine.log"));
// Render the HTML as a PDF. Stored in myPdf as type PdfDocument;
PdfDocument myPdf = PdfDocument.renderHtmlAsPdf("<h1> ~Hello World~ </h1> Made with IronPDF!");
// Save the PdfDocument to a file
myPdf.saveAs(Paths.get("html_saved.pdf"));
Comment extraire une image d'un fichier PDF en Java ?
Mise à jour septembre 1, 2024
Partager:
Cet article explorera comment extraire des images d'un document PDF existant et les enregistrer dans un seul dossier en utilisant le langage de programmation Java. À cet effet, la bibliothèque IronPDF for Java est utilisée pour extraire des images.
Comment extraire une image d'un fichier PDF en Java ?
Vérifier les images extraites dans le répertoire spécifié
IronPDF for Java PDF Library (Bibliothèque PDF Java)
IronPDF est une bibliothèque Java conçue pour aider les développeurs à générer, modifier etextraire des données à partir de fichiers PDFdans leurs applications Java. Avec IronPDF, vous pouvez créer des documents PDF à partir de diverses sources, telles que HTML, des images, et plus encore. De plus, vous avez la possibilité defusionner, diviser, et manipuler des PDF existants. IronPDF inclut également des fonctionnalités de sécurité, telles queprotection par mot de passe etsignatures numériques.
Développé et maintenu par Iron Software, IronPDF est connu pour sa capacité à extraire du texte à partir de PDF, HTML et URL. Il s'agit donc d'un outil polyvalent et puissant pour un grand nombre d'applications, que vous créiez des PDF à partir de zéro ou que vous travailliez sur des PDF existants.
Conditions préalables
Avant d'utiliser IronPDF pour extraire des données d'un fichier PDF, quelques conditions préalables doivent être remplies :
Installation de Java: Assurez-vous que Java est installé sur votre système et que son chemin d'accès a été défini dans les variables d'environnement. Si vous n'avez pas encore installé Java, suivez les instructions à l'adresse suivantepage de téléchargement du site Java.
Java IDE: Avoir soit Eclipse soit IntelliJ installé comme votre IDE Java. Vous pouvez télécharger Eclipse à partir de ce lienprivilège et IntelliJ à partir de ceciPage de téléchargement.
Bibliothèque IronPDF: Téléchargez et ajoutez la bibliothèque IronPDF à votre projet en tant que dépendance. Pour les instructions d'installation, visitez le siteSite web d'IronPDF.
Installation de Maven: Assurez-vous que Maven est installé et intégré à votre IDE avant de commencer le processus de conversion PDF. Suivez le tutoriel à l'adresse suivanteguide de JetBrains pour obtenir de l'aide sur l'installation et l'intégration de Maven.
Installation d'IronPDF for Java
L'installation d'IronPDF for Java est un processus simple, à condition que toutes les conditions requises soient remplies. Ce guide utilisera JetBrains IntelliJ IDEA pour démontrer l'installation et exécuter du code exemple.
Voici ce qu'il faut faire :
Lancer IntelliJ IDEA : Ouvrez JetBrains IntelliJ IDEA sur votre système.
Créer un projet Maven : Dans IntelliJ IDEA, créer un nouveau projet Maven. Ceci fournira un environnement approprié pour l'installation d'IronPDF for Java.
Créer un nouveau projet Maven
Une nouvelle fenêtre apparaît. Saisissez le nom du projet et cliquez sur Terminer.
Entrez le nom du projet
Après avoir cliqué sur Terminer, un nouveau projet s'ouvrira sur un fichier pom.xml pour ajouter les dépendances Maven de IronPDF for Java.
Ensuite, ajoutez les dépendances suivantes dans le fichier pom.xml ou vous pouvez télécharger le fichier JAR depuis le lien suivantDépôt Maven.
Une fois que vous placez les dépendances dans le fichier pom.xml, une petite icône apparaîtra dans le coin supérieur droit du fichier.
Le fichier pom.xml avec une petite icône pour installer les dépendances
Cliquez sur cette icône pour installer les dépendances Maven d'IronPDF for Java. Cela ne prendra que quelques minutes en fonction de votre connexion internet.
Extraire des images
Vous pouvez extraire des images d'un document PDF en utilisant IronPDF avec une seule méthode appelée.[extractAllImages](/java/object-reference/api/com/ironsoftware/ironpdf/PdfDocument.html#extractAllImages()). Cette méthode renvoie toutes les images disponibles dans un fichier PDF. Ensuite, vous pouvez enregistrer toutes les images extraites dans le chemin de fichier de votre choix à l'aide de la méthode ImageIO.write en fournissant le chemin et le format de l'image de sortie.
5.1. Extraire des images d'un document PDF
Dans l'exemple ci-dessous, les images d'un document PDF seront extraites et sauvegardées dans le système de fichiers en tant qu'images PNG.
import com.ironsoftware.ironpdf.PdfDocument;
import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.nio.file.Files;
import java.nio.file.Paths;
import java.util.List;
public class main {
public static void main(String[] args) throws Exception {
PdfDocument pdf = PdfDocument.fromFile(Paths.get("Final Project Report Craft Arena.pdf"));
List<BufferedImage> images = pdf.extractAllImages();
int i = 0;
for (BufferedImage image : images) {
ImageIO.write(image, "PNG", Files.newOutputStream(Paths.get("image" + ++i + ".png")));
}
}
}
import com.ironsoftware.ironpdf.PdfDocument;
import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.nio.file.Files;
import java.nio.file.Paths;
import java.util.List;
public class main {
public static void main(String[] args) throws Exception {
PdfDocument pdf = PdfDocument.fromFile(Paths.get("Final Project Report Craft Arena.pdf"));
List<BufferedImage> images = pdf.extractAllImages();
int i = 0;
for (BufferedImage image : images) {
ImageIO.write(image, "PNG", Files.newOutputStream(Paths.get("image" + ++i + ".png")));
}
}
}
JAVA
Le programme ci-dessus ouvre le fichier "Final Project Report Craft Arena.pdf" et utilise la méthode extractAllImages pour extraire toutes les images du fichier dans une liste d'objets BufferedImage. Il enregistre ensuite chaque nouvelle image dans des fichiers PNG distincts portant un nom unique.
Extraction d'images à partir du fichier PDF
Extraire les images à partir de l'URL
Cette section expliquera comment extraire des images directement à partir des URLs. Dans le code ci-dessous, l'URL est convertie en page PDF, puis la navigation est basculée pour extraire les images du PDF.
import com.ironsoftware.ironpdf.PdfDocument;
import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.io.IOException;
import java.nio.file.Files;
import java.nio.file.Paths;
import java.util.List;
public class main {
public static void main(String[] args) throws IOException {
PdfDocument pdf = PdfDocument.renderUrlAsPdf("https://www.amazon.com/?tag=hp2-brobookmark-us-20");
List<BufferedImage> images = pdf.extractAllImages();
int i = 0;
for (BufferedImage image : images) {
ImageIO.write(image, "PNG", Files.newOutputStream(Paths.get("image" + ++i + ".png")));
}
}
}
import com.ironsoftware.ironpdf.PdfDocument;
import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.io.IOException;
import java.nio.file.Files;
import java.nio.file.Paths;
import java.util.List;
public class main {
public static void main(String[] args) throws IOException {
PdfDocument pdf = PdfDocument.renderUrlAsPdf("https://www.amazon.com/?tag=hp2-brobookmark-us-20");
List<BufferedImage> images = pdf.extractAllImages();
int i = 0;
for (BufferedImage image : images) {
ImageIO.write(image, "PNG", Files.newOutputStream(Paths.get("image" + ++i + ".png")));
}
}
}
JAVA
Dans le code ci-dessus, l'URL de la page d'accueil d'Amazon est fournie en entrée, et elle renvoie 74 images.
Extraction d'images à partir du fichier PDF
Conclusion
L'extraction d'images d'un document PDF peut être réalisée en Java à l'aide de la bibliothèque IronPDF. Pour installer IronPDF, vous devez disposer de Java, d'un IDE Java(Eclipse ou IntelliJ)maven, et la bibliothèque IronPDF installée et intégrée à votre projet. Le processus d'extraction des images d'un document PDF à l'aide d'IronPDF est simple et ne nécessite qu'un seul appel à la méthode extractAllImages. Vous pouvez ensuite enregistrer les images dans un fichier de votre choix en utilisant la méthode ImageIO.write.
Cet article fournit un guide étape par étape pourcomment extraire des images à partir d'un document PDF à l'aide de Java et de la bibliothèque IronPDF. De plus amples informations, notamment sur la manière d'extraire du texte des PDF, sont disponibles dans la rubriqueExemple de code d'extraction de texte.
IronPDF est une bibliothèque dotée d'unlicence commercialeà partir de $749. Cependant, vous pouvez l'évaluer en production avecun essai gratuit.
Jordi maîtrise parfaitement Python, C# et C++. Lorsqu'il ne met pas à profit ses compétences chez Iron Software, il se consacre à la programmation de jeux. Partageant des responsabilités en matière de tests de produits, de développement de produits et de recherche, Jordi apporte une valeur ajoutée considérable à l'amélioration continue des produits. Cette expérience variée le stimule et l'engage, et il dit que c'est l'un des aspects qu'il préfère dans son travail chez Iron Software. Jordi a grandi à Miami, en Floride, et a étudié l'informatique et les statistiques à l'université de Floride.
< PRÉCÉDENT Comment générer un fichier PDF en Java ?
SUIVANT > Comment extraire des données d'un fichier PDF en Java ?
Des millions d'ingénieurs dans le monde entier lui font confiance
Réservez une démo en direct gratuite
Réservez une démonstration personnelle de 30 minutes.
Pas de contrat, pas de détails de carte, pas d'engagements.
Voici ce à quoi vous pouvez vous attendre :
Une démonstration en direct de notre produit et de ses principales fonctionnalités
Obtenez des recommandations de fonctionnalités spécifiques au projet
Toutes vos questions trouvent réponse pour vous assurer de disposer de toutes les informations dont vous avez besoin. (Aucun engagement de votre part.)
CHOISIR L'HEURE
VOS INFORMATIONS
Réservez votre démo en direct gratuite
Fiable par plus de 2 millions d'ingénieurs dans le monde entier