Extraire des images d'un PDF
Dans le cadre de la vaste collection de fonctions de création et d'édition de PDF d'IronPDF, IronPDf facilite également le traitement granulaire du contenu d'un document PDF grâce à ses méthodes d'extraction de contenu.
La fonction extractAllImages
renvoie une collection de toutes les images incorporées dans un document PDF, chacune étant formatée comme un objet BufferedImage
.
Le cas d'utilisation professionnel le plus courant consiste à enregistrer les images PDF dans des fichiers séparés. L'exemple de code ci-dessus montre une méthode pour y parvenir en utilisant la méthode extractAllImages
avec la classe Java ImageIO
.
IronPDF peut également extraire les images des PDF sous leur forme brute d'octets. Pour cela, utilisez plutôt la méthode extractAllRawImages
.
Il est également possible d'extraire des images d'un sous-ensemble de pages PDF (par opposition à l'ensemble du document). Le bref extrait de code ci-dessous utilise la méthode extractAllImagesFromPages
pour extraire les images des pages 3 et 7 d'un document type.
PdfDocument document = PdfDocument.fromFile(Paths.get("sample.pdf"));
List<BufferedImage> pageRangeImages = document.extractAllImagesFromPages(PageSelection.pageRange(4, 8);
Comment extraire des images d'un fichier PDF en Java ?
- Installer la bibliothèque Java pour extraire les images du PDF
- Utiliser la méthode `extractAllImages` pour extraire les images du PDF
- Interroger chaque image de l'objet de la collection d'images
- Exporter les images extraites avec la méthode `write` en Java
- Effectuer l'extraction sans affecter le PDF original