Extraire des images d'un PDF
Dans le cadre de la vaste collection de fonctions de création et d'édition de PDF d'IronPDF, IronPDF facilite également le traitement granulaire du contenu d'un document PDF grâce à ses méthodes d'extraction de contenu.
La méthode extractAllImages
renvoie une collection de toutes les images intégrées dans un document PDF, chacune formatée sous la forme d'un objet BufferedImage
.
Le cas d'utilisation professionnel le plus courant consiste à enregistrer les images PDF dans des fichiers séparés. L'exemple de code présenté ci-dessus démontre une méthode pour accomplir cela en utilisant la méthode extractAllImages
avec la classe Java ImageIO
.
IronPDF peut également extraire les images des PDF sous leur forme brute d'octets. Pour cela, utilisez plutôt la méthode extractAllRawImages
.
Il est également possible d'extraire des images d'un sous-ensemble de pages PDF (comme opposé à l'intégralité du document). Le bref extrait de code ci-dessous utilise la méthode extractAllImagesFromPages
pour extraire les images des pages 3 et 7 d'un document d'exemple.
PdfDocument document = PdfDocument.fromFile(Paths.get("sample.pdf"));
List<BufferedImage> pageRangeImages = document.extractAllImagesFromPages(PageSelection.pageRange(3, 7));
PdfDocument document = PdfDocument.fromFile(Paths.get("sample.pdf"));
List<BufferedImage> pageRangeImages = document.extractAllImagesFromPages(PageSelection.pageRange(3, 7));
Comment extraire des images d'un fichier PDF en Java ?
- Installer la bibliothèque Java IronPDF
- Utilisez la méthode `extractAllImages` pour extraire des images d'un PDF
- Interroger chaque image de l'objet de la collection d'images
- Exporter les images extraites avec la méthode `write` en Java
- Effectuer l'extraction sans affecter le PDF original