Extraire des images d'un PDF

Dans le cadre de la vaste collection de fonctions de création et d'édition de PDF d'IronPDF, IronPDF facilite également le traitement granulaire du contenu d'un document PDF grâce à ses méthodes d'extraction de contenu.

La méthode extractAllImages renvoie une collection de toutes les images intégrées dans un document PDF, chacune formatée sous la forme d'un objet BufferedImage.

Le cas d'utilisation professionnel le plus courant consiste à enregistrer les images PDF dans des fichiers séparés. L'exemple de code présenté ci-dessus démontre une méthode pour accomplir cela en utilisant la méthode extractAllImages avec la classe Java ImageIO.

IronPDF peut également extraire les images des PDF sous leur forme brute d'octets. Pour cela, utilisez plutôt la méthode extractAllRawImages.

Il est également possible d'extraire des images d'un sous-ensemble de pages PDF (comme opposé à l'intégralité du document). Le bref extrait de code ci-dessous utilise la méthode extractAllImagesFromPages pour extraire les images des pages 3 et 7 d'un document d'exemple.

PdfDocument document = PdfDocument.fromFile(Paths.get("sample.pdf"));  
List<BufferedImage> pageRangeImages = document.extractAllImagesFromPages(PageSelection.pageRange(3, 7));
PdfDocument document = PdfDocument.fromFile(Paths.get("sample.pdf"));  
List<BufferedImage> pageRangeImages = document.extractAllImagesFromPages(PageSelection.pageRange(3, 7));
JAVA