Extraire des images d'un PDF

Dans le cadre de la vaste collection de fonctions de création et d'édition de PDF d'IronPDF, IronPDf facilite également le traitement granulaire du contenu d'un document PDF grâce à ses méthodes d'extraction de contenu.

La fonction extractAllImages renvoie une collection de toutes les images incorporées dans un document PDF, chacune étant formatée comme un objet BufferedImage.

Le cas d'utilisation professionnel le plus courant consiste à enregistrer les images PDF dans des fichiers séparés. L'exemple de code ci-dessus montre une méthode pour y parvenir en utilisant la méthode extractAllImages avec la classe Java ImageIO.

IronPDF peut également extraire les images des PDF sous leur forme brute d'octets. Pour cela, utilisez plutôt la méthode extractAllRawImages.

Il est également possible d'extraire des images d'un sous-ensemble de pages PDF (par opposition à l'ensemble du document). Le bref extrait de code ci-dessous utilise la méthode extractAllImagesFromPages pour extraire les images des pages 3 et 7 d'un document type.

PdfDocument document = PdfDocument.fromFile(Paths.get("sample.pdf"));  
List<BufferedImage> pageRangeImages = document.extractAllImagesFromPages(PageSelection.pageRange(4, 8);
JAVA