Bilder aus PDF extrahieren

Als Teil von IronPDFs umfangreicher Sammlung von PDF-Erstellungs- und Bearbeitungsfunktionen erleichtert IronPDF auch die granulare Verarbeitung des Inhalts eines PDF-Dokuments durch seine Inhaltsextraktionsmethoden.

Die Methode extractAllImages gibt eine Sammlung aller in einem PDF-Dokument eingebetteten Bilder zurück, wobei jedes Bild als BufferedImage-Objekt formatiert ist.

Der häufigste geschäftliche Anwendungsfall ist die Speicherung von PDF-Bildern in separaten Dateien. Das oben vorgestellte Codebeispiel demonstriert eine Methode, um dies mithilfe der extractAllImages-Methode zusammen mit der Java ImageIO-Klasse zu erreichen.

IronPDF kann auch Bilder aus PDFs in ihrer Rohbyte-Form ziehen. Verwenden Sie stattdessen die Methode extractAllRawImages.

Es ist auch möglich, Bilder aus einem Teil der PDF-Seiten (und nicht aus dem gesamten Dokument) zu extrahieren. Der kurze Code-Schnipsel unten verwendet die extractAllImagesFromPages-Methode, um die Bilder von den Seiten 3 und 7 eines Beispieldokuments zu extrahieren.

PdfDocument document = PdfDocument.fromFile(Paths.get("sample.pdf"));  
List<BufferedImage> pageRangeImages = document.extractAllImagesFromPages(PageSelection.pageRange(3, 7));
PdfDocument document = PdfDocument.fromFile(Paths.get("sample.pdf"));  
List<BufferedImage> pageRangeImages = document.extractAllImagesFromPages(PageSelection.pageRange(3, 7));
JAVA