從 PDF 提取圖像

作為IronPDF廣泛的PDF創建和編輯功能的一部分,IronPDF還透過其內容提取方法促進對PDF文件內容的細粒度處理。

extractAllImages 返回一個集合,其中包含嵌入在 PDF 文件中的所有圖像,每個都被格式化為 BufferedImage 對象。

最常見的商業用例是將PDF圖像保存在單独的文件中。 上面的代碼示例展示了一種使用extractAllImages方法及Java ImageIO類來實現此功能的方法。

IronPDF 也可以以原始位元組形式從 PDF 中提取圖像。 為此,請改用extractAllRawImages方法。

也可以從部分PDF頁面擷取圖像(而不是整個文件)。 以下簡短的程式碼片段使用extractAllImagesFromPages方法來從樣本文件的第3頁和第7頁提取圖像。

PdfDocument document = PdfDocument.fromFile(Paths.get("sample.pdf"));  
List<BufferedImage> pageRangeImages = document.extractAllImagesFromPages(PageSelection.pageRange(3, 7));
PdfDocument document = PdfDocument.fromFile(Paths.get("sample.pdf"));  
List<BufferedImage> pageRangeImages = document.extractAllImagesFromPages(PageSelection.pageRange(3, 7));
JAVA