從 PDF 提取圖像

作為IronPDF廣泛的PDF創建和編輯功能的一部分,IronPDF還透過其內容提取方法促進對PDF文件內容的細粒度處理。

extractAllImages 返回 PDF 文檔中嵌入的所有圖像的集合,每個圖像都格式化為 BufferedImage 對象。

最常見的商業用例是將PDF圖像保存在單独的文件中。 上述精選代碼示例演示了一種使用 extractAllImages 方法和 Java ImageIO 類來實現這一點的方法。

IronPDF 也可以以原始位元組形式從 PDF 中提取圖像。 請改用 extractAllRawImages 方法。

也可以從部分PDF頁面中提取圖像。(而不是整份文件). 下面的簡短代碼片段使用了 extractAllImagesFromPages 方法從示例文檔的第3頁和第7頁提取圖像。

PdfDocument document = PdfDocument.fromFile(Paths.get("sample.pdf"));  
List<BufferedImage> pageRangeImages = document.extractAllImagesFromPages(PageSelection.pageRange(3, 7));
JAVA