從 PDF 提取圖像

作為IronPDF廣泛的PDF創建和編輯功能的一部分,IronPDF還通過其內容提取方法促進對PDF文檔內容的細粒度處理。

extractAllImages返回嵌入在PDF文檔中的所有圖像的集合,每個圖像都格式化為BufferedImage對象。

最常見的業務用例是將PDF圖像保存為單獨的文件。上面顯示的代碼示例演示了使用extractAllImages方法和Java ImageIO類來實現此方法。

IronPDF還可以從PDF中提取圖像的原始字節形式。為此,請改用extractAllRawImages方法。

還可以從PDF頁面的子集提取圖像。 (而不是整份文件)簡短的程式碼片段如下,使用 extractAllImagesFromPages 方法從範例文件的第3頁和第7頁提取圖片。

PdfDocument document = PdfDocument.fromFile(Paths.get("sample.pdf"));  
List<BufferedImage> pageRangeImages = document.extractAllImagesFromPages(PageSelection.pageRange(4, 8);
JAVA