從 PDF 提取圖像
作為IronPDF廣泛的PDF創建和編輯功能的一部分,IronPDF還通過其內容提取方法促進對PDF文檔內容的細粒度處理。
extractAllImages
返回嵌入在PDF文檔中的所有圖像的集合,每個圖像都格式化為BufferedImage
對象。
最常見的業務用例是將PDF圖像保存為單獨的文件。上面顯示的代碼示例演示了使用extractAllImages
方法和Java ImageIO
類來實現此方法。
IronPDF還可以從PDF中提取圖像的原始字節形式。為此,請改用extractAllRawImages
方法。
還可以從PDF頁面的子集提取圖像。 (而不是整份文件)簡短的程式碼片段如下,使用 extractAllImagesFromPages
方法從範例文件的第3頁和第7頁提取圖片。
PdfDocument document = PdfDocument.fromFile(Paths.get("sample.pdf"));
List<BufferedImage> pageRangeImages = document.extractAllImagesFromPages(PageSelection.pageRange(4, 8);
如何在 Java 中從 PDF 提取圖片
- 安裝 Java 庫以從 PDF 中提取圖像
- 使用`extractAllImages`方法從PDF中提取圖片
- 遍歷圖像集合對象中的每個圖像
- 使用 Java 中的 `write` 方法匯出提取的圖像
- 在不影響原始 PDF 的情況下進行提取