從 PDF 提取圖像
作為IronPDF廣泛的PDF創建和編輯功能的一部分,IronPDF還透過其內容提取方法促進對PDF文件內容的細粒度處理。
extractAllImages
返回一個集合,其中包含嵌入在 PDF 文件中的所有圖像,每個都被格式化為 BufferedImage
對象。
最常見的商業用例是將PDF圖像保存在單独的文件中。 上面的代碼示例展示了一種使用extractAllImages
方法及Java ImageIO
類來實現此功能的方法。
IronPDF 也可以以原始位元組形式從 PDF 中提取圖像。 為此,請改用extractAllRawImages
方法。
也可以從部分PDF頁面擷取圖像(而不是整個文件)。 以下簡短的程式碼片段使用extractAllImagesFromPages
方法來從樣本文件的第3頁和第7頁提取圖像。
PdfDocument document = PdfDocument.fromFile(Paths.get("sample.pdf"));
List<BufferedImage> pageRangeImages = document.extractAllImagesFromPages(PageSelection.pageRange(3, 7));
PdfDocument document = PdfDocument.fromFile(Paths.get("sample.pdf"));
List<BufferedImage> pageRangeImages = document.extractAllImagesFromPages(PageSelection.pageRange(3, 7));
如何在 Java 中從 PDF 提取圖片
- 安裝IronPDF Java庫
- 使用 `extractAllImages` 方法從 PDF 中提取圖像
- 遍歷圖像集合對象中的每個圖像
- 使用 Java 中的 `write` 方法匯出提取的圖像
- 在不影響原始 PDF 的情況下進行提取