从PDF中提取图像

作为 IronPDF 广泛的 PDF 创建和编辑功能集合的一部分,IronPDf 还可通过其内容提取方法对 PDF 文档内容进行细粒度处理。

提取所有图像 "返回 PDF 文档中嵌入的所有图像的集合,每个图像都格式化为 "缓冲图像 "对象。

最常见的业务用例是将 PDF 图像保存到单独的文件中。上面的代码示例演示了使用 extractAllImages 方法和 Java ImageIO 类实现这一目的的方法。

IronPDF 还可以从 PDF 中提取原始字节形式的图像。为此,请使用 extractAllRawImages 方法。

也可以从 PDF 页面的子集中提取图像 (而不是整个文件).下面的简短代码片段使用 extractAllImagesFromPages 方法从示例文档的第 3 页和第 7 页提取图像。

PdfDocument document = PdfDocument.fromFile(Paths.get("sample.pdf"));  
List<BufferedImage> pageRangeImages = document.extractAllImagesFromPages(PageSelection.pageRange(4, 8);
JAVA