从PDF中提取图像

作为 IronPDF 广泛的 PDF 创建和编辑功能集合的一部分,IronPDF 还可通过其内容提取方法促进对 PDF 文档内容的细粒度处理。

extractAllImages 返回 PDF 文档中嵌入的所有图像的集合,每个图像都格式化为一个 BufferedImage 对象。

最常见的商业用例是将PDF图片保存在单独的文件中。 上面的示例代码展示了使用 extractAllImages 方法以及 Java ImageIO 类来实现这一功能的方法。

IronPDF还可以以原始字节形式从PDF中提取图像。 为此,请使用 extractAllRawImages 方法。

也可以从PDF页面的一个子集中提取图像。(而不是整个文件). 下面的简短代码片段使用了 extractAllImagesFromPages 方法从示例文档的第3页和第7页提取图片。

PdfDocument document = PdfDocument.fromFile(Paths.get("sample.pdf"));  
List<BufferedImage> pageRangeImages = document.extractAllImagesFromPages(PageSelection.pageRange(3, 7));
JAVA