从PDF中提取图像
作为 IronPDF 广泛的 PDF 创建和编辑功能集合的一部分,IronPDF 还可通过其内容提取方法促进对 PDF 文档内容的细粒度处理。
extractAllImages
返回 PDF 文档中嵌入的所有图像的集合,每个图像都格式化为一个 BufferedImage
对象。
最常见的商业用例是将PDF图片保存在单独的文件中。 上面的示例代码展示了使用 extractAllImages
方法以及 Java ImageIO
类来实现这一功能的方法。
IronPDF还可以以原始字节形式从PDF中提取图像。 为此,请使用 extractAllRawImages
方法。
也可以从PDF页面的一个子集中提取图像。(而不是整个文件). 下面的简短代码片段使用了 extractAllImagesFromPages
方法从示例文档的第3页和第7页提取图片。
PdfDocument document = PdfDocument.fromFile(Paths.get("sample.pdf"));
List<BufferedImage> pageRangeImages = document.extractAllImagesFromPages(PageSelection.pageRange(3, 7));
如何用 Java 从 PDF 中提取图像
- 安装 IronPDF for Java 库
- 使用 "extractAllImages "方法从 PDF 中提取图像
- 遍历图像集合对象中的每张图像
- 用 Java 中的 "write "方法导出提取的图像
- 在不影响原始 PDF 的情况下进行提取