从PDF中提取图像
作为 IronPDF 广泛的 PDF 创建和编辑功能集合的一部分,IronPDf 还可通过其内容提取方法对 PDF 文档内容进行细粒度处理。
提取所有图像 "返回 PDF 文档中嵌入的所有图像的集合,每个图像都格式化为 "缓冲图像 "对象。
最常见的业务用例是将 PDF 图像保存到单独的文件中。上面的代码示例演示了使用 extractAllImages
方法和 Java ImageIO
类实现这一目的的方法。
IronPDF 还可以从 PDF 中提取原始字节形式的图像。为此,请使用 extractAllRawImages
方法。
也可以从 PDF 页面的子集中提取图像 (而不是整个文件).下面的简短代码片段使用 extractAllImagesFromPages
方法从示例文档的第 3 页和第 7 页提取图像。
PdfDocument document = PdfDocument.fromFile(Paths.get("sample.pdf"));
List<BufferedImage> pageRangeImages = document.extractAllImagesFromPages(PageSelection.pageRange(4, 8);
如何用 Java 从 PDF 中提取图像
- 安装 Java 库,从 PDF 中提取图像
- 使用 "extractAllImages "方法从 PDF 中提取图像
- 遍历图像集合对象中的每张图像
- 用 Java 中的 "write "方法导出提取的图像
- 在不影响原始 PDF 文件的情况下进行提取