在实际环境中测试
在生产中测试无水印。
随时随地为您服务。
本文将探讨如何使用Java编程语言从现有的PDF文档中提取图像并将其保存到单个文件夹中。为此,使用IronPDF for Java库来提取图像。
IronPDF 是一个专为帮助开发人员生成、修改和 从PDF文件中提取数据 在他们的Java应用程序中。使用IronPDF,您可以从多种来源创建PDF文档,例如HTML、图像等。此外,您还可以 并吞, (意见) 分歧, 并操作现有的PDF。IronPDF还包括安全功能,例如 密码保护 和 数字签名由Iron Software开发和维护,IronPDF因其能够从PDF、HTML和URL中提取文本而闻名。这使得它成为一个用于多种应用程序的多功能和强大工具,无论是从头创建PDF还是处理现有的PDF都非常方便。
在使用IronPDF从PDF文件中提取数据之前,需要满足一些先决条件:
Java安装: 确保在您的系统上安装了Java并且其路径已经在环境变量中设置。如果您还没有安装Java,请按照以下说明进行操作 从Java网站下载页面.
Java IDE: 安装 Eclipse 或 IntelliJ 作为 Java IDE。您可以从以下网址下载 Eclipse 链接 和 IntelliJ 下载页面.
IronPDF 库: 下载 IronPDF 库并将其作为依赖项添加到项目中。有关设置说明,请访问 IronPDF 网站.
安装 IronPDF for Java 是一个简单的过程,只要满足所有要求即可。本指南将使用 JetBrains IntelliJ IDEA 演示安装并运行一些示例代码。
步骤如下:
启动 IntelliJ IDEA:在您的系统上打开 JetBrains IntelliJ IDEA。
创建一个 Maven 项目:在 IntelliJ IDEA 中创建一个新的 Maven 项目。这将为 IronPDF for Java 的安装提供合适的环境。
创建一个新的Maven项目
将会出现一个新窗口。输入项目名称并点击完成。
输入项目名称
点击完成后,将打开一个新项目,显示pom.xml
文件以添加IronPDF for Java的Maven依赖项。
接下来,在pom.xml
文件中添加以下依赖项,或者您可以从以下下载JAR文件 Maven 存储库.
<dependency>
<groupId>com.ironsoftware</groupId>
<artifactId>com.ironsoftware</artifactId>
<version>2024.9.1</version>
</dependency>
一旦将依赖项放入 pom.xml
文件中,文件的右上角会出现一个小图标。
pom.xml 文件带有一个小图标以安装依赖项
点击此图标以安装 IronPDF for Java 的 Maven 依赖项。根据您的互联网连接速度,这只需几分钟。
您可以使用一个名为 IronPDF 的方法从 PDF 文档中提取图像。 [提取所有图像
](/java/object-reference/api/com/ironsoftware/ironpdf/PdfDocument.html#extractAllImages())此方法返回 PDF 文件中可用的所有图像。之后,您可以使用 ImageIO.write
方法通过提供输出图像的路径和格式,将所有提取的图像保存到您选择的文件路径。
在下面的示例中,将从PDF文档中提取图像并将其保存到文件系统中为PNG图像。
import com.ironsoftware.ironpdf.PdfDocument;
import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.nio.file.Files;
import java.nio.file.Paths;
import java.util.List;
public class main {
public static void main(String[] args) throws Exception {
PdfDocument pdf = PdfDocument.fromFile(Paths.get("Final Project Report Craft Arena.pdf"));
List<BufferedImage> images = pdf.extractAllImages();
int i = 0;
for (BufferedImage image : images) {
ImageIO.write(image, "PNG", Files.newOutputStream(Paths.get("image" + ++i + ".png")));
}
}
}
上面的程序打开了“Final Project Report Craft Arena.pdf”文件,并使用extractAllImages
方法将文件中的所有图像提取到一个BufferedImage
对象列表中。然后,它将每个新文件图像保存为具有唯一名称的单独PNG文件。
从PDF中提取图像
本节将讨论如何直接从URL中提取图像。在下面的代码中,URL会被转换为PDF页面,然后切换导航以从PDF中提取图像。
import com.ironsoftware.ironpdf.PdfDocument;
import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.io.IOException;
import java.nio.file.Files;
import java.nio.file.Paths;
import java.util.List;
public class main {
public static void main(String[] args) throws IOException {
PdfDocument pdf = PdfDocument.renderUrlAsPdf("https://www.amazon.com/?tag=hp2-brobookmark-us-20");
List<BufferedImage> images = pdf.extractAllImages();
int i = 0;
for (BufferedImage image : images) {
ImageIO.write(image, "PNG", Files.newOutputStream(Paths.get("image" + ++i + ".png")));
}
}
}
在上述代码中,亚马逊主页的URL作为输入,并返回74张图片。
从PDF中提取图像
使用 IronPDF 库可以在 Java 中从 PDF 文档中提取图像。要安装 IronPDF,您需要有 Java 和 Java IDE。 (Eclipse 或 IntelliJ)在您的项目中安装并集成了 IronPDF、Maven 和 IronPDF 库。使用 IronPDF 从 PDF 文档中提取图像的过程非常简单,只需调用 extractAllImages
方法即可。然后,您可以使用 ImageIO.write
方法将图像保存到您选择的文件路径中。
本文将逐步介绍 如何提取图像 使用 Java 和 IronPDF 库从 PDF 文档中提取文本。更多详情,包括如何从 PDF 中提取文本的信息,请参阅 提取文本代码示例.