在实际环境中测试
在生产中测试无水印。
随时随地为您服务。
本文将探讨如何使用Java编程语言从现有PDF文档中提取图像并将其保存在一个文件夹中。 为此,使用IronPDF for Java库提取图像。
IronPDF 是一个 Java 库,专为帮助开发人员生成、修改和从PDF文件中提取数据在他们的Java应用程序中。 使用 IronPDF,您可以从多种来源创建 PDF 文档,例如 HTML、图像等。 此外,您还可以并吞, (意见) 分歧以及操作现有的PDF。 IronPDF 还包括安全功能,例如密码保护和数字签名.
由Iron Software开发和维护,IronPDF以其从PDF、HTML和URL中提取文本的能力而闻名。 这使它成为一个多功能且强大的工具,可用于各种应用,无论是从头创建 PDF 还是处理现有的 PDF。
在使用IronPDF从PDF文件中提取数据之前,必须满足以下几个前提条件:
Java 安装:确保您的系统上已安装 Java,并且已在环境变量中设置了其路径。 如果您尚未安装 Java,请按照以下说明操作从Java网站下载页面.
Java IDE: 确保安装了Eclipse或IntelliJ作为您的Java IDE。您可以从这里下载Eclipse链接和 IntelliJ下载页面.
IronPDF 库: 下载并将 IronPDF 库添加到您的项目中作为依赖项。 有关设置说明,请访问IronPDF 网站.
安装 IronPDF for Java 是一个简单的过程,前提是满足所有要求。 本指南将使用 JetBrains IntelliJ IDEA 演示安装并运行一些示例代码。
这是需要做的事:
启动 IntelliJ IDEA:在您的系统上打开 JetBrains IntelliJ IDEA。
创建一个Maven项目:在IntelliJ IDEA中,创建一个新的Maven项目。 这将为安装IronPDF for Java提供合适的环境。
创建一个新的 Maven 项目
一个新窗口将会出现。 输入项目名称,然后点击完成。
输入项目名称
点击完成后,将打开一个新项目,并打开一个 pom.xml
文件以添加 IronPDF for Java 的 Maven 依赖。
接下来,在 pom.xml
文件中添加以下依赖项,或者您可以从以下网址下载 JAR 文件Maven 存储库.
<dependency>
<groupId>com.ironsoftware</groupId>
<artifactId>com.ironsoftware</artifactId>
<version>2024.11.4</version>
</dependency>
一旦将依赖项放置在pom.xml
文件中,文件的右上角将出现一个小图标。
带有小图标以安装依赖项的pom.xml文件
点击此图标安装IronPDF for Java的Maven依赖。 这只需要几分钟,具体取决于您的网络连接。
您可以使用IronPDF中的一个名为extract的单一方法从PDF文档中提取图像。[提取所有图像
](/java/object-reference/api/com/ironsoftware/ironpdf/PdfDocument.html#extractAllImages()). 此方法返回 PDF 文件中的所有可用图像。之后,您可以使用 ImageIO.write
方法提供输出图像的路径和格式,将所有提取的图像保存到您选择的文件路径。
在以下示例中,PDF文档中的图像将被提取并保存到文件系统中作为PNG图像。
import com.ironsoftware.ironpdf.PdfDocument;
import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.nio.file.Files;
import java.nio.file.Paths;
import java.util.List;
public class main {
public static void main(String[] args) throws Exception {
PdfDocument pdf = PdfDocument.fromFile(Paths.get("Final Project Report Craft Arena.pdf"));
List<BufferedImage> images = pdf.extractAllImages();
int i = 0;
for (BufferedImage image : images) {
ImageIO.write(image, "PNG", Files.newOutputStream(Paths.get("image" + ++i + ".png")));
}
}
}
上面的程序打开 "Final Project Report Craft Arena.pdf" 文件,并使用 extractAllImages
方法将文件中的所有图像提取到一个 BufferedImage
对象列表中。 然后将每个新文件图像保存到具有唯一名称的单独PNG文件中。
从PDF输出中提取图像
本节将讨论如何直接从URL中提取图像。 在下面的代码中,URL 会被转换成 PDF 页面,然后切换导航以从 PDF 中提取图像。
import com.ironsoftware.ironpdf.PdfDocument;
import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.io.IOException;
import java.nio.file.Files;
import java.nio.file.Paths;
import java.util.List;
public class main {
public static void main(String[] args) throws IOException {
PdfDocument pdf = PdfDocument.renderUrlAsPdf("https://www.amazon.com/?tag=hp2-brobookmark-us-20");
List<BufferedImage> images = pdf.extractAllImages();
int i = 0;
for (BufferedImage image : images) {
ImageIO.write(image, "PNG", Files.newOutputStream(Paths.get("image" + ++i + ".png")));
}
}
}
在上述代码中,提供了亚马逊主页的URL作为输入,并返回了74张图片。
从PDF输出中提取图像
使用IronPDF库在Java中可以从PDF文档中提取图像。 要安装IronPDF,您需要具备Java和Java IDE。(Eclipse 或 IntelliJ), Maven 和 IronPDF 库已安装并集成到您的项目中。 使用 IronPDF 从 PDF 文档中提取图像的过程很简单,只需调用 extractAllImages
方法即可。 然后,您可以使用 ImageIO.write
方法将图像保存到您选择的文件路径。
本文提供了一个分步指南如何提取图像使用Java和IronPDF库从PDF文档提取。 更多详细信息,包括如何从PDF中提取文本的信息,可以在提取文本代码示例.