跳過到頁腳內容
使用 IRONPDF FOR JAVA

如何在 Java 中提取圖像從 PDF

本文將探討如何從現有的PDF文件中提取圖片,並使用Java編程語言將它們保存到單個資料夾中。 為此目的,使用IronPDF for Java庫來提取圖片。

class="hsg-featured-snippet">

如何在Java中從PDF中提取圖片

  1. 安裝Java庫以從PDF中提取圖片
  2. 加載PDF文件或從URL渲染
  3. 利用extractAllImages方法提取圖片
  4. 將提取的圖片保存到Java中的文件或流
  5. 檢查指定目錄中的提取圖片

IronPDF Java PDF庫

IronPDF是一個Java庫,旨在幫助開發人員在他們的Java應用程序中生成、修改和從PDF文件中提取數據。 使用IronPDF,您可以從多種來源(如HTML、圖片等)創建PDF文檔。 Additionally, you have the ability to merge, split, and manipulate existing PDFs. IronPDF also includes security features, such as password protection and digital signatures.

由Iron Software開發和維護,IronPDF以其從PDF、HTML和URL中提取文本的能力而著稱。 這使其成為一個適用於多種應用的多功能和強大的工具,無論您是從頭創建PDF還是處理現有的PDF。

先決條件

在使用IronPDF從PDF文件中提取數據之前,還需滿足一些先決條件:

  1. Java安裝:確保Java已安裝在您的系統上,並且其路徑已設置到環境變量中。 如果您尚未安裝Java,請按照Java網站上的下載頁面的說明進行操作。
  2. Java IDE: Have either Eclipse or IntelliJ installed as your Java IDE. You can download Eclipse from this link and IntelliJ from this download page.
  3. IronPDF庫:下載並將IronPDF庫作為依賴項添加到您的項目中。 要獲取設置說明,請訪問IronPDF網站
  4. Maven安裝:確保Maven已安裝並與您的IDE集成,以便開始PDF轉換過程。 請按照此JetBrains指南來獲取有關安裝和集成Maven的幫助。

IronPDF for Java安裝

安裝IronPDF for Java是一個簡單的過程,只要滿足所有要求即可。 本指南將使用JetBrains IntelliJ IDEA演示安裝並運行一些示例代碼。

  1. 啟動IntelliJ IDEA:在您的系統上打開JetBrains IntelliJ IDEA。

  2. 創建一個Maven項目:在IntelliJ IDEA中創建一個新的Maven項目。 這將為 IronPDF for Java 的安裝提供合適的環境。

如何在Java中從PDF中提取圖片,圖1:創建一個新的Maven項目 創建一個新的Maven項目

新的窗口會出現。 輸入項目名稱並點擊完成。

如何在Java中從PDF中提取圖片,圖2:輸入項目名稱 輸入項目名稱

完成後,新的項目將打開到pom.xml文件,以添加IronPDF for Java的Maven依賴項。

接下來,在pom.xml文件中添加以下依賴項,或者您可以從以下Maven倉庫下載JAR文件。

<dependency>
    <groupId>com.ironsoftware</groupId>
    <artifactId>ironpdf</artifactId>
    <version>YOUR_VERSION_HERE</version>
</dependency>
<dependency>
    <groupId>com.ironsoftware</groupId>
    <artifactId>ironpdf</artifactId>
    <version>YOUR_VERSION_HERE</version>
</dependency>
XML

將依賴項放入pom.xml文件後,文件的右上角會出現一個小圖標。

如何在Java中從PDF中提取圖片,圖3:帶有小圖標的pom.xml文件用於安裝依賴項 帶有小圖標的pom.xml文件用於安裝依賴項

點擊該圖標以安裝IronPDF for Java的Maven依賴項。 這將根據您網絡連線的速度花費幾分鐘。

提取圖片

您可以使用IronPDF的一個叫做extractAllImages的單一方法從PDF文檔中提取圖片。 此方法返回PDF文件中所有可用的圖片。然後,您可以使用ImageIO.write方法通過提供輸出圖片的路徑和格式將所有提取的圖片保存到您選擇的文件路徑。

5.1. 從PDF文檔提取圖片

在以下示例中,將從PDF文檔中提取圖片並保存到文件系統中作為PNG圖片。

import com.ironsoftware.ironpdf.PdfDocument;
import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.nio.file.Files;
import java.nio.file.Paths;
import java.util.List;

public class Main {
    public static void main(String[] args) throws Exception {
        // Load PDF document from file
        PdfDocument pdf = PdfDocument.fromFile(Paths.get("Final Project Report Craft Arena.pdf"));

        // Extract all images from the PDF document
        List<BufferedImage> images = pdf.extractAllImages();
        int i = 0;

        // Save each extracted image to the filesystem as a PNG
        for (BufferedImage image : images) {
            ImageIO.write(image, "PNG", Files.newOutputStream(Paths.get("image" + ++i + ".png")));
        }
    }
}
import com.ironsoftware.ironpdf.PdfDocument;
import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.nio.file.Files;
import java.nio.file.Paths;
import java.util.List;

public class Main {
    public static void main(String[] args) throws Exception {
        // Load PDF document from file
        PdfDocument pdf = PdfDocument.fromFile(Paths.get("Final Project Report Craft Arena.pdf"));

        // Extract all images from the PDF document
        List<BufferedImage> images = pdf.extractAllImages();
        int i = 0;

        // Save each extracted image to the filesystem as a PNG
        for (BufferedImage image : images) {
            ImageIO.write(image, "PNG", Files.newOutputStream(Paths.get("image" + ++i + ".png")));
        }
    }
}
JAVA

上面的程序打開“Final Project Report Craft Arena.pdf”文件,並使用extractAllImages方法將文件中的所有圖片提取到一個BufferedImage對象列表中。 然後為每個新文件圖片使用唯一名稱將其保存到個別的PNG文件中。

如何在Java中從PDF中提取圖片,圖4:PDF輸出的圖片提取 PDF輸出的圖片提取

提取圖片 from URL

本節將討論如何直接從URL提取圖片。 在下面的代碼中,URL會轉換為PDF頁面,然後切換導航以從PDF中提取圖片。

import com.ironsoftware.ironpdf.PdfDocument;
import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.io.IOException;
import java.nio.file.Files;
import java.nio.file.Paths;
import java.util.List;

public class Main {
    public static void main(String[] args) throws IOException {
        // Render PDF from a URL
        PdfDocument pdf = PdfDocument.renderUrlAsPdf("https://www.amazon.com/?tag=hp2-brobookmark-us-20");

        // Extract all images from the rendered PDF document
        List<BufferedImage> images = pdf.extractAllImages();
        int i = 0;

        // Save each extracted image to the filesystem as a PNG
        for (BufferedImage image : images) {
            ImageIO.write(image, "PNG", Files.newOutputStream(Paths.get("image" + ++i + ".png")));
        }
    }
}
import com.ironsoftware.ironpdf.PdfDocument;
import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.io.IOException;
import java.nio.file.Files;
import java.nio.file.Paths;
import java.util.List;

public class Main {
    public static void main(String[] args) throws IOException {
        // Render PDF from a URL
        PdfDocument pdf = PdfDocument.renderUrlAsPdf("https://www.amazon.com/?tag=hp2-brobookmark-us-20");

        // Extract all images from the rendered PDF document
        List<BufferedImage> images = pdf.extractAllImages();
        int i = 0;

        // Save each extracted image to the filesystem as a PNG
        for (BufferedImage image : images) {
            ImageIO.write(image, "PNG", Files.newOutputStream(Paths.get("image" + ++i + ".png")));
        }
    }
}
JAVA

在上面的代碼中,亞馬遜首頁的URL作為輸入提供,並返回74張圖片。

如何在Java中從PDF中提取圖片,圖5:PDF輸出的圖片提取 PDF輸出的圖片提取

結論

在Java中使用IronPDF庫可以完成從PDF文檔中提取圖片的操作。 若要安裝IronPDF,您需要先安裝Java、Java IDE(Eclipse或IntelliJ)、Maven以及IronPDF庫,並將其與您的項目集成。 使用IronPDF從PDF文檔中提取圖片的過程非常簡單,只需調用extractAllImages這一個方法即可。 然後,您可以使用ImageIO.write方法將圖片保存到您選擇的文件路徑。

本文提供了一個有關使用Java和IronPDF庫如何提取圖片的逐步指南。 更多詳細信息,包括如何從PDF中提取文本的信息,可以在提取文本代碼示例中找到。

IronPDF是一個可以商業授權使用的庫,起價$799。 不過,您可以使用免費試用在生產環境中進行評估。

常見問題解答

如何使用 Java 從 PDF 中提取圖像?

要使用 Java 從 PDF 中提取圖像,請使用 IronPDF 庫。首先加載 PDF 文檔,然後使用 extractAllImages 方法。然後可以使用像 ImageIO.write 這樣的方法保存提取的圖像。

在 Java 中提取 PDF 中的圖像需要哪些前提條件?

要使用 Java 從 PDF 中提取圖像,請確保已安裝 Java 並安裝了一個 Java IDE,例如 Eclipse 或 IntelliJ IDEA。此外,配置 Maven 以管理依賴項並在項目中包含 IronPDF 庫。

如何在 Java 中安裝 PDF 圖像提取庫?

要安裝 IronPDF 庫,請在您的 Java IDE(例如 IntelliJ IDEA)中創建一個 Maven 項目。將 IronPDF 依賴項添加到您的 pom.xml 文件,並使用 Maven 下載並將其包含在您的項目中。

我可以從 Java 中生成的 URL 的 PDF 中提取圖像嗎?

可以,您可以使用 IronPDF 的 renderUrlAsPdf 方法將 URL 轉換為 PDF,然後使用 extractAllImages 方法從生成的 PDF 中提取圖像。

Java PDF 庫是否有試用版可用?

IronPDF 提供免費試用版,允許您探索其在 Java 中進行 PDF 管理和圖像提取的功能和特性。

哪些 Java IDE 適合使用 IronPDF?

Eclipse 和 IntelliJ IDEA 是推薦用於開發使用 IronPDF 庫處理 PDF 的 Java 應用程序的 IDE。

如何使用 Java 保存從 PDF 中提取的圖像?

一旦您使用 IronPDF 從 PDF 中提取了圖像,可以使用 ImageIO.write 方法保存它們,指定所需的文件路徑和圖像格式。

在 Java 中使用哪種方法從 PDF 文件中提取圖像?

在 IronPDF 中,使用 extractAllImages 方法從 PDF 文檔中提取所有圖像。此方法返回您可以進一步處理或保存的圖像列表。

從 PDF 提取圖像時可以選擇哪些圖像格式?

提取的圖像可以使用 Java 中的 ImageIO.write 方法保存為各種格式,例如 PNG。

Java 中的 PDF 管理庫提供哪些功能?

IronPDF 是一個全面的 Java 庫,使開發人員能夠生成、修改和從 PDF 文件中提取數據。它包括文本提取、合併、拆分和應用安全措施等功能。

Darrius Serrant
全棧軟件工程師 (WebOps)

Darrius Serrant 擁有邁阿密大學計算機科學學士學位,目前任職於 Iron Software 的全栈 WebOps 市場營銷工程師。從小就迷上編碼,他認為計算既神秘又可接近,是創意和解決問題的完美媒介。

在 Iron Software,Darrius 喜歡創造新事物,並簡化複雜概念以便於理解。作為我們的駐場開發者之一,他也自願教學生,分享他的專業知識給下一代。

對 Darrius 來說,工作令人滿意因為它被重視且有實際影響。