跳過到頁腳內容
使用 IRONPDF FOR JAVA

如何在 Java 中提取圖像從 PDF

本文將探討如何使用 Java 程式語言從現有的 PDF 文件中提取圖像並將它們保存到單一資料夾中。 為此,我們使用 IronPDF for Java 庫來提取影像。

IronPDF Java PDF 庫

IronPDF 是一個 Java 程式庫,旨在幫助開發人員在其 Java 應用程式中產生、修改和提取 PDF 文件中的資料。 使用 IronPDF,您可以從多種來源建立 PDF 文檔,例如 HTML、圖像等。 此外,您還可以合併分割和操作現有的 PDF 檔案。 IronPDF 也包含密碼保護和數位簽章等安全功能。

IronPDF 由 Iron Software 開發和維護,以其從 PDF、HTML 和 URL 中提取文字的功能而聞名。 這使其成為一款用途廣泛且功能強大的工具,適用於各種應用場景,無論是從頭開始建立 PDF 還是處理現有的 PDF。

先決條件

在使用 IronPDF 從 PDF 文件中提取數據之前,必須滿足一些先決條件:

  1. Java 安裝:確保您的系統上已安裝 Java,並且已在環境變數中設定其路徑。 如果您還沒有安裝 Java,請按照Java 網站上的以下下載頁面上的說明進行操作。
  2. Java IDE:請安裝 Eclipse 或 IntelliJ 作為您的 Java IDE。您可以從此連結下載 Eclipse,從此下載頁面下載IntelliJ。
  3. IronPDF 庫:下載 IronPDF 庫並將其作為依賴項新增至您的專案。 有關設定說明,請造訪IronPDF 網站
  4. Maven 安裝:在開始 PDF 轉換過程之前,請確保已安裝 Maven 並將其整合到您的 IDE 中。 請按照JetBrains 提供的以下指南中的教程,以獲取有關安裝和整合 Maven 的協助。

IronPDF Java 安裝

只要滿足所有要求,安裝 IronPDF for Java 就是一個簡單的過程。 本指南將使用 JetBrains IntelliJ IDEA 來示範安裝過程並執行一些範例程式碼。

1.啟動 IntelliJ IDEA:在您的系統上開啟 JetBrains IntelliJ IDEA。

2.建立 Maven 專案:在 IntelliJ IDEA 中,建立一個新的 Maven 專案。 這將為安裝 IronPDF for Java 提供合適的環境。

如何在 Java 中從 PDF 中提取圖像,圖 1:建立一個新的 Maven 項目 建立一個新的 Maven 項目

將出現一個新視窗。 輸入項目名稱,然後點選"完成"。

如何在 Java 中從 PDF 中提取圖像,圖 2:輸入專案名稱 請輸入項目名稱

點擊"完成"後,將開啟一個新項目,進入pom.xml文件,新增 IronPDF for Java 的 Maven 依賴項。

接下來,在pom.xml檔案中新增以下依賴項,或者您可以從以下Maven 儲存庫下載 JAR 檔案。

<dependency>
    <groupId>com.ironsoftware</groupId>
    <artifactId>ironpdf</artifactId>
    <version>YOUR_VERSION_HERE</version>
</dependency>
<dependency>
    <groupId>com.ironsoftware</groupId>
    <artifactId>ironpdf</artifactId>
    <version>YOUR_VERSION_HERE</version>
</dependency>
XML

pom.xml檔案中新增依賴項後,檔案右上角會出現一個小圖示。

如何在 Java 中從 PDF 中提取圖像,圖 3:帶有小圖標的 pom.xml 文件,用於安裝依賴項 pom.xml 檔案帶有一個小圖標,用於安裝依賴項

點擊此圖示安裝 IronPDF for Java 的 Maven 依賴項。 這只需要幾分鐘,具體時間取決於您的網路連線速度。

擷取影像

您可以使用 IronPDF 透過名為[extractAllImages](/java/object-reference/api/com/ironsoftware/ironpdf/PdfDocument.html#extractAllImages()的單一方法從 PDF 文件中提取影像。 此方法傳回 PDF 文件中的所有圖像。之後,您可以使用ImageIO.write方法,透過指定輸出映像的路徑和格式,將所有提取的映像儲存到您選擇的檔案路徑。

5.1 從PDF文件中擷取影像

在下面的範例中,PDF 文件中的圖像將被提取出來,並以 PNG 圖像的形式儲存到檔案系統中。

import com.ironsoftware.ironpdf.PdfDocument;
import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.nio.file.Files;
import java.nio.file.Paths;
import java.util.List;

public class Main {
    public static void main(String[] args) throws Exception {
        // Load PDF document from file
        PdfDocument pdf = PdfDocument.fromFile(Paths.get("Final Project Report Craft Arena.pdf"));

        // Extract all images from the PDF document
        List<BufferedImage> images = pdf.extractAllImages();
        int i = 0;

        // Save each extracted image to the filesystem as a PNG
        for (BufferedImage image : images) {
            ImageIO.write(image, "PNG", Files.newOutputStream(Paths.get("image" + ++i + ".png")));
        }
    }
}
import com.ironsoftware.ironpdf.PdfDocument;
import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.nio.file.Files;
import java.nio.file.Paths;
import java.util.List;

public class Main {
    public static void main(String[] args) throws Exception {
        // Load PDF document from file
        PdfDocument pdf = PdfDocument.fromFile(Paths.get("Final Project Report Craft Arena.pdf"));

        // Extract all images from the PDF document
        List<BufferedImage> images = pdf.extractAllImages();
        int i = 0;

        // Save each extracted image to the filesystem as a PNG
        for (BufferedImage image : images) {
            ImageIO.write(image, "PNG", Files.newOutputStream(Paths.get("image" + ++i + ".png")));
        }
    }
}
JAVA

上面的程式開啟"Final Project Report Craft Arena.pdf"文件,並使用extractAllImages方法將文件中的所有影像提取到BufferedImage物件清單中。 然後,它將每個新檔案圖像儲存為具有唯一名稱的單獨 PNG 檔案。

如何在 Java 中從 PDF 中提取圖像,圖 4:從 PDF 輸出中提取圖像 從 PDF 輸出中提取影像

從 URL 提取圖像

本節將討論如何直接從 URL 中提取圖像。 在下面的程式碼中,URL 被轉換為 PDF 頁面,然後切換導航以從 PDF 中提取圖像。

import com.ironsoftware.ironpdf.PdfDocument;
import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.io.IOException;
import java.nio.file.Files;
import java.nio.file.Paths;
import java.util.List;

public class Main {
    public static void main(String[] args) throws IOException {
        // Render PDF from a URL
        PdfDocument pdf = PdfDocument.renderUrlAsPdf("https://www.amazon.com/?tag=hp2-brobookmark-us-20");

        // Extract all images from the rendered PDF document
        List<BufferedImage> images = pdf.extractAllImages();
        int i = 0;

        // Save each extracted image to the filesystem as a PNG
        for (BufferedImage image : images) {
            ImageIO.write(image, "PNG", Files.newOutputStream(Paths.get("image" + ++i + ".png")));
        }
    }
}
import com.ironsoftware.ironpdf.PdfDocument;
import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.io.IOException;
import java.nio.file.Files;
import java.nio.file.Paths;
import java.util.List;

public class Main {
    public static void main(String[] args) throws IOException {
        // Render PDF from a URL
        PdfDocument pdf = PdfDocument.renderUrlAsPdf("https://www.amazon.com/?tag=hp2-brobookmark-us-20");

        // Extract all images from the rendered PDF document
        List<BufferedImage> images = pdf.extractAllImages();
        int i = 0;

        // Save each extracted image to the filesystem as a PNG
        for (BufferedImage image : images) {
            ImageIO.write(image, "PNG", Files.newOutputStream(Paths.get("image" + ++i + ".png")));
        }
    }
}
JAVA

在上面的程式碼中,亞馬遜主頁 URL 作為輸入,它會傳回 74 張圖片。

如何在 Java 中從 PDF 中提取圖像,圖 5:從 PDF 輸出中提取圖像 從 PDF 輸出中提取影像

結論

使用 Java 中的 IronPDF 庫可以從 PDF 文件中提取影像。 要安裝 IronPDF,您需要安裝 Java、Java IDE(Eclipse 或 IntelliJ)、Maven 以及 IronPDF 程式庫並將其整合到您的專案中。 使用 IronPDF 從 PDF 文件中提取影像的過程很簡單,只需要呼叫extractAllImages方法。 然後,您可以使用ImageIO.write方法將映像儲存到您選擇的檔案路徑。

本文提供了使用 Java 和 IronPDF 庫從 PDF 文件中提取影像的逐步指南。 更多詳細信息,包括如何從 PDF 中提取文本的信息,可以在"提取文本代碼示例"中找到。

IronPDF 是一個採用商業許可的庫,起價為$799 。 不過,您可以透過免費試用版在生產環境中進行評估。

常見問題解答

如何使用 Java 從 PDF 擷取影像?

若要使用 Java 從 PDF 擷取影像,請利用 IronPDF for Java 函式庫。首先載入 PDF 文件,然後使用 extractAllImages 方法。然後,可以使用 ImageIO.write 等方法儲存擷取的影像。

使用 Java 從 PDF 擷取影像需要哪些先決條件?

若要使用 Java 從 PDF 擷取影像,請確認已安裝 Java 以及 Java IDE,例如 Eclipse 或 IntelliJ IDEA。此外,配置 Maven 以管理依赖关系,并在您的项目中包含 IronPDF 库。

如何在 Java 中安裝一個用於 PDF 圖像擷取的庫?

若要安裝 IronPDF 函式庫,請在您的 Java IDE(例如 IntelliJ IDEA)中建立一個 Maven 專案。將 IronPDF 相依性加入您的 pom.xml 檔案,並使用 Maven 下載 IronPDF 並將其納入專案中。

我可以用 Java 從 URL 產生的 PDF 中提取圖片嗎?

是的,您可以使用 IronPDF 的 renderUrlAsPdf 方法將 URL 轉換為 PDF,然後運用 extractAllImages 方法從結果 PDF 中提取圖片。

Java PDF 函式庫是否有試用版本?

IronPDF 提供免費試用版本,讓您探索其在 Java 中進行 PDF 管理和影像擷取的能力與功能。

哪些 Java IDE 適合使用 IronPDF?

建議使用 Eclipse 和 IntelliJ IDEA 作為 IDE,以開發利用 IronPDF 函式庫來處理 PDF 的 Java 應用程式。

如何使用 Java 儲存從 PDF 擷取的影像?

使用 IronPDF 從 PDF 擷取影像後,您可以使用 ImageIO.write 方法儲存影像,並指定所需的檔案路徑和影像格式。

在 Java 中,使用哪種方法從 PDF 檔案中擷取影像?

在 IronPDF 中,extractAllImages 方法用於從 PDF 文件中提取所有圖片。此方法會返回一個圖片清單,您可以進一步處理或儲存這些圖片。

保存從 PDF 擷取的影像時,可以使用哪些影像格式?

透過 Java 中的 ImageIO.write 方法,可將擷取的影像儲存為各種格式,例如 PNG。

PDF 管理庫在 Java 中提供哪些功能?

IronPDF 是一個適用於 Java 的全面性函式庫,可讓開發人員從 PDF 檔案中產生、修改及擷取資料。它包括文本提取、合併、分割和應用安全措施等功能。

Darrius Serrant
全棧軟件工程師 (WebOps)

Darrius Serrant 擁有邁阿密大學計算機科學學士學位,目前任職於 Iron Software 的全栈 WebOps 市場營銷工程師。從小就迷上編碼,他認為計算既神秘又可接近,是創意和解決問題的完美媒介。

在 Iron Software,Darrius 喜歡創造新事物,並簡化複雜概念以便於理解。作為我們的駐場開發者之一,他也自願教學生,分享他的專業知識給下一代。

對 Darrius 來說,工作令人滿意因為它被重視且有實際影響。