跳過到頁腳內容
使用 IRONPDF FOR JAVA

如何在 Java 中提取圖像從 PDF

本文將探討如何使用 Java 程式語言從現有的 PDF 文件中提取圖像並將它們保存到單一資料夾中。 為此,我們使用IronPDF 適用於 Java 庫來提取圖像。

IronPDF Java PDF 庫

IronPDF是一個 Java 程式庫,旨在幫助開發人員在其 Java 應用程式中產生、修改和提取 PDF 文件中的資料。 使用IronPDF,您可以從多種來源建立 PDF 文檔,例如 HTML、圖像等。 此外,您還可以合併分割和操作現有的 PDF 檔案。 IronPDF也包含密碼保護和數位簽章等安全功能。

IronPDF由Iron Software開發和維護,以其從 PDF、HTML 和 URL 中提取文字的功能而聞名。 這使其成為一款用途廣泛且功能強大的工具,適用於各種應用場景,無論是從頭開始建立 PDF 還是處理現有的 PDF。

先決條件

在使用IronPDF從 PDF 文件中提取數據之前,必須滿足一些先決條件:

  1. Java 安裝:確保您的系統上已安裝 Java,並且已在環境變數中設定其路徑。 如果您還沒有安裝 Java,請按照Java 網站上的以下下載頁面上的說明進行操作。
  2. Java IDE:請安裝 Eclipse 或 IntelliJ 作為您的 Java IDE。您可以從此連結下載 Eclipse,從此下載頁面下載IntelliJ。
  3. IronPDF庫:下載IronPDF庫並將其作為依賴項新增至您的專案。 有關設定說明,請造訪IronPDF網站
  4. Maven安裝:在開始 PDF 轉換過程之前,請確保已安裝Maven並將其整合到您的 IDE 中。 請按照JetBrains 提供的以下指南中的教程,以獲取有關安裝和整合Maven 的協助。

IronPDF Java 安裝

只要滿足所有要求,安裝IronPDF 適用於 Java 就是一個簡單的過程。 本指南將使用 JetBrains IntelliJ IDEA 來示範安裝過程並執行一些範例程式碼。

1.啟動 IntelliJ IDEA:在您的系統上開啟 JetBrains IntelliJ IDEA。

2.建立Maven專案:在 IntelliJ IDEA 中,建立一個新的Maven專案。 這將為安裝IronPDF 適用於 Java 提供合適的環境。

如何在Java中從PDF中擷取影像,圖1:建立一個新的Maven專案 建立一個新的Maven項目

將出現一個新視窗。 輸入項目名稱,然後點選"完成"。

如何在Java中從PDF中擷取影像,圖2:輸入項目名稱 請輸入項目名稱

點選"完成"後,將開啟一個新項目,進入 pom.xml 文件,以新增IronPDF 適用於 Java 的Maven依賴項。

接下來,在 pom.xml 檔案中新增以下依賴項,或者您可以從以下Maven儲存庫下載 JAR 檔案。

<dependency>
    <groupId>com.ironsoftware</groupId>
    <artifactId>ironpdf</artifactId>
    <version>YOUR_VERSION_HERE</version>
</dependency>
<dependency>
    <groupId>com.ironsoftware</groupId>
    <artifactId>ironpdf</artifactId>
    <version>YOUR_VERSION_HERE</version>
</dependency>
XML

將相依性放入 pom.xml 檔案後,檔案右上角會出現一個小圖示。

如何在Java中從PDF中提取圖像,圖3:帶有小圖標的pom.xml文件,用於安裝依賴項 pom.xml 檔案帶有一個小圖標,用於安裝依賴項

點選此圖示安裝IronPDF 適用於 Java 的Maven相依性。 這只需要幾分鐘,具體時間取決於您的網路連線速度。

擷取影像

您可以使用IronPDF透過名為[extractAllImages](/java/object-reference/api/com/ironsoftware/ironpdf/PdfDocument.html#extractAllImages()的單一方法從 PDF 文件中提取影像)。 此方法傳回 PDF 文件中的所有圖像。之後,您可以使用 ImageIO.write 方法,透過提供輸出影像的路徑和格式,將所有擷取的影像儲存到您選擇的檔案路徑。

5.1 從PDF文件中擷取影像

在下面的範例中,PDF 文件中的圖像將被提取出來,並以 PNG 圖像的形式儲存到檔案系統中。

import com.ironsoftware.ironpdf.PdfDocument;
import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.nio.file.Files;
import java.nio.file.Paths;
import java.util.List;

public class Main {
    public static void main(String[] args) throws Exception {
        // Load PDF document from file
        PdfDocument pdf = PdfDocument.fromFile(Paths.get("Final Project Report Craft Arena.pdf"));

        // Extract all images from the PDF document
        List<BufferedImage> images = pdf.extractAllImages();
        int i = 0;

        // Save each extracted image to the filesystem as a PNG
        for (BufferedImage image : images) {
            ImageIO.write(image, "PNG", Files.newOutputStream(Paths.get("image" + ++i + ".png")));
        }
    }
}
import com.ironsoftware.ironpdf.PdfDocument;
import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.nio.file.Files;
import java.nio.file.Paths;
import java.util.List;

public class Main {
    public static void main(String[] args) throws Exception {
        // Load PDF document from file
        PdfDocument pdf = PdfDocument.fromFile(Paths.get("Final Project Report Craft Arena.pdf"));

        // Extract all images from the PDF document
        List<BufferedImage> images = pdf.extractAllImages();
        int i = 0;

        // Save each extracted image to the filesystem as a PNG
        for (BufferedImage image : images) {
            ImageIO.write(image, "PNG", Files.newOutputStream(Paths.get("image" + ++i + ".png")));
        }
    }
}
JAVA

上面的程式開啟"Final Project Report Craft Arena.pdf"文件,並使用 extractAllImages 方法將文件中的所有圖像提取到 BufferedImage 物件清單中。 然後,它將每個新檔案圖像儲存為具有唯一名稱的單獨 PNG 檔案。

如何在Java中從PDF中擷取影像,圖4:從PDF輸出中擷取影像 從 PDF 輸出中提取影像

從 URL 提取圖像

本節將討論如何直接從 URL 中提取圖像。 在下面的程式碼中,URL 被轉換為 PDF 頁面,然後切換導航以從 PDF 中提取圖像。

import com.ironsoftware.ironpdf.PdfDocument;
import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.io.IOException;
import java.nio.file.Files;
import java.nio.file.Paths;
import java.util.List;

public class Main {
    public static void main(String[] args) throws IOException {
        // Render PDF from a URL
        PdfDocument pdf = PdfDocument.renderUrlAsPdf("https://www.amazon.com/?tag=hp2-brobookmark-us-20");

        // Extract all images from the rendered PDF document
        List<BufferedImage> images = pdf.extractAllImages();
        int i = 0;

        // Save each extracted image to the filesystem as a PNG
        for (BufferedImage image : images) {
            ImageIO.write(image, "PNG", Files.newOutputStream(Paths.get("image" + ++i + ".png")));
        }
    }
}
import com.ironsoftware.ironpdf.PdfDocument;
import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.io.IOException;
import java.nio.file.Files;
import java.nio.file.Paths;
import java.util.List;

public class Main {
    public static void main(String[] args) throws IOException {
        // Render PDF from a URL
        PdfDocument pdf = PdfDocument.renderUrlAsPdf("https://www.amazon.com/?tag=hp2-brobookmark-us-20");

        // Extract all images from the rendered PDF document
        List<BufferedImage> images = pdf.extractAllImages();
        int i = 0;

        // Save each extracted image to the filesystem as a PNG
        for (BufferedImage image : images) {
            ImageIO.write(image, "PNG", Files.newOutputStream(Paths.get("image" + ++i + ".png")));
        }
    }
}
JAVA

在上面的程式碼中,亞馬遜主頁 URL 作為輸入,它會傳回 74 張圖片。

如何在Java中從PDF中擷取影像,圖5:從PDF輸出擷取影像 從 PDF 輸出中提取影像

結論

使用 Java 中的IronPDF庫可以從 PDF 文件中提取影像。 要安裝IronPDF,您需要安裝 Java、Java IDE(Eclipse 或 IntelliJ)、 Maven以及IronPDF庫並將其整合到您的專案中。 使用IronPDF從 PDF 文件中提取影像的過程很簡單,只需要對 extractAllImages 進行一次方法呼叫。 然後,您可以使用 ImageIO.write 方法將圖像儲存到您選擇的檔案路徑。

本文提供了使用 Java 和IronPDF庫從 PDF 文件中提取影像的逐步指南。 更多詳細信息,包括如何從 PDF 中提取文本的信息,可以在"提取文本代碼示例"中找到。

IronPDF是一個具有商業許可的庫,許可從 $999 開始。 不過,您可以透過免費試用版在生產環境中進行評估。

常見問題解答

如何使用Java從PDF中擷取影像?

若要使用 Java 從 PDF 中提取圖像,請使用IronPDF庫。首先載入 PDF 文檔,然後使用extractAllImages方法。提取的映像隨後可以使用ImageIO.write等方法保存。

在Java中從PDF中擷取影像需要哪些前提條件?

若要使用 Java 從 PDF 中提取圖像,請確保已安裝 Java 以及 Java 整合開發環境(IDE),例如 Eclipse 或 IntelliJ IDEA。此外,請設定 Maven 以管理依賴項,並將IronPDF庫包含在您的專案中。

如何在Java中安裝用於PDF圖像提取的庫?

若要安裝IronPDF程式庫,請在 Java IDE(例如 IntelliJ IDEA)中建立一個 Maven 專案。將IronPDF依賴項新增至pom.xml檔案中,然後使用 Maven 下載並將其包含在您的專案中。

我能否用 Java 從 URL 生成的 PDF 文件中提取圖像?

是的,您可以使用 IronPDF 的renderUrlAsPdf方法將 URL 轉換為 PDF,然後使用extractAllImages方法從生成的 PDF 中提取圖像。

是否有Java PDF庫的試用版?

IronPDF提供免費試用版,讓您可以探索其在 Java 中進行 PDF 管理和影像擷取的功能和功能。

哪些Java IDE適合使用IronPDF?

對於使用IronPDF庫處理 PDF 的 Java 應用程式開發,建議使用 Eclipse 和 IntelliJ IDEA 作為 IDE。

如何使用 Java 保存從 PDF 中提取的圖像?

使用IronPDF從 PDF 擷取影像後,可以使用ImageIO.write方法儲存它們,並指定所需的檔案路徑和影像格式。

Java 中用哪一種方法從 PDF 檔案中擷取影像?

在IronPDF中, extractAllImages方法用於從 PDF 文件中提取所有影像。此方法傳回一個圖像列表,您可以對其進行進一步處理或儲存。

從PDF檔案中擷取影像並儲存時,可以使用哪些影像格式?

使用 Java 中的ImageIO.write方法,可以將擷取的映像儲存為各種格式,例如 PNG。

Java 中的 PDF 管理庫提供哪些功能?

IronPDF是一個功能全面的 Java 函式庫,它使開發人員能夠產生、修改 PDF 檔案並從中提取資料。它包含文字提取、合併、分割和應用安全措施等功能。

Darrius Serrant
全棧軟件工程師 (WebOps)

Darrius Serrant 擁有邁阿密大學計算機科學學士學位,目前任職於 Iron Software 的全栈 WebOps 市場營銷工程師。從小就迷上編碼,他認為計算既神秘又可接近,是創意和解決問題的完美媒介。

在 Iron Software,Darrius 喜歡創造新事物,並簡化複雜概念以便於理解。作為我們的駐場開發者之一,他也自願教學生,分享他的專業知識給下一代。

對 Darrius 來說,工作令人滿意因為它被重視且有實際影響。

鋼鐵支援團隊

我們每週 5 天,每天 24 小時在線上。
聊天
電子郵件
打電話給我