跳至頁尾內容
使用 IRONPDF FOR JAVA

如何在Java中從PDF中提取圖像

本文將探討如何使用 Java 程式語言從現有的 PDF 文件中提取圖像並將它們保存到單一資料夾中。 為此,我們使用 IronPDF for Java 庫來提取影像。

IronPDF Java PDF 庫

IronPDF 是一個 Java 程式庫,旨在幫助開發人員在其 Java 應用程式中產生、修改和提取 PDF 文件中的資料。 使用 IronPDF,您可以從多種來源建立 PDF 文檔,例如 HTML、圖像等。 此外,您還可以合併分割和操作現有的 PDF 檔案。 IronPDF 也包含密碼保護和數位簽章等安全功能。

IronPDF 由 Iron Software 開發和維護,以其從 PDF、HTML 和 URL 中提取文字的功能而聞名。 這使其成為一款用途廣泛且功能強大的工具,適用於各種應用場景,無論是從頭開始建立 PDF 還是處理現有的 PDF。

先決條件

在使用 IronPDF 從 PDF 文件中提取數據之前,必須滿足一些先決條件:

  1. Java 安裝:確保您的系統上已安裝 Java,並且已在環境變數中設定其路徑。 如果您還沒有安裝 Java,請按照Java 網站上的以下下載頁面上的說明進行操作。
  2. Java IDE:請安裝 Eclipse 或 IntelliJ 作為您的 Java IDE。您可以從此連結下載 Eclipse,從此下載頁面下載IntelliJ。
  3. IronPDF 庫:下載 IronPDF 庫並將其作為依賴項新增至您的專案。 有關設定說明,請造訪IronPDF 網站
  4. Maven 安裝:在開始 PDF 轉換過程之前,請確保已安裝 Maven 並將其整合到您的 IDE 中。 請按照JetBrains 提供的以下指南中的教程,以獲取有關安裝和整合 Maven 的協助。

IronPDF Java 安裝

只要滿足所有要求,安裝 IronPDF for Java 就是一個簡單的過程。 本指南將使用 JetBrains IntelliJ IDEA 來示範安裝過程並執行一些範例程式碼。

1.啟動 IntelliJ IDEA:在您的系統上開啟 JetBrains IntelliJ IDEA。

2.建立 Maven 專案:在 IntelliJ IDEA 中,建立一個新的 Maven 專案。 這將為安裝 IronPDF for Java 提供合適的環境。

如何在 Java 中從 PDF 中提取圖像,圖 1:建立一個新的 Maven 項目 建立一個新的 Maven 項目

將出現一個新視窗。 輸入項目名稱,然後點選"完成"。

如何在 Java 中從 PDF 中提取圖像,圖 2:輸入專案名稱 請輸入項目名稱

點擊"完成"後,將開啟一個新項目,進入pom.xml文件,新增 IronPDF for Java 的 Maven 依賴項。

接下來,在pom.xml檔案中新增以下依賴項,或者您可以從以下Maven 儲存庫下載 JAR 檔案。

<dependency>
    <groupId>com.ironsoftware</groupId>
    <artifactId>ironpdf</artifactId>
    <version>YOUR_VERSION_HERE</version>
</dependency>
<dependency>
    <groupId>com.ironsoftware</groupId>
    <artifactId>ironpdf</artifactId>
    <version>YOUR_VERSION_HERE</version>
</dependency>
XML

pom.xml檔案中新增依賴項後,檔案右上角會出現一個小圖示。

如何在 Java 中從 PDF 中提取圖像,圖 3:帶有小圖標的 pom.xml 文件,用於安裝依賴項 pom.xml 檔案帶有一個小圖標,用於安裝依賴項

點擊此圖示安裝 IronPDF for Java 的 Maven 依賴項。 這只需要幾分鐘,具體時間取決於您的網路連線速度。

擷取影像

您可以使用 IronPDF 透過名為[extractAllImages](/java/object-reference/api/com/ironsoftware/ironpdf/PdfDocument.html#extractAllImages()的單一方法從 PDF 文件中提取影像。 此方法傳回 PDF 文件中的所有圖像。之後,您可以使用ImageIO.write方法,透過指定輸出映像的路徑和格式,將所有提取的映像儲存到您選擇的檔案路徑。

5.1 從PDF文件中擷取影像

在下面的範例中,PDF 文件中的圖像將被提取出來,並以 PNG 圖像的形式儲存到檔案系統中。

import com.ironsoftware.ironpdf.PdfDocument;
import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.nio.file.Files;
import java.nio.file.Paths;
import java.util.List;

public class Main {
    public static void main(String[] args) throws Exception {
        // Load PDF document from file
        PdfDocument pdf = PdfDocument.fromFile(Paths.get("Final Project Report Craft Arena.pdf"));

        // Extract all images from the PDF document
        List<BufferedImage> images = pdf.extractAllImages();
        int i = 0;

        // Save each extracted image to the filesystem as a PNG
        for (BufferedImage image : images) {
            ImageIO.write(image, "PNG", Files.newOutputStream(Paths.get("image" + ++i + ".png")));
        }
    }
}
import com.ironsoftware.ironpdf.PdfDocument;
import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.nio.file.Files;
import java.nio.file.Paths;
import java.util.List;

public class Main {
    public static void main(String[] args) throws Exception {
        // Load PDF document from file
        PdfDocument pdf = PdfDocument.fromFile(Paths.get("Final Project Report Craft Arena.pdf"));

        // Extract all images from the PDF document
        List<BufferedImage> images = pdf.extractAllImages();
        int i = 0;

        // Save each extracted image to the filesystem as a PNG
        for (BufferedImage image : images) {
            ImageIO.write(image, "PNG", Files.newOutputStream(Paths.get("image" + ++i + ".png")));
        }
    }
}
JAVA

上面的程式開啟"Final Project Report Craft Arena.pdf"文件,並使用extractAllImages方法將文件中的所有影像提取到BufferedImage物件清單中。 然後,它將每個新檔案圖像儲存為具有唯一名稱的單獨 PNG 檔案。

如何在 Java 中從 PDF 中提取圖像,圖 4:從 PDF 輸出中提取圖像 從 PDF 輸出中提取影像

從 URL 提取圖像

本節將討論如何直接從 URL 中提取圖像。 在下面的程式碼中,URL 被轉換為 PDF 頁面,然後切換導航以從 PDF 中提取圖像。

import com.ironsoftware.ironpdf.PdfDocument;
import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.io.IOException;
import java.nio.file.Files;
import java.nio.file.Paths;
import java.util.List;

public class Main {
    public static void main(String[] args) throws IOException {
        // Render PDF from a URL
        PdfDocument pdf = PdfDocument.renderUrlAsPdf("https://www.amazon.com/?tag=hp2-brobookmark-us-20");

        // Extract all images from the rendered PDF document
        List<BufferedImage> images = pdf.extractAllImages();
        int i = 0;

        // Save each extracted image to the filesystem as a PNG
        for (BufferedImage image : images) {
            ImageIO.write(image, "PNG", Files.newOutputStream(Paths.get("image" + ++i + ".png")));
        }
    }
}
import com.ironsoftware.ironpdf.PdfDocument;
import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.io.IOException;
import java.nio.file.Files;
import java.nio.file.Paths;
import java.util.List;

public class Main {
    public static void main(String[] args) throws IOException {
        // Render PDF from a URL
        PdfDocument pdf = PdfDocument.renderUrlAsPdf("https://www.amazon.com/?tag=hp2-brobookmark-us-20");

        // Extract all images from the rendered PDF document
        List<BufferedImage> images = pdf.extractAllImages();
        int i = 0;

        // Save each extracted image to the filesystem as a PNG
        for (BufferedImage image : images) {
            ImageIO.write(image, "PNG", Files.newOutputStream(Paths.get("image" + ++i + ".png")));
        }
    }
}
JAVA

在上面的程式碼中,亞馬遜主頁 URL 作為輸入,它會傳回 74 張圖片。

如何在 Java 中從 PDF 中提取圖像,圖 5:從 PDF 輸出中提取圖像 從 PDF 輸出中提取影像

結論

使用 Java 中的 IronPDF 庫可以從 PDF 文件中提取影像。 要安裝 IronPDF,您需要安裝 Java、Java IDE(Eclipse 或 IntelliJ)、Maven 以及 IronPDF 程式庫並將其整合到您的專案中。 使用 IronPDF 從 PDF 文件中提取影像的過程很簡單,只需要呼叫extractAllImages方法。 然後,您可以使用ImageIO.write方法將映像儲存到您選擇的檔案路徑。

本文提供了使用 Java 和 IronPDF 庫從 PDF 文件中提取影像的逐步指南。 更多詳細信息,包括如何從 PDF 中提取文本的信息,可以在"提取文本代碼示例"中找到。

IronPDF 是一個採用商業許可的庫,起價為$799 。 不過,您可以透過免費試用版在生產環境中進行評估。

常見問題解答

如何使用Java從PDF中擷取影像?

若要使用 Java 從 PDF 中提取圖像,請使用 IronPDF 庫。首先載入 PDF 文檔,然後使用extractAllImages方法。提取的映像隨後可以使用ImageIO.write等方法保存。

在Java中從PDF中擷取影像需要哪些前提條件?

若要使用 Java 從 PDF 中提取圖像,請確保已安裝 Java 以及 Java 整合開發環境(IDE),例如 Eclipse 或 IntelliJ IDEA。此外,請設定 Maven 以管理依賴項,並將 IronPDF 庫包含在您的專案中。

如何在Java中安裝用於PDF圖像提取的庫?

若要安裝 IronPDF 程式庫,請在 Java IDE(例如 IntelliJ IDEA)中建立一個 Maven 專案。將 IronPDF 依賴項新增至pom.xml檔案中,然後使用 Maven 下載並將其包含在您的專案中。

我能否用 Java 從 URL 生成的 PDF 文件中提取圖像?

是的,您可以使用 IronPDF 的renderUrlAsPdf方法將 URL 轉換為 PDF,然後使用extractAllImages方法從生成的 PDF 中提取圖像。

是否有Java PDF庫的試用版?

IronPDF 提供免費試用版,讓您可以探索其在 Java 中進行 PDF 管理和影像擷取的功能和功能。

哪些Java IDE適合使用IronPDF?

對於使用 IronPDF 庫處理 PDF 的 Java 應用程式開發,建議使用 Eclipse 和 IntelliJ IDEA 作為 IDE。

如何使用 Java 保存從 PDF 中提取的圖像?

使用 IronPDF 從 PDF 擷取影像後,可以使用ImageIO.write方法儲存它們,並指定所需的檔案路徑和影像格式。

Java 中用哪一種方法從 PDF 檔案中擷取影像?

在 IronPDF 中, extractAllImages方法用於從 PDF 文件中提取所有影像。此方法傳回一個圖像列表,您可以進一步處理或儲存這些圖像。

從PDF檔案中擷取影像並儲存時,可以使用哪些影像格式?

使用 Java 中的ImageIO.write方法,可以將擷取的映像儲存為各種格式,例如 PNG。

Java 中的 PDF 管理庫提供哪些功能?

IronPDF 是一個功能全面的 Java 函式庫,它使開發人員能夠產生、修改 PDF 檔案並從中提取資料。它包含文字提取、合併、分割和應用安全措施等功能。

柯蒂斯·週
技術撰稿人

Curtis Chau擁有卡爾頓大學電腦科學學士學位,專長於前端開發,精通Node.js、TypeScript、JavaScript和React。他熱衷於打造直覺美觀的使用者介面,喜歡使用現代框架,並擅長撰寫結構清晰、視覺效果出色的使用者手冊。

除了開發工作之外,柯蒂斯對物聯網 (IoT) 也抱有濃厚的興趣,致力於探索硬體和軟體整合的創新方法。閒暇時,他喜歡玩遊戲和製作 Discord 機器人,將他對科技的熱愛與創造力結合。