使用 IRONPDF FOR JAVA

如何在 Java 中從 PDF 提取圖像

已更新 2024年9月1日
分享:

本文將探討如何使用 Java 程式語言從現有 PDF 檔案中提取圖像並將它們保存到單個資料夾中。 為此,使用 IronPDF for Java 庫來提取圖像。

IronPDF Java PDF 函式庫

IronPDF 是一個 Java 函式庫,旨在協助開發者生成、修改和從 PDF 文件中提取數據在他們的 Java 應用程式中。 使用 IronPDF,您可以從各種來源(如 HTML、圖像等)創建 PDF 文件。 此外,您可以合併, 分割和操作現有的 PDF。 IronPDF 也包含安全功能,例如密碼保護數位簽章.

由 Iron Software 開發和維護的 IronPDF 以其從 PDF、HTML 和 URL 中提取文本的能力而聞名。 這使其成為一個多功能且強大的工具,適用於各種應用程序,無論您是從頭開始創建 PDF 還是處理現有的 PDF。

先決條件

在使用 IronPDF 從 PDF 文件中提取數據之前,必須滿足一些先決條件:

  1. Java 安裝: 確保您的系統已安裝 Java,並在環境變數中設置了其路徑。 如果您尚未安裝 Java,請按照以下說明進行操作下載頁面來自Java網站.

  2. Java IDE: 安裝 Eclipse 或 IntelliJ 作為您的 Java IDE。您可以從這裡下載 Eclipse連結和IntelliJ從這個下載頁面.

  3. IronPDF 庫: 下載並將 IronPDF 庫作為依賴項添加到您的項目中。 如需設定說明,請訪問IronPDF 網站.

  4. Maven 安裝: 在開始 PDF 轉換過程之前,請確保 Maven 已安裝並與您的 IDE 整合。 請按照以下教程進行來自JetBrains的指南協助安裝和集成 Maven。

IronPDF for Java 安裝

如果滿足所有要求,安裝 IronPDF for Java 是一個簡單的過程。 本指南將使用 JetBrains IntelliJ IDEA 演示安裝並運行一些範例代碼。

以下是要做的事情:

啟動 IntelliJ IDEA:在您的系統上打開 JetBrains IntelliJ IDEA。

在 IntelliJ IDEA 中創建一個新的 Maven 項目。 這將為安裝 IronPDF for Java 提供合適的環境。

如何在 Java 中從 PDF 中提取圖片,圖 1:創建新的 Maven 項目

建立一個新的 Maven 專案

將會出現一個新視窗。 輸入專案名稱,然後點擊完成。

如何在 Java 中從 PDF 提取圖像,圖 2:輸入項目名稱

輸入專案名稱

在您點擊 完成 後,將會開啟一個新專案,以 pom.xml 檔案的方式加入 IronPDF for Java 的 Maven 依賴項。

接下來,請在 pom.xml 文件中添加以下相依性,或者您可以從以下下載 JAR 檔案Maven 資料庫.

<dependency>
   <groupId>com.ironsoftware</groupId>
   <artifactId>com.ironsoftware</artifactId>
   <version>2024.11.4</version>
</dependency>

將依賴項放置在 pom.xml 文件中後,文件的右上角會出現一個小圖標。

如何從 PDF 中提取圖像在 Java,中,圖 3:帶有小圖標安裝依賴項的 pom.xml 文件

帶有小圖標來安裝依賴項的pom.xml檔案

點擊此圖標以安裝 IronPDF for Java 的 Maven 依賴項。 這只會根據您的網路連接花幾分鐘的時間。

提取圖像

您可以使用IronPDF中的一個方法從PDF文檔中提取圖像[提取所有圖像](/java/object-reference/api/com/ironsoftware/ironpdf/PdfDocument.html#extractAllImages()). 此方法返回 PDF 文件中所有可用的圖像。之後,您可以使用 ImageIO.write 方法,通過提供輸出圖像的路徑和格式,將所有提取的圖像保存到您選擇的文件路徑。

5.1. 從 PDF 文件中提取圖片

在以下範例中,PDF 文件中的影像將被提取並保存到檔案系統中為 PNG 影像。

import com.ironsoftware.ironpdf.PdfDocument;

import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.nio.file.Files;
import java.nio.file.Paths;
import java.util.List;

public class main {
    public static void main(String[] args) throws Exception {
        PdfDocument pdf = PdfDocument.fromFile(Paths.get("Final Project Report Craft Arena.pdf"));

        List<BufferedImage> images = pdf.extractAllImages();
        int i = 0;
        for (BufferedImage image : images) {
            ImageIO.write(image, "PNG", Files.newOutputStream(Paths.get("image" + ++i + ".png")));
        }
    }
}
JAVA

上面的程式開啟了 "Final Project Report Craft Arena.pdf" 檔案,並使用 extractAllImages 方法將檔案中的所有圖片提取為 BufferedImage 物件的列表。 然後將每個新檔案圖像儲存為具有唯一名稱的單獨 PNG 檔案。

如何從 PDF 中提取影像在 Java 中,圖4:從 PDF 輸出提取影像

從 PDF 輸出提取圖像

從 URL 擷取圖像

本節將討論如何直接從 URL 提取圖像。 在以下程式碼中,URL 轉換為 PDF 頁面,然後切換導航以從 PDF 中擷取圖像。

import com.ironsoftware.ironpdf.PdfDocument;

import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.io.IOException;
import java.nio.file.Files;
import java.nio.file.Paths;
import java.util.List;

public class main {
    public static void main(String[] args) throws IOException {
        PdfDocument pdf = PdfDocument.renderUrlAsPdf("https://www.amazon.com/?tag=hp2-brobookmark-us-20");

        List<BufferedImage> images = pdf.extractAllImages();
        int i = 0;
        for (BufferedImage image : images) {
            ImageIO.write(image, "PNG", Files.newOutputStream(Paths.get("image" + ++i + ".png")));
        }
    }
}
JAVA

在上述程式碼中,Amazon 首頁的 URL 被作為輸入,並且返回了 74 張圖片。

如何在 Java 中從 PDF 中提取圖像,圖 5:從 PDF 輸出的圖像提取

從 PDF 輸出提取圖像

結論

使用 IronPDF 庫可以在 Java 中從 PDF 文件中提取圖像。 要安裝 IronPDF,您需要具備 Java 和 Java IDE。(Eclipse 或 IntelliJ), Maven 與 IronPDF 庫已安裝並整合到您的專案中。 使用 IronPDF 從 PDF 文件中提取圖片的過程很簡單,只需要一次方法呼叫 extractAllImages 即可。 然後,你可以使用 ImageIO.write 方法將圖片保存到你選擇的文件路徑中。

本文提供了一個分步指南關於如何提取圖片使用 Java 和 IronPDF 函式庫 從 PDF 文件中提取。 更多詳情,包括如何從 PDF 中提取文本的信息,可以在提取文本代碼範例.

IronPDF 是一個庫,具有一個商業授權,起始於 $749。 不過,您可以在生產環境中使用來評估它免費試用.

< 上一頁
如何在 Java 中生成 PDF
下一個 >
如何在 Java 中從 PDF 提取資料

使用 Maven 安裝

版本:2024.11.4

<dependency>
  <groupId>com.ironsoftware</groupId>
  <artifactId>ironpdf</artifactId>
  <version>2024.11.4</version>
</dependency>

準備開始了嗎? 版本: 2024.11 剛剛發布

免費 Maven 下載 查看許可證 >