使用 IRONPDF FOR JAVA

如何在 Java 中從 PDF 提取圖像

已更新 2024年9月1日
分享:

本文將探討如何從現有的 PDF 文件中提取圖像並使用 Java 程式語言將它們保存到單一文件夾中。為此,使用 IronPDF for Java 庫來提取圖像。

IronPDF Java PDF Library

IronPDF 是一個專為開發者設計的 Java 庫,旨在幫助生成、修改和 從 PDF 文件中提取數據 在他們的Java應用程式中。使用IronPDF,您可以從多種來源創建PDF文件,例如HTML、圖片等。此外,您還可以 合併, 分割, 並操作現有的PDF。IronPDF還包括安全功能,例如 密碼保護數位簽章由 Iron Software 開發和維護的 IronPDF 以其從 PDF、HTML 和 URL 中提取文本的能力而聞名。這使它成為一個多功能且強大的工具,適用於各種應用,不論是從頭開始創建 PDF 還是處理現有的 PDF。

先決條件

在使用 IronPDF 從 PDF 文件中提取數據之前,必須滿足以下先決條件:

  1. Java 安裝: 確保您的系統已安裝 Java,並且已在環境變量中設置其路徑。如果您尚未安裝 Java,請按照以下說明進行安裝。 下載頁面來自Java網站

  2. Java IDE:安裝 Eclipse 或 IntelliJ 作為您的 Java IDE。您可以從這裡下載 Eclipse 連結 和IntelliJ從這個 下載頁面.

  3. IronPDF 庫: 下載並將 IronPDF 庫新增至您的專案作為依賴項。設定指示,請訪問 IronPDF 網站.

  4. Maven 安裝: 在開始 PDF 轉換過程之前,請確保已安裝 Maven 並與您的 IDE 集成。請按照以下教程進行操作 來自JetBrains的指南 協助安裝和集成 Maven。

IronPDF for Java 安裝

安裝 IronPDF for Java 是一個簡單的過程,只要符合所有的需求。本指南將使用 JetBrains IntelliJ IDEA 來演示安裝並運行一些示例代碼。

以下是要做的事情:

啟動 IntelliJ IDEA:在您的系統中打開 JetBrains IntelliJ IDEA。

創建 Maven 項目:在 IntelliJ IDEA 中,創建一個新的 Maven 項目。這將為安裝 IronPDF for Java 提供合適的環境。

如何在 Java 中從 PDF 中提取圖片,圖 1:創建新的 Maven 項目

建立一個新的 Maven 專案

將會出現一個新視窗。輸入專案名稱後點擊完成。

如何在 Java 中從 PDF 提取圖像,圖 2:輸入項目名稱

輸入專案名稱

當你點擊 完成 之後,一個新的專案將會開啟到 pom.xml 檔案,以添加 IronPDF for Java 的 Maven 依賴項。

接下來,在 pom.xml 檔案中添加以下依賴項,或者你可以從以下網址下載 JAR 檔案 Maven 資料庫.

<dependency>
   <groupId>com.ironsoftware</groupId>
   <artifactId>com.ironsoftware</artifactId>
   <version>2024.9.1</version>
</dependency>

將依賴項放置在 pom.xml 文件中後,文件的右上角會出現一個小圖標。

如何從 PDF 中提取圖像在 Java,中,圖 3:帶有小圖標安裝依賴項的 pom.xml 文件

pom.xml 檔案帶有小圖示來安裝依賴項

點擊此圖示來安裝 IronPDF for Java 的 Maven 依賴項。這根據您的網路連接狀況可能只需要幾分鐘。

提取圖片

您可以使用 IronPDF 從 PDF 文件中提取圖片,通過一個稱為的方法 [提取所有圖像](/java/object-reference/api/com/ironsoftware/ironpdf/PdfDocument.html#extractAllImages())此方法會返回 PDF 檔案中所有可用的圖片。之後,您可以使用 ImageIO.write 方法,通過提供輸出圖片的路徑和格式,將所有提取的圖片保存到您選擇的檔案路徑。

5.1. 從 PDF 文件中提取圖片

下面的例子中,將從 PDF 文件中提取圖片並保存到檔案系統中作為 PNG 圖片。

import com.ironsoftware.ironpdf.PdfDocument;

import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.nio.file.Files;
import java.nio.file.Paths;
import java.util.List;

public class main {
    public static void main(String[] args) throws Exception {
        PdfDocument pdf = PdfDocument.fromFile(Paths.get("Final Project Report Craft Arena.pdf"));

        List<BufferedImage> images = pdf.extractAllImages();
        int i = 0;
        for (BufferedImage image : images) {
            ImageIO.write(image, "PNG", Files.newOutputStream(Paths.get("image" + ++i + ".png")));
        }
    }
}
JAVA

上述程式開啟"Final Project Report Craft Arena.pdf"檔案,使用extractAllImages方法將檔案中的所有影像提取為BufferedImage物件的列表。然後將每個新影像檔案另存為具有唯一名稱的獨立PNG檔案。

如何從 PDF 中提取影像在 Java 中,圖4:從 PDF 輸出提取影像

從 PDF 輸出提取圖像

從URL提取圖像

本節將討論如何直接從URL提取圖像。在下面的代碼中,URL被轉換為PDF頁面,然後切換導航以從PDF中提取圖像。

import com.ironsoftware.ironpdf.PdfDocument;

import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.io.IOException;
import java.nio.file.Files;
import java.nio.file.Paths;
import java.util.List;

public class main {
    public static void main(String[] args) throws IOException {
        PdfDocument pdf = PdfDocument.renderUrlAsPdf("https://www.amazon.com/?tag=hp2-brobookmark-us-20");

        List<BufferedImage> images = pdf.extractAllImages();
        int i = 0;
        for (BufferedImage image : images) {
            ImageIO.write(image, "PNG", Files.newOutputStream(Paths.get("image" + ++i + ".png")));
        }
    }
}
JAVA

在上面的程式碼中,提供了亞馬遜首頁的URL作為輸入,並返回了74張圖片。

如何在 Java 中從 PDF 中提取圖像,圖 5:從 PDF 輸出的圖像提取

從 PDF 輸出提取圖像

結論

可以使用IronPDF庫在Java中從PDF文件中提取圖像。要安裝IronPDF,您需要具備Java和Java IDE。 (Eclipse 或 IntelliJ), Maven,和 IronPDF 庫已安裝並集成到您的項目中。使用 IronPDF 從 PDF 文件中提取圖像的過程非常簡單,只需調用一個方法 extractAllImages。然後,您可以使用 ImageIO.write 方法將圖像保存到您選擇的文件路徑。

本文章提供逐步指南關於 如何提取圖片 從 PDF 文件中使用 Java 和 IronPDF 庫。更多詳細信息,包括如何從 PDF 中提取文本的信息,可以在 提取文本代碼範例.

IronPDF 是一個具有 商業授權起價 $749。然而,您可以在生產環境中評估它 免費試用.

< 上一頁
如何在 Java 中生成 PDF
下一個 >
如何在 Java 中從 PDF 提取資料

使用 Maven 安裝

版本: 2024.9.1

<dependency>
  <groupId>com.ironsoftware</groupId>
  <artifactId>ironpdf</artifactId>
  <version>2024.9.1</version>
</dependency>

準備開始了嗎? 版本: 2024.9 剛剛發布

免費 Maven 下載 查看許可證 >