跳過到頁腳內容
使用 IRONPDF FOR JAVA

如何在 Java 中提取圖像從 PDF

本文將探討如何從現有的PDF文件中提取圖片,並使用Java程式語言將它們儲存到單一資料夾中。 為此目的,使用IronPDF for Java程式庫來提取圖片。

IronPDF Java PDF程式庫

IronPDF是一個Java程式庫,旨在幫助開發人員在其Java應用程式中生成、修改和從PDF文件中提取數據。 使用IronPDF,您可以從HTML、圖片等多種來源創建PDF文件。 此外,您還可以合併拆分以及操作現有的PDF。 IronPDF還包括安全功能,如密碼保護數位簽名

由Iron Software開發和維護,IronPDF以其從PDF、HTML和URL提取文字的能力而聞名。 這使其成為適用於各種應用程式的多功能和強大的工具,無論您是從頭創建PDF還是處理現有的。

先決條件

在使用IronPDF從PDF文件中提取數據之前,需要滿足以下幾個先決條件:

  1. Java安裝:確保您的系統上已安裝Java,並且在環境變量中已設置其路徑。 如果您尚未安裝Java,請按照以下Java網站下載頁面的說明進行安裝。
  2. Java IDE:安裝Eclipse或IntelliJ作為您的Java IDE。您可以從此鏈接下載Eclipse,從此下載頁面下載IntelliJ。
  3. IronPDF程式庫:下載並將IronPDF程式庫添加到您的專案作為依賴項。 有關設置說明,請訪問IronPDF網站
  4. Maven安裝:確保在開始PDF轉換過程之前已安裝並集成了Maven。 請參考以下JetBrains指南以獲得安裝和集成Maven的幫助。

IronPDF for Java安裝

只要滿足所有要求,安裝IronPDF for Java是一個簡單的過程。 本指南將使用JetBrains IntelliJ IDEA來演示安裝並運行一些示例代碼。

  1. 啟動IntelliJ IDEA:在您的系統上打開JetBrains IntelliJ IDEA。

  2. 創建一個Maven專案:在IntelliJ IDEA中創建一個新的Maven專案。 這將為IronPDF for Java的安裝提供合適的環境。

如何在Java中從PDF提取圖片,圖1:創建新的Maven專案 創建新的Maven專案

一個新窗口將會出現。 輸入項目名稱,然後點擊完成。

如何在Java中從PDF提取圖片,圖2:輸入專案名稱 輸入專案名稱

當您點擊完成後,新專案將開啟pom.xml文件以添加IronPDF for Java的Maven依賴項。

接下來,在pom.xml文件中添加以下依賴項,或者您可以從以下Maven儲存庫下載JAR文件。

<dependency>
    <groupId>com.ironsoftware</groupId>
    <artifactId>ironpdf</artifactId>
    <version>YOUR_VERSION_HERE</version>
</dependency>
<dependency>
    <groupId>com.ironsoftware</groupId>
    <artifactId>ironpdf</artifactId>
    <version>YOUR_VERSION_HERE</version>
</dependency>
XML

一旦您將依賴項放入pom.xml文件,文件的右上角將出現一個小圖標。

如何在Java中從PDF提取圖片,圖3:pom.xml文件中帶有安裝依賴項的小圖標 pom.xml文件中帶有安裝依賴項的小圖標

點擊此圖標以安裝IronPDF for Java的Maven依賴項。 這將根據您的網絡連接情況只需幾分鐘。

提取圖片

您可以使用IronPDF中的一個名為[extractAllImages](/java/object-reference/api/com/ironsoftware/ironpdf/PdfDocument.html#extractAllImages()的方法從PDF文檔中提取圖片。 此方法返回PDF文件中所有可用的圖片。之後,您可以使用ImageIO.write方法通過提供輸出圖片的路徑和格式將所有提取的圖片儲存到您選擇的文件路徑中。

5.1. 從PDF文檔中提取圖片

在下面的例子中,將從PDF文檔中提取圖片並以PNG格式儲存到檔案系統中。

import com.ironsoftware.ironpdf.PdfDocument;
import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.nio.file.Files;
import java.nio.file.Paths;
import java.util.List;

public class Main {
    public static void main(String[] args) throws Exception {
        // Load PDF document from file
        PdfDocument pdf = PdfDocument.fromFile(Paths.get("Final Project Report Craft Arena.pdf"));

        // Extract all images from the PDF document
        List<BufferedImage> images = pdf.extractAllImages();
        int i = 0;

        // Save each extracted image to the filesystem as a PNG
        for (BufferedImage image : images) {
            ImageIO.write(image, "PNG", Files.newOutputStream(Paths.get("image" + ++i + ".png")));
        }
    }
}
import com.ironsoftware.ironpdf.PdfDocument;
import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.nio.file.Files;
import java.nio.file.Paths;
import java.util.List;

public class Main {
    public static void main(String[] args) throws Exception {
        // Load PDF document from file
        PdfDocument pdf = PdfDocument.fromFile(Paths.get("Final Project Report Craft Arena.pdf"));

        // Extract all images from the PDF document
        List<BufferedImage> images = pdf.extractAllImages();
        int i = 0;

        // Save each extracted image to the filesystem as a PNG
        for (BufferedImage image : images) {
            ImageIO.write(image, "PNG", Files.newOutputStream(Paths.get("image" + ++i + ".png")));
        }
    }
}
JAVA

上面的程式開啟了"Final Project Report Craft Arena.pdf"文件,並使用BufferedImage物件列表。 然後,將每個新文件圖片儲存為具有唯一名稱的單獨PNG文件。

如何在Java中從PDF提取圖片,圖4:從PDF輸出提取圖片 從PDF輸出提取圖片

從URL提取圖片

此部分將討論如何直接從URL中提取圖片。 在下面的代碼中,URL被轉換為PDF頁面,然後切換導航以從PDF中提取圖片。

import com.ironsoftware.ironpdf.PdfDocument;
import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.io.IOException;
import java.nio.file.Files;
import java.nio.file.Paths;
import java.util.List;

public class Main {
    public static void main(String[] args) throws IOException {
        // Render PDF from a URL
        PdfDocument pdf = PdfDocument.renderUrlAsPdf("https://www.amazon.com/?tag=hp2-brobookmark-us-20");

        // Extract all images from the rendered PDF document
        List<BufferedImage> images = pdf.extractAllImages();
        int i = 0;

        // Save each extracted image to the filesystem as a PNG
        for (BufferedImage image : images) {
            ImageIO.write(image, "PNG", Files.newOutputStream(Paths.get("image" + ++i + ".png")));
        }
    }
}
import com.ironsoftware.ironpdf.PdfDocument;
import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.io.IOException;
import java.nio.file.Files;
import java.nio.file.Paths;
import java.util.List;

public class Main {
    public static void main(String[] args) throws IOException {
        // Render PDF from a URL
        PdfDocument pdf = PdfDocument.renderUrlAsPdf("https://www.amazon.com/?tag=hp2-brobookmark-us-20");

        // Extract all images from the rendered PDF document
        List<BufferedImage> images = pdf.extractAllImages();
        int i = 0;

        // Save each extracted image to the filesystem as a PNG
        for (BufferedImage image : images) {
            ImageIO.write(image, "PNG", Files.newOutputStream(Paths.get("image" + ++i + ".png")));
        }
    }
}
JAVA

在上面的代碼中,Amazon首頁URL作為輸入,返回了74張圖片。

如何在Java中從PDF提取圖片,圖5:從PDF輸出提取圖片 從PDF輸出提取圖片

結論

在Java中使用IronPDF程式庫可以從PDF文檔中提取圖片。 要安裝IronPDF,您需要安裝Java、Java IDE(Eclipse或IntelliJ)、Maven和與專案集成的IronPDF程式庫。 使用IronPDF從PDF文件中提取圖片的過程很簡單,僅需要調用一個extractAllImages方法。 然後,您可以使用ImageIO.write方法將圖片儲存到您選擇的文件路徑中。

本文提供了一個逐步指南,說明如何使用Java和IronPDF程式庫從PDF文件中提取圖片。 更多詳細信息,包括如何從PDF中提取文本的信息,可以在提取文本代碼示例中找到。

IronPDF是一個擁有商業授權的程式庫,起價為$799。 不過,您可以通過免費試用在生產環境中進行評估。

常見問題解答

如何使用Java從PDF中擷取影像?

若要使用 Java 從 PDF 中提取圖像,請使用IronPDF庫。首先載入 PDF 文檔,然後使用extractAllImages方法。提取的映像隨後可以使用ImageIO.write等方法保存。

在Java中從PDF中擷取影像需要哪些前提條件?

若要使用 Java 從 PDF 中提取圖像,請確保已安裝 Java 以及 Java 整合開發環境(IDE),例如 Eclipse 或 IntelliJ IDEA。此外,請設定 Maven 以管理依賴項,並將IronPDF庫包含在您的專案中。

如何在Java中安裝用於PDF圖像提取的庫?

若要安裝IronPDF程式庫,請在 Java IDE(例如 IntelliJ IDEA)中建立一個 Maven 專案。將IronPDF依賴項新增至pom.xml檔案中,然後使用 Maven 下載並將其包含在您的專案中。

我能否用 Java 從 URL 生成的 PDF 文件中提取圖像?

是的,您可以使用 IronPDF 的renderUrlAsPdf方法將 URL 轉換為 PDF,然後使用extractAllImages方法從生成的 PDF 中提取圖像。

是否有Java PDF庫的試用版?

IronPDF提供免費試用版,讓您可以探索其在 Java 中進行 PDF 管理和影像擷取的功能和功能。

哪些Java IDE適合使用IronPDF?

對於使用IronPDF庫處理 PDF 的 Java 應用程式開發,建議使用 Eclipse 和 IntelliJ IDEA 作為 IDE。

如何使用 Java 保存從 PDF 中提取的圖像?

使用IronPDF從 PDF 擷取影像後,可以使用ImageIO.write方法儲存它們,並指定所需的檔案路徑和影像格式。

Java 中用哪一種方法從 PDF 檔案中擷取影像?

在IronPDF中, extractAllImages方法用於從 PDF 文件中提取所有影像。此方法傳回一個圖像列表,您可以對其進行進一步處理或儲存。

從PDF檔案中擷取影像並儲存時,可以使用哪些影像格式?

使用 Java 中的ImageIO.write方法,可以將擷取的映像儲存為各種格式,例如 PNG。

Java 中的 PDF 管理庫提供哪些功能?

IronPDF是一個功能全面的 Java 函式庫,它使開發人員能夠產生、修改 PDF 檔案並從中提取資料。它包含文字提取、合併、分割和應用安全措施等功能。

Darrius Serrant
全棧軟件工程師 (WebOps)

Darrius Serrant 擁有邁阿密大學計算機科學學士學位,目前任職於 Iron Software 的全栈 WebOps 市場營銷工程師。從小就迷上編碼,他認為計算既神秘又可接近,是創意和解決問題的完美媒介。

在 Iron Software,Darrius 喜歡創造新事物,並簡化複雜概念以便於理解。作為我們的駐場開發者之一,他也自願教學生,分享他的專業知識給下一代。

對 Darrius 來說,工作令人滿意因為它被重視且有實際影響。

Iron Support Team

We're online 24 hours, 5 days a week.
Chat
Email
Call Me