如何在Java中從PDF中提取圖像
本文將探討如何使用 Java 程式語言從現有的 PDF 文件中提取圖像並將它們保存到單一資料夾中。 為此,我們使用 IronPDF for Java 庫來提取影像。
如何在 Java 中提取圖像從 PDF
- 安裝 Java 庫以從 PDF 中提取圖像
- 加載 PDF 文件或從 URL 渲染
- 利用
extractAllImages方法提取映像 - 將提取的圖像保存到 Java 中的文件或流中
- 檢查指定目錄中的提取圖像
IronPDF Java PDF 庫
IronPDF 是一個 Java 程式庫,旨在幫助開發人員在其 Java 應用程式中產生、修改和提取 PDF 文件中的資料。 使用 IronPDF,您可以從多種來源建立 PDF 文檔,例如 HTML、圖像等。 此外,您還可以合併、分割和操作現有的 PDF 檔案。 IronPDF 也包含密碼保護和數位簽章等安全功能。
IronPDF 由 Iron Software 開發和維護,以其從 PDF、HTML 和 URL 中提取文字的功能而聞名。 這使其成為一款用途廣泛且功能強大的工具,適用於各種應用場景,無論是從頭開始建立 PDF 還是處理現有的 PDF。
先決條件
在使用 IronPDF 從 PDF 文件中提取數據之前,必須滿足一些先決條件:
- Java 安裝:確保您的系統上已安裝 Java,並且已在環境變數中設定其路徑。 如果您還沒有安裝 Java,請按照Java 網站上的以下下載頁面上的說明進行操作。
- Java IDE:請安裝 Eclipse 或 IntelliJ 作為您的 Java IDE。您可以從此連結下載 Eclipse,從此下載頁面下載IntelliJ。
- IronPDF 庫:下載 IronPDF 庫並將其作為依賴項新增至您的專案。 有關設定說明,請造訪IronPDF 網站。
- Maven 安裝:在開始 PDF 轉換過程之前,請確保已安裝 Maven 並將其整合到您的 IDE 中。 請按照JetBrains 提供的以下指南中的教程,以獲取有關安裝和整合 Maven 的協助。
IronPDF Java 安裝
只要滿足所有要求,安裝 IronPDF for Java 就是一個簡單的過程。 本指南將使用 JetBrains IntelliJ IDEA 來示範安裝過程並執行一些範例程式碼。
1.啟動 IntelliJ IDEA:在您的系統上開啟 JetBrains IntelliJ IDEA。
2.建立 Maven 專案:在 IntelliJ IDEA 中,建立一個新的 Maven 專案。 這將為安裝 IronPDF for Java 提供合適的環境。
如何在 Java 中從 PDF 中提取圖像,圖 1:建立一個新的 Maven 項目 建立一個新的 Maven 項目
將出現一個新視窗。 輸入項目名稱,然後點選"完成"。
如何在 Java 中從 PDF 中提取圖像,圖 2:輸入專案名稱 請輸入項目名稱
點擊"完成"後,將開啟一個新項目,進入pom.xml文件,新增 IronPDF for Java 的 Maven 依賴項。
接下來,在pom.xml檔案中新增以下依賴項,或者您可以從以下Maven 儲存庫下載 JAR 檔案。
<dependency>
<groupId>com.ironsoftware</groupId>
<artifactId>ironpdf</artifactId>
<version>YOUR_VERSION_HERE</version>
</dependency><dependency>
<groupId>com.ironsoftware</groupId>
<artifactId>ironpdf</artifactId>
<version>YOUR_VERSION_HERE</version>
</dependency>在pom.xml檔案中新增依賴項後,檔案右上角會出現一個小圖示。
如何在 Java 中從 PDF 中提取圖像,圖 3:帶有小圖標的 pom.xml 文件,用於安裝依賴項 pom.xml 檔案帶有一個小圖標,用於安裝依賴項
點擊此圖示安裝 IronPDF for Java 的 Maven 依賴項。 這只需要幾分鐘,具體時間取決於您的網路連線速度。
擷取影像
您可以使用 IronPDF 透過名為[extractAllImages](/java/object-reference/api/com/ironsoftware/ironpdf/PdfDocument.html#extractAllImages()的單一方法從 PDF 文件中提取影像。 此方法傳回 PDF 文件中的所有圖像。之後,您可以使用ImageIO.write方法,透過指定輸出映像的路徑和格式,將所有提取的映像儲存到您選擇的檔案路徑。
5.1 從PDF文件中擷取影像
在下面的範例中,PDF 文件中的圖像將被提取出來,並以 PNG 圖像的形式儲存到檔案系統中。
import com.ironsoftware.ironpdf.PdfDocument;
import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.nio.file.Files;
import java.nio.file.Paths;
import java.util.List;
public class Main {
public static void main(String[] args) throws Exception {
// Load PDF document from file
PdfDocument pdf = PdfDocument.fromFile(Paths.get("Final Project Report Craft Arena.pdf"));
// Extract all images from the PDF document
List<BufferedImage> images = pdf.extractAllImages();
int i = 0;
// Save each extracted image to the filesystem as a PNG
for (BufferedImage image : images) {
ImageIO.write(image, "PNG", Files.newOutputStream(Paths.get("image" + ++i + ".png")));
}
}
}import com.ironsoftware.ironpdf.PdfDocument;
import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.nio.file.Files;
import java.nio.file.Paths;
import java.util.List;
public class Main {
public static void main(String[] args) throws Exception {
// Load PDF document from file
PdfDocument pdf = PdfDocument.fromFile(Paths.get("Final Project Report Craft Arena.pdf"));
// Extract all images from the PDF document
List<BufferedImage> images = pdf.extractAllImages();
int i = 0;
// Save each extracted image to the filesystem as a PNG
for (BufferedImage image : images) {
ImageIO.write(image, "PNG", Files.newOutputStream(Paths.get("image" + ++i + ".png")));
}
}
}上面的程式開啟"Final Project Report Craft Arena.pdf"文件,並使用extractAllImages方法將文件中的所有影像提取到BufferedImage物件清單中。 然後,它將每個新檔案圖像儲存為具有唯一名稱的單獨 PNG 檔案。
如何在 Java 中從 PDF 中提取圖像,圖 4:從 PDF 輸出中提取圖像 從 PDF 輸出中提取影像
從 URL 提取圖像
本節將討論如何直接從 URL 中提取圖像。 在下面的程式碼中,URL 被轉換為 PDF 頁面,然後切換導航以從 PDF 中提取圖像。
import com.ironsoftware.ironpdf.PdfDocument;
import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.io.IOException;
import java.nio.file.Files;
import java.nio.file.Paths;
import java.util.List;
public class Main {
public static void main(String[] args) throws IOException {
// Render PDF from a URL
PdfDocument pdf = PdfDocument.renderUrlAsPdf("https://www.amazon.com/?tag=hp2-brobookmark-us-20");
// Extract all images from the rendered PDF document
List<BufferedImage> images = pdf.extractAllImages();
int i = 0;
// Save each extracted image to the filesystem as a PNG
for (BufferedImage image : images) {
ImageIO.write(image, "PNG", Files.newOutputStream(Paths.get("image" + ++i + ".png")));
}
}
}import com.ironsoftware.ironpdf.PdfDocument;
import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.io.IOException;
import java.nio.file.Files;
import java.nio.file.Paths;
import java.util.List;
public class Main {
public static void main(String[] args) throws IOException {
// Render PDF from a URL
PdfDocument pdf = PdfDocument.renderUrlAsPdf("https://www.amazon.com/?tag=hp2-brobookmark-us-20");
// Extract all images from the rendered PDF document
List<BufferedImage> images = pdf.extractAllImages();
int i = 0;
// Save each extracted image to the filesystem as a PNG
for (BufferedImage image : images) {
ImageIO.write(image, "PNG", Files.newOutputStream(Paths.get("image" + ++i + ".png")));
}
}
}在上面的程式碼中,亞馬遜主頁 URL 作為輸入,它會傳回 74 張圖片。
如何在 Java 中從 PDF 中提取圖像,圖 5:從 PDF 輸出中提取圖像 從 PDF 輸出中提取影像
結論
使用 Java 中的 IronPDF 庫可以從 PDF 文件中提取影像。 要安裝 IronPDF,您需要安裝 Java、Java IDE(Eclipse 或 IntelliJ)、Maven 以及 IronPDF 程式庫並將其整合到您的專案中。 使用 IronPDF 從 PDF 文件中提取影像的過程很簡單,只需要呼叫extractAllImages方法。 然後,您可以使用ImageIO.write方法將映像儲存到您選擇的檔案路徑。
本文提供了使用 Java 和 IronPDF 庫從 PDF 文件中提取影像的逐步指南。 更多詳細信息,包括如何從 PDF 中提取文本的信息,可以在"提取文本代碼示例"中找到。
常見問題解答
如何使用Java從PDF中擷取影像?
若要使用 Java 從 PDF 中提取圖像,請使用 IronPDF 庫。首先載入 PDF 文檔,然後使用extractAllImages方法。提取的映像隨後可以使用ImageIO.write等方法保存。
在Java中從PDF中擷取影像需要哪些前提條件?
若要使用 Java 從 PDF 中提取圖像,請確保已安裝 Java 以及 Java 整合開發環境(IDE),例如 Eclipse 或 IntelliJ IDEA。此外,請設定 Maven 以管理依賴項,並將 IronPDF 庫包含在您的專案中。
如何在Java中安裝用於PDF圖像提取的庫?
若要安裝 IronPDF 程式庫,請在 Java IDE(例如 IntelliJ IDEA)中建立一個 Maven 專案。將 IronPDF 依賴項新增至pom.xml檔案中,然後使用 Maven 下載並將其包含在您的專案中。
我能否用 Java 從 URL 生成的 PDF 文件中提取圖像?
是的,您可以使用 IronPDF 的renderUrlAsPdf方法將 URL 轉換為 PDF,然後使用extractAllImages方法從生成的 PDF 中提取圖像。
是否有Java PDF庫的試用版?
IronPDF 提供免費試用版,讓您可以探索其在 Java 中進行 PDF 管理和影像擷取的功能和功能。
哪些Java IDE適合使用IronPDF?
對於使用 IronPDF 庫處理 PDF 的 Java 應用程式開發,建議使用 Eclipse 和 IntelliJ IDEA 作為 IDE。
如何使用 Java 保存從 PDF 中提取的圖像?
使用 IronPDF 從 PDF 擷取影像後,可以使用ImageIO.write方法儲存它們,並指定所需的檔案路徑和影像格式。
Java 中用哪一種方法從 PDF 檔案中擷取影像?
在 IronPDF 中, extractAllImages方法用於從 PDF 文件中提取所有影像。此方法傳回一個圖像列表,您可以進一步處理或儲存這些圖像。
從PDF檔案中擷取影像並儲存時,可以使用哪些影像格式?
使用 Java 中的ImageIO.write方法,可以將擷取的映像儲存為各種格式,例如 PNG。
Java 中的 PDF 管理庫提供哪些功能?
IronPDF 是一個功能全面的 Java 函式庫,它使開發人員能夠產生、修改 PDF 檔案並從中提取資料。它包含文字提取、合併、分割和應用安全措施等功能。






