如何在 Java 中提取圖像從 PDF
本文將探討如何使用 Java 程式語言從現有的 PDF 文件中提取圖像並將它們保存到單一資料夾中。 為此,我們使用 IronPDF for Java 庫來提取影像。
如何在 Java 中提取圖像從 PDF
- 安裝 Java 庫以從 PDF 中提取圖像
- 加載 PDF 文件或從 URL 渲染
- 利用
extractAllImages方法提取映像 - 將提取的圖像保存到 Java 中的文件或流中
- 檢查指定目錄中的提取圖像
IronPDF Java PDF 庫
IronPDF 是一個 Java 程式庫,旨在幫助開發人員在其 Java 應用程式中產生、修改和提取 PDF 文件中的資料。 使用 IronPDF,您可以從多種來源建立 PDF 文檔,例如 HTML、圖像等。 此外,您還可以合併、分割和操作現有的 PDF 檔案。 IronPDF 也包含密碼保護和數位簽章等安全功能。
IronPDF 由 Iron Software 開發和維護,以其從 PDF、HTML 和 URL 中提取文字的功能而聞名。 這使其成為一款用途廣泛且功能強大的工具,適用於各種應用場景,無論是從頭開始建立 PDF 還是處理現有的 PDF。
先決條件
在使用 IronPDF 從 PDF 文件中提取數據之前,必須滿足一些先決條件:
- Java 安裝:確保您的系統上已安裝 Java,並且已在環境變數中設定其路徑。 如果您還沒有安裝 Java,請按照Java 網站上的以下下載頁面上的說明進行操作。
- Java IDE:請安裝 Eclipse 或 IntelliJ 作為您的 Java IDE。您可以從此連結下載 Eclipse,從此下載頁面下載IntelliJ。
- IronPDF 庫:下載 IronPDF 庫並將其作為依賴項新增至您的專案。 有關設定說明,請造訪IronPDF 網站。
- Maven 安裝:在開始 PDF 轉換過程之前,請確保已安裝 Maven 並將其整合到您的 IDE 中。 請按照JetBrains 提供的以下指南中的教程,以獲取有關安裝和整合 Maven 的協助。
IronPDF Java 安裝
只要滿足所有要求,安裝 IronPDF for Java 就是一個簡單的過程。 本指南將使用 JetBrains IntelliJ IDEA 來示範安裝過程並執行一些範例程式碼。
1.啟動 IntelliJ IDEA:在您的系統上開啟 JetBrains IntelliJ IDEA。
2.建立 Maven 專案:在 IntelliJ IDEA 中,建立一個新的 Maven 專案。 這將為安裝 IronPDF for Java 提供合適的環境。
如何在 Java 中從 PDF 中提取圖像,圖 1:建立一個新的 Maven 項目 建立一個新的 Maven 項目
將出現一個新視窗。 輸入項目名稱,然後點選"完成"。
如何在 Java 中從 PDF 中提取圖像,圖 2:輸入專案名稱 請輸入項目名稱
點擊"完成"後,將開啟一個新項目,進入pom.xml文件,新增 IronPDF for Java 的 Maven 依賴項。
接下來,在pom.xml檔案中新增以下依賴項,或者您可以從以下Maven 儲存庫下載 JAR 檔案。
<dependency>
<groupId>com.ironsoftware</groupId>
<artifactId>ironpdf</artifactId>
<version>YOUR_VERSION_HERE</version>
</dependency><dependency>
<groupId>com.ironsoftware</groupId>
<artifactId>ironpdf</artifactId>
<version>YOUR_VERSION_HERE</version>
</dependency>在pom.xml檔案中新增依賴項後,檔案右上角會出現一個小圖示。
如何在 Java 中從 PDF 中提取圖像,圖 3:帶有小圖標的 pom.xml 文件,用於安裝依賴項 pom.xml 檔案帶有一個小圖標,用於安裝依賴項
點擊此圖示安裝 IronPDF for Java 的 Maven 依賴項。 這只需要幾分鐘,具體時間取決於您的網路連線速度。
擷取影像
您可以使用 IronPDF 透過名為[extractAllImages](/java/object-reference/api/com/ironsoftware/ironpdf/PdfDocument.html#extractAllImages()的單一方法從 PDF 文件中提取影像。 此方法傳回 PDF 文件中的所有圖像。之後,您可以使用ImageIO.write方法,透過指定輸出映像的路徑和格式,將所有提取的映像儲存到您選擇的檔案路徑。
5.1 從PDF文件中擷取影像
在下面的範例中,PDF 文件中的圖像將被提取出來,並以 PNG 圖像的形式儲存到檔案系統中。
import com.ironsoftware.ironpdf.PdfDocument;
import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.nio.file.Files;
import java.nio.file.Paths;
import java.util.List;
public class Main {
public static void main(String[] args) throws Exception {
// Load PDF document from file
PdfDocument pdf = PdfDocument.fromFile(Paths.get("Final Project Report Craft Arena.pdf"));
// Extract all images from the PDF document
List<BufferedImage> images = pdf.extractAllImages();
int i = 0;
// Save each extracted image to the filesystem as a PNG
for (BufferedImage image : images) {
ImageIO.write(image, "PNG", Files.newOutputStream(Paths.get("image" + ++i + ".png")));
}
}
}import com.ironsoftware.ironpdf.PdfDocument;
import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.nio.file.Files;
import java.nio.file.Paths;
import java.util.List;
public class Main {
public static void main(String[] args) throws Exception {
// Load PDF document from file
PdfDocument pdf = PdfDocument.fromFile(Paths.get("Final Project Report Craft Arena.pdf"));
// Extract all images from the PDF document
List<BufferedImage> images = pdf.extractAllImages();
int i = 0;
// Save each extracted image to the filesystem as a PNG
for (BufferedImage image : images) {
ImageIO.write(image, "PNG", Files.newOutputStream(Paths.get("image" + ++i + ".png")));
}
}
}上面的程式開啟"Final Project Report Craft Arena.pdf"文件,並使用extractAllImages方法將文件中的所有影像提取到BufferedImage物件清單中。 然後,它將每個新檔案圖像儲存為具有唯一名稱的單獨 PNG 檔案。
如何在 Java 中從 PDF 中提取圖像,圖 4:從 PDF 輸出中提取圖像 從 PDF 輸出中提取影像
從 URL 提取圖像
本節將討論如何直接從 URL 中提取圖像。 在下面的程式碼中,URL 被轉換為 PDF 頁面,然後切換導航以從 PDF 中提取圖像。
import com.ironsoftware.ironpdf.PdfDocument;
import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.io.IOException;
import java.nio.file.Files;
import java.nio.file.Paths;
import java.util.List;
public class Main {
public static void main(String[] args) throws IOException {
// Render PDF from a URL
PdfDocument pdf = PdfDocument.renderUrlAsPdf("https://www.amazon.com/?tag=hp2-brobookmark-us-20");
// Extract all images from the rendered PDF document
List<BufferedImage> images = pdf.extractAllImages();
int i = 0;
// Save each extracted image to the filesystem as a PNG
for (BufferedImage image : images) {
ImageIO.write(image, "PNG", Files.newOutputStream(Paths.get("image" + ++i + ".png")));
}
}
}import com.ironsoftware.ironpdf.PdfDocument;
import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.io.IOException;
import java.nio.file.Files;
import java.nio.file.Paths;
import java.util.List;
public class Main {
public static void main(String[] args) throws IOException {
// Render PDF from a URL
PdfDocument pdf = PdfDocument.renderUrlAsPdf("https://www.amazon.com/?tag=hp2-brobookmark-us-20");
// Extract all images from the rendered PDF document
List<BufferedImage> images = pdf.extractAllImages();
int i = 0;
// Save each extracted image to the filesystem as a PNG
for (BufferedImage image : images) {
ImageIO.write(image, "PNG", Files.newOutputStream(Paths.get("image" + ++i + ".png")));
}
}
}在上面的程式碼中,亞馬遜主頁 URL 作為輸入,它會傳回 74 張圖片。
如何在 Java 中從 PDF 中提取圖像,圖 5:從 PDF 輸出中提取圖像 從 PDF 輸出中提取影像
結論
使用 Java 中的 IronPDF 庫可以從 PDF 文件中提取影像。 要安裝 IronPDF,您需要安裝 Java、Java IDE(Eclipse 或 IntelliJ)、Maven 以及 IronPDF 程式庫並將其整合到您的專案中。 使用 IronPDF 從 PDF 文件中提取影像的過程很簡單,只需要呼叫extractAllImages方法。 然後,您可以使用ImageIO.write方法將映像儲存到您選擇的檔案路徑。
本文提供了使用 Java 和 IronPDF 庫從 PDF 文件中提取影像的逐步指南。 更多詳細信息,包括如何從 PDF 中提取文本的信息,可以在"提取文本代碼示例"中找到。
常見問題解答
如何使用 Java 從 PDF 擷取影像?
若要使用 Java 從 PDF 擷取影像,請利用 IronPDF for Java 函式庫。首先載入 PDF 文件,然後使用 extractAllImages 方法。然後,可以使用 ImageIO.write 等方法儲存擷取的影像。
使用 Java 從 PDF 擷取影像需要哪些先決條件?
若要使用 Java 從 PDF 擷取影像,請確認已安裝 Java 以及 Java IDE,例如 Eclipse 或 IntelliJ IDEA。此外,配置 Maven 以管理依赖关系,并在您的项目中包含 IronPDF 库。
如何在 Java 中安裝一個用於 PDF 圖像擷取的庫?
若要安裝 IronPDF 函式庫,請在您的 Java IDE(例如 IntelliJ IDEA)中建立一個 Maven 專案。將 IronPDF 相依性加入您的 pom.xml 檔案,並使用 Maven 下載 IronPDF 並將其納入專案中。
我可以用 Java 從 URL 產生的 PDF 中提取圖片嗎?
是的,您可以使用 IronPDF 的 renderUrlAsPdf 方法將 URL 轉換為 PDF,然後運用 extractAllImages 方法從結果 PDF 中提取圖片。
Java PDF 函式庫是否有試用版本?
IronPDF 提供免費試用版本,讓您探索其在 Java 中進行 PDF 管理和影像擷取的能力與功能。
哪些 Java IDE 適合使用 IronPDF?
建議使用 Eclipse 和 IntelliJ IDEA 作為 IDE,以開發利用 IronPDF 函式庫來處理 PDF 的 Java 應用程式。
如何使用 Java 儲存從 PDF 擷取的影像?
使用 IronPDF 從 PDF 擷取影像後,您可以使用 ImageIO.write 方法儲存影像,並指定所需的檔案路徑和影像格式。
在 Java 中,使用哪種方法從 PDF 檔案中擷取影像?
在 IronPDF 中,extractAllImages 方法用於從 PDF 文件中提取所有圖片。此方法會返回一個圖片清單,您可以進一步處理或儲存這些圖片。
保存從 PDF 擷取的影像時,可以使用哪些影像格式?
透過 Java 中的 ImageIO.write 方法,可將擷取的影像儲存為各種格式,例如 PNG。
PDF 管理庫在 Java 中提供哪些功能?
IronPDF 是一個適用於 Java 的全面性函式庫,可讓開發人員從 PDF 檔案中產生、修改及擷取資料。它包括文本提取、合併、分割和應用安全措施等功能。







