在實際環境中測試
在生產環境中測試無浮水印。
在任何需要的地方都能運作。
本文將探討如何使用 Java 程式語言從現有 PDF 檔案中提取圖像並將它們保存到單個資料夾中。 為此,使用 IronPDF for Java 庫來提取圖像。
IronPDF 是一個 Java 函式庫,旨在協助開發者生成、修改和從 PDF 文件中提取數據在他們的 Java 應用程式中。 使用 IronPDF,您可以從各種來源(如 HTML、圖像等)創建 PDF 文件。 此外,您可以合併, 分割和操作現有的 PDF。 IronPDF 也包含安全功能,例如密碼保護和數位簽章.
由 Iron Software 開發和維護的 IronPDF 以其從 PDF、HTML 和 URL 中提取文本的能力而聞名。 這使其成為一個多功能且強大的工具,適用於各種應用程序,無論您是從頭開始創建 PDF 還是處理現有的 PDF。
在使用 IronPDF 從 PDF 文件中提取數據之前,必須滿足一些先決條件:
Java 安裝: 確保您的系統已安裝 Java,並在環境變數中設置了其路徑。 如果您尚未安裝 Java,請按照以下說明進行操作下載頁面來自Java網站.
Java IDE: 安裝 Eclipse 或 IntelliJ 作為您的 Java IDE。您可以從這裡下載 Eclipse連結和IntelliJ從這個下載頁面.
IronPDF 庫: 下載並將 IronPDF 庫作為依賴項添加到您的項目中。 如需設定說明,請訪問IronPDF 網站.
如果滿足所有要求,安裝 IronPDF for Java 是一個簡單的過程。 本指南將使用 JetBrains IntelliJ IDEA 演示安裝並運行一些範例代碼。
以下是要做的事情:
啟動 IntelliJ IDEA:在您的系統上打開 JetBrains IntelliJ IDEA。
在 IntelliJ IDEA 中創建一個新的 Maven 項目。 這將為安裝 IronPDF for Java 提供合適的環境。
建立一個新的 Maven 專案
將會出現一個新視窗。 輸入專案名稱,然後點擊完成。
輸入專案名稱
在您點擊 完成 後,將會開啟一個新專案,以 pom.xml
檔案的方式加入 IronPDF for Java 的 Maven 依賴項。
接下來,請在 pom.xml
文件中添加以下相依性,或者您可以從以下下載 JAR 檔案Maven 資料庫.
<dependency>
<groupId>com.ironsoftware</groupId>
<artifactId>com.ironsoftware</artifactId>
<version>2024.11.4</version>
</dependency>
將依賴項放置在 pom.xml
文件中後,文件的右上角會出現一個小圖標。
帶有小圖標來安裝依賴項的pom.xml檔案
點擊此圖標以安裝 IronPDF for Java 的 Maven 依賴項。 這只會根據您的網路連接花幾分鐘的時間。
您可以使用IronPDF中的一個方法從PDF文檔中提取圖像[提取所有圖像
](/java/object-reference/api/com/ironsoftware/ironpdf/PdfDocument.html#extractAllImages()). 此方法返回 PDF 文件中所有可用的圖像。之後,您可以使用 ImageIO.write
方法,通過提供輸出圖像的路徑和格式,將所有提取的圖像保存到您選擇的文件路徑。
在以下範例中,PDF 文件中的影像將被提取並保存到檔案系統中為 PNG 影像。
import com.ironsoftware.ironpdf.PdfDocument;
import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.nio.file.Files;
import java.nio.file.Paths;
import java.util.List;
public class main {
public static void main(String[] args) throws Exception {
PdfDocument pdf = PdfDocument.fromFile(Paths.get("Final Project Report Craft Arena.pdf"));
List<BufferedImage> images = pdf.extractAllImages();
int i = 0;
for (BufferedImage image : images) {
ImageIO.write(image, "PNG", Files.newOutputStream(Paths.get("image" + ++i + ".png")));
}
}
}
上面的程式開啟了 "Final Project Report Craft Arena.pdf" 檔案,並使用 extractAllImages
方法將檔案中的所有圖片提取為 BufferedImage
物件的列表。 然後將每個新檔案圖像儲存為具有唯一名稱的單獨 PNG 檔案。
從 PDF 輸出提取圖像
本節將討論如何直接從 URL 提取圖像。 在以下程式碼中,URL 轉換為 PDF 頁面,然後切換導航以從 PDF 中擷取圖像。
import com.ironsoftware.ironpdf.PdfDocument;
import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.io.IOException;
import java.nio.file.Files;
import java.nio.file.Paths;
import java.util.List;
public class main {
public static void main(String[] args) throws IOException {
PdfDocument pdf = PdfDocument.renderUrlAsPdf("https://www.amazon.com/?tag=hp2-brobookmark-us-20");
List<BufferedImage> images = pdf.extractAllImages();
int i = 0;
for (BufferedImage image : images) {
ImageIO.write(image, "PNG", Files.newOutputStream(Paths.get("image" + ++i + ".png")));
}
}
}
在上述程式碼中,Amazon 首頁的 URL 被作為輸入,並且返回了 74 張圖片。
從 PDF 輸出提取圖像
使用 IronPDF 庫可以在 Java 中從 PDF 文件中提取圖像。 要安裝 IronPDF,您需要具備 Java 和 Java IDE。(Eclipse 或 IntelliJ), Maven 與 IronPDF 庫已安裝並整合到您的專案中。 使用 IronPDF 從 PDF 文件中提取圖片的過程很簡單,只需要一次方法呼叫 extractAllImages
即可。 然後,你可以使用 ImageIO.write
方法將圖片保存到你選擇的文件路徑中。
本文提供了一個分步指南關於如何提取圖片使用 Java 和 IronPDF 函式庫 從 PDF 文件中提取。 更多詳情,包括如何從 PDF 中提取文本的信息,可以在提取文本代碼範例.