在實際環境中測試
在生產環境中測試無浮水印。
在任何需要的地方都能運作。
本文將探討如何從現有的 PDF 文件中提取圖像並使用 Java 程式語言將它們保存到單一文件夾中。為此,使用 IronPDF for Java 庫來提取圖像。
IronPDF 是一個專為開發者設計的 Java 庫,旨在幫助生成、修改和 從 PDF 文件中提取數據 在他們的Java應用程式中。使用IronPDF,您可以從多種來源創建PDF文件,例如HTML、圖片等。此外,您還可以 合併, 分割, 並操作現有的PDF。IronPDF還包括安全功能,例如 密碼保護 和 數位簽章由 Iron Software 開發和維護的 IronPDF 以其從 PDF、HTML 和 URL 中提取文本的能力而聞名。這使它成為一個多功能且強大的工具,適用於各種應用,不論是從頭開始創建 PDF 還是處理現有的 PDF。
在使用 IronPDF 從 PDF 文件中提取數據之前,必須滿足以下先決條件:
Java 安裝: 確保您的系統已安裝 Java,並且已在環境變量中設置其路徑。如果您尚未安裝 Java,請按照以下說明進行安裝。 下載頁面來自Java網站。
Java IDE:安裝 Eclipse 或 IntelliJ 作為您的 Java IDE。您可以從這裡下載 Eclipse 連結 和IntelliJ從這個 下載頁面.
IronPDF 庫: 下載並將 IronPDF 庫新增至您的專案作為依賴項。設定指示,請訪問 IronPDF 網站.
安裝 IronPDF for Java 是一個簡單的過程,只要符合所有的需求。本指南將使用 JetBrains IntelliJ IDEA 來演示安裝並運行一些示例代碼。
以下是要做的事情:
啟動 IntelliJ IDEA:在您的系統中打開 JetBrains IntelliJ IDEA。
創建 Maven 項目:在 IntelliJ IDEA 中,創建一個新的 Maven 項目。這將為安裝 IronPDF for Java 提供合適的環境。
建立一個新的 Maven 專案
將會出現一個新視窗。輸入專案名稱後點擊完成。
輸入專案名稱
當你點擊 完成 之後,一個新的專案將會開啟到 pom.xml
檔案,以添加 IronPDF for Java 的 Maven 依賴項。
接下來,在 pom.xml
檔案中添加以下依賴項,或者你可以從以下網址下載 JAR 檔案 Maven 資料庫.
<dependency>
<groupId>com.ironsoftware</groupId>
<artifactId>com.ironsoftware</artifactId>
<version>2024.9.1</version>
</dependency>
將依賴項放置在 pom.xml
文件中後,文件的右上角會出現一個小圖標。
pom.xml 檔案帶有小圖示來安裝依賴項
點擊此圖示來安裝 IronPDF for Java 的 Maven 依賴項。這根據您的網路連接狀況可能只需要幾分鐘。
您可以使用 IronPDF 從 PDF 文件中提取圖片,通過一個稱為的方法 [提取所有圖像
](/java/object-reference/api/com/ironsoftware/ironpdf/PdfDocument.html#extractAllImages())此方法會返回 PDF 檔案中所有可用的圖片。之後,您可以使用 ImageIO.write
方法,通過提供輸出圖片的路徑和格式,將所有提取的圖片保存到您選擇的檔案路徑。
下面的例子中,將從 PDF 文件中提取圖片並保存到檔案系統中作為 PNG 圖片。
import com.ironsoftware.ironpdf.PdfDocument;
import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.nio.file.Files;
import java.nio.file.Paths;
import java.util.List;
public class main {
public static void main(String[] args) throws Exception {
PdfDocument pdf = PdfDocument.fromFile(Paths.get("Final Project Report Craft Arena.pdf"));
List<BufferedImage> images = pdf.extractAllImages();
int i = 0;
for (BufferedImage image : images) {
ImageIO.write(image, "PNG", Files.newOutputStream(Paths.get("image" + ++i + ".png")));
}
}
}
上述程式開啟"Final Project Report Craft Arena.pdf"檔案,使用extractAllImages
方法將檔案中的所有影像提取為BufferedImage
物件的列表。然後將每個新影像檔案另存為具有唯一名稱的獨立PNG檔案。
從 PDF 輸出提取圖像
本節將討論如何直接從URL提取圖像。在下面的代碼中,URL被轉換為PDF頁面,然後切換導航以從PDF中提取圖像。
import com.ironsoftware.ironpdf.PdfDocument;
import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.io.IOException;
import java.nio.file.Files;
import java.nio.file.Paths;
import java.util.List;
public class main {
public static void main(String[] args) throws IOException {
PdfDocument pdf = PdfDocument.renderUrlAsPdf("https://www.amazon.com/?tag=hp2-brobookmark-us-20");
List<BufferedImage> images = pdf.extractAllImages();
int i = 0;
for (BufferedImage image : images) {
ImageIO.write(image, "PNG", Files.newOutputStream(Paths.get("image" + ++i + ".png")));
}
}
}
在上面的程式碼中,提供了亞馬遜首頁的URL作為輸入,並返回了74張圖片。
從 PDF 輸出提取圖像
可以使用IronPDF庫在Java中從PDF文件中提取圖像。要安裝IronPDF,您需要具備Java和Java IDE。 (Eclipse 或 IntelliJ), Maven,和 IronPDF 庫已安裝並集成到您的項目中。使用 IronPDF 從 PDF 文件中提取圖像的過程非常簡單,只需調用一個方法 extractAllImages
。然後,您可以使用 ImageIO.write
方法將圖像保存到您選擇的文件路徑。
本文章提供逐步指南關於 如何提取圖片 從 PDF 文件中使用 Java 和 IronPDF 庫。更多詳細信息,包括如何從 PDF 中提取文本的信息,可以在 提取文本代碼範例.