跳過到頁腳內容
使用 IRONPDF FOR PYTHON

如何在 Python 中從 PDF 中提取圖像

本文將使用 IronPDF for Python,透過 Python 程式碼從 PDF 檔案中擷取影像。

IronPDF for Python

IronPDF for Python 是一個尖端且強大的函式庫,它為 Python 中的 PDF 文件處理帶來了新的維度。 作為一款全面的 PDF 任務解決方案,IronPDF 能夠將高級 PDF 功能無縫整合到應用程式中。

IronPDF 提供各種工具和 API,用於執行諸如從頭開始建立 PDF、將 HTML 轉換為高品質 PDF 以及透過合併、分割和編輯等操作來管理 PDF 頁面等任務。 這些工具操作簡便,效率高。 IronPDF 擁有用戶友好的介面和豐富的文檔,為開發人員開啟了無限可能。

無論是建立專業報告和發票、自動化工作流程或管理文檔,IronPDF 都能在文件管理和自動化領域提供寶貴的資產,使其成為任何希望在 Python 應用程式中利用 PDF 功能的開發人員的必備工具。

如何使用 IronPDF for Python 從 PDF 擷取影像

  1. 在 Python 中安裝 IronPDF 庫以從 PDF 中提取圖像。
  2. 使用PdfDocument.FromFile方法,透過本機磁碟上的檔案路徑載入 PDF 檔案。
  3. 應用ExtractAllImages方法從 PDF 檔案中擷取影像。
  4. 使用循環遍歷 PDF 中找到的所有擷取影像。
  5. 從 PDF 檔案中擷取這些影像,並以所需的影像副檔名儲存。

先決條件

在深入探討如何使用 Python 從 PDF 提取映像之前,讓我們先安裝必要的先決條件:

  1. Python 安裝:請確保您的系統上已安裝Python解釋器。 從 PDF 取得影像的過程需要 Python 3.0 或更高版本。 請確保您已安裝相容的 Python 版本。
  2. IronPDF 庫:要利用IronPDF的強大功能,您需要使用 Python 套件管理器pip安裝它。 只需打開命令列介面並執行以下命令:

    pip install ironpdf
    pip install ironpdf
    SHELL

3.整合開發環境(IDE):雖然不是強制性的,但使用 IDE 可以大大提升您的開發體驗。 整合開發環境 (IDE) 提供程式碼自動完成、偵錯和更簡化的工作流程等功能。 PyCharm 是 Python 開發領域非常流行的整合開發環境 (IDE)。 您可以從JetBrains 網站下載並安裝 PyCharm。

一旦這些先決條件具備,您就可以探索使用 Python 和 IronPDF 從 PDF 中擷取影像的令人興奮的逐步指南。

步驟 1:建立一個新的 Python 項目

以下是在 PyCharm 中建立新 Python 專案的步驟。

  1. 若要在 PyCharm 中啟動一個新的 Python 項目,請開啟 PyCharm 應用程式並導覽至頂部功能表。
  2. 點選"檔案" ,然後從下拉式選單中選擇"新項目"

    如何在 Python 中從 PDF 中提取圖像,圖 1:PyCharm IDE PyCharm IDE

  3. 點選"新專案"後,將出現一個名為"建立專案"的新視窗。
  4. 在此視窗中,在頂部的"位置"欄位中輸入您的項目名稱。選擇環境; 如果您使用的是虛擬環境,請從提供的選項中選擇。

    如何在 Python 中從 PDF 中提取圖像,圖 2:在 PyCharm 中建立一個新的 Python 項目 在 PyCharm 中建立一個新的 Python 項目

  5. 選擇環境後,點選"建立"按鈕建立 Python 專案。

您的 Python 專案現已建立完成,可用於執行各種任務,例如提取映像。

步驟 2 安裝 IronPDF

若要安裝 IronPDF,請開啟終端機或單獨的命令提示符,然後輸入命令pip install ironpdf ,然後按Enter鍵。 終端將顯示以下輸出。

如何在 Python 中從 PDF 中提取圖像,圖 3:安裝 IronPDF 套件 安裝 IronPDF 軟體包

步驟 3:使用 IronPDF 從 PDF 檔案中擷取影像

IronPDF 為開發人員提供工具和 API,使他們能夠無縫地瀏覽 PDF 文件並識別和提取嵌入的圖像。 無論是用於分析還是集成,IronPDF 都利用 Python 的靈活性簡化了提取過程。 這使其成為處理 PDF 文件和圖像類應用程式的必備工具。它可以從 PDF 文件中提取所有圖像,而且只需幾行程式碼即可輕鬆完成。

請使用 Python 程式語言,透過以下程式碼從 PDF 中提取圖像。

from ironpdf import PdfDocument

# Open PDF file
pdf = PdfDocument.FromFile("FYP Thesis.pdf") 

# Get all images found in the PDF Document
all_images = pdf.ExtractAllImages()

# Save each image to the local disk with a dynamic name
for i, image in enumerate(all_images):
    image.SaveAs(f"output_image_{i}.png")
from ironpdf import PdfDocument

# Open PDF file
pdf = PdfDocument.FromFile("FYP Thesis.pdf") 

# Get all images found in the PDF Document
all_images = pdf.ExtractAllImages()

# Save each image to the local disk with a dynamic name
for i, image in enumerate(all_images):
    image.SaveAs(f"output_image_{i}.png")
PYTHON

這段程式碼首先匯入 IronPDF 庫,然後使用PdfDocument.FromFile方法透過檔案路徑從本機空間載入 PDF 檔案。 它存取 PDF 的每一頁,提取圖像位元組作為 Image 物件。 然後使用SaveAs方法儲存來自 PDF 頁面的這些影像物件。 該程式碼根據圖像索引和所需的圖像檔案副檔名(在本例中為 PNG)分配動態圖像名稱。

這種方法比使用其他 Python 程式庫(如PyMuPDFPillow)更簡單,後者需要更多的程式碼才能完成提取和保存圖像檔案的相同任務。

步驟 4:從 PDF 檔案儲存影像

從 PDF 檔案的所有頁面中提取圖像,並以 PNG 格式儲存。 您也可以透過調整檔案副檔名來修改輸出格式,使其與所需的影像檔案格式相符。

如何在 Python 中從 PDF 中提取圖像,圖 4:從範例 PDF 文件中提取的圖像 從範例 PDF 檔案中提取的圖像

結論

Python 與功能強大的IronPDF結合使用,為從 PDF 文件中檢索影像提供了一個多功能且高效的解決方案。 利用 Python 的靈活性和 IronPDF 的功能,開發人員可以無縫瀏覽 PDF 文檔,在其中定位圖像字節,並以所需的圖像擴展名保存這些圖像。 該過程包括從 PDF 中獲取圖像,然後可以根據需要對生成的圖像清單進行進一步處理和操作。 透過掌握使用 Python 從 PDF 中獲取影像的技巧,開發人員可以增強工作流程、自動化文件管理,並探索各種基於影像的應用,這使其成為數位時代的寶貴技能。

有關從 PDF 文件中提取圖像的更多功能,請造訪以下範例。 您還可以探索其他操作,例如將 PDF 文件內容轉換為圖像; 完整的教學可以在這篇Python 教學文章中找到。

常見問題解答

如何使用 Python 從 PDF 中提取圖片?

您可以使用 IronPDF for Python 從 PDF 中提取圖片,方法是使用 PdfDocument.FromFile 方法載入 PDF,並使用 ExtractAllImages 方法提取圖片。

使用 Python 儲存從 PDF 擷取的影像的步驟為何?

若要儲存擷取的影像,請遍歷影像,並使用 SaveAs 方法以指定的檔案副檔名儲存每張影像,例如 PNG。

為什麼選擇 IronPDF 從 Python 的 PDF 中提取圖像?

與 PyMuPDF 和 Pillow 等其他函式庫相比,IronPDF 簡化了影像擷取的過程,減少了達成相似結果所需的程式碼數量。

在 Python 中使用 IronPDF 處理 PDF 有哪些要求?

您需要有 Python 3.0 或更新版本,並透過 pip 安裝 IronPDF for Python 函式庫。使用 PyCharm 之類的 IDE 進行開發也是有益的。

如何安裝 IronPDF for Python?

IronPDF 可以使用 pip 包管理器進行安裝。在您的命令列介面執行指令 pip install ironpdf

IronPDF 可以用於在 Python 中自動管理 PDF 文件嗎?

是的,IronPDF 可以自動執行文件管理任務,例如擷取影像和轉換 PDF 內容,從而提升工作流程效率。

IronPDF 支持哪些图像格式来保存提取的图像?

透過在 SaveAs 方法中指定所需的檔案副檔名,即可將擷取的影像儲存為 PNG 等格式。

IronPDF 適合用於在 Python 中開發基於影像的應用程式嗎?

IronPDF 非常適合開發基於圖像的應用程式,因為它提供了在 PDF 文件中提取和管理圖像的強大功能。

Curtis Chau
技術作家

Curtis Chau 擁有卡爾頓大學計算機科學學士學位,專注於前端開發,擅長於 Node.js、TypeScript、JavaScript 和 React。Curtis 熱衷於創建直觀且美觀的用戶界面,喜歡使用現代框架並打造結構良好、視覺吸引人的手冊。

除了開發之外,Curtis 對物聯網 (IoT) 有著濃厚的興趣,探索將硬體和軟體結合的創新方式。在閒暇時間,他喜愛遊戲並構建 Discord 機器人,結合科技與創意的樂趣。