使用IRONPDF FOR PYTHON

如何在 Python 中從 PDF 提取圖片

本文將使用IronPDF for Python透過Python程式碼從PDF檔案中提取圖像。

IronPDF for Python

IronPDF for Python 是一個尖端且強大的庫,為 Python 中的 PDF 文件處理帶來新的維度。 作為 PDF 任務的綜合解決方案,IronPDF 能夠將高級 PDF 功能無縫整合到應用程式中。

IronPDF 提供廣泛的工具和 API,用於例如從頭開始創建 PDF,將HTML 轉換為高品質的 PDF,以及通過合併合併拆分和編輯等操作來管理 PDF 頁面。 這些工具既易於使用又高效。 IronPDF 擁有用戶友好的介面和全面的文檔,為開發者開啟無限可能。

無論是製作專業報告和發票、自動化工作流程,還是管理文件,IronPDF 在文件管理和自動化領域提供了寶貴的資產,使其成為任何開發者在 Python 應用中利用 PDF 的強大功能時的必備工具。

如何使用 IronPDF for Python 從 PDF 中提取圖像

  1. 安裝 IronPDF 庫以從 PDF 中提取圖像至 Python。

  2. PdfDocument.FromFile 方法,以使用本地磁碟的檔案路徑載入 PDF 檔案。

  3. 應用 ExtractAllImages 方法以從 PDF 文件中提取圖像。

  4. 使用迴圈遍歷在 PDF 中找到的所有提取圖像。

  5. 將這些從 PDF 文件中提取的影像按需求的影像格式儲存。

先決條件

在深入了解使用 Python 從 PDF 獲取圖像的世界之前,讓我們先安裝必要的先決條件:

  1. Python 安裝:請確保您的系統上已安裝Python 解釋器。 從 PDF 獲取圖像的過程需要 Python 3.0 或更新版本。 確保您有相容的 Python 安裝。

  2. IronPDF 庫:若要使用IronPDF的強大功能,您需要使用 Python 的套件管理工具 pip 來安裝。 只需打開命令行介面並執行以下命令:
    :ProductInstall
    :ProductInstall
SHELL
  1. 整合開發環境 (IDE): 雖然不是強制性的,但使用 IDE 可以大大提升您的開發體驗。 IDE 提供如程式碼補全、除錯及更精簡工作流程等功能。 一個非常受歡迎的 Python 開發 IDE 是 PyCharm。 您可以從JetBrains網站下載並安裝PyCharm。

    一旦這些先決條件到位,您可以透過使用 Python 和 IronPDF 從 PDF 中擷取圖像的逐步指南,探索這個令人興奮的世界。

步驟 1 創建一個新的 Python 專案

以下是在 PyCharm 中創建新 Python 專案的步驟。

  1. 要在 PyCharm 中啟動新的 Python 專案,打開 PyCharm 應用程式,並導航到頂部選單。

  2. 點擊檔案並從下拉選單中選擇新專案

    如何從 PDF 中提取圖片:Python 中的示例,圖 1:PyCharm IDE

    PyCharm IDE

  3. 點擊新專案後,將出現標題為建立專案的新視窗。

  4. 在此視窗中,在頂部的位置欄位輸入您的專案名稱。選擇環境; 如果您正在使用虛擬環境,請從提供的選項中選擇。

    如何在 Python 中從 PDF 中提取圖像,圖 2:在 PyCharm 中創建一個新的 Python 專案

    在 PyCharm 中創建一個新的 Python 專案

  5. 選擇環境後,點擊建立按鈕來建立您的 Python 專案。

    您的 Python 專案現已建立並可用於各種任務,例如提取圖片。

步驟 2 安裝 IronPDF

要安裝IronPDF,只需打開終端或單獨的命令提示符並輸入命令pip install ironpdf,然後按Enter鍵。 終端將顯示以下輸出。

如何在 Python 中從 PDF 提取圖像,圖 3:安裝 IronPDF 套件

安裝 IronPDF 套件

步驟 3 使用 IronPDF 從 PDF 文件中提取圖像

IronPDF為開發者提供工具和API,使之能夠順暢地導航PDF並識別和提取嵌入的圖像。 無論是用於分析還是整合,IronPDF 藉助 Python 的靈活性使提取流程更加順暢。 這使得處理 PDF 和基於影像的應用程序變得至關重要。它可以從 PDF 文件中提取所有影像,只需要幾行程式碼就能輕鬆完成。

請參見以下程式碼,使用 Python 編程語言從 PDF 中提取圖像。

from ironpdf import *

# Open PDF file
pdf = PdfDocument.FromFile("FYP Thesis.pdf") 

# Get all images found in PDF Document
all_images = pdf.ExtractAllImages()

# Save each image to the local disk image
for i, image in enumerate(all_images):
    image.SaveAs(f"output_image_{i}.png")
py
PYTHON

這段程式碼首先匯入IronPDF庫,然後使用PdfDocument.FromFile方法僅透過檔案路徑從本地空間載入PDF檔案。 然後它將訪問 PDF 的每一頁,將圖像字節提取為 Image 對象。 這些來自 PDF 頁面的圖像對象隨後使用SaveAs方法保存。 在上述代碼中,使用者根據圖像索引和圖像擴展名(PNG)分配一個動態的圖像名稱。

相比於使用如PyMuPDFPillow這樣的Python函式庫,這些函式庫使用import fitz來提取影像,使用ExtractImage()解析圖片,並使用from PIL import Image將位元組轉化為PIL影像實例以將影像檔案儲存至磁碟上,這要簡單得多。 IronPDF只需幾行代碼即可實現這一點。

步驟 4 從 PDF 文件中儲存圖像

從 PDF 文件的所有頁面中提取圖像並以 PNG 格式保存。 您也可以通過調整文件擴展名來匹配所需的圖像文件格式,從而靈活地修改輸出格式以保存可用的圖像對象。

如何在 Python 中從 PDF 中提取圖像,圖 4:從範例 PDF 文件中提取的圖像

從範例 PDF 檔案提取的圖像

結論

Python 結合強大功能的IronPDF,為從 PDF 檔案提取圖像的任務提供了一個多用途且高效的解決方案。 利用 Python 的靈活性和 IronPDF 的功能,開發者可以無縫地導航 PDF 文件,定位其中的圖像位元組,並以所需的圖像擴展名保存這些圖像。 該過程包括從 PDF 獲取圖像,並且生成的圖像列表可以根據需要進一步處理和操作。 通過掌握使用 Python 從 PDF 獲取圖像的技術,開發人員可以提升他們的工作流程,自動化文檔管理,並探索各種基於圖像的應用,使其在數位時代成為一項有價值的技能。

有關從 PDF 文件中提取更多影像的功能,請參閱以下範例。 您可以探索其他操作,例如將 PDF 文件內容轉換為圖像的選項,完整的教學可在此如何使用 Python 文章中找到。

查克尼思·賓
軟體工程師
Chaknith 致力於 IronXL 和 IronBarcode。他在 C# 和 .NET 方面擁有豐富的專業知識,協助改進軟體並支持客戶。他從用戶互動中獲得的洞察力有助於提高產品、文檔和整體體驗。
< 上一頁
如何在 Python 中將 PNG 轉換為 PDF 檔案
下一個 >
如何從 PDF 中擷取數據於 Python

準備開始了嗎? 版本: 2025.5 剛剛發布

查看許可證 >