在生產環境中測試,無水印。
在任何需要的地方都能運行。
獲得 30 天的全功能產品。
在幾分鐘內上手運行。
試用產品期間完全訪問我們的支援工程團隊
本文將使用IronPDF for Python透過Python程式碼從PDF檔案中提取圖像。
IronPDF for Python 是一個尖端且強大的庫,為 Python 中的 PDF 文件處理帶來新的維度。 作為 PDF 任務的綜合解決方案,IronPDF 能夠將高級 PDF 功能無縫整合到應用程式中。
IronPDF 提供廣泛的工具和 API,用於例如從頭開始創建 PDF,將HTML 轉換為高品質的 PDF,以及通過合併合併、拆分和編輯等操作來管理 PDF 頁面。 這些工具既易於使用又高效。 IronPDF 擁有用戶友好的介面和全面的文檔,為開發者開啟無限可能。
無論是製作專業報告和發票、自動化工作流程,還是管理文件,IronPDF 在文件管理和自動化領域提供了寶貴的資產,使其成為任何開發者在 Python 應用中利用 PDF 的強大功能時的必備工具。
安裝 IronPDF 庫以從 PDF 中提取圖像至 Python。
寫 PdfDocument.FromFile
方法,以使用本地磁碟的檔案路徑載入 PDF 檔案。
應用 ExtractAllImages
方法以從 PDF 文件中提取圖像。
使用迴圈遍歷在 PDF 中找到的所有提取圖像。
在深入了解使用 Python 從 PDF 獲取圖像的世界之前,讓我們先安裝必要的先決條件:
Python 安裝:請確保您的系統上已安裝Python 解釋器。 從 PDF 獲取圖像的過程需要 Python 3.0 或更新版本。 確保您有相容的 Python 安裝。
pip
來安裝。 只需打開命令行介面並執行以下命令: :ProductInstall
:ProductInstall
整合開發環境 (IDE): 雖然不是強制性的,但使用 IDE 可以大大提升您的開發體驗。 IDE 提供如程式碼補全、除錯及更精簡工作流程等功能。 一個非常受歡迎的 Python 開發 IDE 是 PyCharm。 您可以從JetBrains網站下載並安裝PyCharm。
一旦這些先決條件到位,您可以透過使用 Python 和 IronPDF 從 PDF 中擷取圖像的逐步指南,探索這個令人興奮的世界。
以下是在 PyCharm 中創建新 Python 專案的步驟。
要在 PyCharm 中啟動新的 Python 專案,打開 PyCharm 應用程式,並導航到頂部選單。
點擊檔案並從下拉選單中選擇新專案。
PyCharm IDE
點擊新專案後,將出現標題為建立專案的新視窗。
在此視窗中,在頂部的位置欄位輸入您的專案名稱。選擇環境; 如果您正在使用虛擬環境,請從提供的選項中選擇。
在 PyCharm 中創建一個新的 Python 專案
選擇環境後,點擊建立按鈕來建立您的 Python 專案。
您的 Python 專案現已建立並可用於各種任務,例如提取圖片。
要安裝IronPDF,只需打開終端或單獨的命令提示符並輸入命令pip install ironpdf,然後按Enter鍵。 終端將顯示以下輸出。
安裝 IronPDF 套件
IronPDF為開發者提供工具和API,使之能夠順暢地導航PDF並識別和提取嵌入的圖像。 無論是用於分析還是整合,IronPDF 藉助 Python 的靈活性使提取流程更加順暢。 這使得處理 PDF 和基於影像的應用程序變得至關重要。它可以從 PDF 文件中提取所有影像,只需要幾行程式碼就能輕鬆完成。
請參見以下程式碼,使用 Python 編程語言從 PDF 中提取圖像。
from ironpdf import *
# Open PDF file
pdf = PdfDocument.FromFile("FYP Thesis.pdf")
# Get all images found in PDF Document
all_images = pdf.ExtractAllImages()
# Save each image to the local disk image
for i, image in enumerate(all_images):
image.SaveAs(f"output_image_{i}.png")
py
這段程式碼首先匯入IronPDF庫,然後使用PdfDocument.FromFile
方法僅透過檔案路徑從本地空間載入PDF檔案。 然後它將訪問 PDF 的每一頁,將圖像字節提取為 Image 對象。 這些來自 PDF 頁面的圖像對象隨後使用SaveAs
方法保存。 在上述代碼中,使用者根據圖像索引和圖像擴展名(PNG)分配一個動態的圖像名稱。
相比於使用如PyMuPDF和Pillow這樣的Python函式庫,這些函式庫使用import fitz
來提取影像,使用ExtractImage()
解析圖片,並使用from PIL import Image將位元組轉化為PIL影像實例以將影像檔案儲存至磁碟上,這要簡單得多。 IronPDF只需幾行代碼即可實現這一點。
從 PDF 文件的所有頁面中提取圖像並以 PNG 格式保存。 您也可以通過調整文件擴展名來匹配所需的圖像文件格式,從而靈活地修改輸出格式以保存可用的圖像對象。
從範例 PDF 檔案提取的圖像
Python 結合強大功能的IronPDF,為從 PDF 檔案提取圖像的任務提供了一個多用途且高效的解決方案。 利用 Python 的靈活性和 IronPDF 的功能,開發者可以無縫地導航 PDF 文件,定位其中的圖像位元組,並以所需的圖像擴展名保存這些圖像。 該過程包括從 PDF 獲取圖像,並且生成的圖像列表可以根據需要進一步處理和操作。 通過掌握使用 Python 從 PDF 獲取圖像的技術,開發人員可以提升他們的工作流程,自動化文檔管理,並探索各種基於圖像的應用,使其在數位時代成為一項有價值的技能。
有關從 PDF 文件中提取更多影像的功能,請參閱以下範例。 您可以探索其他操作,例如將 PDF 文件內容轉換為圖像的選項,完整的教學可在此如何使用 Python 文章中找到。