使用IRONPDF FOR PYTHON

Python PdfWriter(代碼範例教程)

發佈 2023年12月24日
分享:

簡介

IronPDF 是一個純 Python 的 PDF 檔案物件庫,適合尋找 編寫 PDF 文件 或在其應用程式中操作 PDF 文件。IronPDF 以其簡單和多功能性脫穎而出,成為需要自動生成 PDF 或將 PDF 生成集成到軟體系統中的任務的理想選擇。

在本指南中,我們將探索如何使用 IronPDF 作為純 Python 的 PDF 庫來創建 PDF 文件或 PDF 頁面屬性和閱讀 PDF 文件。我們將包括示例和實際的代碼片段,讓您親身了解如何在 Python 專案中使用 IronPDF for Python 的 PdfWriter 來編寫 PDF 文件和創建新 PDF 頁面。

設定 IronPDF

安裝

要開始使用IronPDF,您需要通過Python Package Index進行安裝。在終端中運行以下命令:

 pip install ironpdf

撰寫 PDF 文件和操作 PDF 文件

創建新的 PDF

IronPDF 簡化了 創建新的PDF文件 並處理現有的PDF。它提供了一個簡單的界面來生成文檔,無論是簡單的單頁PDF還是包含各種元素,例如用戶密碼的更複雜文檔。這項功能對於報告生成、創建發票等任務至關重要。

from ironpdf import *     License.LicenseKey = "Your-License-Key"
# Set a log path
Logger.EnableDebugging = True
Logger.LogFilePath = "Custom.log"
Logger.LoggingMode = Logger.LoggingModes.All
html = """
<html>
   <head>
      <title>IronPDF Python!</title>
      <link rel='stylesheet' href='assets/style.css'>
   </head>
   <body>
      <h1>Its' IronPDF World!!</h1>
      <a href='https://ironpdf.com/python/'><img src='assets/logo.png' /></a>
   </body>
</html>
"""
renderer = ChromePdfRenderer()
pdf = renderer.RenderHtmlAsPdf(html)
pdf.SaveAs("New PDF File.pdf")
PYTHON

Python PdfWriter(代碼範例教程):圖 1 - 輸出檔案

合併 PDF 檔案

IronPDF 簡化了將多個 PDF 檔案合併為一個的任務。這一功能對於匯總各種報告、組裝掃描文件或整理相關信息非常有用。例如,您可能需要在從多個來源創建綜合報告時合併 PDF 檔案,或者當您有一系列需要作為單一文件呈現的文件時。

from ironpdf import *     License.LicenseKey = "Your-License-Key"
# Set a log path
Logger.EnableDebugging = True
Logger.LogFilePath = "Custom.log"
Logger.LoggingMode = Logger.LoggingModes.All
pdfOne = PdfDocument("Report First.pdf")
pdfTwo = PdfDocument("Report Second.pdf")
merged = PdfDocument.Merge(pdfOne, pdfTwo)
merged.SaveAs("Merged.pdf")
PYTHON

將現有的 PDF 文件合併成一個新的 PDF 文件的能力,在數據科學等領域也非常有用,因為合併後的 PDF 文檔可以作為訓練 AI 模組的數據集。IronPDF 輕鬆處理這項工作,保持每頁原始文件的完整性和格式,從而產生無縫且連貫的輸出 PDF 文件。

Python PdfWriter(程式範例教學):圖2 - 合併PDF輸出

分割單一 PDF

相反地,IronPDF 也擅長將現有的 PDF 檔案分割成多個新的檔案。當你需要從大部頭的 PDF 文件中提取特定部分,或者將文件分割成更小、更易管理的部分時,此功能相當實用。

from ironpdf import *     License.LicenseKey = "Your-License-Key"
# Set a log path
Logger.EnableDebugging = True
Logger.LogFilePath = "Custom.log"
Logger.LoggingMode = Logger.LoggingModes.All
pdf = PdfDocument("Report.pdf")
# take the first page
page1doc = pdf.CopyPage(0)
page1doc.SaveAs("Split1.pdf")
PYTHON

例如,您可能希望從一份大型報告中隔離某些 PDF 頁面或從一本書的不同章節創建單獨的文件。IronPDF 允許您選擇所需的多個頁面轉換為新的 PDF 文件,確保您可以根據需要操作和管理您的 PDF 內容。

Python PdfWriter(代碼範例教學):圖 3 - 分割 PDF 輸出

實現安全功能

在處理敏感或機密資訊時,確保 PDF 文件的安全是首要任務。IronPDF 通過提供強大的安全功能來滿足這一需求,包括用戶密碼保護和加密。這確保了您的 PDF 文件保持安全,僅授權用戶可以訪問。

from ironpdf import *     License.LicenseKey = "Your-License-Key"
# Set a log path
Logger.EnableDebugging = True
Logger.LogFilePath = "Custom.log"
Logger.LoggingMode = Logger.LoggingModes.All
pdf = PdfDocument("Report.pdf")
# The following code makes a PDF read only and will disallow copy & paste and printing
pdf.SecuritySettings.RemovePasswordsAndEncryption()
pdf.SecuritySettings.MakePdfDocumentReadOnly("secret-key")
pdf.SecuritySettings.AllowUserAnnotations = False
pdf.SecuritySettings.AllowUserCopyPasteContent = False
pdf.SecuritySettings.AllowUserFormData = False
pdf.SecuritySettings.AllowUserPrinting = PdfPrintSecurity.FullPrintRights
# Change or set the document encryption password
pdf.SecuritySettings.OwnerPassword = "top-secret"  # password to edit the PDF
pdf.SecuritySettings.UserPassword = "sharable"  # password to open the PDF
pdf.SaveAs("secured.pdf")
PYTHON

通過設置用戶密碼,您可以控制誰能查看或編輯您的 PDF 文件。加密選項增加了一層額外的安全保護,防止數據未經授權的訪問,使 IronPDF 成為管理 PDF 格式敏感信息的可靠選擇。

從PDF中擷取文字

IronPDF 的另一個重要功能是能從 PDF 文件中擷取文字。此功能對於資料檢索、內容分析,甚至將現有 PDF 中的文字內容重新用於新文件而言,特別有用。

from ironpdf import *     License.LicenseKey = "Your-License-Key"
# Set a log path
Logger.EnableDebugging = True
Logger.LogFilePath = "Custom.log"
Logger.LoggingMode = Logger.LoggingModes.All
pdf = PdfDocument("Report.pdf")
# Extract text from PDF document
allText = pdf.ExtractAllText()
# Extract text from specific page in the document
specificPage = pdf.ExtractTextFromPage(3)
PYTHON

無論您是提取數據進行分析,還是在大型文件中搜尋特定信息,或將內容從 PDF 轉換為文本文件以便進一步處理,IronPDF 都使這一過程變得簡單高效。該庫確保提取的文本保持其原始格式和結構,使其能立即滿足您的特定需求。

管理文件信息

高效的 PDF 管理不仅仅在于其內容。IronPDF 允許有效管理文件的元數據和屬性,例如作者姓名、文件標題、創建日期等。此功能對於組織和分类您的 PDF 文件至關重要,特別是在文件來源和元數據重要的環境中。

from ironpdf import *     License.LicenseKey = "Your-License-Key"
# Set a log path
Logger.EnableDebugging = True
Logger.LogFilePath = "Custom.log"
Logger.LoggingMode = Logger.LoggingModes.All
# Load an existing PDF or create a new one
pdf = PdfDocument("Report.pdf")
# Edit file metadata
pdf.MetaData.Author = "Satoshi Nakamoto"
pdf.MetaData.Keywords = "SEO, Friendly"
pdf.MetaData.ModifiedDate = Now()
pdf.SaveAs("MetaData Updated.pdf")
PYTHON

例如,在學術或企業環境中,能夠追踪文件的創建日期和作者身份對於記錄保存和文件檢索非常重要。IronPDF 使管理這些信息變得簡單,提供了一種便捷的方法來處理和更新 Python 應用程序中的文件信息。

結論

Python PdfWriter(範例教學):圖4-License

本教程涵蓋了在 Python 中使用 IronPDF 進行 PDF 操作的基本知識。從創建新的 PDF 文件到合併現有文件以及添加安全功能,IronPDF 是任何 Python 開發者的多功能工具。

IronPDF for Python 提供了一個 免費試用 供用戶探索其功能。若要在試用期後繼續使用,授權價格從 $749 起跳。此定價允許開發者在其專案中使用 IronPDF 的全部功能。

< 上一頁
如何在 Python 中給 PDF 檔案添加浮水印
下一個 >
如何在 Python 中從掃描的 PDF 提取文本

準備開始了嗎? 版本: 2024.9 剛剛發布

免費 pip 安裝 查看許可證 >