使用IRONPDF FOR PYTHON

Python PdfWriter(代码示例教程)

Kannaopat Udonpant
坎那帕·乌东攀
2023年十二月24日
更新 2024年十月7日
分享:

介绍

IronPDF 是一个纯 Python 的 PDF 文件对象库,适用于想要在应用程序中编写 PDF 文件或操作 PDF 文件的 Python 开发人员。 IronPDF以其简单性和多功能性脱颖而出,使其成为需要自动生成PDF或将PDF生成集成到软件系统中的任务的理想选择。

本指南将探讨如何使用 IronPDF 这款纯 Python PDF 库来创建 PDF 文件或 PDF 页面属性,以及读取 PDF 文件。 它将包括示例和实际代码片段,让您能够亲身理解如何在您的Python项目中使用IronPDF for Python的PdfWriter来写入PDF文件并创建新的PDF页面。

设置 IronPDF

安装

要开始使用IronPDF,您需要通过Python软件包索引安装它。 在终端中运行以下命令:

pip install ironpdf

编写 PDF 文件和操作 PDF 文件

创建新的PDF

IronPDF 简化了创建新的 PDF 文件和处理现有 PDF 的过程。 它提供了一个简单的界面来生成文档,无论是简单的单页PDF还是包含用户密码等各种元素的更复杂的文档。 此功能对于生成报告、创建发票等任务至关重要。

from ironpdf import *

License.LicenseKey = "Your-License-Key"
# Set a log path
Logger.EnableDebugging = True
Logger.LogFilePath = "Custom.log"
Logger.LoggingMode = Logger.LoggingModes.All
html = """
<html>
   <head>
      <title>IronPDF for Python!</title>
      <link rel='stylesheet' href='assets/style.css'>
   </head>
   <body>
      <h1>It's IronPDF World!!</h1>
      <a href="https://ironpdf.com/python/"><img src='assets/logo.png' /></a>
   </body>
</html>
"""
renderer = ChromePdfRenderer()
pdf = renderer.RenderHtmlAsPdf(html)
pdf.SaveAs("New PDF File.pdf")
PYTHON

Python PdfWriter(代码示例教程),图 1:输出文件

输出文件

合并 PDF 文件

IronPDF简化了将多个PDF文件合并为一个的任务。 此功能有助于聚合各种报告、汇编扫描文档或整理相关信息。 例如,当您需要从多个来源创建综合报告或将一系列文件合并为单个文件时,您可能需要合并PDF文件。

from ironpdf import *

License.LicenseKey = "Your-License-Key"
# Set a log path
Logger.EnableDebugging = True
Logger.LogFilePath = "Custom.log"
Logger.LoggingMode = Logger.LoggingModes.All
pdfOne = PdfDocument("Report First.pdf")
pdfTwo = PdfDocument("Report Second.pdf")
merged = PdfDocument.Merge(pdfOne, pdfTwo)
merged.SaveAs("Merged.pdf")
PYTHON

将现有的 PDF 文件合并成新的 PDF 文件的能力在数据科学等领域也很有用,因为合并后的 PDF 文档可以作为训练 AI 模块的数据集。 IronPDF 轻松处理此任务,保持原始文档每页的完整性和格式,从而生成无缝且连贯的输出 PDF 文件。

Python PdfWriter(代码示例教程),图2:合并的 PDF 输出

合并 PDF 输出

拆分单个PDF文件

相反,IronPDF 在将现有的 PDF 文件拆分为多个新文件方面也表现出色。 当您需要从大型 PDF 文档中提取特定部分或将文档划分为更小、更易于管理的部分时,此功能非常方便。

from ironpdf import *

License.LicenseKey = "Your-License-Key"
# Set a log path
Logger.EnableDebugging = True
Logger.LogFilePath = "Custom.log"
Logger.LoggingMode = Logger.LoggingModes.All
pdf = PdfDocument("Report.pdf")
# take the first page
page1doc = pdf.CopyPage(0)
page1doc.SaveAs("Split1.pdf")
PYTHON

例如,您可能想从大型报告中隔离某些PDF页面,或从一本书的不同章节中创建单独的文档。 IronPDF允许您选择所需的多个页面转换为一个新的PDF文件,确保您可以根据需要操作和管理PDF内容。

Python PdfWriter(代码示例教程),图3:拆分PDF输出

拆分PDF输出

实现安全功能

在处理敏感或机密信息时,保护您的PDF文档变得至关重要。 IronPDF通过提供强大的安全功能来满足这一需求,包括用户密码保护和加密。 这可以确保您的PDF文件保持安全,并且仅授权用户可以访问。

from ironpdf import *

License.LicenseKey = "Your-License-Key"
# Set a log path
Logger.EnableDebugging = True
Logger.LogFilePath = "Custom.log"
Logger.LoggingMode = Logger.LoggingModes.All
pdf = PdfDocument("Report.pdf")
# The following code makes a PDF read-only and will disallow copy & paste and printing
pdf.SecuritySettings.RemovePasswordsAndEncryption()
pdf.SecuritySettings.MakePdfDocumentReadOnly("secret-key")
pdf.SecuritySettings.AllowUserAnnotations = False
pdf.SecuritySettings.AllowUserCopyPasteContent = False
pdf.SecuritySettings.AllowUserFormData = False
pdf.SecuritySettings.AllowUserPrinting = PdfPrintSecurity.FullPrintRights
# Change or set the document encryption password
pdf.SecuritySettings.OwnerPassword = "top-secret"  # password to edit the PDF
pdf.SecuritySettings.UserPassword = "sharable"  # password to open the PDF
pdf.SaveAs("secured.pdf")
PYTHON

通过设置用户密码,您可以控制谁可以查看或编辑您的PDF文档。 加密选项增加了额外的安全层,保护您的数据免受未经授权的访问,使IronPDF成为管理PDF格式的敏感信息的可靠选择。

从PDF中提取文本

IronPDF的另一个关键功能是能够从PDF文档中提取文本。 此功能对于数据检索、内容分析,甚至将现有PDF中的文本内容重新用于新文档特别有用。

from ironpdf import *

License.LicenseKey = "Your-License-Key"
# Set a log path
Logger.EnableDebugging = True
Logger.LogFilePath = "Custom.log"
Logger.LoggingMode = Logger.LoggingModes.All
pdf = PdfDocument("Report.pdf")
# Extract text from PDF document
allText = pdf.ExtractAllText()
# Extract text from specific page in the document
specificPage = pdf.ExtractTextFromPage(3)
PYTHON

无论您是提取数据进行分析、在大文档中搜索特定信息,还是将内容从PDF转换为文本文件以便进一步处理,IronPDF都使这一过程变得简单高效。 该库确保提取的文本保持原有格式和结构,使其能够立即用于您的特定需求。

管理文档信息

PDF 的高效管理不仅仅局限于其内容。 IronPDF 可以有效管理文档的元数据和属性,例如作者姓名、文档标题、创建日期等。 此功能对于组织和分类您的PDF文档至关重要,尤其是在文件出处和元数据重要的环境中。

from ironpdf import *

License.LicenseKey = "Your-License-Key"
# Set a log path
Logger.EnableDebugging = True
Logger.LogFilePath = "Custom.log"
Logger.LoggingMode = Logger.LoggingModes.All
# Load an existing PDF or create a new one
pdf = PdfDocument("Report.pdf")
# Edit file metadata
pdf.MetaData.Author = "Satoshi Nakamoto"
pdf.MetaData.Keywords = "SEO, Friendly"
pdf.MetaData.ModifiedDate = Now()
pdf.SaveAs("MetaData Updated.pdf")
PYTHON

例如,在学术或企业环境中,能够追踪文档的创建日期和作者对于记录保存和文档检索至关重要。 IronPDF使管理这些信息变得简单,为在您的Python应用程序中处理和更新文档信息提供了一种流畅的方式。

结论

Python PdfWriter(代码示例教程),图4:License

许可证

本教程涵盖了在Python中使用IronPDF进行PDF操作的基础知识。 从创建新的PDF文件到合并现有文件,以及添加安全功能,IronPDF是任何Python开发者的多功能工具。

IronPDF for Python 还提供以下功能:

Kannaopat Udonpant
坎那帕·乌东攀
软件工程师
在成为软件工程师之前,Kannapat 从日本北海道大学完成了环境资源博士学位。在攻读学位期间,Kannapat 还成为了生物生产工程系车辆机器人实验室的成员。2022年,他利用自己的 C# 技能加入了 Iron Software 的工程团队,专注于 IronPDF。Kannapat 珍视他的工作,因为他能直接向编写 IronPDF 大部分代码的开发者学习。除了同伴学习,Kannapat 还享受在 Iron Software 工作的社交方面。不写代码或文档时,Kannapat 通常在 PS5 上玩游戏或重看《最后生还者》。
< 前一页
如何在Python中为PDF文件添加水印
下一步 >
如何在Python中从扫描的PDF中提取文本

准备开始了吗? 版本: 2025.3 刚刚发布

查看许可证 >