使用IRONPDF FOR PYTHON

如何在Python中将PDF转换为PDFA

查克尼特·宾
查克尼特·宾
2023年七月22日
更新 2024年九月21日
分享:

本篇文章将介绍 IronPDF for Python 模块,用于将现有 PDF 文件转换为 PDFA 文件。

IronPDF

与其他语言相比,Python 为程序员提供了更大的活力,使开发人员能够快速、轻松地创建图形用户界面。 因此,将 IronPDF 库纳入 Python 是一个简单明了的过程。 可以利用各种预装工具,如 PyQt、wxWidgets、Kivy 以及其他各种软件包和库,高效、安全地组装功能齐全的图形用户界面。

有了 IronPDF for Python 的帮助,Python 网页设计和开发将大大简化。 这主要是因为有大量 Python 网络开发范例可供选择,包括 Django、Flask 和 Pyramid。 Reddit、Mozilla 和 Spotify 等网站和在线服务已成功采用了这些框架。

IronPDF 的功能

  • HTML、HTML5、ASP、PHP 和其他来源可用于创建 PDF 文件。 此外,还可将图片文件转换为 PDF 格式。
  • IronPDF 可以创建交互式 PDF 文档。 它提供的功能包括打印PDF文件,将PDF页面光栅化为图像,将PDF转换为HTML,拆分合并PDF文件,从PDF文件中提取文本和图像,搜索PDF文件中的特定短语,以及填写和提交交互式表单
  • 使用 IronPDF,可以从 URL 创建文档,同时还支持用户代理、代理、cookie、HTTP 标头、唯一网络登录凭证、表单变量以及使用 HTML 登录表单登录的用户代理。
  • IronPDF允许用户查看并注释PDF文件。
  • 可以使用 IronPDF 从文件中提取图片。
  • 使用 IronPDF,非常容易在文档中添加页眉、页脚、文本、图片、书签水印等内容。
  • 用户可以使用 IronPDF 在新文档或现有文档中合并和拆分页面。
  • 将文档转换为 PDF 对象无需依赖 Acrobat 浏览器。
  • IronPdf 允许从 CSS 文件创建 PDF 文档。
  • 带有媒体类型规范的 CSS 文件可用于使用 IronPdf 构建文档。

配置 Python 环境

设置 Python

确保您的计算机上安装了 Python。 请访问官方 Python 网站,以下载并安装适合您操作系统的最新版本的 Python。 安装 Python 后,创建一个虚拟环境来隔离项目需求。 利用venv模块创建和管理虚拟环境,为您的转换项目提供一个干净且独立的工作空间。

在 PyCharm 中新建项目

本教程推荐使用 Python 开发 IDE PyCharm。 从官方网站下载并安装PyCharm。

启动 PyCharm IDE 后,从菜单中选择 "新建项目",如下图所示。

如何在Python中将PDF转换为PDF/A,图1:PyCharm IDE

PyCharm IDE

选择 "新建项目 "后,会出现一个新窗口,让您指定项目的位置和 Python 环境,如下图所示。

如何在Python中将PDF转换为PDF/A,图2:在PyCharm中创建一个新的Python项目

在 PyCharm 中创建一个新的 Python 项目

在选择项目的位置和环境路径后,点击Create按钮来启动一个新项目。 在新打开的窗口中,您可以在 Python 文件中输入代码。本教程使用 Python 3.9。

如何在Python中将PDF转换为PDF/A,图3:主Python文件

主Python文件

IronPDF库要求

IronPDF for Python 利用了 .NET。 因此,要使用 IronPDF for Python,您的机器上必须安装 .NET Runtime。 该 Python 包已预装在 Windows 上,但 Linux 和 Mac 用户在使用该 Python 包之前可能需要安装 .NET。

IronPDF 库设置

为了能够生成、修改和打开“.pdf”扩展名的文件,必须安装ironpdf包。 打开终端窗口并输入以下命令在 PyCharm 中安装该包:

pip install ironpdf

ironpdf 包已安装,如下图所示。

如何在Python中将PDF转换为PDF/A,图4:安装IronPDF包

安装 IronPDF 包

从 PDF 文档创建 PDF/A

在 IronPDF 库的协助下,创建 PDF/A 文档是一个简单明了的过程。 这些文件旨在存储信息,以便长期保存。 以下是将 PDF 文件转换为 PDF/A 文件的示例代码片段:

from ironpdf import *

pdf = PdfDocument.FromFile("sample.pdf")
pdf.SaveAsPdfA("Converted_pdfa.pdf", PdfAVersions.PdfA3)
PYTHON

上面的代码演示了如何在 IronPDF 的协助下,仅用几行 Python 代码就将 PDF 文件转换为 PDF/A 格式。 在初始步骤中,导入IronPDF库,这使您可以使用IronPDF提供的所有功能,特别是通过PdfDocument类。

通过使用FromFile方法,通过将其文件路径指定为参数来加载输入的PDF文件。 PdfDocument对象提供了SaveAsPdfA方法,可以让您将PDF文件保存并转换为PDF/A格式。 SaveAsPdfA 方法需要两个参数:新的保存文件位置和 PDF/A 版本。 PDF/A 版本参数是可选的,如果未指定,将默认为 PdfAVersions.PdfA3

如何在 Python 中将 PDF 转换为 PDFA,图 5:输出 PDF 文件

输出 PDF 文件

在输出中,将同时显示源文件和创建的 PDF/A 文件。 不过,水印可以通过使用软件的授权版本去除。 有关更详细的教程和信息,您可以点击以下HTML 转 PDF 转换器教程

结论

为了提高数据安全性并将潜在风险降至最低,IronPDF 库提供了强大的安全功能。 它与所有主流网络浏览器兼容,不局限于任何特定浏览器。 只需几行代码,程序员就能使用 IronPDF 轻松创建和阅读 PDF 文件。 该库提供一系列许可选项,以满足开发人员的不同需求,包括免费的开发人员许可和可供购买的额外开发许可。

Lite套餐的价格为$749,包括永久许可、30天退款保证、一年的软件支持和升级选项。 首次购买后不收取额外费用。 这些许可证适用于开发、暂存和生产环境。 此外,IronPdf 还提供免费许可,但有一定的时间和再分发限制。 用户有机会在真实环境中试用软件,在此期间,免费试用期不会应用水印。 请点击以下许可页面了解有关IronPDF试用价格和许可的更多信息。

查克尼特·宾
软件工程师
Chaknith 负责 IronXL 和 IronBarcode 的工作。他在 C# 和 .NET 方面拥有深厚的专业知识,帮助改进软件并支持客户。他从用户互动中获得的洞察力,有助于提升产品、文档和整体体验。
< 前一页
如何在Python中压平PDF文件
下一步 >
如何在Python中编写PDF文件

准备开始了吗? 版本: 2025.4 刚刚发布

查看许可证 >