使用IRONPDF FOR PYTHON

如何在Python中将PDF转换为PDFA

发布 2023年七月22日
分享:

简介

Adobe 开发的便携式文档格式 (PDF) 在文档共享方面,PDF/A 对于保持内容的完整性至关重要,它既能提供丰富的文本,又能带来美感。PDF/A 是便携式文档格式的 ISO 标准化版本,专门设计用于电子文档的归档和长期保存。 (PDF).与 PDF 不同,PDF/A 禁止加密和字体链接等不适合长期存档的功能。色彩管理指南、嵌入式字体辅助以及用于阅读嵌入式注释的用户界面都包含在 PDF/A 文件阅读器的 ISO 规范中。在本文章中,我们将使用 IronPDF Python 模块将现有的 PDF 文件转换为 PDFA 文件。

2.0 IronPDF

与其他语言相比,Python 为程序员提供了更大的活力,使开发人员能够快速、轻松地创建图形用户界面。因此,将 IronPDF 库集成到 Python 中是一个简单易行的过程。可以利用各种预装工具,如 PyQt、wxWidgets、Kivy 以及其他各种软件包和库,高效安全地组装出功能齐全的图形用户界面。

在 IronPDF 的帮助下,Python 网页设计和开发得到了极大的简化。这主要归功于大量可用的 Python 网络开发范例,包括 Django、Flask 和 Pyramid。Reddit、Mozilla 和 Spotify 等网站和在线服务都成功地使用了这些框架。

2.1 IronPDF 的功能

  • 可使用 HTML、HTML5、ASP、PHP 和其他资源创建 PDF 文件。此外,还可将图片文件转换为 PDF。
  • IronPDF 可以创建交互式 PDF 文档。它提供的功能包括打印 PDF 文件、将 PDF 页面光栅化为图像、将 PDF 转换为 HTML、分割和合并 PDF 文件、从 PDF 文件中提取文本和图像、搜索 PDF 文件中的特定短语以及填写和提交交互式表单。
  • 有了 IronPDF,用户可以通过 URL 创建文档,同时还支持用户代理、代理、cookies、HTTP 标头、独特的网络登录凭证、表单变量以及使用 HTML 登录表单登录的用户代理。
  • IronPDF 允许用户检查和注释 PDF 文件。
  • 使用 IronPDF 可以从文档中提取图像。
  • IronPDF 可以在文档中添加页眉、页脚、文本、图像、书签、水印等。
  • 用户可以使用 IronPDF 在新文档或现有文档中合并和拆分页面。
  • 无需依赖 Acrobat 浏览器即可将文档转换为 PDF 对象。
  • IronPDF 允许从 CSS 文件创建 PDF 文档。
  • 带有媒体类型规范的 CSS 文件可用于使用 IronPDF 创建文档。

3.0 配置 Python 环境

3.1 设置 Python

确保计算机上安装了 Python。访问官方 Python 网站 下载并安装适合您操作系统的最新 Python 版本。安装好 Python 后,创建一个虚拟环境来隔离项目需求。利用 venv 模块创建和管理虚拟环境,为您的转换项目提供干净、独立的工作空间。

3.2 PyCharm 中的新项目

在本教程中,我们将使用 Python 开发的集成开发环境 PyCharm。

启动 PyCharm IDE 后,从菜单中选择 "新建项目",如下图所示。

如何用 Python 将 PDF 转换为 PDF/A:图 1

选择 "新建项目 "后,会出现一个新窗口,让你指定项目的位置和 Python 环境,如下图所示。

如何用 Python 将 PDF 转换为 PDF/A:图 2

选择项目位置和环境路由后,点击 "创建 "按钮启动新项目。在新打开的窗口中,您可以在 Python 文件中输入代码。本教程使用 Python 3.9。

如何用 Python 将 PDF 转换为 PDF/A:图 3

3.3 IronPDF 库要求

Python 中的 IronPDF 使用 .NET。因此,要使用 IronPDF for Python,必须在计算机上安装 .NET Runtime。Windows 上预装了 .NET,但 Linux 和 Mac 用户在使用此 Python 软件包之前可能需要安装 .NET。

3.4 IronPDF 库设置

为了能够生成、修改和打开扩展名为".pdf "的文件,必须安装 ironpdf 软件包。打开终端窗口,输入以下命令在 PyCharm 中安装该软件包:

 pip install ironpdf

如下面的截图所示,"ironpdf "软件包已经安装。

如何用 Python 将 PDF 转换为 PDF/A:图 4

4.0 从 PDF 文档创建 PDF/A

在 IronPDF 库的帮助下,创建 PDFA/A 文档是一个简单明了的过程。这些文件旨在长期保存信息。下面是将 PDF 文件转换为 PDFA 文件的示例代码片段:

from ironpdf import *
pdf = PdfDocument.FromFile("sample.pdf")
pdf.SaveAsPdfA("Converted_pdfa.pdf", PdfAVersions.PdfA3)
PYTHON

上面的代码演示了我们如何在 IronPDF 的帮助下,仅用几行 Python 代码就能轻松地将 PDF 文件转换为 PDF/A 格式。第一步,我们导入 IronPDF 库,这样就可以利用 IronPDF 提供的所有功能。通过 PdfDocument 类,我们可以处理现有的 PDF 文件并对其执行各种操作。

通过使用 FromFile 方法,我们可以将 PDF 文件的文件路径指定为参数,从而加载输入的 PDF 文件。PDFDocument对象提供了SaveAsPdfA方法,使我们能够保存 PDF 文件并将其转换为 PDF/A 格式。SaveAsPdfA 方法需要两个参数:新的保存文件位置和 PDF/A 版本。PDF/A 版本参数是可选的,如果未指定,则默认为 PdfAVersions.PdfA3

如何用 Python 将 PDF 转换为 PDFA:图 5

在输出中,源文件和创建的 PDF/A 文件都会显示。不过,使用软件的授权版本可以去除水印。如需了解更详细的教程和信息,请点击以下链接 链接.

5.0 结论

为了提高数据安全性并将潜在风险降至最低,IronPDF 库提供了强大的安全功能。它与所有主流网络浏览器兼容,不局限于任何特定浏览器。只需几行代码,程序员就能使用 IronPDF 轻松创建和读取 PDF 文件。该库提供一系列许可选项,以满足开发人员的不同需求,包括免费的开发人员许可和可购买的额外开发许可。

售价为 $749 的精简版软件包包括永久许可证、30 天退款保证、一年软件支持和升级选项。首次购买后无需支付额外费用。这些许可证适用于开发、暂存和生产环境。此外,IronPDF 还提供有一定时间和再分发限制的免费许可证。用户有机会在实际环境中试用该软件,包括 免费试用 期间不会应用水印。请点击以下链接 链接 了解有关 IronPDF 试用价格和许可的更多信息。

< 前一页
如何在Python中压平PDF文件
下一步 >
如何在Python中编写PDF文件

准备开始了吗? 版本: 2024.9 刚刚发布

免费 pip 安装 查看许可证 >