将多个PDF文件合并为一个PDF文件(使用Python)

This article was translated from English: Does it need improvement?
Translated
View the article in English

PDF格式(Portable Document Format)广泛用于在不同平台和软件应用程序中以一致的方式显示文本和图形。

Python作为一种高级编程语言,在处理各种计算机系统方面提供了灵活性和易用性。然而,在Python中处理源PDF文件和输入流可能会带来挑战。幸运的是,IronPDF是一个Python库,它提供了一种方便的解决方案,可以轻松操作和处理现有的PDF文件。

在本指南中,我们将引导您完成安装IronPDF Python库的过程,并演示如何将多个PDF文档合并为一个PDF文件。

IronPDF:Python 库

IronPDF 是一个功能强大的用于 PDF 操作的 Python 库。它能让您毫不费力地创建、阅读和编辑 PDF 文件。使用 IronPDF,您可以从头开始生成 PDF,使用 HTML、CSS 和 Javascript 自定义 PDF 的外观,并添加标题和作者姓名等元数据。值得注意的是,IronPDF 允许将多个 PDF 文件无缝合并到一个目标文件中。它提供了一个独立的解决方案,无需依赖外部框架。

此外,IronPDF 还具有跨平台兼容性,支持 Windows 和 Linux 上的Python 3.x。这确保了无论您的操作环境如何,都能利用其功能。

通过 Pip 安装 IronPDF

要使用 pip 安装 IronPDF 库,请执行以下命令:

 pip install ironpdf

在 Python 脚本中,确保包含以下导入语句,以使用 IronPDF 的功能生成和合并 PDF 文件

from ironpdf import *
PYTHON

使用 IronPDF 在 Python 中合并两个 PDF 文件

合并 PDF 下面示例中的文件包括两个步骤:

  • 创建 PDF 文件
  • 将它们合并为一个最终 PDF 文件

下面是演示该过程的代码示例:

html_a = """<p> [PDF_A] </p>
            <p> [PDF_A] 1st Page </p>
            <div style='page-break-after: always;'></div>
            <p> [PDF_A] 2nd Page</p>"""

html_b = """<p> [PDF_B] </p>
            <p> [PDF_B] 1st Page </p>
            <div style='page-break-after: always;'></div>
            <p> [PDF_B] 2nd Page</p>"""

renderer = ChromePdfRenderer()

pdfdoc_a = renderer.RenderHtmlAsPdf(html_a)
pdfdoc_b = renderer.RenderHtmlAsPdf(html_b)
merged = PdfDocument.Merge(pdfdoc_a, pdfdoc_b)
PYTHON

在提供的代码中,创建了两个 HTML 字符串,每个字符串代表跨越两个页面的内容。IronPDF 的 "RenderHtmlAsPdf "方法用于将这两个 HTML 字符串转换为单独的 PDF 文档,即 PdfDocument 对象。

要合并 PDF 文件,需要使用 PdfDocument.Merge 方法。它通过将第二个 PDFDocument 的内容追加到第一个 PDFDocument 的末尾,将两个 PDF 文档合并为一个 PDF 文档。结果是一个包含合并内容的新PDF文档。

保存合并的多个 PDF 文档

要将合并后的 PDF 文件保存到特定的目标文件路径,可以使用以下简洁的单行本:

merged.SaveAs("Merged.pdf")
PYTHON

合并后的 PDF 文件输出如下所示:

Python 合并 PDF - 图 2:合并多个 PDF 文档

合并两份 PDF 文档

合并两个以上的 PDF 文件

要在 Python 中使用 IronPDF 合并两个以上的 PDF 文档,可以按照以下两个简单的步骤进行:

  • 创建一个列表并添加要合并的 PDF 的 PdfDocument 对象
  • 将此列表作为一个参数传递给 PdfDocument.Merge 方法

下面的代码片段说明了这一过程:

html_a = """<p> [PDF_A] </p>
            <p> [PDF_A] 1st Page </p>
            <div style='page-break-after: always;'></div>
            <p> [PDF_A] 2nd Page</p>"""

html_b = """<p> [PDF_B] </p>
            <p> [PDF_B] 1st Page </p>
            <div style='page-break-after: always;'></div>
            <p> [PDF_B] 2nd Page</p>"""

html_c = """<p> [PDF_C] </p>
            <p> [PDF_C] 1st Page </p>
            <div style='page-break-after: always;'></div>
            <p> [PDF_C] 2nd Page</p>"""

renderer = ChromePdfRenderer()

pdfdoc_a = renderer.RenderHtmlAsPdf(html_a)
pdfdoc_b = renderer.RenderHtmlAsPdf(html_b)
pdfdoc_c = renderer.RenderHtmlAsPdf(html_c)

pdfs = List [PdfDocument]()
pdfs.Add(pdfdoc_a)
pdfs.Add(pdfdoc_b)
pdfs.Add(pdfdoc_c)
pdf = PdfDocument.Merge(pdfs)
pdf.SaveAs("merged.pdf")
PYTHON

在上述代码中,使用 HTML 渲染方法生成了三个 PDF 文档。然后,创建一个新的 List 集合来存储这些 PDF 文档。然后将此列表作为一个参数传递给合并方法,从而将 PDF 文件合并为一个文档。

Python Merge PDFs - Figure 3: 合并两个以上的 PDF 文件

合并两个以上的 PDF 文件

结论

本文全面介绍了如何使用 IronPDF for Python 合并 PDF 文件。

我们首先讨论 IronPDF for Python 的安装过程。然后,我们将探讨使用 HTML 渲染方法生成 PDF 的直接方法。此外,我们还将深入探讨如何将两个或多个 PDF 文件合并为一个 PDF 文件。

凭借其高效的性能和精确的执行,IronPDF 被证明是在 Python 中处理 PDF 文件的绝佳选择。利用 IronPDF for .NET 的功能,该库可将 HTML/URL/字符串无缝转换为 PDF。它支持 HTML、CSS、JS、JPG 和 PNG 等常用文档类型,确保生成高质量的 PDF 文档。IronPDF 采用尖端技术构建,是您在 Python 中执行 PDF 相关任务的可靠解决方案。

要进一步深入了解如何使用 IronPDF for Python,您可以浏览我们广泛收集的以下内容 代码示例.

IronPDF 为开发目的提供免费使用,并为商业应用提供许可选项。有关许可的详细信息,请访问以下网站 链接.

*下载 软件产品。