如何使用 Python 合并 PDF 文件

Merge PDF Files into a Single PDF Using Python

This article was translated from English: Does it need improvement?
Translated
View the article in English

PDF格式,全称可移植文档格式,被广泛用于在不同平台和软件应用中以一致的方式显示文本和图形。

Python作为一种高级编程语言,提供了在各种计算机系统上工作的多样性和易用性。 然而,在Python中处理源PDF文件和输入流可能会带来挑战。 幸运的是,IronPDF,一个Python库,为轻松操作和处理现有PDF文件提供了一个方便的解决方案。

在本指南中,我们将引导您完成安装IronPDF for Python库的过程,并演示如何将多个PDF文件合并为一个PDF文件。

class="hsg-featured-snippet">

如何在Python中合并PDF文件

  1. 安装用于合并PDF文件的Python库
  2. 利用RenderHtmlAsPdf方法生成单个PDF文件
  3. 在Python中使用Merge方法合并生成的PDF文件
  4. 使用SaveAs方法保存合并的PDF文件
  5. 通过创建PDF对象列表并使用Merge方法合并多个PDF文件

IronPDF:Python库

IronPDF是一个强大的Python库,用于PDF操作。 它使您能够轻松地创建、读取和编辑PDF文件。 使用IronPDF,您可以从头开始生成PDF,使用HTML、CSS和JavaScript自定义其外观,并添加元数据,如标题和作者姓名。 值得注意的是,IronPDF允许无缝合并多个PDF文件为一个目的文件。它提供了一个无需依赖外部框架的独立解决方案。

此外,IronPDF被设计为跨平台兼容,支持Windows和Linux上的Python 3.x。 这确保无论您的操作环境如何,您都可以利用其功能。

通过Pip安装IronPDF

要使用pip安装IronPDF库,请执行以下命令:

 pip install ironpdf

在您的Python脚本中,请确保包含以下导入声明,以利用IronPDF的功能生成和合并PDF文件:

from ironpdf import *
from ironpdf import *
PYTHON

使用IronPDF在Python中合并两个PDF文件

合并PDF文件的过程如下所示,分为两步:

  • 创建PDF文件
  • 将它们合并为一个最终的PDF文件

以下是展示该过程的代码示例:

# HTML content for the first PDF
html_a = """<p> [PDF_A] </p>
            <p> [PDF_A] 1st Page </p>
            <div style='page-break-after: always;'></div>
            <p> [PDF_A] 2nd Page</p>"""

# HTML content for the second PDF
html_b = """<p> [PDF_B] </p>
            <p> [PDF_B] 1st Page </p>
            <div style='page-break-after: always;'></div>
            <p> [PDF_B] 2nd Page</p>"""

# Initialize ChromePdfRenderer
renderer = ChromePdfRenderer()

# Convert HTML to PDF documents
pdfdoc_a = renderer.RenderHtmlAsPdf(html_a)
pdfdoc_b = renderer.RenderHtmlAsPdf(html_b)

# Merge the PDF documents
merged = PdfDocument.Merge([pdfdoc_a, pdfdoc_b])
# HTML content for the first PDF
html_a = """<p> [PDF_A] </p>
            <p> [PDF_A] 1st Page </p>
            <div style='page-break-after: always;'></div>
            <p> [PDF_A] 2nd Page</p>"""

# HTML content for the second PDF
html_b = """<p> [PDF_B] </p>
            <p> [PDF_B] 1st Page </p>
            <div style='page-break-after: always;'></div>
            <p> [PDF_B] 2nd Page</p>"""

# Initialize ChromePdfRenderer
renderer = ChromePdfRenderer()

# Convert HTML to PDF documents
pdfdoc_a = renderer.RenderHtmlAsPdf(html_a)
pdfdoc_b = renderer.RenderHtmlAsPdf(html_b)

# Merge the PDF documents
merged = PdfDocument.Merge([pdfdoc_a, pdfdoc_b])
PYTHON

在提供的代码中,创建了两个HTML字符串,每个代表两个页面的内容。 使用IronPDF中的RenderHtmlAsPdf方法将这两个HTML字符串转换为单独的PDF文档作为PdfDocument对象。

要合并PDF文件,使用PdfDocument.Merge方法。 它通过将PdfDocument对象的内容合并到新的PdfDocument中,将两个PDF文档合并为一个PDF文档。

保存合并的多个 PDF 文档

要将合并后的PDF文件保存到特定的目标文件路径,可以使用以下简洁的单行代码:

# Save the merged PDF document
merged.SaveAs("Merged.pdf")
# Save the merged PDF document
merged.SaveAs("Merged.pdf")
PYTHON

合并后的 PDF 文件输出如下所示:

class="content-img-align-center">
class="center-image-wrapper"> Python Merge PDFs - 图2:合并多个PDF文档

class="content__image-caption">合并两个PDF文档

合并两个以上的PDF文件

要使用IronPDF在Python中合并两个以上的PDF文档,您可以按照以下两个简单步骤进行:

  • 创建一个列表并添加您要合并的PDF的PdfDocument对象
  • 将此列表作为单个参数传递给PdfDocument.Merge方法

下面的代码片段展示了这一过程:

# HTML content for the first PDF
html_a = """<p> [PDF_A] </p>
            <p> [PDF_A] 1st Page </p>
            <div style='page-break-after: always;'></div>
            <p> [PDF_A] 2nd Page</p>"""

# HTML content for the second PDF
html_b = """<p> [PDF_B] </p>
            <p> [PDF_B] 1st Page </p>
            <div style='page-break-after: always;'></div>
            <p> [PDF_B] 2nd Page</p>"""

# HTML content for the third PDF
html_c = """<p> [PDF_C] </p>
            <p> [PDF_C] 1st Page </p>
            <div style='page-break-after: always;'></div>
            <p> [PDF_C] 2nd Page</p>"""

# Initialize ChromePdfRenderer
renderer = ChromePdfRenderer()

# Convert HTML to PDF documents
pdfdoc_a = renderer.RenderHtmlAsPdf(html_a)
pdfdoc_b = renderer.RenderHtmlAsPdf(html_b)
pdfdoc_c = renderer.RenderHtmlAsPdf(html_c)

# List of PDF documents to merge
pdfs = [pdfdoc_a, pdfdoc_b, pdfdoc_c]

# Merge the list of PDFs into a single PDF
pdf = PdfDocument.Merge(pdfs)

# Save the merged PDF document
pdf.SaveAs("merged.pdf")
# HTML content for the first PDF
html_a = """<p> [PDF_A] </p>
            <p> [PDF_A] 1st Page </p>
            <div style='page-break-after: always;'></div>
            <p> [PDF_A] 2nd Page</p>"""

# HTML content for the second PDF
html_b = """<p> [PDF_B] </p>
            <p> [PDF_B] 1st Page </p>
            <div style='page-break-after: always;'></div>
            <p> [PDF_B] 2nd Page</p>"""

# HTML content for the third PDF
html_c = """<p> [PDF_C] </p>
            <p> [PDF_C] 1st Page </p>
            <div style='page-break-after: always;'></div>
            <p> [PDF_C] 2nd Page</p>"""

# Initialize ChromePdfRenderer
renderer = ChromePdfRenderer()

# Convert HTML to PDF documents
pdfdoc_a = renderer.RenderHtmlAsPdf(html_a)
pdfdoc_b = renderer.RenderHtmlAsPdf(html_b)
pdfdoc_c = renderer.RenderHtmlAsPdf(html_c)

# List of PDF documents to merge
pdfs = [pdfdoc_a, pdfdoc_b, pdfdoc_c]

# Merge the list of PDFs into a single PDF
pdf = PdfDocument.Merge(pdfs)

# Save the merged PDF document
pdf.SaveAs("merged.pdf")
PYTHON

在上面的代码中,使用HTML渲染方法生成了三个PDF文档。 随后,创建了一个新的列表集合来存储这些PDF。 然后将此列表作为单一参数传递给合并方法,从而将这些PDF合并为一个文档。

class="content-img-align-center">
class="center-image-wrapper"> Python Merge PDFs - 图3:合并两个以上的PDF文件

class="content__image-caption">合并两个以上的PDF文件

结论

本文为您提供了一个关于使用IronPDF for Python合并PDF文件的全面指南。

我们首先讨论了IronPDF for Python的安装过程。 然后,我们探索了一种使用HTML渲染方法生成PDF的简单方法。 此外,我们深入探讨了如何将两个或多个PDF文件合并为一个PDF文件。

凭借其高效的性能和精准的执行,IronPDF被证明是用于Python中处理PDF文件的理想选择。 利用IronPDF for .NET的功能,该库可以实现从HTML/URL/字符串到PDF的无缝转换。 它支持流行的文档类型,如HTML、CSS、JS、JPG和PNG,确保生产出高质量的PDF文档。 IronPDF利用前沿技术构建,成为您在Python中与PDF相关任务的可靠解决方案。

要进一步了解如何利用IronPDF for Python,您可以浏览我们的代码示例的丰富集合。

IronPDF为开发目的提供免费使用,并为商业应用提供许可选项。 有关许可的详细信息,请访问以下链接

下载软件产品。

常见问题解答

如何在 Python 中合并 PDF 文件?

要在 Python 中合并 PDF 文件,可以使用 IronPDF。首先,使用RenderHtmlAsPdf方法生成单个 PDF,然后使用PdfDocument.Merge方法将它们合并成一个文档。最后,使用SaveAs方法保存合并后的 PDF。

如何安装 IronPDF for Python?

可以使用 pip 包管理器安装 IronPDF,命令为pip install ironpdf。安装后,可以在您的 Python 脚本中使用from ironpdf import *导入它。

我可以使用 Python 合并两个以上的 PDF 吗?

可以,使用 IronPDF 可以合并两个以上的 PDF。为要合并的所有 PDF 创建一个PdfDocument对象的列表,并将此列表传递给PdfDocument.Merge方法。

在Python中使用IronPDF进行PDF操作的优势是什么?

IronPDF 提供了创建、编辑和合并 PDF 文件的强大解决方案。它支持 HTML、CSS 和 JavaScript,允许高度自定义。它是高效且跨平台的,支持在 Windows 和 Linux 上的 Python。

IronPDF 在开发时可以免费使用。但对于商业用途,您需要了解他们的许可选项。

如何在 Python 中合并 PDF 后保存它?

使用 IronPDF 的PdfDocument.Merge方法合并 PDF 文件后,使用SaveAs方法保存生成的文档,并指定所需的文件路径。

IronPDF 支持哪些文件格式用于 PDF 生成?

IronPDF 支持从 HTML、CSS 和 JavaScript 内容生成 PDF。它允许将 HTML/URL/String 输入转换为高质量的 PDF 文件。

在哪里可以找到使用 IronPDF 进行 PDF 任务的 Python 示例?

您可以在 IronPDF 网站的“代码示例”部分找到各种代码示例和详细教程。

IronPDF 如何为 Python 应用程序确保跨平台兼容性?

IronPDF 设计为兼容 Windows 和 Linux 平台上的 Python 3.x,是进行跨平台 PDF 操作的多功能选择。

IronPDF 文章提供了关于在 Python 中使用 IronPDF 合并 PDF 文件的详细教程。文章首先强调了 PDF 格式的广泛使用,以跨平台一致地展示文本和图形。鉴于 Python 的多功能性,教程处理了 PDF 处理中的挑战,并介绍了 IronPDF 作为 PDF 操作的解决方案。指南解释了通过 pip 安装 IronPDF 库,并演示了将多个 PDF 合并为一个的过程。过程包括使用`RenderHtmlAsPdf`方法生成单个 PDF 文件,并使用`Merge`方法进行合并,还涵盖了如何使用`SaveAs`方法保存合并后的文档。IronPDF 通过创建 PDF 对象列表并将其传递给`Merge`方法支持合并两个以上的 PDF。文章提供了代码片段,说明了这些步骤,并强调了 IronPDF 的跨平台兼容性和易用性。IronPDF 支持创建、读取和编辑 PDF 支持 HTML、CSS、JavaScript 和其他流行的文档类型。该库提供免费的开发使用和商业许可选项。结论强调 IronPDF 在 Python 上执行 PDF 任务的效率和可靠性,并鼓励读者探索更多代码示例和许可信息。

Curtis Chau
技术作家

Curtis Chau 拥有卡尔顿大学的计算机科学学士学位,专注于前端开发,精通 Node.js、TypeScript、JavaScript 和 React。他热衷于打造直观且美观的用户界面,喜欢使用现代框架并创建结构良好、视觉吸引力强的手册。

除了开发之外,Curtis 对物联网 (IoT) 有浓厚的兴趣,探索将硬件和软件集成的新方法。在空闲时间,他喜欢玩游戏和构建 Discord 机器人,将他对技术的热爱与创造力相结合。

准备开始了吗?
版本: 2025.9 刚刚发布