使用 Python 將多個 PDF 文件合併為單個 PDF

This article was translated from English: Does it need improvement?
Translated
View the article in English

PDF 格式,即便攜文件格式,被廣泛用於在不同平台和軟體應用程序中一致地顯示文字和圖形。

Python 作為一種高階程式語言,當涉及到處理各種電腦系統時,提供了靈活性和易用性。然而,在 Python 中處理來源 PDF 文件和輸入流可能會帶來挑戰。幸運的是,IronPDF,一個 Python 庫,提供了一個方便的解決方案,用於輕鬆地操作和處理現有的 PDF 文件。

在本指南中,我們將帶您了解如何安裝 IronPDF Python 庫,並演示如何將多個 PDF 文件合併為一個單個 PDF 文件。

IronPDF: Python Library

IronPDF 是一個功能強大的 Python 庫,用於 PDF 操作。它使您可以輕鬆地創建、讀取和編輯 PDF 文件。使用 IronPDF,您可以從頭開始生成 PDF,使用 HTML、CSS、Javascript 自訂其外觀,並添加標題和作者姓名等元數據。值得注意的是,IronPDF 允許將多個 PDF 文件無縫合併到單個目標文件中。它提供了一個自主解決方案,無需依賴於外部框架。

此外,IronPDF 被設計成跨平台兼容,支持 Python 3.x 在 Windows 和 Linux 上運行。這確保了無論您的運行環境如何,都可以利用其功能。

使用 Pip 安裝 IronPDF

要使用 pip 安裝 IronPDF 庫,執行以下命令:

 pip install ironpdf

在您的 Python 腳本中,請確保包括以下導入語句,以利用 IronPDF 的功能來生成和合併 PDF 文件

from ironpdf import *
PYTHON

使用 IronPDF 在 Python 中合併兩個 PDF 文件

合併 PDF 以下示例中的文件涉及兩個步驟:

  • 創建 PDF 文件
  • 將它們合併成一個最終的 PDF 文件

以下是一個演示該過程的代碼示例:

html_a = """<p> [PDF_A] </p>
            <p> [PDF_A] 1st Page </p>
            <div style='page-break-after: always;'></div>
            <p> [PDF_A] 2nd Page</p>"""

html_b = """<p> [PDF_B] </p>
            <p> [PDF_B] 1st Page </p>
            <div style='page-break-after: always;'></div>
            <p> [PDF_B] 2nd Page</p>"""

renderer = ChromePdfRenderer()

pdfdoc_a = renderer.RenderHtmlAsPdf(html_a)
pdfdoc_b = renderer.RenderHtmlAsPdf(html_b)
merged = PdfDocument.Merge(pdfdoc_a, pdfdoc_b)
PYTHON

在提供的代碼中,創建了兩個 HTML 字符串,每個都表示跨越兩頁的內容。使用 IronPDF 的 RenderHtmlAsPdf 方法將兩個 HTML 字符串轉換為分別的 PDF 文檔作為 PdfDocument 對象。

為合併 PDF 文件,使用了 PdfDocument.Merge 方法。它通過將第二個 PdfDocument 的內容附加到第一個的末尾來合併兩個 PDF 文件成一個 PDF 文件。結果是一個新的 PdfDocument,包含了合併的內容。

儲存合併多個 PDF 文件

要將合併後的 PDF 檔案儲存到指定的目標文件路徑,可以使用以下簡潔的單行程式碼:

merged.SaveAs("Merged.pdf")
PYTHON

合併的 PDF 檔案輸出如下所示:

Python 合併 PDF - 圖 2: 合併多個 PDF 文件

合併兩個 PDF 文件

合併多於兩個PDF文件

使用 IronPDF 在 Python 中合併多於兩個 PDF 文件,您可以按照以下兩個簡單步驟操作:

  • 創建一個列表並添加您想合併的 PDF 的 PdfDocument 對象
  • 將此列表作為單個參數傳遞給 PdfDocument.Merge 方法

下面的代碼片段展示了這個過程:

html_a = """<p> [PDF_A] </p>
            <p> [PDF_A] 1st Page </p>
            <div style='page-break-after: always;'></div>
            <p> [PDF_A] 2nd Page</p>"""

html_b = """<p> [PDF_B] </p>
            <p> [PDF_B] 1st Page </p>
            <div style='page-break-after: always;'></div>
            <p> [PDF_B] 2nd Page</p>"""

html_c = """<p> [PDF_C] </p>
            <p> [PDF_C] 1st Page </p>
            <div style='page-break-after: always;'></div>
            <p> [PDF_C] 2nd Page</p>"""

renderer = ChromePdfRenderer()

pdfdoc_a = renderer.RenderHtmlAsPdf(html_a)
pdfdoc_b = renderer.RenderHtmlAsPdf(html_b)
pdfdoc_c = renderer.RenderHtmlAsPdf(html_c)

pdfs = List [PdfDocument]()
pdfs.Add(pdfdoc_a)
pdfs.Add(pdfdoc_b)
pdfs.Add(pdfdoc_c)
pdf = PdfDocument.Merge(pdfs)
pdf.SaveAs("merged.pdf")
PYTHON

在上述代碼中,使用HTML渲染方法生成了三個PDF文檔。之後,創建了一個新的List集合來存儲這些PDF。然後將此列表作為單個參數傳遞給合併方法,從而將這些PDF合併成一個文檔。

Python Merge PDFs - Figure 3: 合併超過兩個 PDF 文件

合併超過兩個 PDF 文件

結論

本文提供了一個使用 IronPDF for Python 合併 PDF 文件的全方位指南。

我們首先討論了 IronPDF for Python 的安裝過程。然後,我們探討了使用 HTML 渲染方法生成 PDF 的簡單方法。此外,我們深入研究了如何將兩個或多個 PDF 合併成一個 PDF 文件。

IronPDF 以其高效的性能和精確的執行力,成為在 Python 中處理 PDF 文件的優秀選擇。利用 IronPDF for .NET 的功能,該庫實現了從 HTML/URL/字符串到 PDF 的無縫轉換。它支持流行的文件類型,如 HTML、CSS、JS、JPG 和 PNG,確保生成高質量的 PDF 文件。使用尖端技術構建的 IronPDF,是處理 Python PDF 相關任務的可靠解決方案。

要進一步了解如何使用 IronPDF for Python,您可以探索我們的廣泛收藏。 程式碼範例IronPDF提供免費使用以供開發用途,並針對商業應用提供授權選項。欲了解有關授權的詳細資訊,請訪問以下網址 連結下載 該軟體產品。