使用 IRONPDF FOR NODE.JS

如何在 Node.js 中讀取 PDF 文件

在不斷變化的網頁開發世界中,Node.js 已經成為一個強大的平台,讓開發人員能夠構建可擴展且高效的應用程式。 Node.js 的一個迷人之處在於它能夠無縫地與各種庫和模組協作,從而擴展其功能。 在本文中,我們將深入探討 Node.js 的 PDF 閱讀器功能,探索 IronPDF 庫及其如何用於處理 PDF 文件。

什麼是 Node.js PDF Reader?

Node.js PDF Reader 是一個專門的工具,旨在促進於 Node.js 環境中讀取和操作 PDF(可攜式文件格式)檔案。 PDF 文件由於在不同平台上具有一致的格式,廣泛用於文件共享。 將 PDF 閱讀功能整合到 Node.js 應用程式中,可以開創廣泛的可能性,從提取信息到生成動態報告。

如何使用 Node.js PDF Reader 讀取 PDF?

  1. 安裝 Node.js PDF 閱讀器庫。

  2. 導入所需的依賴項。

  3. 使用PdfDocument.open方法開啟PDF檔案。

  4. 使用extractText方法從PDF檔案中提取文本,詳情請參閱此處

  5. 使用console.log方法在控制台顯示提取的文字。

2. IronPDF for Node.js 介紹

IronPDF 是一個用於在 Node.js 生態系統中處理 PDF 文件的綜合庫。 它提供了一系列功能,是需要以程式化方式與 PDF 文件互動的開發人員的首選。 IronPDF由Iron Software團隊開發,以其簡單性和易於整合到Node.js項目中而聞名。

2.1. IronPDF 的主要功能

  1. PDF生成: IronPDF允許開發人員從頭開始創建PDF文件,完全控制內容、格式和布局。

  2. PDF 解析 該函式庫可以從現有的 PDF 文件中提取文字、圖像及其他元素,讓開發者能夠處理這些文件中儲存的資料。

  3. PDF 修改:IronPDF 支援修改現有的 PDF 檔案,使得可以動態地新增、移除或更新內容。

  4. PDF 渲染: 使用 IronPDF,開發者可以將 PDF 文件渲染為多種格式,包括從圖像從 HTML,擴展在 Web 應用程式中顯示 PDF 內容的可能性。

  5. 跨平台相容性:IronPDF 專為在不同操作系統上無縫運行而設計,確保無論部署環境如何,其行為皆一致。

2.2. 安裝 IronPDF

在探討 IronPDF 的功能之前,首先要在您的 Node.js 專案中安裝該庫。 安裝過程簡單,可以使用 NPM 軟體包管理器完成。 開啟終端並執行以下命令:

npm i @ironsoftware/ironpdf

此命令安裝 IronPDF 庫,並使其在您的 Node.js 應用程序中可用。

要安裝必須使用的IronPDF引擎以使用IronPDF庫,請在控制台上運行以下命令:

:InstallCmd npm install @ironsoftware/ironpdf-engine-windows-x64
:InstallCmd npm install @ironsoftware/ironpdf-engine-windows-x64
SHELL

3. 使用 Node.js 和 IronPDF 讀取 PDF 文件

使用 Node.js 和 IronPDF 讀取 PDF 文件涉及一系列簡單的步驟,提供的代碼示例展示了一種簡潔而強大的方法來實現這一點。 該程式碼使用 @ironsoftware/ironpdf 套件中的 PdfDocument 類別來開啟並從 PDF 檔案中提取文字。讓我們逐步分解這段程式碼:

  1. 導入PdfDocument
    import { PdfDocument } from "@ironsoftware/ironpdf";
    import { PdfDocument } from "@ironsoftware/ironpdf";
NODE.JS

程式碼開始時會從IronPDF函式庫導入PdfDocument類別。 此類別提供用於處理 PDF 文件的方法,例如打開、提取文字及執行各種操作。

  1. 開啟 PDF 文件:
    const pdf = await PdfDocument.open("output.pdf");
    const pdf = await PdfDocument.open("output.pdf");
NODE.JS

PdfDocument.open方法用於打開 PDF 文件。在此範例中,指定了檔案 "output.pdf"。 await 關鍵字被使用是因為 open 方法返回一個 promise。這確保了代碼在 PDF 項完整加載之前等待,以便繼續執行下一步驟。

  1. 從 PDF 提取文字:
    const text = await pdf.extractText();
    const text = await pdf.extractText();
NODE.JS

一旦開啟 PDF,就會對 pdf 對象調用 extractText 方法。 此方法會以非同步方式從 PDF 文件中提取文本內容。 結果存儲在text變量中。

  1. 記錄提取的文本:
    console.log(text);
    console.log(text);
NODE.JS

最後,提取的文本使用console.log記錄到控制台。 這個步驟對開發者來說至關重要,以驗證文本提取過程是否成功,並檢查從範例 PDF 檢視器中提取的內容。

  1. async 函數包裝器:
    (async () => { // Code goes here })();
    (async () => { // Code goes here })();
NODE.JS

整個代碼包裝在一個使用 async 關鍵字的立即執行函數表達式(IIFE)中的異步函數中。 這允許在函式內使用await,從而啟用非同步操作,例如載入PDF和擷取文字。

總而言之,此程式碼展示了一種使用 Node.js 和 IronPDF 閱讀 PDF 文件的簡短且有效的方法。 通過利用IronPDF庫的功能,開發者可以輕鬆打開PDF文檔,提取文本內容,並將這些功能集成到他們的Node.js應用程式中。

如何在 Node.js 中閱讀 PDF 文件,圖 1:從樣本 PDF 文件中提取的文本

從範例 PDF 文件中提取的文本

3.1. 讀取受密碼保護的 PDF 檔案

閱讀受密碼保護的 PDF 文件需要處理保護文件內容的額外安全層。 在這種情況下,使用支持密碼驗證的 PDF 閱讀庫,例如 IronPDF,是至關重要的。

該過程涉及在文件打開階段提供正確的密碼,從而使 PDF 內的內容得以解密。 這可確保只有授權用戶才能訪問和提取受密碼保護的 PDF 文件中的信息,從而增強這些文檔中敏感數據的安全性。

const pdf = await PdfDocument.open("encrypted.pdf", "password");
const pdf = await PdfDocument.open("encrypted.pdf", "password");
NODE.JS

使用上述程式碼,使用者可以讀取受密碼保護的 PDF 檔內容。

3.2. 讀取 PDF 文件的元數據

IronPDF for Node.js 提供讀取 PDF 文件頁面中繼資料的功能。 下面的程式碼將演示如何從 PDF 文件中讀取元數據。

import { PdfDocument } from "@ironsoftware/ironpdf";

(async () => {
  // Step 1. Import a PDF
  const pdf = await PdfDocument.open("output.pdf");
  const metadata = await pdf.getMetadata();
  console.log("\n")
  console.log(metadata)
})();
import { PdfDocument } from "@ironsoftware/ironpdf";

(async () => {
  // Step 1. Import a PDF
  const pdf = await PdfDocument.open("output.pdf");
  const metadata = await pdf.getMetadata();
  console.log("\n")
  console.log(metadata)
})();
NODE.JS

輸出

如何在 Node.js 中讀取 PDF 檔案,圖 2:從範例 PDF 檔案中提取的中繼資料

從範例 PDF 文件提取的元資料

4. 結論

總之,Node.js PDF Reader,尤其是在利用IronPDF庫時,為處理PDF文件的開發人員開闢了一個充滿可能性的世界。 無論是透過數據提取策略擷取文本、圖像,還是動態修改現有文檔,或者是創建 PDF 查看器,IronPDF 都在 Node.js 環境中提供了一套多功能的工具來處理 PDF。 它還支持表格數據,並且 PDF 閱讀器模組可以提取文本條目。

要開始使用 Node.js PDF 數據讀取器和 IronPDF,請按照本文中的步驟操作。 探索Iron Software 文件以獲取更深入的信息和高級使用案例。 擁有合適的工具與知識,您可以通過使用數據提取規則無縫整合原始 PDF 緩衝區讀取功能來增強您的 Node.js 應用程序。

為什麼使用 IronPDF for Node.js?

  1. 免費試用:IronPDF for Node.js 提供IronPDF for Node.js 的免費試用,讓開發者在承諾購買前探索其功能。 試用期讓使用者可以在不需要財務承諾的情況下評估此函式庫對其特定 PDF 任務的適用性。

  2. 功能豐富: IronPDF Node.js 功能概覽 擁有豐富的功能,為在 Node.js 中處理 PDF 文件提供全面的功能集。 從 PDF 生成到文字提取和文件修改,此庫提供強大的工具包,使其在廣泛的應用中具有多功能性。

  3. 程式碼範例及文件/支援:IronPDF 提供豐富的文件和支援,讓開發人員可以輕鬆整合和利用其功能。 該函式庫附有詳細的Node.js PDF 轉換示例,以促進順利的學習過程,並確保開發人員擁有成功實施所需的資源。
Darrius Serrant
全端軟體工程師(WebOps)

Darrius Serrant 擁有邁阿密大學的計算機科學學士學位,目前擔任 Iron Software 的全端 WebOps 行銷工程師。自幼對編程產生興趣,他認為計算機既神秘又易於接觸,使其成為創造力和解決問題的完美媒介。

在 Iron Software,Darrius 享受創造新事物並簡化複雜概念使其更易理解的過程。作為我們的其中一位常駐開發人員,他也自願教導學生,將他的專業知識傳授給下一代。

對 Darrius 來說,他的工作之所以令人滿足,是因為它受到重視並且產生了真正的影響。

< 上一頁
Node.js PDF SDK(開發人員教程)
下一個 >
在 Node.js 中將 HTML 轉換為 PDF 無需 Puppeteer

準備開始了嗎? 版本: 2025.5 剛剛發布

查看許可證 >