使用 IRONPDF FOR NODE.JS 如何在 Node.js 中從 PDF 中提取圖像 Darrius Serrant 更新日期:6月 22, 2025 Download IronPDF npm 下載 Start Free Trial Copy for LLMs Copy for LLMs Copy page as Markdown for LLMs Open in ChatGPT Ask ChatGPT about this page Open in Gemini Ask Gemini about this page Open in Grok Ask Grok about this page Open in Perplexity Ask Perplexity about this page Share Share on Facebook Share on X (Twitter) Share on LinkedIn Copy URL Email article 如何使用 IronPDF Node.js 從 PDF 文件中提取圖像 設置 Node.js 應用程序。 安裝 IronPDF NPM 包。 為提取準備PDF。 從 PDF 文件中提取圖像並保存。 先決條件 如果您尚未安裝 Node.js,請從 https://nodejs.org/ 下載並安裝。 介紹 IronPDF NPM 包 IronPDF NPM 包是為 .NET 環境設計的 IronPDF 庫的 Node.js 包裝器。 它允許開發人員在 Node.js 應用程序中利用 IronPDF 的強大 PDF 操作功能。 此包特別適用於處理 PDF 文檔,提供了許多在現實應用中有用的功能,如文件處理、報告生成等。 IronPDF 在 Node.js 中的主要功能 PDF 創建: IronPDF 可以從多種來源創建 PDF,包括 HTML 內容、圖像甚至是原始文本。 這個功能對於需要生成報告、發票或任何其他 PDF 格式文件的 web 應用程序非常有用。 IronPDF 支持樣式和格式化 HTML 內容,是將網頁轉換為結構良好的 PDF 文檔的絕佳選擇。 PDF 編輯: IronPDF 允許您通過添加文本、圖像、註釋和修改佈局來操作現有的 PDF。 您還可以將多個 PDF 合併為一個,將大型文檔拆分為較小部分,或者在 PDF 中重新排列頁面。 這些功能使其對需要動態修改 PDF 的應用程序(如文件管理系統或需要自動生成文檔的應用程序)非常理想。 PDF 轉換: IronPDF 的一個突出功能是將 PDF 轉換為其他多種格式的能力。 例如,它可以將 PDF 文檔轉換為圖像(PNG,JPEG),HTML 和 Word 格式。 當您需要以不同格式展示 PDF 的內容或者為用戶界面創建 PDF 的圖像預覽時,這個功能特別有用。 提取文本和圖像: 雖然 IronPDF 沒有直接提取原始圖像的 REST API,但它提供了一種將 PDF 頁面呈現為圖像(如 PNG 或 JPEG)的方法,這可以作為一種提取內容的間接方式。 您可以將 PDF 的每頁渲染成圖像,有效地捕捉文檔的視覺表示並將其保存以供進一步使用或展示。 將頁面渲染為圖像: IronPDF 可以將 PDF 頁面轉換為高質量圖像。 例如,您可以將多頁 PDF 轉換為一系列 PNG,每頁一個。 這在您需要將頁面顯示為縮略圖或圖像格式時特別有用。 它支持各種圖像格式類型。 安全與加密: IronPDF 支持加密 PDF 的工作。 它允許您打開、解密和操作安全文檔,這對於處理需要密碼或其他形式保護的文檔至關重要。 跨平台兼容性: IronPDF 兼容於 Windows 和 Linux 環境,是一個用於服務器端應用的多功能工具。 Node.js 包裝器簡化了將 IronPDF 集成到基於 Node.js 應用中的過程。 步驟1:設置 Node.js 應用程序 首先,通過在本地計算機上創建一個文件夾並打開 Visual Studio Code 來設置 Node.js 專案文件夾。 mkdir PdfImageExtractor cd PdfImageExtractor code . mkdir PdfImageExtractor cd PdfImageExtractor code . SHELL 步驟2:安裝 IronPDF NPM 包 根據 Windows 或 Linux 機器安裝 IronPDF Node.js 包及其支持包 npm install @ironsoftware/ironpdf npm install @ironsoftware/ironpdf-engine-windows-x64 npm install @ironsoftware/ironpdf npm install @ironsoftware/ironpdf-engine-windows-x64 SHELL 包 @ironsoftware/ironpdf-engine-windows-x64 是特別為 Windows 64 位系統設計的 IronPDF 庫的特定平台版本。 1. Windows(64 位)專用平台二進製文件 IronPDF 庫具有平台特定的依賴關係。 為了使 Node.js 能夠與 IronPDF 高效協作,它需要針對特定操作系統和架構的本機二進制文件。 在這種情況下,@ironsoftware/ironpdf-engine-windows-x64 包提供了針對 Windows 64 位 環境的本機引擎。 2. 優化性能 通過使用此 Windows 專用包,您可以確保 IronPDF 庫在基於 Windows 的系統上正常工作。 它確保所有本機依賴項(如與 PDF 呈現和操作相關的依賴項)都兼容並在您的計算機上平穩運行。 3. 簡化安裝 安裝 @ironsoftware/ironpdf-engine-windows-x64 包自動化此過程,無需手動管理和配置 Windows 64 位系統的所需二進製文件。 這節省了時間並消除了潛在的兼容性問題。 4. 跨平台兼容性 IronPDF 也支持其他平台如 macOS 和 Linux。 提供平台特定包,使開發人員能夠使用其操作系統的正確二進製,從而提高庫的整體穩定性和可靠性。 5. 某些功能的必備項 如果您正在使用某些 IronPDF 功能(如將 PDF 渲染為圖像或執行複雜的文檔操作),則需要本機引擎。 @ironsoftware/ironpdf-engine-windows-x64 包含專門針對 Windows 環境的此引擎。 步驟3:為提取準備 PDF 現在取得需要提取的 PDF 文件。 複製用於應用程序的路徑。 本文使用以下文件。 步驟4:從 PDF 文件中提取圖像並保存 現在在上述步驟中使用該文件並在 Node.js 專案文件夾中的 app.js 文件中編寫以下代碼片段。 const fs = require('fs'); const { IronPdfGlobalConfig, PdfDocument } = require('@ironsoftware/ironpdf') // Apply your IronPDF license key IronPdfGlobalConfig.getConfig().licenseKey = "Your license key"; (async () => { // Extracting Image and Text content from Pdf Documents // Import existing PDF document const pdf = await PdfDocument.fromFile("ironPDF.pdf"); // Get all text to put in a search index and log it const text = await pdf.extractText(); console.log('All Text: ' + text); // Get all Images as buffers const imagesBuffer = await pdf.extractRawImages(); console.log('Images count: ' + imagesBuffer.length); // Save the first extracted image to the local file system fs.writeFileSync("./file1.jpg", imagesBuffer[0]); // Indicate completion console.log('Complete!'); })(); 運行該應用程序: node app.js node app.js SHELL 代碼解釋 此代碼片段示例演示如何在 Node.js 中使用 IronPDF 庫從 PDF 文檔中提取文本和圖像(JPG 格式)。 許可設置:使用IronPdfGlobalConfig設置 IronPDF 的許可密鑰,以使用該庫的功能。 PDF加載:代碼使用PdfDocument.fromFile()方法加載 PDF 文檔ironPDF.pdf。 這允許該程序使用 PDF 的內容。 文本提取:使用extractText()方法從加載的 PDF 中提取所有文本。 這些文本可以用於索引或搜索文檔等任務。 圖像提取:使用extractRawImages()方法從 PDF 中提取原始圖像。 這些圖像以緩衝區的形式返回,可保存或進一步處理。 保存圖像:提取的圖像通過使用 Node 的fs.writeFileSync()方法保存到本地文件系統作為 JPG 文件。 最終輸出:提取完成後,程序打印出提取的文本,提取的圖像數量,然後保存第一張圖像。 該代碼演示了如何使用 IronPDF 與 PDF 文件進行交互,以便在 Node.js 環境中提取內容並處理。 輸出 許可(試用可用) IronPDF Node.js 需要許可密鑰才能運行。 開發人員可以使用他們的電子郵件 ID 從許可頁面獲取試用許可。 提供電子郵件 ID 後,密鑰將發送到電子郵件中並可以在應用程序中按如下方式使用。 const { IronPdfGlobalConfig } = require('@ironsoftware/ironpdf') // Apply your IronPDF license key IronPdfGlobalConfig.getConfig().licenseKey = "Your license key"; 結論 在 Node.js 中使用 IronPDF 從 PDF 提取圖像提供了一種處理 PDF 內容的堅固有效的方法。 雖然 IronPDF 並不像某些專業工具提供直接的圖像提取,但它允許您將 PDF 頁面呈現為圖像,這對於創建文檔的視覺表示非常有用。 該庫能以簡單的方式從 PDF 中提取文本和圖像,對於需要處理和操作 PDF 內容的應用程序是一個有價值的工具。 它與 Node.js 的整合允許開發人員輕鬆地將 PDF 提取納入 web 或伺服器端應用程序。 總體來說,IronPDF 提供了一種強大的 PDF 操作解決方案,提供了轉換、保存和從 PDF 提取圖像的靈活性,適用於廣泛的應用場景,如文檔索引、預覽生成和內容提取。 然而,如果您的重點僅僅是從 PDF 中提取嵌入的圖像,探索其他庫或許能提供更專業的解決方案。 常見問題解答 如何使用 Node.js 從 PDF 文件中擷取圖像? 您可以在 Node.js 中使用 IronPDF 將 PDF 頁面渲染為可以保存的圖像文件。這涉及設置 Node.js 專案、安裝 IronPDF 並使用其方法將 PDF 頁面轉換成圖像格式。 設置 IronPDF 以在 Node.js 中進行圖像提取涉及哪些步驟? 要在 Node.js 中設置 IronPDF 進行圖像提取,您需要創建一個 Node.js 專案,安裝 IronPDF NPM 套件,然後使用 IronPDF 的功能加載 PDF 文件並將其頁面渲染為圖像。 IronPDF 能直接從 PDF 在 Node.js 中提取圖像嗎? IronPDF 不能直接提取圖像,但可以將 PDF 頁面渲染為圖像。這些渲染的圖像可以保存,有效地讓您從 PDF 中提取圖像內容。 在 Node.js 環境中使用 IronPDF 的先決條件是什麼? 先決條件包括安裝 Node.js,設置專案目錄,以及安裝 IronPDF NPM 套件,並安裝任何特定於平臺的套件,例如 Windows 64 位版本以獲得最佳性能。 如何使用 IronPDF 在 Node.js 中處理 PDF 操作任務? IronPDF 允許您執行創建、編輯、轉換和從 PDF 中擷取內容等任務。您可以使用 IronPDF 方法加載 PDF 並根據需要進行操作。 在 Node.js 中操作 PDF 使用 IronPDF 是否需要許可? 是的,需要許可才能訪問 IronPDF 的所有功能。您可以通過註冊電子郵件在 IronPDF 網站上獲取試用許可。 在 Node.js 中直接從 PDF 中提取圖像可能需要哪些附加庫? 雖然 IronPDF 可以將頁面渲染為圖像,但直接圖像提取可能需要考慮使用專門提取嵌入圖像的附加庫。 IronPDF 為何是處理 Node.js 應用中 PDF 操作的一個強大選擇? IronPDF 以其穩健性、與 Node.js 的易集成性,以及用於 PDF 創建、編輯和內容擷取的全面功能,使其適合用於 Web 和文件處理應用。 Darrius Serrant 立即與工程團隊聊天 全棧軟件工程師 (WebOps) Darrius Serrant 擁有邁阿密大學計算機科學學士學位,目前任職於 Iron Software 的全栈 WebOps 市場營銷工程師。從小就迷上編碼,他認為計算既神秘又可接近,是創意和解決問題的完美媒介。在 Iron Software,Darrius 喜歡創造新事物,並簡化複雜概念以便於理解。作為我們的駐場開發者之一,他也自願教學生,分享他的專業知識給下一代。對 Darrius 來說,工作令人滿意因為它被重視且有實際影響。 相關文章 更新日期 6月 22, 2025 如何在 Node.js 中編輯 PDF 文件 此教程旨在引導初學者通過 Node.js 使用 IronPDF 來編輯和創建 PDF 文件的基礎。 閱讀更多 更新日期 7月 28, 2025 如何在 Node.js 中將 PDF 轉換為文本 本教程旨在引導初學者通過設置 Node.js 專案來從 PDF 頁面文件中提取文本,使用 IronPDF。 閱讀更多 更新日期 7月 28, 2025 如何在 Node.js 中分割 PDF 文件 本文演示如何使用 IronPDF(一個強大的 PDF 庫)將 PDF 文檔分割成多個文件,存放於 Node.js 的輸出文件夾中。 閱讀更多 如何在 Node.js 中編輯 PDF 文件
更新日期 7月 28, 2025 如何在 Node.js 中分割 PDF 文件 本文演示如何使用 IronPDF(一個強大的 PDF 庫)將 PDF 文檔分割成多個文件,存放於 Node.js 的輸出文件夾中。 閱讀更多