USING IRONPDF C# Extract Text From PDF (Code Example Tutorial) Kye Stuart 更新:2025年7月28日 下載 IronPDF NuGet 下載 DLL 下載 Windows 安裝程式 開始免費試用 法學碩士副本 法學碩士副本 將頁面複製為 Markdown 格式,用於 LLMs 在 ChatGPT 中打開 請向 ChatGPT 諮詢此頁面 在雙子座打開 請向 Gemini 詢問此頁面 在 Grok 中打開 向 Grok 詢問此頁面 打開困惑 向 Perplexity 詢問有關此頁面的信息 分享 在 Facebook 上分享 分享到 X(Twitter) 在 LinkedIn 上分享 複製連結 電子郵件文章 您的企業在PDF安全和合規性方面的年度訂閱費用過高。不妨考慮一下Iron Software的IronSecureDoc ,它提供SaaS服務管理解決方案,例如數位簽章、內容編輯、加密和保護,所有服務只需一次性付費。立即體驗IronSecureDoc! PDF(便攜式文件格式)文件在無數行業中發揮著至關重要的作用,使企業能夠安全地共享、儲存和管理文件。 對於開發人員來說,處理 PDF 文件通常涉及創建、讀取、轉換和提取內容以滿足客戶需求。 從 PDF 中提取文字對於資料分析、文件索引、內容遷移或啟用輔助功能等任務至關重要。 像IronPDF這樣的現代庫使這些任務比以往任何時候都更容易,它們提供了強大的工具,可以以最少的努力來操作 PDF 文件。 本指南重點介紹最常見的需求之一:使用 C# 從 PDF 中提取文字。 我們將引導您完成在 Visual Studio 中設定專案、安裝 IronPDF 以及使用它進行文字擷取的操作,並提供簡潔的程式碼範例。 在這個過程中,我們將重點介紹 IronPDF 的強大功能,包括它使用 .NET 建立、操作和轉換 PDF 文件的功能。 無論您是建立文件密集型應用程序,還是僅需要高效的 PDF 處理,本教學都將幫助您入門。 如何使用 C# 從 PDF 中提取文本 從 PDF 提取文字 C# 庫 在 Visual Studio 中創建一個新項目 將庫安裝到您的項目中 從 PDF 文件中執行文本提取 查看從 PDF 文檔中提取的文本輸出 1. IronPDF 功能 IronPDF 是一款功能強大的 PDF 轉換器,幾乎可以執行瀏覽器可以執行的任何操作。 使用面向開發人員的 .NET 程式庫,建立、讀取和操作 PDF 文件變得非常簡單。 IronPDF 使用 Chrome 引擎將 HTML 文件轉換為 PDF 文件。 IronPDF 支援 HTML、ASPX、Razor HTML 和 MVC 視圖等多種 Web 元件。 IronPDF 支援 Microsoft .NET 應用程式(包括 ASP.NET Web 應用程式和傳統 Windows 應用程式)。 IronPDF 也可以用來創建視覺效果出色的 PDF 文件。 我們可以使用 IronPDF 從 HTML5、JavaScript、CSS 和圖像建立 PDF 文件。 此外,文件還可以包含頁首和頁尾。 多虧了 IronPDF,我們可以輕鬆閱讀 PDF 文件。 IronPDF 還擁有全面的 PDF 轉換引擎和強大的 HTML 轉 PDF 轉換器,可以處理 PDF 文件。 PDF 建立:從 HTML、JavaScript、CSS、圖片或 URL 產生 PDF。 新增頁首、頁尾、書籤、浮水印和其他自訂元素,以增強設計效果。 HTML 轉 PDF 轉換:直接將 HTML、Razor/MVC 視圖和媒體類型 CSS 檔案轉換為 PDF 格式。 -互動式 PDF 功能:建立、填寫和提交互動式PDF 表單。 -文字與影像擷取:從現有 PDF 文件中擷取文字或影像,以便進行資料處理或重複使用。 -文件操作:合併、分割和重新排列新建或現有 PDF 文件中的頁面。 -影像與頁面處理:將 PDF 頁面柵格化為影像,並將影像轉換為 PDF 格式。 -使用自訂登入憑證: IronPDF 能夠根據 URL 建立文件。 它還支援自訂網路登入憑證、使用者代理、代理、cookie、HTTP 標頭和表單變量,用於HTML 登入表單背後的登入。 -搜尋和輔助功能:搜尋 PDF 文件中的文本,並確保其符合輔助功能標準。 -轉換功能多樣:可將 PDF 轉換為 HTML 等其他格式,並可使用 CSS 檔案產生 PDF。 -獨立功能:無需 Adobe Acrobat 或其他第三方工具即可獨立運作。 2.在 Visual Studio 中建立新專案 開啟 Visual Studio 軟體,並移至"檔案"功能表。 選擇"新建專案",然後選擇"控制台應用程式"。 在本文中,我們要使用控制台應用程式來產生 PDF 文件。 C# 從 PDF 中提取文字(程式碼範例教學),圖 1:在 Visual Studio 中建立一個新項目 在適當的文字方塊中輸入專案名稱並選擇檔案路徑。 然後,按一下"建立"按鈕,並選擇所需的 .NET Framework,如下面的螢幕截圖所示。 ! C# 從 PDF 提取文字(程式碼範例教學),圖 2:在 Visual Studio 中設定新項目在 Visual Studio 中設定新項目 Visual Studio 專案現在將為所選應用程式產生結構,如果您選擇了控制台、Windows 和 Web 應用程序,它將開啟program.cs文件,您可以在其中輸入程式碼並產生/運行應用程式。 ! C# 從 PDF 擷取文字(程式碼範例教學),圖 3:選擇 .NET Core選擇 .NET Core 接下來,我們可以加入測試程式碼的函式庫。 3.安裝 IronPdf 函式庫 IronPDF Library 可以通過四種方式下載和安裝。 這些工具包括 使用 Visual Studio。 使用 Visual Studio Command-Line。 直接從 NuGet 網站下載。 直接從 IronPdf 網站下載。 3.1 使用 Visual Studio Visual Studio 軟體提供 NuGet Package Manager 選項,可直接將套件安裝至解決方案。 下面的截圖顯示了如何打開 NuGet Package Manager。 ! C# 從 PDF 提取文字(程式碼範例教學),圖 4:Visual Studio program.cs 檔案Visual Studio program.cs 文件 它提供了一個搜尋框,用於顯示 NuGet 網站上的套件清單。在套件管理器中,我們需要搜尋關鍵字"IronPdf",如下面的螢幕截圖所示。 ! C# 從 PDF 擷取文字(程式碼範例教學),圖 5:NuGet 套件管理器NuGet 套件管理器 在上圖中,我們可以看到相關搜尋項目的清單。 我們需要選擇所需的選項,將套件安裝至解決方案。 3.2 使用 Visual Studio 命令列 在 Visual Studio 中,前往"工具">"NuGet 套件管理員">"套件管理員控制台"。 在套件管理員控制台索引標籤中輸入以下一行: Install-Package IronPdf 現在,套件將下載/安裝至目前的專案,並可立即使用。 ! C# 從 PDF 擷取文字(程式碼範例教學),圖 6:NuGet 套件管理器中的 IronPdf庫 3.3 從 NuGet 網站直接下載 第三種方法是直接從IronPDF 的網站下載 NuGet 套件。 導覽至 NuGet 上的 IronPDF 套件。 請從右側功能表中選擇下載套件選項。 雙擊下載的套件。 它會自動安裝。 接下來,重新載入解決方案並開始在專案中使用。 3.4 直接從 IronPDF 網站下載 請造訪IronPDF 官方網站,直接從其網站下載最新軟體包。下載完成後,請按照以下步驟將該軟體包新增至專案。 在解決方案視窗中右擊專案。 然後,選擇選項參考並瀏覽下載參考的位置。 接下來,按一下確定以新增參考。 4. 使用 IronPDF 擷取文本 IronPDF 程式讓我們可以從 PDF 文件中提取文本,並將 PDF 頁面轉換為 PDF 物件。 以下是如何使用 IronPDF 讀取現有 PDF 的範例。 第一種方法是從 PDF 中提取文本,範例程式碼片段如下。 using IronPdf; // Load an existing PDF document from a file var pdfDocument = PdfDocument.FromFile("result.pdf"); // Extract all text from the entire PDF document string allText = pdfDocument.ExtractAllText(); using IronPdf; // Load an existing PDF document from a file var pdfDocument = PdfDocument.FromFile("result.pdf"); // Extract all text from the entire PDF document string allText = pdfDocument.ExtractAllText(); $vbLabelText $csharpLabel FromFile靜態方法用於從現有文件中載入 PDF 文件並將其轉換為PDFDocument對象,如上面的程式碼所示。 我們可以使用此物件閱讀 PDF 頁面上可存取的文字和圖片。 該物件有一個名為ExtractAllText的方法,它可以從整個 PDF 文件中提取所有文本,然後將提取的文本保存到我們可以用於處理的字串中。 下面給出的是我們可以用來從 PDF 文件逐頁提取文本的第二種方法的程式碼範例。 using IronPdf; // Load an existing PDF document from a file using PdfDocument pdf = PdfDocument.FromFile("result.pdf"); // Loop through each page of the PDF document for (var index = 0; index < pdf.PageCount; index++) { // Extract text from the current page string text = pdf.ExtractTextFromPage(index); } using IronPdf; // Load an existing PDF document from a file using PdfDocument pdf = PdfDocument.FromFile("result.pdf"); // Loop through each page of the PDF document for (var index = 0; index < pdf.PageCount; index++) { // Extract text from the current page string text = pdf.ExtractTextFromPage(index); } $vbLabelText $csharpLabel 在上面的程式碼中,我們可以看到它首先載入整個 PDF 文件並將其轉換為 PDF 物件。 然後,我們使用名為PageCount的內建屬性來取得整個 PDF 文件的頁數,該屬性會擷取已載入的 PDF 文件中可用的總頁數。 使用"for 迴圈"和ExtractTextFromPage函數,我們可以將頁碼作為參數傳遞,從而從載入的文件中提取文字。 然後它會將確切的文字保存到字串變數中。 同樣,它會藉助"for"或"for each"循環逐頁從PDF中提取文字。 5.結論 IronPDF 是一個功能強大且用途廣泛的 PDF 庫,旨在讓在 .NET 應用程式中處理 PDF 文件變得輕鬆方便。 它強大的功能使開發人員能夠創建、操作和提取 PDF 中的內容,而無需依賴 Adobe Reader 等第三方依賴項。 IronPDF 的突出功能之一是能夠從 PDF 文件中提取文字。 此功能對於自動化資料分析、文件索引、內容遷移和啟用輔助功能等任務非常有價值。 IronPDF 讓開發人員以程式設計方式檢索和處理文本,從而簡化工作流程,並為處理 PDF 內容開闢了新的可能性。 IronPDF 具有整合簡單、跨平台支援等優點,是開發人員高效處理 PDF 文件的絕佳選擇。 此外,IronPDF 還提供免費試用,讓您在正式購買前可以無風險地體驗其全部功能。 有關定價詳情和許可選項的更多信息,請訪問定價頁面。 常見問題解答 如何使用 C# 從 PDF 文件中提取文字? 您可以使用 IronPDF 用 C# 從 PDF 文件中提取文字。首先,使用 PdfDocument.FromFile 方法載入 PDF,然後應用 ExtractAllText 方法擷取文件中的文字。 在 Visual Studio 專案中設定 IronPdf 涉及哪些步驟? 要在 Visual Studio 專案中設定 IronPDF,您可以透過 NuGet 套件管理員安裝。另外,您也可以使用 Visual Studio Command-Line 或直接從 NuGet 或 IronPDF 網站下載。 哪些功能使 IronPDF 成為一個全面的 PDF 程式庫? IronPDF 提供廣泛的功能,包括 PDF 建立、HTML 至 PDF 轉換、文字與影像擷取、文件處理,以及支援互動式 PDF 表單。 IronPDF 可以用 C# 將 HTML 轉換成 PDF 嗎? 是的,IronPdf 可以使用其整合的 Chrome 引擎將 HTML(包括 Razor/MVC 視圖和媒體類型 CSS 檔案)直接轉換為 PDF 格式。 IronPDF 兼容所有類型的 .NET 應用程式嗎? 是的,IronPDF 可與 ASP.NET Web 應用程式和傳統 Windows 應用程式相容,為 .NET 開發人員提供多功能性。 IronPDF 如何促進 PDF 文件的可讀性? IronPDF 可讓使用者搜尋 PDF 文件內的文字,並確保這些文件符合可存取性標準,進而提升可存取性。 IronPDF 是否需要任何第三方相依性? IronPDF for .NET 獨立運作,不需要像 Adobe Acrobat 之類的第三方工具,可在您的 .NET 應用程式中實現無縫 PDF 操作。 使用 IronPDF 從 PDF 中提取文字有哪些優勢? IronPdf 可透過程式化的文字擷取功能簡化工作流程,這對資料分析、文件索引和內容遷移非常有用。 IronPDF 是否提供試用版? 是的,IronPDF 提供免費試用版,讓開發人員在做出購買決定之前,可以探索其特色與功能。 在 .NET 應用程式中使用 IronPDF 進行 PDF 管理的重要性何在? IronPDF 對於 .NET 應用程式中的 PDF 管理至關重要,因為它擁有強大的功能集,包括 PDF 建立、文字萃取以及 HTML 至 PDF 轉換,所有這些功能都不需要像 Adobe Acrobat 之類的外部軟體。 本文中的 C# PDF 文本提取代碼與 .NET 10 兼容嗎? 是的。本教程中的 PdfDocument.FromFile 和 ExtractText 示例在 .NET 10 中的工作方式與在早期 .NET 版本中的工作方式相同。建立 .NET 10 專案後,從 NuGet 安裝最新的 IronPDF 套件,您就可以在現代的 .NET 10 應用程式中執行相同的程式碼來讀取 PDF 和抽取文字。 Kye Stuart 立即與工程團隊聊天 技術撰稿人 Kye Stuart 在 Iron Software 融合了編碼熱情與寫作技巧。他們曾在 Yoobee 學院接受軟體部署的教育,現在將複雜的技術概念轉換成清晰的教育內容。 工作之餘,他們喜歡 PC 遊戲、Twitch 串流,以及園藝和遛狗 Jaiya 等戶外活動。Kye 直截了當的方式讓他們成為 Iron Software 為全球開發人員解開技術謎團的關鍵。 相關文章 更新2026年1月22日 How to Create PDF Documents in .NET with IronPDF: Complete Guide Discover effective methods to create PDF files in C# for developers. Enhance your coding skills and streamline your projects. Read the article now! 閱讀更多 更新2026年1月21日 How to Merge PDF Files in VB.NET: Complete Tutorial Merge PDF VB NET with IronPDF. Learn to combine multiple PDF files into one document using simple VB.NET code. Step-by-step examples included. 閱讀更多 更新2026年1月21日 C# PDFWriter Tutorial: Create PDF Documents in .NET Learn to create PDFs efficiently using C# PDFWriter with this step-by-step guide for developers. Read the article to enhance your skills today! 閱讀更多 How to Generate PDF in ASP.NET Using C#How to Extract Data from PDF in C#
更新2026年1月22日 How to Create PDF Documents in .NET with IronPDF: Complete Guide Discover effective methods to create PDF files in C# for developers. Enhance your coding skills and streamline your projects. Read the article now! 閱讀更多
更新2026年1月21日 How to Merge PDF Files in VB.NET: Complete Tutorial Merge PDF VB NET with IronPDF. Learn to combine multiple PDF files into one document using simple VB.NET code. Step-by-step examples included. 閱讀更多
更新2026年1月21日 C# PDFWriter Tutorial: Create PDF Documents in .NET Learn to create PDFs efficiently using C# PDFWriter with this step-by-step guide for developers. Read the article to enhance your skills today! 閱讀更多