如何在 C# 中從 PDF 文件提取文本

在本次視頻教程中,我們深入探討如何在 Visual Studio 2022 中使用 C# 從 PDF 文件中提取文本。這個過程從設置 iTextSharp 庫開始,該庫是通過 NuGet 套件管理器安裝的,以確保與 .NET 7 的兼容性。教程逐步講解了編碼過程。首先,導入 iTextSharp 命名空間,然後使用 'FromFile' 方法創建一個 PDF 文件對象,傳入 PDF 文件路徑。 使用「ExtractAllText」提取文本,將其存儲在字串變數「altText」中。 接下來,設置一個文本文件路徑,並使用 'StreamWriter' 類將提取的文本寫入 'intro.txt'。 最後,運行程式以確認文字提取按預期運作,結果將儲存到指定的文字檔案中。本教程最後鼓勵觀眾訂閱以獲取更多有用的內容,並提供針對任何疑問的支援。

進一步閱讀如何在C#中從PDF檔案中擷取文本

Chipego
奇佩戈·卡林达
軟體工程師
Chipego 擁有天生的傾聽技能,這幫助他理解客戶問題,並提供智能解決方案。他在獲得信息技術理學學士學位後,于 2023 年加入 Iron Software 團隊。IronPDF 和 IronOCR 是 Chipego 專注的兩個產品,但隨著他每天找到新的方法來支持客戶,他對所有產品的了解也在不斷增長。他喜歡在 Iron Software 的協作生活,公司內的團隊成員從各自不同的經歷中共同努力,創造出有效的創新解決方案。當 Chipego 離開辦公桌時,他常常享受讀好書或踢足球的樂趣。
< 上一頁
如何在 .Net 6 中生成 PDF 文件
下一個 >
如何在 C# 中將 Excel 文件轉換為 PDF