在生產環境中測試,無水印。
在任何需要的地方都能運行。
獲得 30 天的全功能產品。
在幾分鐘內上手運行。
試用產品期間完全訪問我們的支援工程團隊
本文將使用IronPDF for .NET,一個 C# PDF 庫來讀取 PDF 文件。
如果尚未完成,請下載 Visual Studio。 設置環境並安裝IronPDF庫。
使用PdfDocument.FromFile
方法來開啟和加載所需的 PDF 文件。
利用 IronPDF 的ExtractAllText
方法來擷取內容。
根據需要分析或操作提取的文本。
IronPDF是一個用於C#的強大PDF讀取函式庫,使開發人員能夠輕鬆處理PDF文件。 IronPDF 擁有豐富的功能和能力,簡化了 PDF 文件處理的任務,使用戶能夠輕鬆讀取、提取和操作 PDF 內容。 無論您是自動化文件處理、提取數據和圖像進行分析,或是從頭開始創建 PDF,IronPDF 都提供了一套全面的工具來簡化這些任務。
本文探討使用IronPDF在C#中進行高效PDF處理的世界,展示其作為開發人員在其軟體開發旅程中的必備工具的多功能性和價值。
在深入瞭解程式編碼之前,我們先開始設置一個新的Visual Studio C# 控制台應用程式項目。 此專案將作為開發和實際範例的專用工作區。
要開始此過程,請啟動 Visual Studio 並透過導航到「檔案」選單,選擇「新增」,然後選擇「專案」,來建立一個新專案。
在 Visual Studio 中導航至建立專案對話框
此操作將彈出一個新視窗,提供您指定專案模板的機會。 出於簡化目的,選擇「控制台應用程式」範本,然後點擊位於窗口左下角的下一步按鈕繼續。
在 Visual Studio 中創建一個新專案
在接下來的視窗中,您將被要求為您的專案指定名稱並指定所需的專案位置。 一旦這些細節就位,點擊下一步按鈕繼續。
配置專案
在此步驟中,選擇您偏好的目標框架,然後點擊建立按鈕完成專案建立過程。
.NET Framework 選擇
隨著您的專案現在已經穩固建立,下一個關鍵步驟涉及安裝IronPDF。
IronPDF 提供多種選項來下載和安裝 PDF 圖書館。 在本指南中,重點將放在使用 NuGet 套件管理員來安裝 IronPDF,這是一種高效且被廣泛採用的方法。
在 Visual Studio 中,導航到 "工具" 菜單,優雅地將游標懸停在 "NuGet 套件管理器" 選項上。
從擴展選單中,選擇「NuGet 套件管理員 (解決方案)」。
導航至 NuGet 套件管理器
選擇此選項後,將會開啟一個新窗口。 在此精選視窗中,導航至「瀏覽」選單,然後在搜索欄中輸入「IronPDF」。
然後螢幕將顯示可用的 IronPDF 套件。 要繼續,請從列表中選擇最新的套件,然後點擊“安裝”選項執行此選擇。
在 NuGet 封裝管理器 UI 中搜尋並安裝 IronPdf 封裝
對於那些更喜歡命令行方法的人,NuGet 套件管理器控制台提供了一個優雅的途徑。 只需打開此控制台,輸入以下命令,然後按「Enter」鍵:
Install-Package IronPdf
您也可以選擇通過NuGet 網站 連結直接獲取該套件。
本節將展示如何使用 C# 編程語言和 IronPDF 來開啟和讀取完整的 PDF 文件。
using IronPdf;
using System;
IronPdf.License.LicenseKey = "";
//raw text string path
var pdf = PdfDocument.FromFile("document_scaled_compressed.pdf");
string text = pdf.ExtractAllText();
Console.WriteLine(text);
using IronPdf;
using System;
IronPdf.License.LicenseKey = "";
//raw text string path
var pdf = PdfDocument.FromFile("document_scaled_compressed.pdf");
string text = pdf.ExtractAllText();
Console.WriteLine(text);
Imports IronPdf
Imports System
IronPdf.License.LicenseKey = ""
'raw text string path
Dim pdf = PdfDocument.FromFile("document_scaled_compressed.pdf")
Dim text As String = pdf.ExtractAllText()
Console.WriteLine(text)
要開始使用,您需要匯入所需的命名空間。 在上述代碼範例中,匯入了IronPdf
命名空間,其中包含處理PDF的基本功能。 此外,也導入了System
命名空間以進行一般系統層級操作。
using IronPdf;
using System;
using IronPdf;
using System;
Imports IronPdf
Imports System
IronPDF 在生產環境中需要有效的授權金鑰。 在此代碼範例中,有一行是用來設定許可證金鑰的。 然而,在您提供的代碼中,授權金鑰被留空""
。 在生產環境中使用 IronPDF 時,請確保用有效的授權鍵替換掉空字串。
IronPdf.License.LicenseKey = "Your_License_Key_Here";
IronPdf.License.LicenseKey = "Your_License_Key_Here";
IronPdf.License.LicenseKey = "Your_License_Key_Here"
下一步是載入和解析 PDF 文件。在提供的程式碼中,使用 PdfDocument.FromFile
方法按檔名 "document_scaled_compressed.pdf" 來載入 PDF,並將其指定給 pdf 變數。 此 PDF 文件將用於文本提取。
var pdf = PdfDocument.FromFile("document_scaled_compressed.pdf");
var pdf = PdfDocument.FromFile("document_scaled_compressed.pdf");
Dim pdf = PdfDocument.FromFile("document_scaled_compressed.pdf")
IronPDF提供了一種從載入的PDF文件中提取文本的簡單方法。 ExtractAllText
方法可以從每個 PDF 頁面中提取所有文本內容,並將其存儲在名為 text 的 string 變數中,這樣就能將 PDF 轉換為文本。
string text = pdf.ExtractAllText();
string text = pdf.ExtractAllText();
Dim text As String = pdf.ExtractAllText()
最後一步是顯示提取的文本。 在程式碼中,Console.WriteLine 會將提取的文字列印並寫入主控台。 這是一個用於除錯或向使用者展示文字的有用方法。
Console.WriteLine(text);
Console.WriteLine(text);
Console.WriteLine(text)
從 PDF 文件中提取的文本
本文引導開發人員通過使用IronPDF庫在C#中有效處理PDF文件的過程。 它首先展示了專用 Visual Studio 專案的設置,接著通過 NuGet 套件管理器簡單地安裝了 IronPDF。 接下來,文章提供了逐步說明,解釋如何匯入必要的庫,設置IronPDF授權密鑰,載入PDF文件,提取文本內容,並顯示所有頁面中的提取文本。 您也可以使用 C# 將提取的文本保存到 TXT 文件中。
憑藉其使用者友好的方法和全面的功能,IronPDF成為自動化文檔流程、數據提取和從HTML、URL以及圖像創建PDF的不可或缺工具,使其成為增強涉及PDF文件處理的C#軟體開發項目的寶貴資產。
完整的文章《使用 IronPDF 讀取 PDF 檔案》可以在以下的操作指南頁面中找到。 C# PDF 讀取器上的代碼範例也可用。 如需更多使用 IronPDF 的程式碼範例,請造訪此範例頁面。 IronPDF 還提供廣泛的文檔來回答所有開發人員的問題,並提供全方位的實際支援。 IronPDF 提供免費的試用許可證,讓用戶可以在決定購買永久許可證之前,探索其全部功能。