如何在C#中讀取PDF文件
本文將使用IronPDF for .NET,這是一個用於讀取 PDF 檔案的 C# PDF 函式庫。
如何使用 IronPDF 閱讀 PDF 文件
- 如果尚未下載,請下載 Visual Studio。 設定環境並安裝 IronPDF 庫。
- 使用
PdfDocument.FromFile方法開啟並載入所需的 PDF 檔案。 - 利用 IronPDF 的
ExtractAllText方法檢索內容。 - 根據需要分析或處理擷取的文字。
- 將擷取的文字列印到控制台以供閱讀。
IronPDF。
IronPDF是一個功能強大的 C# PDF 閱讀器庫,它使開發人員能夠輕鬆處理 PDF 文件。 IronPDF 憑藉其豐富的功能和強大的效能,簡化了 PDF 文件的處理,使用戶能夠輕鬆讀取、提取和操作 PDF 內容。 無論您是要自動化文件處理流程、提取資料和影像進行分析,還是從頭開始建立 PDF,IronPDF 都提供了一套全面的工具來簡化這些任務。
本文探討如何使用IronPDF在 C# 中有效處理 PDF,展示了 IronPDF 的多功能性和價值,使其成為開發人員軟體開發過程中必不可少的工具。
建立新的 Visual Studio 項目
在深入探討編碼方面之前,讓我們先建立一個新的Visual Studio C# 控制台應用程式專案。 該專案將作為一個專門的工作空間,用於開發和實際案例展示。
- 若要啟動此流程,請啟動 Visual Studio,然後導覽至"檔案"選單,選擇"新建",再選擇"專案",建立新專案。
如何在 C# 中讀取 PDF 文件,圖 1:在 Visual Studio 中導覽至"建立專案"對話框 在 Visual Studio 中,導覽至"建立專案"對話方塊。
- 此操作將彈出一個新窗口,讓您有機會指定項目模板。 為了簡單起見,請選擇"控制台應用程式"模板,然後按一下位於視窗左下角的"下一步"按鈕繼續。
如何在 C# 中讀取 PDF 文件,圖 2:在 Visual Studio 中建立一個新項目 在 Visual Studio 中建立一個新項目
- 在後續的視窗中,系統會提示您為項目指定名稱並指定所需的項目位置。 填寫完這些細節後,點擊"下一步"按鈕繼續。
如何在 C# 中讀取 PDF 文件,圖 3:設定項目 配置專案
- 在此步驟中,選擇您喜歡的目標框架,然後按一下"建立"按鈕完成專案建立過程。
如何在 C# 中讀取 PDF 文件,圖 4:.NET Framework 選擇 .NET Framework 選擇
現在您的專案已經穩固建立,下一個關鍵步驟是安裝IronPDF 。
安裝 IronPDF。
IronPDF提供了多種下載和安裝 PDF 庫的選項。 在本指南中,我們將重點介紹如何使用 NuGet 套件管理器安裝 IronPDF,這是一種高效且廣泛採用的方法。
- 在 Visual Studio 中,導覽至"工具"選單,然後將遊標優雅地懸停在"NuGet 套件管理器"選項上。
- 從擴充功能表中,選擇"NuGet 解決方案套件管理員"。
如何在 C# 中讀取 PDF 文件,圖 5:導航到 NuGet 套件管理器 導覽至 NuGet 套件管理器
- 選擇此選項後,將開啟一個新視窗。 在這個精簡後的視窗中,導覽至"瀏覽"選單,然後在搜尋列中輸入"IronPDF"。
- 螢幕將顯示可用的 IronPDF 軟體包。 若要繼續操作,請從清單中選擇最新軟體包,然後按一下"安裝"選項執行此選擇。
如何在 C# 中讀取 PDF 文件,圖 6:在 NuGet 套件管理器 UI 中搜尋並安裝 IronPdf 套件 在 NuGet 套件管理器介面中搜尋並安裝 IronPdf 套件。
對於那些更喜歡命令列方式的用戶來說,NuGet 套件管理器控制台提供了一種優雅的途徑。 只需開啟此控制台,輸入以下命令,然後按"Enter"鍵:
Install-Package IronPdf
您也可以選擇直接從NuGet 網站連結取得軟體包。
使用 IronPDF 讀取 PDF 文件
本節將展示如何使用 IronPDF 使用 C# 程式語言開啟和閱讀完整的 PDF 檔案。
using IronPdf;
using System;
class Program
{
static void Main()
{
// Set the license key for IronPDF if available
IronPdf.License.LicenseKey = "Your_License_Key_Here";
// Load the PDF document from a specified file path
var pdf = PdfDocument.FromFile("document_scaled_compressed.pdf");
// Extract all text from the loaded PDF
string text = pdf.ExtractAllText();
// Output the extracted text to the console
Console.WriteLine(text);
}
}using IronPdf;
using System;
class Program
{
static void Main()
{
// Set the license key for IronPDF if available
IronPdf.License.LicenseKey = "Your_License_Key_Here";
// Load the PDF document from a specified file path
var pdf = PdfDocument.FromFile("document_scaled_compressed.pdf");
// Extract all text from the loaded PDF
string text = pdf.ExtractAllText();
// Output the extracted text to the console
Console.WriteLine(text);
}
}Imports IronPdf
Imports System
Friend Class Program
Shared Sub Main()
' Set the license key for IronPDF if available
IronPdf.License.LicenseKey = "Your_License_Key_Here"
' Load the PDF document from a specified file path
Dim pdf = PdfDocument.FromFile("document_scaled_compressed.pdf")
' Extract all text from the loaded PDF
Dim text As String = pdf.ExtractAllText()
' Output the extracted text to the console
Console.WriteLine(text)
End Sub
End Class1. 導入必要的庫
首先,您需要匯入所需的命名空間。 在上面的程式碼範例中,匯入了IronPdf命名空間,其中包含處理 PDF 的基本函數。 此外, System命名空間也被導入,用於一般的系統級操作。
using IronPdf;
using System;using IronPdf;
using System;Imports IronPdf
Imports System2. 設定 IronPDF 許可證密鑰
IronPDF需要在生產環境中使用時擁有有效的許可證密鑰。 在程式碼範例中,有一行需要設定許可證密鑰。 但是,在您提供的程式碼中,許可證金鑰為空"" 。 在生產環境中使用時,請確保將空字串替換為 IronPDF 提供的有效許可證金鑰。
IronPdf.License.LicenseKey = "Your_License_Key_Here";IronPdf.License.LicenseKey = "Your_License_Key_Here";IronPdf.License.LicenseKey = "Your_License_Key_Here"3. 載入 PDF 文檔
下一步是載入並解析 PDF 檔案。在提供的程式碼中,使用PdfDocument.FromFile方法載入文件名為"document_scaled_compressed.pdf"的 PDF 文件,並將其賦值給pdf變數。 此PDF文件將用於提取文字。
var pdf = PdfDocument.FromFile("document_scaled_compressed.pdf");var pdf = PdfDocument.FromFile("document_scaled_compressed.pdf");Dim pdf = PdfDocument.FromFile("document_scaled_compressed.pdf")4. 從PDF文件中提取文本
IronPDF 提供了一種從已載入的 PDF 文件中提取文字的簡單方法。 ExtractAllText方法可以從 PDF 的每一頁中提取所有文字內容,並將其儲存在名為text 的**字串**變數中,其作用相當於將 PDF 轉換為文字。
string text = pdf.ExtractAllText();string text = pdf.ExtractAllText();Dim text As String = pdf.ExtractAllText()5. 顯示提取的文本
最後一步是顯示提取的文字。 在程式碼中, Console.WriteLine會將擷取的文字列印並寫入控制台。 這是一種用於調試或向用戶展示文字的有效方法。
Console.WriteLine(text);Console.WriteLine(text);Console.WriteLine(text)輸出:從 PDF 文件中提取的文本
如何在 C# 中讀取 PDF 文件,圖 7:從 PDF 文件中提取的文本 從 PDF 文件中提取的文本
結論
本文指導開發人員如何使用IronPDF庫在 C# 中有效地處理 PDF 文件。 它首先示範如何設定一個專用的 Visual Studio 項目,然後透過 NuGet 套件管理器直接安裝了 IronPDF。 文章隨後提供了逐步解釋如何匯入必要的庫、設定 IronPDF 許可證密鑰、加載 PDF 文件、提取文字內容以及顯示從所有頁面提取的文本。 您也可以使用 C# 將提取的文字儲存到 TXT 檔案。
IronPDF憑藉其用戶友好的方法和全面的功能,成為自動化文件處理、資料提取以及從 HTML、URL 和圖像創建 PDF 的不可或缺的工具,使其成為增強涉及 C# 中 PDF 文件處理的軟體開發專案的寶貴資產。
有關使用IronPDF讀取 PDF 檔案的完整文章,請參閱以下操作指南頁面。 C# PDF 閱讀器的程式碼範例也已提供。 有關使用 IronPDF 的更多程式碼範例,請造訪此範例頁面。 IronPDF 也提供豐富的文檔,解答所有開發人員的問題,並提供全面的實務支援。 IronPDF 提供免費試用許可證,以便用戶在決定購買永久許可證之前探索其全部功能。
常見問題解答
如何在 C# 中載入 PDF 文件?
您可以使用 PdfDocument.FromFile 方法在 C# 中載入 PDF 文件,只需提供您想要載入的 PDF 的檔案路徑即可。
使用 C# 從 PDF 擷取文字的方法是什麼?
IronPDF 中的 ExtractAllText 方法用於從載入的 PDF 文件中提取所有文字內容,有助於資料檢索和操作。
如何在 Visual Studio 中設定一個新專案,以便使用 C# 處理 PDF?
要建立新專案,請在 Visual Studio 中建立 C# Console Application,並使用 NuGet Package Manager 安裝 IronPDF 函式庫。
在生產環境中實作 PDF 函式庫是否需要授權金鑰?
是的,在生產環境中使用 IronPDF 需要有效的許可金鑰,才能使用其全部功能。
我可以使用 C# 將 HTML 內容轉換成 PDF 文件嗎?
是的,IronPDF 可以將 HTML 內容轉換成 PDF 文件,因此對於從網頁或 HTML 字串建立 PDF 非常有用。
在 C# 中使用 PDF 函式庫處理文件有哪些優點?
使用 IronPDF 可簡化 PDF 自動化、資料抽取和建立等工作,透過提供可靠的文件處理能力來強化軟體專案。
開發人員在哪裡可以找到更多在 C# 中使用 PDF 函式庫的範例?
開發人員可以在 IronPDF 的官網上找到其他範例和說明文件,其中包括各種使用情況的指南和範例程式碼。
PDF 函式庫是否提供試用版以供評估?
是的,IronPDF 提供免費的試用授權,讓使用者在決定購買之前,可以探索資料庫的功能。
使用 C# 從 PDF 擷取文字時,如何排除故障?
確保使用 PdfDocument.FromFile 正確載入 PDF 檔案,並檢查控制台輸出中是否有任何錯誤或異常,以獲得指引。
IronPDF 可以從影像建立 PDF 嗎?
是的,IronPDF 可以從影像產生 PDF,提供文件製作的彈性,並支援多種輸入格式。
IronPDF 是否與 .NET 10 相容,可以用 C# 來閱讀 PDF?
是的,IronPDF 與 .NET 10 完全相容,可在 .NET 10 專案中使用 PdfDocument.FromFile 和 ExtractAllText 等方法讀取、提取和處理 PDF。.NET 10 與早期版本都正式支援此功能。






