如何在C#中讀取PDF文件
本文將使用IronPDF 適用於 .NET,這是一個用於讀取 PDF 檔案的 C# PDF 函式庫。
如何使用 IronPDF 閱讀 PDF 文件
- 如果尚未下載,請下載 Visual Studio。 設定環境並安裝 IronPDF 庫。
- 使用
PdfDocument.FromFile方法開啟並載入所需的 PDF 檔案。 - 利用 IronPDF 的
ExtractAllText方法檢索內容。 - 根據需要分析或處理擷取的文字。
- 將擷取的文字列印到控制台以供閱讀。
IronPDF。
IronPDF是一個功能強大的 C# PDF 閱讀器庫,它使開發人員能夠輕鬆處理 PDF 文件。 IronPDF 憑藉其豐富的功能和強大的效能,簡化了 PDF 文件的處理,使用戶能夠輕鬆讀取、提取和操作 PDF 內容。 無論您是要自動化文件處理流程、提取資料和影像進行分析,還是從頭開始建立 PDF,IronPDF 都提供了一套全面的工具來簡化這些任務。
本文探討如何使用IronPDF在 C# 中有效處理 PDF,展示了 IronPDF 的多功能性和價值,使其成為開發人員軟體開發過程中必不可少的工具。
建立新的 Visual Studio 項目
在深入探討編碼方面之前,讓我們先建立一個新的Visual Studio C# 控制台應用程式專案。 該專案將作為一個專門的工作空間,用於開發和實際案例展示。
- 若要啟動此流程,請啟動 Visual Studio,然後導覽至"檔案"選單,選擇"新建",再選擇"專案",建立新專案。
如何在 C# 中讀取 PDF 文件,圖 1:在 Visual Studio 中導覽至"建立專案"對話框 在 Visual Studio 中,導覽至"建立專案"對話方塊。
- 此操作將彈出一個新窗口,讓您有機會指定項目模板。 為了簡單起見,請選擇"控制台應用程式"模板,然後按一下位於視窗左下角的"下一步"按鈕繼續。
如何在 C# 中讀取 PDF 文件,圖 2:在 Visual Studio 中建立一個新項目 在 Visual Studio 中建立一個新項目
- 在後續的視窗中,系統會提示您為項目指定名稱並指定所需的項目位置。 填寫完這些細節後,點擊"下一步"按鈕繼續。
如何在 C# 中讀取 PDF 文件,圖 3:設定項目 配置專案
- 在此步驟中,選擇您喜歡的目標框架,然後按一下"建立"按鈕完成專案建立過程。
如何在 C# 中讀取 PDF 文件,圖 4:.NET Framework 選擇 .NET Framework 選擇
現在您的專案已經穩固建立,下一個關鍵步驟是安裝IronPDF 。
安裝 IronPDF。
IronPDF提供了多種下載和安裝 PDF 庫的選項。 在本指南中,我們將重點介紹如何使用 NuGet 套件管理器安裝 IronPDF,這是一種高效且廣泛採用的方法。
- 在 Visual Studio 中,導覽至"工具"選單,然後將遊標優雅地懸停在"NuGet 套件管理器"選項上。
- 從擴充功能表中,選擇"NuGet 解決方案套件管理員"。
如何在 C# 中讀取 PDF 文件,圖 5:導航到 NuGet 套件管理器 導覽至 NuGet 套件管理器
- 選擇此選項後,將開啟一個新視窗。 在這個精簡後的視窗中,導覽至"瀏覽"選單,然後在搜尋列中輸入"IronPDF"。
- 螢幕將顯示可用的 IronPDF 軟體包。 若要繼續操作,請從清單中選擇最新軟體包,然後按一下"安裝"選項執行此選擇。
如何在 C# 中讀取 PDF 文件,圖 6:在 NuGet 套件管理器 UI 中搜尋並安裝 IronPDF 套件 在 NuGet 套件管理器介面中搜尋並安裝 IronPDF 套件。
對於那些更喜歡命令列方式的用戶來說,NuGet 套件管理器控制台提供了一種優雅的途徑。 只需開啟此控制台,輸入以下命令,然後按"Enter"鍵:
Install-Package IronPdf
您也可以選擇直接從NuGet 網站連結取得軟體包。
使用 IronPDF 讀取 PDF 文件
本節將展示如何使用 IronPDF 使用 C# 程式語言開啟和閱讀完整的 PDF 檔案。
using IronPdf;
using System;
class Program
{
static void Main()
{
// Set the license key for IronPDF if available
IronPdf.License.LicenseKey = "Your_License_Key_Here";
// Load the PDF document from a specified file path
var pdf = PdfDocument.FromFile("document_scaled_compressed.pdf");
// Extract all text from the loaded PDF
string text = pdf.ExtractAllText();
// Output the extracted text to the console
Console.WriteLine(text);
}
}
using IronPdf;
using System;
class Program
{
static void Main()
{
// Set the license key for IronPDF if available
IronPdf.License.LicenseKey = "Your_License_Key_Here";
// Load the PDF document from a specified file path
var pdf = PdfDocument.FromFile("document_scaled_compressed.pdf");
// Extract all text from the loaded PDF
string text = pdf.ExtractAllText();
// Output the extracted text to the console
Console.WriteLine(text);
}
}
Imports IronPdf
Imports System
Friend Class Program
Shared Sub Main()
' Set the license key for IronPDF if available
IronPdf.License.LicenseKey = "Your_License_Key_Here"
' Load the PDF document from a specified file path
Dim pdf = PdfDocument.FromFile("document_scaled_compressed.pdf")
' Extract all text from the loaded PDF
Dim text As String = pdf.ExtractAllText()
' Output the extracted text to the console
Console.WriteLine(text)
End Sub
End Class
1. 導入必要的庫
首先,您需要匯入所需的命名空間。 在上面的程式碼範例中,導入了 IronPdf 命名空間,其中包含處理 PDF 的基本函數。 此外,還導入了 System 命名空間,用於一般的系統級操作。
using IronPdf;
using System;
using IronPdf;
using System;
Imports IronPdf
Imports System
2. 設定 IronPDF 許可證密鑰
IronPDF需要在生產環境中使用時擁有有效的許可證密鑰。 在程式碼範例中,有一行需要設定許可證密鑰。 但是,在您提供的程式碼中,許可證金鑰為空 ""。 在生產環境中使用時,請確保將空字串替換為 IronPDF 提供的有效許可證金鑰。
IronPdf.License.LicenseKey = "Your_License_Key_Here";
IronPdf.License.LicenseKey = "Your_License_Key_Here";
IronPdf.License.LicenseKey = "Your_License_Key_Here"
3. 載入 PDF 文檔
下一步是載入並解析 PDF 檔案。在提供的程式碼中,使用 PdfDocument.FromFile 方法載入文件名為"document_scaled_compressed.pdf"的 PDF 文件,並將其賦值給pdf變數。 此PDF文件將用於提取文字。
var pdf = PdfDocument.FromFile("document_scaled_compressed.pdf");
var pdf = PdfDocument.FromFile("document_scaled_compressed.pdf");
Dim pdf = PdfDocument.FromFile("document_scaled_compressed.pdf")
4. 從PDF文件中提取文字
IronPDF 提供了一種從已載入的 PDF 文件中提取文字的簡單方法。 ExtractAllText方法可以從 PDF 的每一頁中提取所有文字內容,並將其儲存在名為text 的**字串**變數中,其作用相當於將 PDF 轉換為文字。
string text = pdf.ExtractAllText();
string text = pdf.ExtractAllText();
Dim text As String = pdf.ExtractAllText()
5. 顯示提取的文字
最後一步是顯示提取的文字。 在程式碼中, Console.WriteLine會將擷取的文字列印並寫入控制台。 這是一種用於調試或向用戶展示文字的有效方法。
Console.WriteLine(text);
Console.WriteLine(text);
Console.WriteLine(text)
輸出:從 PDF 文件中提取的文字
如何在 C# 中讀取 PDF 文件,圖 7:從 PDF 文件中提取的文字 從 PDF 文件中提取的文字
結論
本文指導開發人員如何使用IronPDF庫在 C# 中有效地處理 PDF 文件。 它首先示範如何設定一個專用的 Visual Studio 項目,然後透過 NuGet 套件管理器直接安裝了 IronPDF。 文章隨後提供了逐步解釋如何匯入必要的庫、設定 IronPDF 許可證密鑰、加載 PDF 文件、提取文字內容以及顯示從所有頁面提取的文字。 您也可以使用 C# 將提取的文字儲存到 TXT 檔案。
IronPDF憑藉其用戶友好的方法和全面的功能,成為自動化文件處理、資料提取以及從 HTML、URL 和圖像創建 PDF 的不可或缺的工具,使其成為增強涉及 C# 中 PDF 文件處理的軟體開發專案的寶貴資產。
有關使用IronPDF讀取 PDF 檔案的完整文章,請參閱以下操作指南頁面。 C# PDF 閱讀器的程式碼範例也已提供。 有關使用 IronPDF 的更多程式碼範例,請造訪此範例頁面。 IronPDF 也提供豐富的文檔,解答所有開發人員的問題,並提供全面的實務支援。 IronPDF 提供免費試用許可證,以便用戶在決定購買永久許可證之前探索其全部功能。
常見問題解答
如何在 C# 中加載 PDF 文檔?
您可以使用 PdfDocument.FromFile 方法通過提供您希望加載的 PDF 的文件路徑來在 C# 中加載 PDF 文檔。
使用 C# 從 PDF 提取文本的方法是什麼?
IronPDF 中的 ExtractAllText 方法用於從加載的 PDF 文檔中提取所有文本內容,幫助實現數據檢索和操作。
如何在 Visual Studio 中設置一個新項目以使用 C# 處理 PDF?
要設置新項目,請在 Visual Studio 中創建一個 C# 控制台應用程序,並使用 NuGet 包管理器安裝 IronPDF 庫。
在生產環境中實施 PDF 庫是否需要許可密鑰?
是的,需要有效的許可密鑰才能在生產環境中使用 IronPDF 以訪問其全部功能。
我可以使用 C# 將 HTML 內容轉換為 PDF 文件嗎?
是的,IronPDF 允許將 HTML 內容轉換為 PDF 文件,這對於從網頁或 HTML 字串創建 PDF 十分有用。
在 C# 中使用 PDF 庫進行文檔處理的優勢是什麼?
使用 IronPDF 簡化了 PDF 自動化、數據提取和創建等任務,通過提供可靠的文檔處理能力來提升軟件項目。
開發者可以在哪裡找到更多關於在 C# 中使用 PDF 庫的例子?
開發者可以在 IronPDF 的官方網站上找到額外的示例和文檔,其中包括用於各種用例的指南和示例代碼。
PDF 庫是否提供試用版以供評估?
是的,IronPDF 提供免費試用許可證,允許用戶在購買前探索庫的功能。
在使用 C# 從 PDF 提取文本時,我如何排解問題?
確保使用 PdfDocument.FromFile 正確加載 PDF 文件,並檢查控制台輸出中的任何錯誤或異常以獲取指導。
IronPDF 可以從圖像創建 PDF 嗎?
是的,IronPDF 可以從圖像生成 PDF,提供了靈活的文檔創建選項,並支持各種輸入格式。
IronPDF與.NET 10兼容於C#中閱讀PDF嗎?
是的,IronPDF完全兼容.NET 10—支持在.NET 10專案中使用如PdfDocument.FromFile和ExtractAllText等方法進行PDF的閱讀、提取和操作。它在.NET 10上與早期版本一起獲得正式支持。



