跳過到頁腳內容
使用IRONPDF

如何在C#中讀取PDF文件

本文將使用IronPDF for .NET,一個C# PDF庫來讀取PDF文件。

如何使用IronPDF讀取PDF文件

  1. 如果尚未安裝,請下載Visual Studio。 設置環境並安裝IronPDF庫。
  2. 使用PdfDocument.FromFile方法以打開和加載所需的PDF文件。
  3. 利用IronPDF的ExtractAllText方法來檢索內容。
  4. 根據需要分析或操作提取的文本。
  5. 在控制台中打印提取的文本以閱讀。

IronPDF

IronPDF,一個強大的C# PDF閱讀器庫,使開發人員能夠輕鬆處理PDF文檔。 憑藉其廣泛的功能和能力,IronPDF簡化了PDF文檔處理的任務,使用戶能夠輕鬆地讀取、提取和操作PDF內容。 無論您是在自動化文檔流程、提取數據和圖像以進行分析,還是從頭創建PDF,IronPDF都提供了一整套工具來精簡這些任務。

本文探討了如何在C#中使用IronPDF進行高效的PDF處理,展示了它的多用途性和作為開發者軟體開發旅程中的重要工具的價值。

創建新的Visual Studio專案

在深入編碼部分之前,讓我們從設置一個全新的Visual Studio C#控制台應用程序項目開始。 此項目將作為一個專用的開發和實例空間。

  1. 為了啟動這個過程,打開Visual Studio並通過導航到"檔案"菜單,選擇"新建",然後選擇"項目"來創建新項目。

如何在C#中讀取PDF文件,圖1:導航到Visual Studio中的創建項目對話框 導航到Visual Studio中的創建項目對話框

  1. 此操作將提示出現新窗口,使您有機會指定項目模板。 為簡便起見,選擇"控制台應用程序"模板,然後點擊位於窗口左下角的下一步按鈕。

如何在C#中讀取PDF文件,圖2:在Visual Studio中創建新項目 在 Visual Studio 中創建新專案

  1. 在接下來的窗口中,系統會提示您指定項目名稱和目標項目位置。 完成這些詳細信息後,點擊下一步按鈕繼續。

如何在C#中讀取PDF文件,圖3:配置項目 配置項目

  1. 在這一步中,選擇您偏好的目標框架,並點擊創建按鈕完成項目創建過程。

如何在C#中讀取PDF文件,圖4:選擇.NET框架 .NET 框架選擇

現在項目已經建立,下一個重要步驟是安裝IronPDF

安裝IronPDF

IronPDF提供了多種下載和安裝PDF庫的選擇。 出於本指南的目的,重點將放在使用NuGet Package Manager安裝IronPDF,這是一個高效且廣泛採用的方法。

  1. 在Visual Studio中,導航到"工具"菜單並優雅地將鼠標懸停在"NuGet Package Manager"選項上。
  2. 從展開的菜單中選擇"解決方案的NuGet Package Manager"。

如何在C#中讀取PDF文件,圖5:導航到NuGet Package Manager 導航到NuGet Package Manager

  1. 選擇此選項後,將打開新窗口。 在此精心設計的窗口中,導航到"瀏覽"菜單並在搜索欄中輸入"IronPDF"。
  2. 然後,屏幕將顯示可用的IronPDF包。 要繼續,從列表中選擇最新的包,並點擊"安裝"選項執行此選擇。

如何在C#中讀取PDF文件,圖6:在NuGet Package Manager用戶界面中搜索和安裝IronPdf包 在NuGet Package Manager用戶界面中搜索和安裝IronPdf包

對於更喜歡命令行方法的人,NuGet Package Manager Console提供了一種優雅的路徑。 只需打開此控制台,輸入以下命令,然後按"Enter":

Install-Package IronPdf

您還可以直接從NuGet網站鏈接獲取包。

使用IronPDF讀取PDF文件

本節將展示如何使用C#編程語言和IronPDF打開並讀取完整的PDF文件。

using IronPdf;
using System;

class Program
{
    static void Main()
    {
        // Set the license key for IronPDF if available
        IronPdf.License.LicenseKey = "Your_License_Key_Here";

        // Load the PDF document from a specified file path
        var pdf = PdfDocument.FromFile("document_scaled_compressed.pdf");

        // Extract all text from the loaded PDF
        string text = pdf.ExtractAllText();

        // Output the extracted text to the console
        Console.WriteLine(text);
    }
}
using IronPdf;
using System;

class Program
{
    static void Main()
    {
        // Set the license key for IronPDF if available
        IronPdf.License.LicenseKey = "Your_License_Key_Here";

        // Load the PDF document from a specified file path
        var pdf = PdfDocument.FromFile("document_scaled_compressed.pdf");

        // Extract all text from the loaded PDF
        string text = pdf.ExtractAllText();

        // Output the extracted text to the console
        Console.WriteLine(text);
    }
}
Imports IronPdf
Imports System

Friend Class Program
	Shared Sub Main()
		' Set the license key for IronPDF if available
		IronPdf.License.LicenseKey = "Your_License_Key_Here"

		' Load the PDF document from a specified file path
		Dim pdf = PdfDocument.FromFile("document_scaled_compressed.pdf")

		' Extract all text from the loaded PDF
		Dim text As String = pdf.ExtractAllText()

		' Output the extracted text to the console
		Console.WriteLine(text)
	End Sub
End Class
$vbLabelText   $csharpLabel

1. 導入必要的庫

要開始,您需要導入所需的命名空間。 在上述代碼示例中,導入了IronPdf命名空間,其中包含使用PDF所需的基本功能。 此外,還導入了System命名空間,以進行一般系統層級操作。

using IronPdf;
using System;
using IronPdf;
using System;
Imports IronPdf
Imports System
$vbLabelText   $csharpLabel

2. 設置IronPDF許可證密鑰

IronPDF需要一個有效的許可證密鑰才能在生產環境中使用。 在代碼示例中,有一行應設置許可證密鑰。 然而,在您提供的代碼中,許可證密鑰被留空""。 確保在生產環境中使用IronPDF時,將空字符串替換為有效的IronPDF許可證密鑰。

IronPdf.License.LicenseKey = "Your_License_Key_Here";
IronPdf.License.LicenseKey = "Your_License_Key_Here";
IronPdf.License.LicenseKey = "Your_License_Key_Here"
$vbLabelText   $csharpLabel

3. 加載PDF文檔

下一步是加載和解析PDF文件。在提供的代碼中,使用PdfDocument.FromFile方法按文件名"document_scaled_compressed.pdf"加載PDF並將其分配給pdf變量。 此PDF文件將用於文本提取。

var pdf = PdfDocument.FromFile("document_scaled_compressed.pdf");
var pdf = PdfDocument.FromFile("document_scaled_compressed.pdf");
Dim pdf = PdfDocument.FromFile("document_scaled_compressed.pdf")
$vbLabelText   $csharpLabel

4. 從PDF文檔提取文本

IronPDF提供了一種簡單的方法來從加載的PDF文檔中提取文本。 ExtractAllText方法可以從PDF的每一頁提取所有文本內容,並將其存儲到名為textstring變量中,相當於將PDF轉換為文本。

string text = pdf.ExtractAllText();
string text = pdf.ExtractAllText();
Dim text As String = pdf.ExtractAllText()
$vbLabelText   $csharpLabel

5. 顯示提取的文本

最後一步是顯示提取的文本。 在代碼中,Console.WriteLine將打印並將提取的文本寫入控制台。 這是一種進行調試或將文本呈現給用戶的有用方法。

Console.WriteLine(text);
Console.WriteLine(text);
Console.WriteLine(text)
$vbLabelText   $csharpLabel

輸出從PDF文件中提取的文本

如何在C#中讀取PDF文件,圖7:從PDF文件中提取的文本 從PDF文件中提取的文本

結論

本文引導開發人員通過使用IronPDF庫有效工作處理C#中的PDF文件的過程。 文章首先展示了如何設置一個專用的Visual Studio項目,然後通過NuGet Package Manager進行簡單的IronPDF安裝。 接下來,本文提供了一步步的說明,講解如何導入必要的庫,設置IronPDF許可證密鑰,加載 PDF文件,提取文本內容,並顯示從所有頁面提取的文本。 您還可以使用C#將提取的文本保存到TXT文件中。

憑藉它的用戶友好方法和全面功能,IronPDF作為自動化文檔流程、數據提取和從HTML、URL和圖像創建PDF的必備工具,是提高涉及C#中的PDF文件處理軟件開發項目的寶貴資產。

The complete article on Read PDF files using IronPDF can be found on the following how-to page. 在C# PDF閱讀器上的代碼示例也提供。 有關更多IronPDF的代碼示例,請訪問此示例頁面。 IronPDF還提供了廣泛的文檔以解答所有開發人員的問題並提供完整的動手支持。 IronPDF offers a free trial license so the users can explore its full functionality before deciding to purchase a perpetual license.

常見問題解答

如何在C#中載入PDF文檔?

您可以使用PdfDocument.FromFile方法在 C# 中載入 PDF 文檔,只需提供要載入的 PDF 文件路徑即可。

如何使用 C# 從 PDF 中提取文字?

IronPDF 中的ExtractAllText方法用於從已載入的 PDF 文件中提取所有文字內容,有助於資料擷取和操作。

如何在 Visual Studio 中建立一個新項目,以便使用 C# 處理 PDF 文件?

要設定一個新項目,請在 Visual Studio 中建立一個 C# 控制台應用程序,並使用 NuGet 套件管理器安裝 IronPDF 庫。

在生產環境中部署 PDF 庫是否需要許可證金鑰?

是的,要在生產環境中使用 IronPDF,需要一個有效的許可證金鑰才能存取其全部功能。

我可以使用 C# 將 HTML 內容轉換為 PDF 文件嗎?

是的,IronPDF 允許將 HTML 內容轉換為 PDF 文檔,因此可用於從網頁或 HTML 字串建立 PDF。

在 C# 中使用 PDF 庫進行文件處理有哪些優點?

使用 IronPDF 可以簡化 PDF 自動化、資料擷取和建立等任務,並透過提供可靠的文件處理功能來增強軟體專案。

開發者可以在哪裡找到更多關於在 C# 中使用 PDF 庫的範例?

開發者可以在 IronPDF 的官方網站上找到更多範例和文檔,其中包括各種用例的指南和範例程式碼。

該PDF庫是否提供試用版供評估?

是的,IronPDF 提供免費試用許可證,使用者可以在決定購買之前探索該庫的功能。

如何使用 C# 從 PDF 擷取文字來排查問題?

確保使用PdfDocument.FromFile正確載入 PDF 文件,並檢查控制台輸出中是否有任何錯誤或異常以取得指導。

IronPDF 能否從影像建立 PDF 檔案?

是的,IronPDF 可以從影像產生 PDF,在文件建立方面提供了靈活性,並支援多種輸入格式。

IronPDF 是否相容於 .NET 10,是否可以用於在 C# 中讀取 PDF 檔案?

是的,IronPDF 完全相容於 .NET 10,支援在 .NET 10 專案中使用PdfDocument.FromFileExtractAllText等方法讀取、擷取和操作 PDF 檔案。它已獲得 .NET 10 及更早版本的官方支援。

Curtis Chau
技術作家

Curtis Chau 擁有卡爾頓大學計算機科學學士學位,專注於前端開發,擅長於 Node.js、TypeScript、JavaScript 和 React。Curtis 熱衷於創建直觀且美觀的用戶界面,喜歡使用現代框架並打造結構良好、視覺吸引人的手冊。

除了開發之外,Curtis 對物聯網 (IoT) 有著濃厚的興趣,探索將硬體和軟體結合的創新方式。在閒暇時間,他喜愛遊戲並構建 Discord 機器人,結合科技與創意的樂趣。