跳過到頁腳內容
使用IRONPDF

如何在C#中讀取PDF文件

本文將使用IronPDF for .NET,這是一個用於讀取 PDF 檔案的 C# PDF 函式庫。

如何使用 IronPDF 閱讀 PDF 文件

  1. 如果尚未下載,請下載 Visual Studio。 設定環境並安裝 IronPDF 庫。
  2. 使用PdfDocument.FromFile方法開啟並載入所需的 PDF 檔案。
  3. 利用 IronPDF 的ExtractAllText方法檢索內容。
  4. 根據需要分析或處理擷取的文字。
  5. 將擷取的文字列印到控制台以供閱讀。

IronPDF。

IronPDF是一個功能強大的 C# PDF 閱讀器庫,它使開發人員能夠輕鬆處理 PDF 文件。 IronPDF 憑藉其豐富的功能和強大的效能,簡化了 PDF 文件的處理,使用戶能夠輕鬆讀取、提取和操作 PDF 內容。 無論您是要自動化文件處理流程、提取資料和影像進行分析,還是從頭開始建立 PDF,IronPDF 都提供了一套全面的工具來簡化這些任務。

本文探討如何使用IronPDF在 C# 中有效處理 PDF,展示了 IronPDF 的多功能性和價值,使其成為開發人員軟體開發過程中必不可少的工具。

建立新的 Visual Studio 項目

在深入探討編碼方面之前,讓我們先建立一個新的Visual Studio C# 控制台應用程式專案。 該專案將作為一個專門的工作空間,用於開發和實際案例展示。

  1. 若要啟動此流程,請啟動 Visual Studio,然後導覽至"檔案"選單,選擇"新建",再選擇"專案",建立新專案。

如何在 C# 中讀取 PDF 文件,圖 1:在 Visual Studio 中導覽至"建立專案"對話框 在 Visual Studio 中,導覽至"建立專案"對話方塊。

  1. 此操作將彈出一個新窗口,讓您有機會指定項目模板。 為了簡單起見,請選擇"控制台應用程式"模板,然後按一下位於視窗左下角的"下一步"按鈕繼續。

如何在 C# 中讀取 PDF 文件,圖 2:在 Visual Studio 中建立一個新項目 在 Visual Studio 中建立一個新項目

  1. 在後續的視窗中,系統會提示您為項目指定名稱並指定所需的項目位置。 填寫完這些細節後,點擊"下一步"按鈕繼續。

如何在 C# 中讀取 PDF 文件,圖 3:設定項目 配置專案

  1. 在此步驟中,選擇您喜歡的目標框架,然後按一下"建立"按鈕完成專案建立過程。

如何在 C# 中讀取 PDF 文件,圖 4:.NET Framework 選擇 .NET Framework 選擇

現在您的專案已經穩固建立,下一個關鍵步驟是安裝IronPDF

安裝 IronPDF。

IronPDF提供了多種下載和安裝 PDF 庫的選項。 在本指南中,我們將重點介紹如何使用 NuGet 套件管理器安裝 IronPDF,這是一種高效且廣泛採用的方法。

  1. 在 Visual Studio 中,導覽至"工具"選單,然後將遊標優雅地懸停在"NuGet 套件管理器"選項上。
  2. 從擴充功能表中,選擇"NuGet 解決方案套件管理員"。

如何在 C# 中讀取 PDF 文件,圖 5:導航到 NuGet 套件管理器 導覽至 NuGet 套件管理器

  1. 選擇此選項後,將開啟一個新視窗。 在這個精簡後的視窗中,導覽至"瀏覽"選單,然後在搜尋列中輸入"IronPDF"。
  2. 螢幕將顯示可用的 IronPDF 軟體包。 若要繼續操作,請從清單中選擇最新軟體包,然後按一下"安裝"選項執行此選擇。

如何在 C# 中讀取 PDF 文件,圖 6:在 NuGet 套件管理器 UI 中搜尋並安裝 IronPdf 套件 在 NuGet 套件管理器介面中搜尋並安裝 IronPdf 套件。

對於那些更喜歡命令列方式的用戶來說,NuGet 套件管理器控制台提供了一種優雅的途徑。 只需開啟此控制台,輸入以下命令,然後按"Enter"鍵:

Install-Package IronPdf

您也可以選擇直接從NuGet 網站連結取得軟體包。

使用 IronPDF 讀取 PDF 文件

本節將展示如何使用 IronPDF 使用 C# 程式語言開啟和閱讀完整的 PDF 檔案。

using IronPdf;
using System;

class Program
{
    static void Main()
    {
        // Set the license key for IronPDF if available
        IronPdf.License.LicenseKey = "Your_License_Key_Here";

        // Load the PDF document from a specified file path
        var pdf = PdfDocument.FromFile("document_scaled_compressed.pdf");

        // Extract all text from the loaded PDF
        string text = pdf.ExtractAllText();

        // Output the extracted text to the console
        Console.WriteLine(text);
    }
}
using IronPdf;
using System;

class Program
{
    static void Main()
    {
        // Set the license key for IronPDF if available
        IronPdf.License.LicenseKey = "Your_License_Key_Here";

        // Load the PDF document from a specified file path
        var pdf = PdfDocument.FromFile("document_scaled_compressed.pdf");

        // Extract all text from the loaded PDF
        string text = pdf.ExtractAllText();

        // Output the extracted text to the console
        Console.WriteLine(text);
    }
}
Imports IronPdf
Imports System

Friend Class Program
	Shared Sub Main()
		' Set the license key for IronPDF if available
		IronPdf.License.LicenseKey = "Your_License_Key_Here"

		' Load the PDF document from a specified file path
		Dim pdf = PdfDocument.FromFile("document_scaled_compressed.pdf")

		' Extract all text from the loaded PDF
		Dim text As String = pdf.ExtractAllText()

		' Output the extracted text to the console
		Console.WriteLine(text)
	End Sub
End Class
$vbLabelText   $csharpLabel

1. 導入必要的庫

首先,您需要匯入所需的命名空間。 在上面的程式碼範例中,匯入了IronPdf命名空間,其中包含處理 PDF 的基本函數。 此外, System命名空間也被導入,用於一般的系統級操作。

using IronPdf;
using System;
using IronPdf;
using System;
Imports IronPdf
Imports System
$vbLabelText   $csharpLabel

2. 設定 IronPDF 許可證密鑰

IronPDF需要在生產環境中使用時擁有有效的許可證密鑰。 在程式碼範例中,有一行需要設定許可證密鑰。 但是,在您提供的程式碼中,許可證金鑰為空"" 。 在生產環境中使用時,請確保將空字串替換為 IronPDF 提供的有效許可證金鑰。

IronPdf.License.LicenseKey = "Your_License_Key_Here";
IronPdf.License.LicenseKey = "Your_License_Key_Here";
IronPdf.License.LicenseKey = "Your_License_Key_Here"
$vbLabelText   $csharpLabel

3. 載入 PDF 文檔

下一步是載入並解析 PDF 檔案。在提供的程式碼中,使用PdfDocument.FromFile方法載入文件名為"document_scaled_compressed.pdf"的 PDF 文件,並將其賦值給pdf變數。 此PDF文件將用於提取文字。

var pdf = PdfDocument.FromFile("document_scaled_compressed.pdf");
var pdf = PdfDocument.FromFile("document_scaled_compressed.pdf");
Dim pdf = PdfDocument.FromFile("document_scaled_compressed.pdf")
$vbLabelText   $csharpLabel

4. 從PDF文件中提取文本

IronPDF 提供了一種從已載入的 PDF 文件中提取文字的簡單方法。 ExtractAllText方法可以從 PDF 的每一頁中提取所有文字內容,並將其儲存在名為text 的**字串**變數中,其作用相當於將 PDF 轉換為文字。

string text = pdf.ExtractAllText();
string text = pdf.ExtractAllText();
Dim text As String = pdf.ExtractAllText()
$vbLabelText   $csharpLabel

5. 顯示提取的文本

最後一步是顯示提取的文字。 在程式碼中, Console.WriteLine會將擷取的文字列印並寫入控制台。 這是一種用於調試或向用戶展示文字的有效方法。

Console.WriteLine(text);
Console.WriteLine(text);
Console.WriteLine(text)
$vbLabelText   $csharpLabel

輸出:從 PDF 文件中提取的文本

如何在 C# 中讀取 PDF 文件,圖 7:從 PDF 文件中提取的文本 從 PDF 文件中提取的文本

結論

本文指導開發人員如何使用IronPDF庫在 C# 中有效地處理 PDF 文件。 它首先示範如何設定一個專用的 Visual Studio 項目,然後透過 NuGet 套件管理器直接安裝了 IronPDF。 文章隨後提供了逐步解釋如何匯入必要的庫、設定 IronPDF 許可證密鑰、加載 PDF 文件、提取文字內容以及顯示從所有頁面提取的文本。 您也可以使用 C# 將提取的文字儲存到 TXT 檔案。

IronPDF憑藉其用戶友好的方法和全面的功能,成為自動化文件處理、資料提取以及從 HTML、URL 和圖像創建 PDF 的不可或缺的工具,使其成為增強涉及 C# 中 PDF 文件處理的軟體開發專案的寶貴資產。

有關使用IronPDF讀取 PDF 檔案的完整文章,請參閱以下操作指南頁面C# PDF 閱讀器的程式碼範例也已提供。 有關使用 IronPDF 的更多程式碼範例,請造訪此範例頁面。 IronPDF 也提供豐富的文檔,解答所有開發人員的問題,並提供全面的實務支援。 IronPDF 提供免費試用許可證,以便用戶在決定購買永久許可證之前探索其全部功能。

常見問題解答

如何在 C# 中載入 PDF 文件?

您可以使用 PdfDocument.FromFile 方法在 C# 中載入 PDF 文件,只需提供您想要載入的 PDF 的檔案路徑即可。

使用 C# 從 PDF 擷取文字的方法是什麼?

IronPDF 中的 ExtractAllText 方法用於從載入的 PDF 文件中提取所有文字內容,有助於資料檢索和操作。

如何在 Visual Studio 中設定一個新專案,以便使用 C# 處理 PDF?

要建立新專案,請在 Visual Studio 中建立 C# Console Application,並使用 NuGet Package Manager 安裝 IronPDF 函式庫。

在生產環境中實作 PDF 函式庫是否需要授權金鑰?

是的,在生產環境中使用 IronPDF 需要有效的許可金鑰,才能使用其全部功能。

我可以使用 C# 將 HTML 內容轉換成 PDF 文件嗎?

是的,IronPDF 可以將 HTML 內容轉換成 PDF 文件,因此對於從網頁或 HTML 字串建立 PDF 非常有用。

在 C# 中使用 PDF 函式庫處理文件有哪些優點?

使用 IronPDF 可簡化 PDF 自動化、資料抽取和建立等工作,透過提供可靠的文件處理能力來強化軟體專案。

開發人員在哪裡可以找到更多在 C# 中使用 PDF 函式庫的範例?

開發人員可以在 IronPDF 的官網上找到其他範例和說明文件,其中包括各種使用情況的指南和範例程式碼。

PDF 函式庫是否提供試用版以供評估?

是的,IronPDF 提供免費的試用授權,讓使用者在決定購買之前,可以探索資料庫的功能。

使用 C# 從 PDF 擷取文字時,如何排除故障?

確保使用 PdfDocument.FromFile 正確載入 PDF 檔案,並檢查控制台輸出中是否有任何錯誤或異常,以獲得指引。

IronPDF 可以從影像建立 PDF 嗎?

是的,IronPDF 可以從影像產生 PDF,提供文件製作的彈性,並支援多種輸入格式。

IronPDF 是否與 .NET 10 相容,可以用 C# 來閱讀 PDF?

是的,IronPDF 與 .NET 10 完全相容,可在 .NET 10 專案中使用 PdfDocument.FromFileExtractAllText 等方法讀取、提取和處理 PDF。.NET 10 與早期版本都正式支援此功能。

Curtis Chau
技術作家

Curtis Chau 擁有卡爾頓大學計算機科學學士學位,專注於前端開發,擅長於 Node.js、TypeScript、JavaScript 和 React。Curtis 熱衷於創建直觀且美觀的用戶界面,喜歡使用現代框架並打造結構良好、視覺吸引人的手冊。

除了開發之外,Curtis 對物聯網 (IoT) 有著濃厚的興趣,探索將硬體和軟體結合的創新方式。在閒暇時間,他喜愛遊戲並構建 Discord 機器人,結合科技與創意的樂趣。