跳過到頁腳內容
使用IRONPDF

C#讀取PDF文件:簡單教程

如果您是開發人員,您可能遇到過從 PDF 文件中讀取文本的問題。可能以下一個或多個場景適用於您:

  1. 您正在開發一個應用程式,該應用程式將兩個 PDF 文件作為輸入並找出文件之間的相似性。
  2. 您正在開發一個需要使用IronPDF 讀取 PDF 文檔並返回字數的應用程式。
  3. 您正在開發一個應用程式,該應用程式使用 IronPDF 從 PDF 文件中提取數據並將其放入結構化數據庫中。
  4. 您正在開發一個應用程式,需要提取 PDF 文本內容並將其轉換為字串。
  5. 使用 C# 從 PDF 文件中提取數據在 IronPDF 開發之前是一項困難且複雜的任務。

IronPDF 庫概覽 是一個庫,使開發人員更容易讀取 PDF 文件。

您可以了解更多關於IronPDF 和 Iron Software 套件提供的信息。

您可以讀取 PDF 文件並使用僅僅兩行代碼在 C# 文本框中顯示數據。 是的,僅僅兩行代碼。 您也可以從 PDF 中提取所有圖像。 此外,您可以使用這些圖像創建另一個文檔,或者根據您的需要在應用程式中顯示它們。

讓我們向您展示如何完成。

我們可以逐步進行應用,選擇任何 PDF 文件,然後顯示其內容。

以下步驟說明如何在 C# 中讀取 PDF 文件:

class="hsg-featured-snippet">

以下步驟說明如何在 C# 中讀取 PDF 文件

  1. 下載 Print to PDF C# 庫
  2. 從電腦中選擇 PDF 文件
  3. 選擇特定的打印機並設置解析度
  4. 檢查來自打印機的 PDF 輸出
  5. 使用 C# 跟踪您的打印過程

先決知識:

  1. 基本的 C# 編程知識
  2. 基本的 C# GUI 控制知識

我設計此教程的方式,即使沒有編程背景的人也能夠進步。

誰應該閱讀這篇文章

任何學習 C# 的新手都應該知道如何使用 IronPDF 讀取 PDF 文件,因為這是您在職業生涯中必定會用到的。

專業開發人員也應該閱讀這些內容,以便能夠了解 IronPDF 庫,這有助於我們讀取、生成和操作 PDF 文件。

現在,我們如何在專案中使用這個庫來讀取 PDF 文件?

我使用 Windows Forms 應用程式進行演示。 您可以根據自己的喜好使用控制台應用、WPF 應用或 ASP.NET 網絡應用。

IronPDF 庫的另一個主要優勢是它可以與 C# 和 VB.NET 一起使用。

讓我們立即開始演示吧。


步驟 #1:創建 Visual Studio 專案

打开 Visual Studio。 我正在使用 Visual Studio 2019。

點擊"創建新專案"。

C# 讀取 PDF 文件:簡易教程,圖3:創建新專案 創建新專案

現在,從模板中選擇 Windows Forms App,按"下一步",然後將出現以下窗口。 輸入專案名稱。 我寫了'使用 IronPDF 讀取 PDF'。

C# 讀取 PDF 文件:簡易教程,圖16:通過 Visual Studio 配置專案 通過 Visual Studio 配置專案

現在,點擊"下一步",然後將出現以下窗口。 從下拉菜單中選擇 '.NET Core 3.1'。

C# 讀取 PDF 文件:簡易教程,圖9:.NET Core 3.1版本 .NET Core 3.1 版本

點擊"創建"按鈕,專案將創建如下所示。

C# 讀取 PDF 文件:簡易教程,圖6:新 Windows Forms 應用的初始階段 新 Windows Forms 應用的初始階段


步驟 #2:安裝 IronPDF NuGet 套件

從菜單欄中點擊專案菜單,然後會出現一個下拉列表。 選擇管理 NuGet 套件,然後點擊它。 將出現以下窗口:

C# 讀取 PDF 文件:簡易教程,圖1:NuGet 套件管理器 NuGet 包管理器

現在,點擊"瀏覽"。 將出現以下窗口:

C# 讀取 PDF 文件:簡易教程,圖2:NuGet 套件管理器 UI NuGet 套件管理器 UI

在搜索框中輸入 IronPdf,然後按"回車"。 將出現以下窗口:

C# 讀取 PDF 文件:簡易教程,圖4:NuGet 解決方案 NuGet 解決方案

選擇並點擊 IronPdf。 將出現以下窗口: C# 讀取 PDF 文件:簡易教程,圖7:安裝免費 IronPdf 安裝免費 IronPdf

按下"安裝"按鈕,然後等待安裝完成。 成功安裝後將出現以下窗口:

C# 讀取 PDF 文件:簡易教程,圖5:IronPdf for .NET IronPdf for .NET

按下"確定"按鈕,然後您就準備就緒了。

注意:還有其他方法下載 NuGet 套件。 您也可以使用套件管理器控制台安裝IronPdf; 為此,打開包管理器控制台,然後編寫以下代碼:

Install-Package IronPdf

您也可以在IronPDF 的 NuGet 套件頁面下載它。

以下 Readme.txt 文件將開啟:

C# 讀取 PDF 文件:簡易教程,圖12:IronPdf 的自述文件,其中包含代碼範例 IronPdf 的自述文件,其中包含代碼範例

我建議您通過所有鏈接,探索更多關於這個庫的 IronPDF 代碼範例


步驟 #3:設計 Windows Forms App

一旦創建了專案並安裝了 NuGet 套件,下一步是設計 Windows Forms 應用程式,這將要求用戶瀏覽文件並顯示其內容。

打開 Form1 設計:

C# 讀取 PDF 文件:簡易教程,圖14:Form1 設計 UI Form1 設計 UI

點擊窗口左側的工具欄:

C# 讀取 PDF 文件:簡易教程,圖15:標籤和文本框的工具箱 UI 標籤和文本框的工具箱 UI

搜索"標籤",將其拖放到窗體設計中

命名標籤。 這裡,我將其命名為"使用 IronPDF 讀取 C# PDF"。

C# 讀取 PDF 文件:簡易教程,圖20:添加了標籤的 Form1 UI 添加了標籤的 Form1 UI

接下來,拖放一個文本框(用於顯示文件路徑),三個按鈕(用於瀏覽文件,使用 IronPDF 讀取 PDF 文件,和第三個按鈕用於"清除文本"字段),一個 RichTextBox(用於讀取和顯示文件內容)。

將文本框和 RichTextBox 的"只讀屬性"設置為"False"。 這樣用戶就只能讀取內容和文件路徑。

C# 讀取 PDF 文件:簡易教程,圖10:完全設計的 Form1 完全設計的 Form1


步驟 #4:添加後端代碼以瀏覽 PDF 文件

雙擊"瀏覽"按鈕,將出現以下窗口:

private void Browse_Click(object sender, EventArgs e)
{
}
private void Browse_Click(object sender, EventArgs e)
{
}
Private Sub Browse_Click(ByVal sender As Object, ByVal e As EventArgs)
End Sub
$vbLabelText   $csharpLabel

接下來,在Browse_Click 函數中寫下以下代碼:

private void Browse_Click(object sender, EventArgs e)
{
    // Initialize and configure OpenFileDialog
    OpenFileDialog browseFile = new OpenFileDialog
    {
        InitialDirectory = @"D:\",
        Title = "Browse Pdf Files",
        CheckFileExists = true,
        CheckPathExists = true,
        DefaultExt = "pdf",
        Filter = "pdf files (*.pdf)|*.pdf",
        FilterIndex = 2,
        RestoreDirectory = true,
        ReadOnlyChecked = true,
        ShowReadOnly = true
    };

    // Show the dialog and get result
    if (browseFile.ShowDialog() == DialogResult.OK)
    {
        // Set the text box with the selected file path
        FilePath.Text = browseFile.FileName;
    }
}
private void Browse_Click(object sender, EventArgs e)
{
    // Initialize and configure OpenFileDialog
    OpenFileDialog browseFile = new OpenFileDialog
    {
        InitialDirectory = @"D:\",
        Title = "Browse Pdf Files",
        CheckFileExists = true,
        CheckPathExists = true,
        DefaultExt = "pdf",
        Filter = "pdf files (*.pdf)|*.pdf",
        FilterIndex = 2,
        RestoreDirectory = true,
        ReadOnlyChecked = true,
        ShowReadOnly = true
    };

    // Show the dialog and get result
    if (browseFile.ShowDialog() == DialogResult.OK)
    {
        // Set the text box with the selected file path
        FilePath.Text = browseFile.FileName;
    }
}
Private Sub Browse_Click(ByVal sender As Object, ByVal e As EventArgs)
	' Initialize and configure OpenFileDialog
	Dim browseFile As New OpenFileDialog With {
		.InitialDirectory = "D:\",
		.Title = "Browse Pdf Files",
		.CheckFileExists = True,
		.CheckPathExists = True,
		.DefaultExt = "pdf",
		.Filter = "pdf files (*.pdf)|*.pdf",
		.FilterIndex = 2,
		.RestoreDirectory = True,
		.ReadOnlyChecked = True,
		.ShowReadOnly = True
	}

	' Show the dialog and get result
	If browseFile.ShowDialog() = DialogResult.OK Then
		' Set the text box with the selected file path
		FilePath.Text = browseFile.FileName
	End If
End Sub
$vbLabelText   $csharpLabel

OpenFileDialog創建 Windows Forms 應用的文件對話框控制項的實例。

我將初始路徑設置為 D 驅動器;您可以設置為任何。

我將DefaultExt = "pdf"設置為我們只需要讀取 PDF 文件。

我使用了過濾器,以便瀏覽文件對話框只會顯示給您選擇的 PDF 文件。

當用戶單擊"確定"時,它將在"文件路徑"字段中顯示文件路徑。

讓我們運行解決方案並測試"瀏覽"按鈕。

C# 讀取 PDF 文件:簡易教程,圖10:Form1 UI Form1 UI

按下"瀏覽"按鈕,然後將出現以下窗口:

C# 讀取 PDF 文件:簡易教程,圖11:瀏覽文件對話框以選擇 PDF 文件 瀏覽文件對話框以選擇 PDF 文件

選擇文件(我選擇了 IronPDFTest.pdf)並按"打開"。 以下窗口将出现。

C# 讀取 PDF 文件:簡易教程,圖13:C# 中的 PDF C# 中的 PDF

現在讓我們在"讀取"按鈕後面編寫代碼以讀取文件。


步驟 #5:添加後端代碼以使用 IronPDF 讀取 PDF 文件

您可能會認為閱讀 PDF 文件的代碼會很複雜且難以編寫和理解。

不用擔心。 IronPDF 簡化了事情,使得一切變得如此簡單。 我們可以輕鬆使用僅兩行代碼讀取 PDF 文件。

去 Form1 設計並"雙擊""讀取"按鈕。 將出現以下窗口:

private void Read_Click(object sender, EventArgs e)
{
}
private void Read_Click(object sender, EventArgs e)
{
}
Private Sub Read_Click(ByVal sender As Object, ByVal e As EventArgs)
End Sub
$vbLabelText   $csharpLabel

添加命名空間 using IronPdf來導入 IronPDF 庫:

using System;
using IronPdf;
using System;
using IronPdf;
Imports System
Imports IronPdf
$vbLabelText   $csharpLabel

Read_Click 函數中寫下以下代碼:

private void Read_Click(object sender, EventArgs e)
{
    // Read the PDF file using IronPdf
    using PdfDocument pdf = PdfDocument.FromFile(FilePath.Text);

    // Extract and display the text from the PDF
    FileContent.Text = pdf.ExtractAllText(); 
}
private void Read_Click(object sender, EventArgs e)
{
    // Read the PDF file using IronPdf
    using PdfDocument pdf = PdfDocument.FromFile(FilePath.Text);

    // Extract and display the text from the PDF
    FileContent.Text = pdf.ExtractAllText(); 
}
Private Sub Read_Click(ByVal sender As Object, ByVal e As EventArgs)
	' Read the PDF file using IronPdf
	Using pdf As PdfDocument = PdfDocument.FromFile(FilePath.Text)
	
		' Extract and display the text from the PDF
		FileContent.Text = pdf.ExtractAllText()
	End Using
End Sub
$vbLabelText   $csharpLabel

FilePath 是顯示我們要讀取的 PDF 文件位置的文本字段的名稱。 我們將動態獲取文件的位置。

使用 IronPDF 提取所有文本 是 IronPDF 函數,將從 PDF 頁面中提取所有數據。 然後將此數據顯示在名為"文件內容"的 Rich Text Box 中。

接下來,讓我們在"清除按鈕"後面編寫代碼。 這只是您希望在讀取 PDF 文檔後清除屏幕的一個額外項目。

雙擊"清除按鈕",它將帶您進入以下代碼:

void Clear_Click(object sender, EventArgs e)
{
}
void Clear_Click(object sender, EventArgs e)
{
}
Private Sub Clear_Click(ByVal sender As Object, ByVal e As EventArgs)
End Sub
$vbLabelText   $csharpLabel

Clear_Click 函數中寫下以下代碼:

void Clear_Click(object sender, EventArgs e)
{
    // Clear the file path and content display fields
    FileContent.Text = "";
    FilePath.Text = "";
}
void Clear_Click(object sender, EventArgs e)
{
    // Clear the file path and content display fields
    FileContent.Text = "";
    FilePath.Text = "";
}
Private Sub Clear_Click(ByVal sender As Object, ByVal e As EventArgs)
	' Clear the file path and content display fields
	FileContent.Text = ""
	FilePath.Text = ""
End Sub
$vbLabelText   $csharpLabel

運行解決方案

點擊"瀏覽"按鈕並選擇您要讀取的文檔。 在我的例子中,我讀取 IronPDF.pdf 文件作為範例:

C# 讀取 PDF 文件:簡易教程,圖8:PDF 文檔 PDF 文檔

按下"打開"按鈕,然後將出現以下窗口:

C# 讀取 PDF 文件:簡易教程,圖13:具有選擇的 PDF 文件的應用程式 具有選擇的 PDF 文件的應用程式

按下"讀取"按鈕。 它將讀取文件並顯示內容如下所示。

C# 讀取 PDF 文件:簡易教程,圖19:顯示 PDF 文字內容 顯示 PDF 文字內容


總結

這是一個範例解決方案。 無論您的 PDF 文檔中有多少頁面、圖像或文本,IronPDF 都會為您提取所有文本和圖像以供您用於任何目的。 您只需獲得庫的許可證並開始使用。

這就完成了本教程。 希望您已了解到一切,如果您有任何問題,隨時在評論區留言。

您可以下載專案壓縮文件。 如果您希望購買完整 Iron 軟件產品包,我們的特價活動意味著您現在可以以僅需兩個 Lite 許可證的價格購買其中所有產品。

常見問題解答

如何使用 C# 讀取 PDF 檔案中的文字?

您可以使用 IronPDF 透過ExtractAllText方法從 PDF 文件中讀取文本,該方法可讓您輕鬆地從 PDF 文件中提取所有文本內容。

在 C# 中使用 IronPDF 進行 PDF 處理有哪些優點?

IronPDF 提供了一種在 C# 中讀取、產生和操作 PDF 的簡單方法。它允許開發人員用最少的程式碼行完成文字擷取和圖像檢索等任務,從而提高生產力和效率。

如何在我的 C# 專案中安裝 IronPDF 庫?

若要安裝 IronPDF,請使用 Visual Studio 中的 NuGet 套件管理器。只需在套件管理器控制台中搜尋“IronPDF”,然後按一下“安裝”即可將其新增至您的專案。

IronPDF 能否用於從 PDF 文件中提取影像?

是的,IronPDF 提供了從 PDF 文件中提取影像的功能,可讓開發人員存取和操作文件中包含的所有影像。

要設定一個能夠讀取 PDF 檔案的 Visual Studio 項目,需要哪些步驟?

設定項目包括建立一個新的 Visual Studio 項目,安裝 IronPDF NuGet 包,設計一個 Windows 窗體應用程序,以及實現用於瀏覽和讀取 PDF 文件的後端程式碼。

如何確保在讀取 PDF 文件後,我的應用程式中的欄位被清空?

您可以在應用程式中實作一個「清除」按鈕,該按鈕會將文字方塊和富文本方塊的內容重設為空字串,從而確保在處理 PDF 後清除欄位。

是否可以使用 VB.NET 呼叫 IronPDF?

是的,IronPDF 與 C# 和 VB.NET 都相容,對於使用不同 .NET 語言的開發人員來說,它是一個用途廣泛的選擇。

使用 IronPDF 顯示 PDF 內容需要多少行程式碼?

使用 IronPDF,只需兩行程式碼即可顯示 PDF 內容,凸顯了其簡化 PDF 處理任務的能力。

IronPDF 中的 'RenderHtmlAsPdf' 方法用於何種用途?

IronPDF 中的RenderHtmlAsPdf方法用於將 HTML 字串轉換為 PDF 文檔,從而實現將 Web 內容無縫整合到 PDF 文件中。

IronPDF 是否完全相容於 .NET 10?

是的。 IronPDF 完全相容於 .NET 10,以及更早的版本,例如 .NET 6-9、.NET Core、.NET Standard 和 .NET Framework。它支援透過 NuGet 安裝,並且可以在包括 Windows、Linux 和 macOS 在內的多個平台上無縫運行。

Curtis Chau
技術作家

Curtis Chau 擁有卡爾頓大學計算機科學學士學位,專注於前端開發,擅長於 Node.js、TypeScript、JavaScript 和 React。Curtis 熱衷於創建直觀且美觀的用戶界面,喜歡使用現代框架並打造結構良好、視覺吸引人的手冊。

除了開發之外,Curtis 對物聯網 (IoT) 有著濃厚的興趣,探索將硬體和軟體結合的創新方式。在閒暇時間,他喜愛遊戲並構建 Discord 機器人,結合科技與創意的樂趣。