使用 IRONPDF

C# 讀取 PDF 檔案:簡單教程

已更新 2023年12月2日
分享:

如果您是開發人員,您可能遇到過從 PDF 文件中讀取文本的問題。也許以下一個或多個情況適用於您。

  1. 您正在開發一個應用程式,該應用程式以兩個 PDF 文件作為輸入並查找文件之間的相似性。

  2. 您正在開發一個需要 閱讀PDF文件 並返回字數。

  3. 您正在開發一個應用程式, 從 PDF 檔案中提取數據 並將其放入結構化數據庫中。

  4. 您正在開發一個需要的應用程序 提取 PDF 文本内容 "5. 使用 C# 從 PDF 文件中提取數據是一項困難且複雜的任務,直到開發了 IronPDF。"

IronPDF 是一個使開發者更容易閱讀 PDF 文件的庫。

你可以瞭解更多关于 IronPDF 和 Iron Software 套裝您可以使用僅僅兩行程式碼來讀取 PDF 文件並將數據顯示在 C# 文本框中。是的,僅僅兩行程式碼。您還可以 提取所有圖片 在您的 PDF 文件中。此外,您可以使用這些圖像創建另一個文件,或根據您的需要在應用程式中顯示它們。

讓我們展示一下如何操作。

我們可以逐步進行應用程式,選擇任何 PDF 檔案並顯示其內容。

以下步驟向您展示如何在 C# 中讀取 PDF 檔案:

先決知識:

  1. C# 編程的基本知識

  2. C# 圖形用戶界面控件的基本知識

我設計這個教程的方式是,即使是一個沒有編程背景的人也能夠進步。

誰應該閱讀這本書

任何學習C#的新手都應該知道如何 讀取 PDF 文件 因為這是您在職業生涯中絕對會用到的東西。

專業開發者也應該閱讀這篇文章,才能了解IronPDF Library,它幫助我們讀取、生成和操作PDF文件。

現在,我們如何在專案中使用這個Library來讀取PDF文件呢?

我將使用Windows Forms App來示範。您可以根據個人偏好使用Console Application、WPF Application或ASP.NET web application。

IronPDF library的另一個主要優點是它可以與C#和VB.NET一起使用。

讓我們馬上開始示範吧。


第一步:建立 Visual Studio 專案

打開 Visual Studio。我使用的是 Visual Studio 2019。

點擊「建立新專案」:

C# 讀取 PDF 檔案:簡易教程,圖 3:創建新專案

建立新專案

現在,從範本中選擇 Windows Forms App,按「下一步」,並且會出現以下視窗。輸入專案名稱。我已經寫了 'Read Pdf using IronPDF'。

C# 讀取PDF檔案:簡單教程,圖16:通過Visual Studio配置項目

通過 Visual Studio 配置項目

現在,點擊「下一步」,以下窗口將出現。從下拉菜單中選擇「.NET Core 3.1」。

C# 讀取 PDF 文件:簡單教程,圖 9:.NET Core 3.1 版本

.NET Core 3.1 版本

點擊「Create」按鈕,專案將被創建,如下所示。

C# 讀取 PDF 文件:簡易教程,圖 6:新建 Windows Forms 應用程式的初始階段

新的 Windows Forms 應用程式初始階段


第 2 步:安裝 IronPDF 的 NuGet 套件

從選單列中點擊「專案」選單,會出現下拉清單。選擇「管理 NuGet 套件」,然後點擊它。隨後會出現以下視窗:

C# 讀取 PDF 檔案:簡單教程,圖 1:NuGet 封裝管理器

NuGet 套件管理器

現在,點擊「瀏覽」。將會出現以下窗口:

C# 讀取 PDF 文件:簡單教程,圖 2:NuGet Package Manager 用戶界面

NuGet 套件管理工具 UI

在搜索框中輸入 IronPdf,然後按下「Enter」。以下窗口將會出現:

C# 讀取 PDF 檔案:簡單教學,圖 4:NuGet 解決方案

NuGet 解決方案

選擇並點擊 IronPDF。將出現以下窗口:

C# 讀取 PDF 文件: 簡單教程,圖 7:安裝免費的 IronPdf

安裝免費的 IronPDF

按下「安裝」按鈕,等待安裝完成。成功安裝後,將會出現以下視窗:

C# 讀取 PDF 文件:簡易教程,圖 5:IronPDF for .NET

IronPDF for .NET

按下「確定」按鈕,您就可以開始使用了。

注意:還有其他方式下載NuGet套件。您也可以使用套件管理員控制台安裝IronPdf;要做到這一點,請打開套件管理員控制台並輸入以下代碼:

Install-Package IronPdf

您還可以在下載 NuGet網站接下來的 Readme.txt 文件將會打開:

C# 讀取 PDF 文件:簡易教程,圖 12:IronPdf 的自述文件的代碼範例

IronPdf 的說明文件及程式碼範例

我建議你瀏覽所有的連結並 探索更多代碼範例 關於此庫。


步驟 #3: 設計 Windows Forms 應用程式

一旦建立專案並安裝 NuGet 套件後,下一步是設計一個 Windows Forms 應用程式,要求使用者瀏覽一個檔案並顯示其內容。

打開 Form1 設計:

C# 讀取 PDF 檔案:簡單教程,圖14:Form1 設計 UI

Form1 設計 UI

點擊在視窗左側的工具欄:

C# 讀取 PDF 文件:簡易教程,圖 15:標籤和文字框的工具箱介面

工具箱用於標籤和文字框的用戶界面

搜尋標籤,並將其拖放到表單設計中

命名標籤。在這裡,我把它命名為 "C# Read Pdf using IronPDF"。

C# 讀取 PDF 文件:簡易教學, 圖 20:添加 Label 的 Form1 UI

Form1 使用者介面,新增標籤

接著,拖曳並放入一個文字框 (顯示文件路徑),三個按鈕 (一個用於瀏覽文件,一個用於使用IronPDF閱讀PDF文件,第三個按鈕用於“清除文本”字段), 以及一個RichTextBox (閱讀及顯示檔案內容)將 TextBox 和 RichTextBox 的「唯讀屬性」設置為「False」。這樣用戶只能讀取內容和檔案路徑。

C# 讀取 PDF 檔案:簡單教程,圖示10:Form1 完成設計

Form1 完全設計


步驟 #4:添加後端程式碼來瀏覽 PDF 檔案

雙擊「瀏覽」按鈕,出現以下視窗:

private void Browse_Click(object sender, EventArgs e)
{
}
private void Browse_Click(object sender, EventArgs e)
{
}
Private Sub Browse_Click(ByVal sender As Object, ByVal e As EventArgs)
End Sub
VB   C#

接下來,在 Browse_Click 函數中寫入以下程式碼:

private void Browse_Click(object sender, EventArgs e)
{
    OpenFileDialog browseFile = new OpenFileDialog
    {
        InitialDirectory = @"D:\",
        Title = "Browse Pdf Files",
        CheckFileExists = true,
        CheckPathExists = true,
        DefaultExt = "pdf",
        Filter = "pdf files (*.pdf)
*.pdf",
        FilterIndex = 2,
        RestoreDirectory = true,
        ReadOnlyChecked = true,
        ShowReadOnly = true
    };
    if (browseFile.ShowDialog() == DialogResult.OK)
    {
        FilePath.Text = browseFile.FileName;
    }
}
private void Browse_Click(object sender, EventArgs e)
{
    OpenFileDialog browseFile = new OpenFileDialog
    {
        InitialDirectory = @"D:\",
        Title = "Browse Pdf Files",
        CheckFileExists = true,
        CheckPathExists = true,
        DefaultExt = "pdf",
        Filter = "pdf files (*.pdf)
*.pdf",
        FilterIndex = 2,
        RestoreDirectory = true,
        ReadOnlyChecked = true,
        ShowReadOnly = true
    };
    if (browseFile.ShowDialog() == DialogResult.OK)
    {
        FilePath.Text = browseFile.FileName;
    }
}
Private Sub Browse_Click(ByVal sender As Object, ByVal e As EventArgs)
	Dim browseFile As New OpenFileDialog With {
		.InitialDirectory = "D:\",
		.Title = "Browse Pdf Files",
		.CheckFileExists = True,
		.CheckPathExists = True,
		.DefaultExt = "pdf",
		.Filter = "pdf files (*.pdf) *.pdf",
		.FilterIndex = 2,
		.RestoreDirectory = True,
		.ReadOnlyChecked = True,
		.ShowReadOnly = True
	}
	If browseFile.ShowDialog() = DialogResult.OK Then
		FilePath.Text = browseFile.FileName
	End If
End Sub
VB   C#

OpenFileDialogue 將建立 Windows Forms App 的文件對話控制項實例。

我已將初始路徑設置為 D 驅動器;你可以設置為任何路徑。

我已將 DefaultExt = "pdf" 設置為我們只需要讀取 PDF 文件。

我已使用過濾器,這樣瀏覽文件對話框僅會顯示 PDF 文件以供選擇。

當用戶點擊 "Ok" 時,它將在文件路徑欄顯示文件路徑。

讓我們運行解決方案並測試 "Browse" 按鈕。

C# 讀取 PDF 文件:簡易教程,圖 10:Form1 UI

Form1 使用者介面

按下「瀏覽」按鈕,以下視窗將出現:

C# 讀取 PDF 文件:簡易教程,圖 11:瀏覽文件對話框以選擇 PDF 文件

瀏覽文件對話框以選擇PDF文件

選擇文件 (我正在選擇IronPDFTest.pdf) 按「打開」。將會出現以下視窗。

C# 讀取 PDF 文件:簡單教學,圖13:C# 中的 PDF

PDF in C#

現在讓我們編寫“讀取”按鈕後面的代碼來讀取文件。


第5步:使用 IronPDF 添加讀取 PDF 文件的後端程式碼

您可能會覺得讀取 PDF 文件的程式碼會很複雜且難以撰寫和理解。

不用擔心。IronPDF 已經簡化所有程式,使所有事情變得簡單得多。只需要兩行程式碼,我們就能輕鬆讀取 PDF 檔案。

轉到 Form1 設計並“雙擊” "讀取" 按鈕。接著將會出現以下視窗:

private void Read_Click(object sender, EventArgs e)
{
}
private void Read_Click(object sender, EventArgs e)
{
}
Private Sub Read_Click(ByVal sender As Object, ByVal e As EventArgs)
End Sub
VB   C#

添加命名空间 using IronPdf 以导入 IronPDF 库:

using System;
using IronPdf;
using System;
using IronPdf;
Imports System
Imports IronPdf
VB   C#

Read_Click 函數內編寫以下代碼:

private void Read_Click(object sender, EventArgs e)
{
    using PdfDocument pdf = PdfDocument.FromFile(FilePath.Text);
    FileContent.Text = pdf.ExtractAllText(); 
}
private void Read_Click(object sender, EventArgs e)
{
    using PdfDocument pdf = PdfDocument.FromFile(FilePath.Text);
    FileContent.Text = pdf.ExtractAllText(); 
}
Private Sub Read_Click(ByVal sender As Object, ByVal e As EventArgs)
	Using pdf As PdfDocument = PdfDocument.FromFile(FilePath.Text)
		FileContent.Text = pdf.ExtractAllText()
	End Using
End Sub
VB   C#

FilePath 是顯示我們想要讀取的 PDF 文件位置的文字欄位名稱。我們將動態獲取文件的位置。

提取所有文本 IronPDF 是一個功能,可以從 PDF 頁面中提取所有數據。這些數據將顯示在富文本框中,並命名為 "File Content"。

接下來,我們來編寫 "清除按鈕" 的後端代碼。如果您希望在閱讀完 PDF 文件後清除屏幕,這只是額外的項目。

雙擊 "清除按鈕",它會將您帶到以下代碼:

void Clear_Click(object sender, EventArgs e)
{
}
void Clear_Click(object sender, EventArgs e)
{
}
Private Sub Clear_Click(ByVal sender As Object, ByVal e As EventArgs)
End Sub
VB   C#

將以下程式碼寫入 Clear_Click 函數中:

void Clear_Click(object sender, EventArgs e)
{
    FileContent.Text = "";
    FilePath.Text = "";
}
void Clear_Click(object sender, EventArgs e)
{
    FileContent.Text = "";
    FilePath.Text = "";
}
Private Sub Clear_Click(ByVal sender As Object, ByVal e As EventArgs)
	FileContent.Text = ""
	FilePath.Text = ""
End Sub
VB   C#

執行解決方案

點擊「瀏覽」按鈕並選擇您想要閱讀的文件。在此例中,我正在閱讀 IronPDF.pdf 文件:

C# 讀取 PDF 檔案:簡單教程,圖 8:PDF 文件

PDF 文件

按下「開啟」按鈕後,將會出現以下視窗:

C# 讀取 PDF 文件:簡易教程,圖 13:選定 PDF 文件的應用程式

附帶選定 PDF 文件的應用程式

按下“讀取”按鈕。它將讀取文件並顯示如下內容。

C# 讀取 PDF 文件:簡易教程,圖 19:顯示 PDF 文本內容

顯示 PDF 文本內容


摘要

這是一個範例解決方案。無論您的PDF文件中有多少頁面、圖像或文字,IronPDF都會為您提取所有文字和圖像,以便您用於任何目的。您只需獲取該庫的許可並開始使用即可。

本教程到此結束。希望您已經了解所有內容,若有任何疑問,請隨時在評論區留言。

您可以下載 專案 zip 檔案. 如果您希望購買完整的 Iron 軟體產品包,我們的特別優惠意味著您現在可以以兩個產品的價格購買所有產品。如果您需要有關許可和支援的更多詳細資訊,請點擊 此定價頁面. 您也可以獲得 免費試用許可

< 上一頁
一鍵生成 .NET PDF
下一個 >
如何為 PDF 文件設置密碼保護

準備開始了嗎? 版本: 2024.10 剛剛發布

免費 NuGet 下載 總下載次數: 10,993,239 查看許可證 >