跳至頁尾內容
使用 IRONPDF

C# 讀取 PDF 檔案:簡易教學

如果您是開發人員,您可能遇到過從 PDF 文件中讀取文字時遇到的問題。以下一種或多種情況可能與您有關:

  1. 你正在開發一個應用程序,該應用程式接受兩個 PDF 文件作為輸入,並找出這兩個文件之間的相似之處。
  2. 你正在開發一個應用程序,需要使用 IronPDF 讀取 PDF 文件並傳回字數統計。
  3. 你正在開發一個應用程序,該應用程式使用 IronPDF 從 PDF 文件中提取資料並將其放入結構化資料庫中。
  4. 你正在開發一個應用程序,需要提取 PDF 文字內容並將其轉換為字串。
  5. 在 IronPDF 開發之前,使用 C# 從 PDF 文件中提取資料是一項困難而複雜的任務。

IronPDF 庫概述:該程式庫使開發人員更輕鬆地讀取 PDF 文件。

您可以進一步了解IronPDF 和 Iron 軟體套件產品

只需兩行程式碼,即可讀取 PDF 檔案並將資料顯示在 C# 文字方塊中。 是的,只需要兩行程式碼。 您也可以從 PDF 文件中提取所有圖像。 此外,您可以根據需要使用這些圖像建立另一個文件或將它們顯示在您的應用程式中。

讓我們來向您展示具體操作方法。

我們可以按照應用程式的步驟來選擇任何 PDF 文件,然後顯示其內容。

以下步驟展示如何在 C# 中讀取 PDF 檔案:

先修知識:

  1. 具備 C# 程式設計基礎知識
  2. 具備 C# GUI 控制項的基礎知識

我設計的這個教程,即使是沒有任何程式設計基礎的人也能輕鬆上手。

誰該讀這篇文章?

任何學習 C# 的新手都應該知道如何使用 IronPDF 讀取 PDF 文件,因為這是你未來職業生涯中肯定會使用的技能。

專業開發人員也應該閱讀本文,以便了解 IronPDF 庫,該庫可以幫助我們讀取、產生和操作 PDF 文件。

那麼,我們如何在專案中使用這個函式庫來讀取PDF檔案呢?

我正在使用 Windows 窗體應用程式進行演示。 您可以根據自己的喜好使用控制台應用程式、WPF 應用程式或 ASP.NET Web 應用程式。

IronPDF 庫的另一個主要優點是它可以與 C# 和 VB.NET 一起使用。

讓我們立即開始演示。


步驟 1:建立 Visual Studio 項目

開啟 Visual Studio。 我使用的是 Visual Studio 2019。

點選"建立新項目":

C# 讀取 PDF 檔案:簡易教程,圖 3:建立新項目 建立新專案

現在,從範本中選擇 Windows 窗體應用程序,按"下一步",將出現以下視窗。 請輸入項目名稱。 我寫了一篇題為"使用 IronPDF 讀取 PDF"的文章。

C# 讀取 PDF 檔案:簡易教學課程,圖 16:透過 Visual Studio 設定項目 透過 Visual Studio 設定項目

現在,點擊"下一步",將出現以下視窗。 從下拉式選單中選擇".NET Core 3.1"。

C# 讀取 PDF 檔案:簡易教程,圖 9:.NET Core 3.1 版本 .NET Core 3.1 版本

點擊"建立"按鈕,項目將如下圖所示建立。

C# 讀取 PDF 檔案:簡易教程,圖 6:新 Windows 窗體應用程式的初始階段 新的 Windows 窗體應用程式的初始階段


步驟 2:安裝 IronPDF NuGet 套件

點選選單列中的"項目"選單,將出現一個下拉清單。 選擇"管理 NuGet 套件",然後按一下它。 將出現以下視窗:

C# 讀取 PDF 檔案:簡易教程,圖 1:NuGet 套件管理器 NuGet 套件管理器

現在,點選"瀏覽"。 將出現以下視窗:

C# 讀取 PDF 檔案:簡易教程,圖 2:NuGet 套件管理器使用者介面 NuGet 套件管理器使用者介面

在搜尋框中輸入 IronPdf,然後按下"回車"鍵。 將出現以下視窗:

C# 讀取 PDF 檔案:簡易教程,圖 4:NuGet 解決方案 NuGet 解決方案

選擇並點擊 IronPdf。 將出現以下視窗: C# 讀取 PDF 檔案:簡易教程,圖 7:安裝免費的 IronPdf 安裝免費的 IronPDF

按下"安裝"按鈕,等待安裝完成。 安裝成功後會出現以下視窗:

C# 讀取 PDF 檔案:簡易教程,圖 5:IronPdf for .NET IronPdf for .NET

按下"確定"按鈕,就可以開始了。

注意:還有其他方法可以下載 NuGet 套件。 您也可以使用軟體套件管理器控制台安裝IronPdf ; 為此,請開啟程式包管理員控制台並輸入以下程式碼:

Install-Package IronPdf

您也可以從IronPDF 的 NuGet 套件頁面下載它。

將會開啟以下 Readme.txt 檔案:

C# 讀取 PDF 檔案:簡易教程,圖 12:IronPdf 的自述文件及程式碼範例 IronPdf 的自述文件及程式碼範例

我建議您瀏覽所有鏈接,並探索更多關於此庫的 IronPDF 程式碼範例


步驟 3:設計 Windows 窗體應用程式

專案建立完畢並安裝 NuGet 套件後,下一步是設計 Windows 窗體應用程序,該應用程式會要求使用者瀏覽檔案並顯示其內容。

開放式表單1設計:

C# 讀取 PDF 檔案:簡易教程,圖 14:Form1 設計 UI Form1 設計使用者介面

點選視窗左側的工具列:

C# 讀取 PDF 檔案:簡易教程,圖 15:標籤和文字方塊的工具箱 UI 標籤和文字方塊的工具箱使用者介面

搜尋"標籤",然後將其拖曳到表單設計中。

請說出標籤的名稱。 這裡,我將其命名為"使用 IronPDF 讀取 Pdf 的 C# 文件"。

C# 讀取 PDF 檔案:簡易教程,圖 20:新增了標籤的 Form1 UI 新增了標籤的 Form1 UI

接下來,拖放一個文字方塊(用於顯示文件路徑)、三個按鈕(一個用於瀏覽文件,一個用於使用 IronPDF 讀取 PDF 文件,第三個按鈕用於"清除文字"欄位)和一個 RichTextBox(用於讀取和顯示文件內容)。

將 TextBox 和 RichTextBox 的"唯讀屬性"設定為"False"。 這樣一來,使用者就只能讀取檔案內容和檔案路徑。

C# 讀取 PDF 檔案:簡易教程,圖 10:Form1 完全設計 Form1 完全設計


步驟 4:新增用於瀏覽 PDF 檔案的後端程式碼

雙擊"瀏覽"按鈕,將出現以下視窗:

private void Browse_Click(object sender, EventArgs e)
{
}
private void Browse_Click(object sender, EventArgs e)
{
}
$vbLabelText   $csharpLabel

接下來,在Browse_Click函數中編寫以下程式碼:

private void Browse_Click(object sender, EventArgs e)
{
    // Initialize and configure OpenFileDialog
    OpenFileDialog browseFile = new OpenFileDialog
    {
        InitialDirectory = @"D:\",
        Title = "Browse Pdf Files",
        CheckFileExists = true,
        CheckPathExists = true,
        DefaultExt = "pdf",
        Filter = "pdf files (*.pdf)|*.pdf",
        FilterIndex = 2,
        RestoreDirectory = true,
        ReadOnlyChecked = true,
        ShowReadOnly = true
    };

    // Show the dialog and get result
    if (browseFile.ShowDialog() == DialogResult.OK)
    {
        // Set the text box with the selected file path
        FilePath.Text = browseFile.FileName;
    }
}
private void Browse_Click(object sender, EventArgs e)
{
    // Initialize and configure OpenFileDialog
    OpenFileDialog browseFile = new OpenFileDialog
    {
        InitialDirectory = @"D:\",
        Title = "Browse Pdf Files",
        CheckFileExists = true,
        CheckPathExists = true,
        DefaultExt = "pdf",
        Filter = "pdf files (*.pdf)|*.pdf",
        FilterIndex = 2,
        RestoreDirectory = true,
        ReadOnlyChecked = true,
        ShowReadOnly = true
    };

    // Show the dialog and get result
    if (browseFile.ShowDialog() == DialogResult.OK)
    {
        // Set the text box with the selected file path
        FilePath.Text = browseFile.FileName;
    }
}
$vbLabelText   $csharpLabel

OpenFileDialog會建立一個 Windows 窗體應用程式的檔案對話方塊控制項實例。

我已將初始路徑設為 D 盤;您可以將其設定為任何盤符。

我已將DefaultExt = "pdf"因為我們只需要讀取 PDF 檔案。

我使用了篩選器,這樣瀏覽文件對話框就只會顯示可供選擇的 PDF 文件。

當使用者點擊"確定"時,檔案路徑將顯示在"檔案路徑"欄位中。

讓我們運行該解決方案並測試"瀏覽"按鈕。

C# 讀取 PDF 檔案:簡易教程,圖 10:Form1 使用者介面 Form1 UI

按下"瀏覽"按鈕,將出現以下視窗:

C# 讀取 PDF 檔案:簡易教程,圖 11:瀏覽檔案對話方塊選擇 PDF 文件 在"瀏覽文件"對話方塊中選擇 PDF 文件

選擇檔案(我選擇的是 IronPDFTest.pdf),然後按"開啟"。 將出現以下視窗。

C# 讀取 PDF 檔案:簡易教程,圖 13:C# 中的 PDF 讀取 C# 中的 PDF

現在讓我們編寫"讀取"按鈕背後的程式碼來讀取檔案。


步驟 5:新增使用 IronPDF 讀取 PDF 文件的後端程式碼

你可能會認為讀取 PDF 文件的程式碼會很複雜,難以編寫和理解。

不用擔心。 IronPDF簡化了操作,讓一切變得容易多了。 我們只需兩行程式碼即可輕鬆讀取 PDF 檔案。

轉到 Form1 設計,然後"雙擊""讀取"按鈕。 將出現以下視窗:

private void Read_Click(object sender, EventArgs e)
{
}
private void Read_Click(object sender, EventArgs e)
{
}
$vbLabelText   $csharpLabel

增加一個using IronPdf命名空間來匯入 IronPDF 庫:

using System;
using IronPdf;
using System;
using IronPdf;
$vbLabelText   $csharpLabel

Read_Click函數內部寫入以下程式碼:

private void Read_Click(object sender, EventArgs e)
{
    // Read the PDF file using IronPdf
    using PdfDocument pdf = PdfDocument.FromFile(FilePath.Text);

    // Extract and display the text from the PDF
    FileContent.Text = pdf.ExtractAllText(); 
}
private void Read_Click(object sender, EventArgs e)
{
    // Read the PDF file using IronPdf
    using PdfDocument pdf = PdfDocument.FromFile(FilePath.Text);

    // Extract and display the text from the PDF
    FileContent.Text = pdf.ExtractAllText(); 
}
$vbLabelText   $csharpLabel

FilePath是顯示我們要讀取的 PDF 文件位置的文字欄位的名稱。 我們將動態獲取文件位置。

ExtractAllText 是 IronPDF 的一個函數,它可以從 PDF 頁面中提取所有資料。 然後,這些資料將顯示在富文本框中,並命名為"文件內容"。

接下來,我們來寫"清除按鈕"背後的程式碼。 如果您希望在閱讀 PDF 文件後清除螢幕,這是一個額外的選項。

雙擊"清除按鈕",即可跳到以下程式碼:

void Clear_Click(object sender, EventArgs e)
{
}
void Clear_Click(object sender, EventArgs e)
{
}
$vbLabelText   $csharpLabel

Clear_Click函數內部寫入以下程式碼:

void Clear_Click(object sender, EventArgs e)
{
    // Clear the file path and content display fields
    FileContent.Text = "";
    FilePath.Text = "";
}
void Clear_Click(object sender, EventArgs e)
{
    // Clear the file path and content display fields
    FileContent.Text = "";
    FilePath.Text = "";
}
$vbLabelText   $csharpLabel

運行解決方案

點選"瀏覽"按鈕,選擇您要閱讀的文件。 以IronPDF.pdf文件為例:

C# 讀取 PDF 文件:簡易教程,圖 8:PDF 文檔 PDF文檔

按下"開啟"按鈕,將出現以下視窗:

C# 讀取 PDF 檔案:簡易教程,圖 13:應用程式選取 PDF 文件 應用程式已選擇 PDF 文件

按下"讀取"按鈕。 它將讀取文件並顯示如下所示的內容。

C# 讀取 PDF 檔案:簡易教程,圖 19:顯示 PDF 文字內容 顯示 PDF 文字內容


摘要

這是一個範例解決方案。 無論您的 PDF 檔案有多少頁、多少張圖片或多少文本,IronPDF 都會提取所有文字和圖片供您用於任何用途。 你只需要獲得該庫的許可證即可開始使用。

教程到此結束。 希望您已經了解所有內容,如有任何疑問,請隨時在評論區留言。

您可以下載專案壓縮檔。 如果您想購買 Iron 軟體產品的完整套裝,我們的特別優惠意味著您現在可以以兩個 Lite 授權的價格購買所有產品。

常見問題解答

如何使用 C# 讀取 PDF 檔案中的文字?

您可以使用 IronPDF 透過ExtractAllText方法從 PDF 文件中讀取文本,該方法可讓您輕鬆地從 PDF 文件中提取所有文本內容。

在 C# 中使用 IronPDF 進行 PDF 處理有哪些優點?

IronPDF 提供了一種在 C# 中讀取、產生和操作 PDF 的簡單方法。它允許開發人員用最少的程式碼行完成文字擷取和圖像檢索等任務,從而提高生產力和效率。

如何在我的 C# 專案中安裝 IronPDF 庫?

若要安裝 IronPDF,請使用 Visual Studio 中的 NuGet 套件管理器。只需在套件管理器控制台中搜尋“IronPdf”,然後按一下“安裝”即可將其新增至您的專案。

IronPDF 能否用於從 PDF 文件中提取影像?

是的,IronPDF 提供了從 PDF 文件中提取影像的功能,可讓開發人員存取和操作文件中包含的所有影像。

要設定一個能夠讀取 PDF 檔案的 Visual Studio 項目,需要哪些步驟?

設定項目包括建立一個新的 Visual Studio 項目,安裝 IronPDF NuGet 包,設計一個 Windows 窗體應用程序,以及實現用於瀏覽和讀取 PDF 文件的後端程式碼。

如何確保在讀取 PDF 文件後,我的應用程式中的欄位被清空?

您可以在應用程式中實作一個「清除」按鈕,該按鈕會將文字方塊和富文本方塊的內容重設為空字串,從而確保在處理 PDF 後清除欄位。

是否可以使用 VB.NET 呼叫 IronPDF?

是的,IronPDF 與 C# 和 VB.NET 都相容,對於使用不同 .NET 語言的開發人員來說,它是一個用途廣泛的選擇。

使用 IronPDF 顯示 PDF 內容需要多少行程式碼?

使用 IronPDF,只需兩行程式碼即可顯示 PDF 內容,凸顯了其簡化 PDF 處理任務的能力。

IronPDF 中的 'RenderHtmlAsPdf' 方法用於何種用途?

IronPDF 中的RenderHtmlAsPdf方法用於將 HTML 字串轉換為 PDF 文檔,從而實現將 Web 內容無縫整合到 PDF 文件中。

IronPDF 是否完全相容於 .NET 10?

是的。 IronPDF 完全相容於 .NET 10,以及更早的版本,例如 .NET 6-9、.NET Core、.NET Standard 和 .NET Framework。它支援透過 NuGet 安裝,並且可以在包括 Windows、Linux 和 macOS 在內的多個平台上無縫運行。

柯蒂斯·週
技術撰稿人

Curtis Chau擁有卡爾頓大學電腦科學學士學位,專長於前端開發,精通Node.js、TypeScript、JavaScript和React。他熱衷於打造直覺美觀的使用者介面,喜歡使用現代框架,並擅長撰寫結構清晰、視覺效果出色的使用者手冊。

除了開發工作之外,柯蒂斯對物聯網 (IoT) 也抱有濃厚的興趣,致力於探索硬體和軟體整合的創新方法。閒暇時,他喜歡玩遊戲和製作 Discord 機器人,將他對科技的熱愛與創造力結合。