跳過到頁腳內容
使用IRONPDF

C#讀取PDF文件:簡單教程

如果您是開發人員,您可能遇到過從 PDF 文件中讀取文字時遇到的問題。以下一種或多種情況可能與您有關:

  1. 你正在開發一個應用程序,該應用程式接受兩個 PDF 文件作為輸入,並找出這兩個文件之間的相似之處。
  2. 你正在開發一個應用程序,需要使用IronPDF讀取 PDF 文件並傳回字數統計。
  3. 你正在開發一個應用程序,該應用程式使用IronPDF從 PDF 文件中提取資料並將其放入結構化資料庫中。
  4. 你正在開發一個應用程序,需要提取 PDF 文字內容並將其轉換為字串。
  5. 在IronPDF開發之前,使用 C# 從 PDF 文件中提取資料是一項困難而複雜的任務。

IronPDF庫概述:該程式庫使開發人員能夠更輕鬆地讀取 PDF 文件。

您可以進一步了解IronPDF和Iron Software套件產品

只需兩行程式碼,即可讀取 PDF 檔案並將資料顯示在 C# 文字方塊中。 是的,只需要兩行程式碼。 您也可以從 PDF 文件中提取所有圖像。 此外,您可以根據需要使用這些圖像建立另一個文件或將它們顯示在您的應用程式中。

讓我們來向您展示具體操作方法。

我們可以按照應用程式的步驟來選擇任何 PDF 文件,然後顯示其內容。

以下步驟展示如何在 C# 中讀取 PDF 檔案:

先修知識:

  1. 具備 C# 程式設計基礎知識
  2. 具備 C# GUI 控制項的基礎知識

我設計的這個教程,即使是沒有任何程式設計基礎的人也能輕鬆上手。

誰該讀這篇文章?

任何學習 C# 的新手都應該知道如何使用IronPDF讀取 PDF 文件,因為這是你未來職業生涯中肯定會用到的技能。

專業開發人員也應該閱讀本文,以便了解IronPDF庫,該庫可以幫助我們讀取、產生和操作 PDF 文件。

那麼,我們如何在專案中使用這個函式庫來讀取PDF檔案呢?

我正在使用 Windows 窗體應用程式進行演示。 您可以根據自己的喜好使用控制台應用程式、WPF 應用程式或ASP.NET Web 應用程式。

IronPDF庫的另一個主要優點是它可以搭配 C# 和.NET。

讓我們立即開始演示。


Step #1: Create a Visual Studio Project

開啟 Visual Studio。 我使用的是 Visual Studio 2019。

點選"建立新項目":

C# 讀取 PDF 檔案:簡易教程,圖 3:建立新專案 建立新專案

現在,從範本中選擇 Windows 窗體應用程序,按"下一步",將出現以下視窗。 請輸入項目名稱。 我寫了一篇題為"使用IronPDF讀取 Pdf"的文章。

C# 讀取 PDF 檔案:簡易教學,圖 16:透過 Visual Studio 設定專案 透過 Visual Studio 設定項目

現在,點擊"下一步",將出現以下視窗。 從下拉式選單中選擇".NET Core 3.1"。

C# 讀取 PDF 檔案:簡易教程,圖 9: .NET Core 3.1 版本 .NET Core 3.1 版本

點擊"建立"按鈕,項目將如下圖所示建立。

C# 讀取 PDF 檔案:簡易教程,圖 6:新建 Windows 窗體應用程式的初始階段 新的 Windows 窗體應用程式的初始階段


Step #2: Install the IronPDF NuGet Package

點選選單列中的"項目"選單,將出現一個下拉清單。 選擇"管理NuGet程式包",然後按一下它。 將出現以下視窗:

C# 讀取 PDF 檔案:簡易教程,圖 1: NuGet套件管理器 NuGet套件管理器

現在,點選"瀏覽"。 將出現以下視窗:

C# 讀取 PDF 檔案:簡易教程,圖 2: NuGet套件管理器 UI NuGet套件管理器使用者介面

在搜尋框中輸入IronPDF ,然後按下"回車"鍵。 將出現以下視窗:

C# 讀取 PDF 檔案:簡易教程,圖 4: NuGet解決方案 NuGet解決方案

選擇並點選IronPDF。 將出現以下視窗: C# 讀取 PDF 檔案:簡易教程,圖 7:安裝免費的IronPDF 安裝免費的IronPDF

按下"安裝"按鈕,等待安裝完成。 安裝成功後,將出現以下視窗:

C# 讀取 PDF 檔案:簡易教程,圖 5: IronPDF for .NET IronPDF for .NET

按下"確定"按鈕,就可以開始了。

注意:還有其他方法可以下載NuGet套件。 您也可以使用軟體套件管理器控制台安裝 IronPdf; 為此,請開啟程式包管理員控制台並輸入以下程式碼:

Install-Package IronPdf

您也可以從IronPDF的NuGet套件頁面下載它。

將會開啟以下 Readme.txt 檔案:

C# 讀取 PDF 檔案:簡易教程,圖 12:IronPdf 的 readme 檔案及程式碼範例 IronPdf 的自述文件及程式碼範例

我建議您瀏覽所有鏈接,並探索更多關於此庫的IronPDF程式碼範例


Step #3: Design a Windows Forms App

專案創建完畢並安裝NuGet套件後,下一步是設計一個 Windows 窗體應用程序,該應用程式會要求使用者瀏覽文件並顯示其內容。

開放式表單1設計:

C# 讀取 PDF 檔案:簡易教程,圖 14:Form1 設計 UI Form1 設計使用者介面

點選視窗左側的工具列:

C# 讀取 PDF 檔案:簡易教程,圖 15:標籤和文字方塊的工具箱 UI 標籤和文字方塊的工具箱使用者介面

搜尋"標籤",然後將其拖曳到表單設計中。

請說出標籤的名稱。 這裡,我將其命名為"使用IronPDF讀取 Pdf 的 C# 版本"。

C# 讀取 PDF 檔案:簡易教程,圖 20:新增了標籤的 Form1 UI 新增了標籤的 Form1 UI

接下來,拖放一個文字方塊(用於顯示文件路徑)、三個按鈕(一個用於瀏覽文件,一個用於使用IronPDF讀取 PDF 文件,第三個按鈕用於"清除文字"欄位)和一個 RichTextBox(用於讀取和顯示文件內容)。

將 TextBox 和 RichTextBox 的"唯讀屬性"設定為"False"。 這樣一來,使用者就只能讀取檔案內容和檔案路徑。

C# 讀取 PDF 檔案:簡易教程,圖 10:Form1 完全設計 Form1 完全設計


Step #4: Add the Back-end Code for Browsing PDF Files

雙擊"瀏覽"按鈕,將出現以下視窗:

private void Browse_Click(object sender, EventArgs e)
{
}
private void Browse_Click(object sender, EventArgs e)
{
}
$vbLabelText   $csharpLabel

接下來,在 Browse_Click 函數中編寫以下程式碼:

private void Browse_Click(object sender, EventArgs e)
{
    // Initialize and configure OpenFileDialog
    OpenFileDialog browseFile = new OpenFileDialog
    {
        InitialDirectory = @"D:\",
        Title = "Browse Pdf Files",
        CheckFileExists = true,
        CheckPathExists = true,
        DefaultExt = "pdf",
        Filter = "pdf files (*.pdf)|*.pdf",
        FilterIndex = 2,
        RestoreDirectory = true,
        ReadOnlyChecked = true,
        ShowReadOnly = true
    };

    // Show the dialog and get result
    if (browseFile.ShowDialog() == DialogResult.OK)
    {
        // Set the text box with the selected file path
        FilePath.Text = browseFile.FileName;
    }
}
private void Browse_Click(object sender, EventArgs e)
{
    // Initialize and configure OpenFileDialog
    OpenFileDialog browseFile = new OpenFileDialog
    {
        InitialDirectory = @"D:\",
        Title = "Browse Pdf Files",
        CheckFileExists = true,
        CheckPathExists = true,
        DefaultExt = "pdf",
        Filter = "pdf files (*.pdf)|*.pdf",
        FilterIndex = 2,
        RestoreDirectory = true,
        ReadOnlyChecked = true,
        ShowReadOnly = true
    };

    // Show the dialog and get result
    if (browseFile.ShowDialog() == DialogResult.OK)
    {
        // Set the text box with the selected file path
        FilePath.Text = browseFile.FileName;
    }
}
$vbLabelText   $csharpLabel

OpenFileDialog 建立 Windows 窗體應用程式的檔案對話方塊控制項實例。

我已將初始路徑設為 D 盤;您可以將其設定為任何盤符。

我已經設定了 DefaultExt = "pdf",因為我們只需要讀取 PDF 檔案。

我使用了篩選器,這樣瀏覽文件對話框就只會顯示可供選擇的 PDF 文件。

當使用者點擊"確定"時,檔案路徑將顯示在"檔案路徑"欄位中。

讓我們運行該解決方案並測試"瀏覽"按鈕。

C# 讀取 PDF 檔案:簡易教程,圖 10:Form1 使用者介面 Form1 使用者介面

按下"瀏覽"按鈕,將出現以下視窗:

C# 讀取 PDF 文件:簡易教程,圖 11:瀏覽文件對話框選擇 PDF 文件 在"瀏覽文件"對話方塊中選擇 PDF 文件

選擇檔案(我選擇的是 IronPDFTest.pdf),然後按"開啟"。 將出現以下視窗。

C# 讀取 PDF 檔案:簡易教程,圖 13:C# 中的 PDF C# 中的 PDF

現在讓我們編寫"讀取"按鈕背後的程式碼來讀取檔案。


Step #5: Add the Back-end Code for Reading PDF Documents using IronPDF

你可能會認為讀取 PDF 文件的程式碼會很複雜,難以編寫和理解。

不用擔心。 IronPDF簡化了操作,讓一切變得容易多了。 我們只需兩行程式碼即可輕鬆讀取 PDF 檔案。

轉到 Form1 設計,然後"雙擊""讀取"按鈕。 將出現以下視窗:

private void Read_Click(object sender, EventArgs e)
{
}
private void Read_Click(object sender, EventArgs e)
{
}
$vbLabelText   $csharpLabel

新增命名空間 using IronPdf 以匯入IronPDF庫:

using System;
using IronPdf;
using System;
using IronPdf;
$vbLabelText   $csharpLabel

Read_Click 函數內部寫入以下程式碼:

private void Read_Click(object sender, EventArgs e)
{
    // Read the PDF file using IronPdf
    using PdfDocument pdf = PdfDocument.FromFile(FilePath.Text);

    // Extract and display the text from the PDF
    FileContent.Text = pdf.ExtractAllText(); 
}
private void Read_Click(object sender, EventArgs e)
{
    // Read the PDF file using IronPdf
    using PdfDocument pdf = PdfDocument.FromFile(FilePath.Text);

    // Extract and display the text from the PDF
    FileContent.Text = pdf.ExtractAllText(); 
}
$vbLabelText   $csharpLabel

FilePath 是顯示我們要閱讀的 PDF 文件位置的文字欄位的名稱。 我們將動態獲取文件位置。

IronPDF是IronPDF的一個函數,它可以從 PDF 頁面中提取所有資料。 然後,這些資料將顯示在富文本框中,並命名為"文件內容"。

接下來,我們來寫"清除按鈕"背後的程式碼。 如果您希望在閱讀 PDF 文件後清除螢幕,這是一個額外的選項。

雙擊"清除按鈕",即可跳到以下程式碼:

void Clear_Click(object sender, EventArgs e)
{
}
void Clear_Click(object sender, EventArgs e)
{
}
$vbLabelText   $csharpLabel

Clear_Click 函數內部寫入以下程式碼:

void Clear_Click(object sender, EventArgs e)
{
    // Clear the file path and content display fields
    FileContent.Text = "";
    FilePath.Text = "";
}
void Clear_Click(object sender, EventArgs e)
{
    // Clear the file path and content display fields
    FileContent.Text = "";
    FilePath.Text = "";
}
$vbLabelText   $csharpLabel

運行解決方案

點選"瀏覽"按鈕,選擇您要閱讀的文件。 以IronPDF.pdf檔為例:

C# 讀取 PDF 檔案:簡易教程,圖 8:PDF 文件 PDF文檔

按下"開啟"按鈕,將出現以下視窗:

C# 讀取 PDF 檔案:簡易教程,圖 13:應用程式已選取 PDF 檔案 應用程式已選擇 PDF 文件

按下"讀取"按鈕。 它將讀取文件並顯示如下所示的內容。

C# 讀取 PDF 檔案:簡易教程,圖 19:顯示 PDF 文字內容 顯示 PDF 文字內容


概括

這是一個範例解決方案。 無論您的 PDF 檔案有多少頁、多少張圖片或多少文本, IronPDF都會提取所有文字和圖片供您用於任何用途。 你只需要獲得該庫的許可證即可開始使用。

教程到此結束。 希望您已經了解所有內容,如有任何疑問,請隨時在評論區留言。

您可以下載專案壓縮檔。 如果您想購買Iron Software產品的完整套裝,我們的特別優惠意味著您現在可以以兩個 Lite 授權的價格購買所有產品。

常見問題解答

我如何使用 C# 從 PDF 文件中讀取文本?

您可以使用 IronPDF 的 ExtractAllText 方法從 PDF 文件中讀取文本,這使您可以輕鬆提取 PDF 文件中的所有文本內容。

在 C# 中使用 IronPDF 進行 PDF 操作的優勢是什么?

IronPDF 提供一種簡單的方法來在 C# 中讀取、生成和處理 PDF。它允許開發者完成文本提取和圖像檢索等操作,並且只需極少的程式碼行,提高了生產力和效率。

如何在我的 C# 專案中安裝 IronPDF 庫?

要安裝 IronPDF,請在 Visual Studio 中使用 NuGet 套件管理器。在包管理控制台中搜索 'IronPDF',然後單擊 'Install' 將其包括在專案中。

可以使用 IronPDF 從 PDF 文件中提取圖像嗎?

是的,IronPDF 提供從 PDF 文件中提取圖像的功能,允許開發者訪問和處理文檔中包含的所有圖像。

設置 Visual Studio 專案以讀取 PDF 文件涉及哪些步驟?

設置專案包括創建一個新的 Visual Studio 專案,安裝 IronPDF NuGet 套件,設計 Windows Forms App,並實現後端代碼以瀏覽和閱讀 PDF 文件。

如何確保我的應用程序中的字段在閱讀 PDF 之後被清除?

您可以在應用程序中實施 'Clear' 按鈕,將 TextBox 和 RichTextBox 的內容重置為空字串,確保字段在處理 PDF 後被清除。

是否可以在 VB.NET 中使用 IronPDF?

是的,IronPDF 與 C# 和 VB.NET 兼容,這使其成為不同 .NET 語言的開發者的一個多功能選擇。

使用 IronPDF 顯示 PDF 內容需要多少行代碼?

您可以用僅兩行代碼顯示 PDF 內容,這突顯出其簡化 PDF 處理任務的能力。

IronPDF 中的 'RenderHtmlAsPdf' 方法用於什麼?

IronPDF 中的 RenderHtmlAsPdf 方法用於將 HTML 字符串轉換為 PDF 文檔,允許將網頁內容無縫集成到 PDF 文件中。

IronPDF 是否與 .NET 10 完全相容?

是的。IronPDF的設計完全符合與.NET 10的兼容性,包括較早的版本如.NET 6-9、.NET Core、.NET Standard和.NET Framework。它支持通過NuGet安裝,並無縫運行於多個平台,如Windows、Linux和macOS。

Curtis Chau
技術作家

Curtis Chau 擁有卡爾頓大學計算機科學學士學位,專注於前端開發,擅長於 Node.js、TypeScript、JavaScript 和 React。Curtis 熱衷於創建直觀且美觀的用戶界面,喜歡使用現代框架並打造結構良好、視覺吸引人的手冊。

除了開發之外,Curtis 對物聯網 (IoT) 有著濃厚的興趣,探索將硬體和軟體結合的創新方式。在閒暇時間,他喜愛遊戲並構建 Discord 機器人,結合科技與創意的樂趣。

Iron Support Team

We're online 24 hours, 5 days a week.
Chat
Email
Call Me