在實際環境中測試
在生產環境中測試無浮水印。
在任何需要的地方都能運作。
如果您是開發人員,您可能遇到過從 PDF 文件中讀取文本的問題。也許以下一個或多個情況適用於您。
您正在開發一個應用程式,該應用程式以兩個 PDF 文件作為輸入並查找文件之間的相似性。
您正在開發一個需要 閱讀PDF文件 並返回字數。
您正在開發一個應用程式, 從 PDF 檔案中提取數據 並將其放入結構化數據庫中。
IronPDF 是一個使開發者更容易閱讀 PDF 文件的庫。
你可以瞭解更多关于 IronPDF 和 Iron Software 套裝您可以使用僅僅兩行程式碼來讀取 PDF 文件並將數據顯示在 C# 文本框中。是的,僅僅兩行程式碼。您還可以 提取所有圖片 在您的 PDF 文件中。此外,您可以使用這些圖像創建另一個文件,或根據您的需要在應用程式中顯示它們。
讓我們展示一下如何操作。
我們可以逐步進行應用程式,選擇任何 PDF 檔案並顯示其內容。
以下步驟向您展示如何在 C# 中讀取 PDF 檔案:
先決知識:
C# 編程的基本知識
我設計這個教程的方式是,即使是一個沒有編程背景的人也能夠進步。
誰應該閱讀這本書
任何學習C#的新手都應該知道如何 讀取 PDF 文件 因為這是您在職業生涯中絕對會用到的東西。
專業開發者也應該閱讀這篇文章,才能了解IronPDF Library,它幫助我們讀取、生成和操作PDF文件。
現在,我們如何在專案中使用這個Library來讀取PDF文件呢?
我將使用Windows Forms App來示範。您可以根據個人偏好使用Console Application、WPF Application或ASP.NET web application。
IronPDF library的另一個主要優點是它可以與C#和VB.NET一起使用。
讓我們馬上開始示範吧。
打開 Visual Studio。我使用的是 Visual Studio 2019。
點擊「建立新專案」:
建立新專案
現在,從範本中選擇 Windows Forms App,按「下一步」,並且會出現以下視窗。輸入專案名稱。我已經寫了 'Read Pdf using IronPDF'。
通過 Visual Studio 配置項目
現在,點擊「下一步」,以下窗口將出現。從下拉菜單中選擇「.NET Core 3.1」。
.NET Core 3.1 版本
點擊「Create」按鈕,專案將被創建,如下所示。
新的 Windows Forms 應用程式初始階段
從選單列中點擊「專案」選單,會出現下拉清單。選擇「管理 NuGet 套件」,然後點擊它。隨後會出現以下視窗:
NuGet 套件管理器
現在,點擊「瀏覽」。將會出現以下窗口:
NuGet 套件管理工具 UI
在搜索框中輸入 IronPdf,然後按下「Enter」。以下窗口將會出現:
NuGet 解決方案
選擇並點擊 IronPDF。將出現以下窗口:
安裝免費的 IronPDF
按下「安裝」按鈕,等待安裝完成。成功安裝後,將會出現以下視窗:
IronPDF for .NET
按下「確定」按鈕,您就可以開始使用了。
注意:還有其他方式下載NuGet套件。您也可以使用套件管理員控制台安裝IronPdf
;要做到這一點,請打開套件管理員控制台並輸入以下代碼:
Install-Package IronPdf
您還可以在下載 NuGet網站接下來的 Readme.txt 文件將會打開:
IronPdf 的說明文件及程式碼範例
我建議你瀏覽所有的連結並 探索更多代碼範例 關於此庫。
一旦建立專案並安裝 NuGet 套件後,下一步是設計一個 Windows Forms 應用程式,要求使用者瀏覽一個檔案並顯示其內容。
打開 Form1 設計:
Form1 設計 UI
點擊在視窗左側的工具欄:
工具箱用於標籤和文字框的用戶界面
搜尋標籤,並將其拖放到表單設計中
命名標籤。在這裡,我把它命名為 "C# Read Pdf using IronPDF"。
Form1 使用者介面,新增標籤
接著,拖曳並放入一個文字框 (顯示文件路徑),三個按鈕 (一個用於瀏覽文件,一個用於使用IronPDF閱讀PDF文件,第三個按鈕用於“清除文本”字段), 以及一個RichTextBox (閱讀及顯示檔案內容)將 TextBox 和 RichTextBox 的「唯讀屬性」設置為「False」。這樣用戶只能讀取內容和檔案路徑。
Form1 完全設計
雙擊「瀏覽」按鈕,出現以下視窗:
private void Browse_Click(object sender, EventArgs e)
{
}
private void Browse_Click(object sender, EventArgs e)
{
}
Private Sub Browse_Click(ByVal sender As Object, ByVal e As EventArgs)
End Sub
接下來,在 Browse_Click 函數中寫入以下程式碼:
private void Browse_Click(object sender, EventArgs e)
{
OpenFileDialog browseFile = new OpenFileDialog
{
InitialDirectory = @"D:\",
Title = "Browse Pdf Files",
CheckFileExists = true,
CheckPathExists = true,
DefaultExt = "pdf",
Filter = "pdf files (*.pdf)
*.pdf",
FilterIndex = 2,
RestoreDirectory = true,
ReadOnlyChecked = true,
ShowReadOnly = true
};
if (browseFile.ShowDialog() == DialogResult.OK)
{
FilePath.Text = browseFile.FileName;
}
}
private void Browse_Click(object sender, EventArgs e)
{
OpenFileDialog browseFile = new OpenFileDialog
{
InitialDirectory = @"D:\",
Title = "Browse Pdf Files",
CheckFileExists = true,
CheckPathExists = true,
DefaultExt = "pdf",
Filter = "pdf files (*.pdf)
*.pdf",
FilterIndex = 2,
RestoreDirectory = true,
ReadOnlyChecked = true,
ShowReadOnly = true
};
if (browseFile.ShowDialog() == DialogResult.OK)
{
FilePath.Text = browseFile.FileName;
}
}
Private Sub Browse_Click(ByVal sender As Object, ByVal e As EventArgs)
Dim browseFile As New OpenFileDialog With {
.InitialDirectory = "D:\",
.Title = "Browse Pdf Files",
.CheckFileExists = True,
.CheckPathExists = True,
.DefaultExt = "pdf",
.Filter = "pdf files (*.pdf) *.pdf",
.FilterIndex = 2,
.RestoreDirectory = True,
.ReadOnlyChecked = True,
.ShowReadOnly = True
}
If browseFile.ShowDialog() = DialogResult.OK Then
FilePath.Text = browseFile.FileName
End If
End Sub
OpenFileDialogue
將建立 Windows Forms App 的文件對話控制項實例。
我已將初始路徑設置為 D 驅動器;你可以設置為任何路徑。
我已將 DefaultExt = "pdf"
設置為我們只需要讀取 PDF 文件。
我已使用過濾器,這樣瀏覽文件對話框僅會顯示 PDF 文件以供選擇。
當用戶點擊 "Ok" 時,它將在文件路徑欄顯示文件路徑。
讓我們運行解決方案並測試 "Browse" 按鈕。
Form1 使用者介面
按下「瀏覽」按鈕,以下視窗將出現:
瀏覽文件對話框以選擇PDF文件
選擇文件 (我正在選擇IronPDFTest.pdf) 按「打開」。將會出現以下視窗。
PDF in C#
現在讓我們編寫“讀取”按鈕後面的代碼來讀取文件。
您可能會覺得讀取 PDF 文件的程式碼會很複雜且難以撰寫和理解。
不用擔心。IronPDF 已經簡化所有程式,使所有事情變得簡單得多。只需要兩行程式碼,我們就能輕鬆讀取 PDF 檔案。
轉到 Form1 設計並“雙擊” "讀取" 按鈕。接著將會出現以下視窗:
private void Read_Click(object sender, EventArgs e)
{
}
private void Read_Click(object sender, EventArgs e)
{
}
Private Sub Read_Click(ByVal sender As Object, ByVal e As EventArgs)
End Sub
添加命名空间 using IronPdf
以导入 IronPDF 库:
using System;
using IronPdf;
using System;
using IronPdf;
Imports System
Imports IronPdf
在 Read_Click
函數內編寫以下代碼:
private void Read_Click(object sender, EventArgs e)
{
using PdfDocument pdf = PdfDocument.FromFile(FilePath.Text);
FileContent.Text = pdf.ExtractAllText();
}
private void Read_Click(object sender, EventArgs e)
{
using PdfDocument pdf = PdfDocument.FromFile(FilePath.Text);
FileContent.Text = pdf.ExtractAllText();
}
Private Sub Read_Click(ByVal sender As Object, ByVal e As EventArgs)
Using pdf As PdfDocument = PdfDocument.FromFile(FilePath.Text)
FileContent.Text = pdf.ExtractAllText()
End Using
End Sub
FilePath
是顯示我們想要讀取的 PDF 文件位置的文字欄位名稱。我們將動態獲取文件的位置。
提取所有文本 IronPDF
是一個功能,可以從 PDF 頁面中提取所有數據。這些數據將顯示在富文本框中,並命名為 "File Content"。
接下來,我們來編寫 "清除按鈕" 的後端代碼。如果您希望在閱讀完 PDF 文件後清除屏幕,這只是額外的項目。
雙擊 "清除按鈕",它會將您帶到以下代碼:
void Clear_Click(object sender, EventArgs e)
{
}
void Clear_Click(object sender, EventArgs e)
{
}
Private Sub Clear_Click(ByVal sender As Object, ByVal e As EventArgs)
End Sub
將以下程式碼寫入 Clear_Click
函數中:
void Clear_Click(object sender, EventArgs e)
{
FileContent.Text = "";
FilePath.Text = "";
}
void Clear_Click(object sender, EventArgs e)
{
FileContent.Text = "";
FilePath.Text = "";
}
Private Sub Clear_Click(ByVal sender As Object, ByVal e As EventArgs)
FileContent.Text = ""
FilePath.Text = ""
End Sub
點擊「瀏覽」按鈕並選擇您想要閱讀的文件。在此例中,我正在閱讀 IronPDF.pdf 文件:
PDF 文件
按下「開啟」按鈕後,將會出現以下視窗:
附帶選定 PDF 文件的應用程式
按下“讀取”按鈕。它將讀取文件並顯示如下內容。
顯示 PDF 文本內容
這是一個範例解決方案。無論您的PDF文件中有多少頁面、圖像或文字,IronPDF都會為您提取所有文字和圖像,以便您用於任何目的。您只需獲取該庫的許可並開始使用即可。
本教程到此結束。希望您已經了解所有內容,若有任何疑問,請隨時在評論區留言。
您可以下載 專案 zip 檔案. 如果您希望購買完整的 Iron 軟體產品包,我們的特別優惠意味著您現在可以以兩個產品的價格購買所有產品。如果您需要有關許可和支援的更多詳細資訊,請點擊 此定價頁面. 您也可以獲得 免費試用許可