使用 IRONPDF

如何在 C# 中讀取 PDF 檔案

已更新 2024年3月24日
分享:

本文將使用 IronPDF for .NET,一個用於閱讀PDF檔案的C# PDF庫。

如何使用 IronPDF 讀取 PDF 文件

  1. 如果尚未完成,請下載 Visual Studio。設定環境並安裝 IronPDF 庫。
  2. 使用 PdfDocument.FromFile 開啟並加載所需 PDF 文件的方法。

  3. 使用 IronPDF 的ExtractAllText方法來檢索內容。

  4. 根據需要分析或操作提取的文字。

  5. 在控制台打印提取的文字以閱讀。

IronPDF

IronPDF, 一個強大的 C# PDF 閱讀器庫,能夠讓開發者輕鬆地處理 PDF 文件。IronPDF 擁有豐富的功能和強大的能力,使得 PDF 文件處理變得簡單,讓使用者可以輕鬆地讀取、提取和操作 PDF 內容。不論是自動化文件處理、提取數據和圖像進行分析,還是從頭創建 PDF 文件,IronPDF 都提供了一整套工具來簡化這些任務。

這篇文章探討了使用 C# 進行高效 PDF 處理的世界 IronPDF,展示了它作為開發人員在軟體開發過程中的基本工具的多功能性和價值。

建立一個新的 Visual Studio 專案

在進入程式碼部分之前,我們先從設定一個全新的 Visual Studio C# 控制台應用程序項目。這個項目將作為開發和實踐範例的專門工作區。

  1. 要開始這個過程,請啟動 Visual Studio,並通過導航到 "文件" 菜單,選擇 "新建",然後選擇 "項目" 來創建新項目。

如何在 C# 中讀取 PDF 檔案,圖 1:前往 Visual Studio 中的建立專案對話框

導航到 Visual Studio 中的建立專案對話框

  1. 此操作將彈出一個新視窗,為您提供指定專案範本的機會。為了簡化過程,選擇「主控台應用程式」範本,然後點擊視窗左下角的 下一步 按鈕繼續。

如何在C#中讀取PDF文件,圖2:在Visual Studio中創建一個新項目

在 Visual Studio 中創建新專案

  1. 在隨後的窗口中,您將被提示為您的專案指定一個名稱並指定所需的專案位置。將這些詳細信息設置好後,點擊下一步按鈕繼續。

如何在 C# 中讀取 PDF 文件,圖 3:配置專案

配置專案

  1. 在此步驟中,選擇您首選的目標框架,並通過點擊 創建 按鈕來完成專案創建過程。

如何在C#中讀取PDF文件,圖4:.NET Framework選擇

.NET 框架選擇

隨著您的專案現在已經穩固建立,下一個關鍵步驟涉及安裝 IronPDF.

安裝 IronPDF

IronPDF 提供了多種下載和安裝PDF庫的選項。為了這個指南,我們將專注於使用NuGet包管理器來安裝IronPDF,這是一種高效且廣泛採用的方法。

  1. 在Visual Studio中,導航到"工具"菜單,然後優雅地將游標懸停在"NuGet包管理器"選項上。

  2. 從展開的菜單中選擇"解決方案的NuGet包管理器"。

如何在C#中讀取PDF檔案,圖5:導航到NuGet套件管理器

導航至 NuGet 套件管理員

  1. 選擇此選項後,將會開啟一個新視窗。在此精簡視窗中,導航到「瀏覽」選單,並在搜尋欄輸入「IronPDF」。

  2. 螢幕將顯示可用的 IronPDF 套件。要繼續,從列表中選擇最新的套件,並點擊「安裝」選項來執行此操作。

如何在 C# 中读取 PDF 文件,圖 6:在 NuGet 套件管理器介面中搜尋並安裝 IronPdf 套件

在 NuGet 套件管理器用戶界面中搜尋並安裝 IronPDF 套件

對於偏好命令行方式的人來說,NuGet 套件管理器控制台提供了一個優雅的途徑。只需打開此控制台,輸入以下命令,然後按“Enter”鍵:

Install-Package IronPdf

您還可以選擇直接從 NuGet網站 連結

使用 IronPDF 讀取 PDF 文件

本節將展示如何使用 C# 編程語言並通過 IronPDF 打開和讀取完整的 PDF 文件。

using IronPdf;
using System;

IronPdf.License.LicenseKey = "";
//raw text string path
var pdf = PdfDocument.FromFile("document_scaled_compressed.pdf");

string text = pdf.ExtractAllText();

Console.WriteLine(text);
using IronPdf;
using System;

IronPdf.License.LicenseKey = "";
//raw text string path
var pdf = PdfDocument.FromFile("document_scaled_compressed.pdf");

string text = pdf.ExtractAllText();

Console.WriteLine(text);
Imports IronPdf
Imports System

IronPdf.License.LicenseKey = ""
'raw text string path
Dim pdf = PdfDocument.FromFile("document_scaled_compressed.pdf")

Dim text As String = pdf.ExtractAllText()

Console.WriteLine(text)
VB   C#

1. 引入必要的庫

要開始,您需要導入所需的命名空間。在上述範例代碼中,導入了 IronPdf 命名空間,該命名空間包含處理 PDF 的基本功能。另外,還導入了 System 命名空間以進行一般系統級操作。

using IronPdf;
using System;
using IronPdf;
using System;
Imports IronPdf
Imports System
VB   C#

2. 設定 IronPDF 授權金鑰

IronPDF 需要有效的授權金鑰才能在生產環境中使用。在代碼範例中,有一行應設置授權金鑰。然而,在您提供的代碼中,授權金鑰被留空了""。確保在生產環境中使用時,將空字串替換為IronPDF提供的有效授權金鑰。

IronPdf.License.LicenseKey = "Your_License_Key_Here";
IronPdf.License.LicenseKey = "Your_License_Key_Here";
IronPdf.License.LicenseKey = "Your_License_Key_Here"
VB   C#

3. 加載 PDF 文檔

接下來的步驟是加載並解析 PDF 文件。在提供的代碼中,使用 PdfDocument.FromFile 方法根據文件名 "document_scaled_compressed.pdf" 加載 PDF,並將其賦值給 pdf 變量。此 PDF 文件將用於文本提取。

var pdf = PdfDocument.FromFile("document_scaled_compressed.pdf");
var pdf = PdfDocument.FromFile("document_scaled_compressed.pdf");
Dim pdf = PdfDocument.FromFile("document_scaled_compressed.pdf")
VB   C#

4. 從PDF文件中提取文字

IronPDF提供了一種簡單的方法來從載入的PDF文件中提取文字。 提取所有文字 此方法可以從PDF的每一頁提取所有文本內容,並將其存儲在名為text字符串變量中,該變量用來將PDF轉換為文本。

string text = pdf.ExtractAllText();
string text = pdf.ExtractAllText();
Dim text As String = pdf.ExtractAllText()
VB   C#

5. 顯示提取的文本

最後一步是顯示提取的文本。在代碼中,Console.WriteLine 將打印並將提取的文本寫入控制台。這是一個用於調試或向用戶呈現文本的有用方法。

Console.WriteLine(text);
Console.WriteLine(text);
Console.WriteLine(text)
VB   C#

從 PDF 文件中提取的文本输出

如何在C#中讀取PDF文件,圖7:從PDF文件中提取的文本

從 PDF 文件中提取的文字

結論

本文指導開發人員如何在 C# 中有效地處理 PDF 文件,使用 IronPDF。 IronPDF 庫。 它首先說明了專用 Visual Studio 專案的設置,並通過 NuGet 套件管理器進行了簡單的 IronPDF 安裝。文章隨後提供了逐步說明,描述如何導入必要的庫、設置 IronPDF 註冊金鑰、載入 PDF 文件、提取文本內容以及顯示所有頁面中提取的文本。您還可以使用 C# 將提取的文本保存到 TXT 文件中。

其用戶友好的方法和全面的功能, IronPDF 作為自動化文件處理、數據提取和從 HTML、URL 及圖像創建 PDF 的必備工具,成為提升處理 C# 中 PDF 文件的軟件開發項目的寶貴資產。

完整文章《使用 中讀取 PDF 文件》 IronPDF 可以在以下位置找到 操作指南頁面. 範例代碼在 C# PDF閱讀器 也可用。如需更多使用IronPDF的程式碼範例,請訪問此 範例頁面. IronPDF 也提供了廣泛的文件,以回答所有開發者的問題並提供全面的實踐支援。IronPDF 提供免費 試用授權 讓用戶在決定購買前,可以探索其全部功能 永久授權.

< 上一頁
如何在 C# 中添加 PDF Stamper
下一個 >
如何在 .NET 庫中壓縮 PDF 檔案

準備開始了嗎? 版本: 2024.9 剛剛發布

免費 NuGet 下載 總下載次數: 10,746,704 查看許可證 >