使用 IRONPDF

如何在 C# 中讀取 PDF 檔案

已更新 2024年3月24日
分享:

本文將使用IronPDFfor .NET,一個用於閱讀PDF檔案的C# PDF庫。

如何使用 IronPDF 讀取 PDF 檔案

  1. 如果尚未完成,請下載 Visual Studio。 設置環境並安裝IronPDF庫。

  2. 使用PdfDocument.FromFile開啟和載入所需 PDF 檔案的方法。

  3. 利用 IronPDF 的 ExtractAllText 方法來擷取內容。

  4. 根據需要分析或操作提取的文本。

  5. 在控制台中打印提取的文本以供閱讀。

IronPDF

IronPDF,這是一個強大的 C# PDF 閱讀器庫,使開發人員能夠輕鬆處理 PDF 文件。 IronPDF 擁有豐富的功能和能力,簡化了 PDF 文件處理的任務,使用戶能夠輕鬆讀取、提取和操作 PDF 內容。 無論您是自動化文件處理、提取數據和圖像進行分析,或是從頭開始創建 PDF,IronPDF 都提供了一套全面的工具來簡化這些任務。

本文探討使用 C# 進行高效 PDF 處理的世界,特別是在IronPDF,展示了它作為開發人員在軟體開發過程中的基本工具的多功能性和價值。

建立新的 Visual Studio 專案

在深入研究編碼方面之前,讓我們先開始建立一個新的Visual StudioC# 主控台應用程式專案。 此專案將作為開發和實際範例的專用工作區。

  1. 要開始此過程,請啟動 Visual Studio 並透過導航到「檔案」選單,選擇「新增」,然後選擇「專案」,來建立一個新專案。

    如何在 C# 中讀取 PDF 檔案,圖 1:前往 Visual Studio 中的建立專案對話框

    導覽至 Visual Studio 的建立專案對話框

  2. 此操作將彈出一個新視窗,提供您指定專案模板的機會。 為了簡化目的,選擇「Console Application」模板,然後單擊位於視窗左下角的 Next 按鈕繼續。

    如何在C#中讀取PDF文件,圖2:在Visual Studio中創建一個新項目

    在 Visual Studio 中創建一個新專案

  3. 在接下來的視窗中,您將被要求為您的專案指定名稱並指定所需的專案位置。 確認這些細節後,點擊 下一步 按鈕繼續。

    如何在 C# 中讀取 PDF 文件,圖 3:配置專案

    配置專案

  4. 在此步驟中,選擇您偏好的目標框架,然後點擊建立按鈕完成專案創建過程。

    如何在C#中讀取PDF文件,圖4:.NET Framework選擇

    .NET Framework 選擇

    現在您的專案已經牢固建立,接下來的重要步驟涉及安裝IronPDF.

安裝 IronPDF

IronPDF提供了多種下載和安裝PDF庫的選項。 在本指南中,重點將放在使用 NuGet 套件管理員來安裝 IronPDF,這是一種高效且被廣泛採用的方法。

  1. 在 Visual Studio 中,導航到 "工具" 菜單,優雅地將游標懸停在 "NuGet 套件管理器" 選項上。

  2. 從擴展選單中,選擇「NuGet 套件管理員 (解決方案)」。

    如何在C#中讀取PDF檔案,圖5:導航到NuGet套件管理器

    導航到 NuGet 套件管理員

  3. 選擇此選項後,將會開啟一個新窗口。 在此精選視窗中,導航至「瀏覽」選單,然後在搜索欄中輸入「IronPDF」。

  4. 然後螢幕將顯示可用的 IronPDF 套件。 要繼續,請從列表中選擇最新的套件,然後點擊“安裝”選項執行此選擇。

    如何在 C# 中读取 PDF 文件,圖 6:在 NuGet 套件管理器介面中搜尋並安裝 IronPdf 套件

    在 NuGet 套件管理器 UI 中搜尋並安裝 IronPdf 套件

    對於那些更喜歡命令行方法的人,NuGet 套件管理器控制台提供了一個優雅的途徑。 只需打開此控制台,輸入以下命令,然後按「Enter」鍵:

Install-Package IronPdf

您還可以選擇直接從NuGet網站連結

使用 IronPDF 讀取 PDF 文件

本節將展示如何使用 C# 編程語言和 IronPDF 來開啟和讀取完整的 PDF 文件。

using IronPdf;
using System;

IronPdf.License.LicenseKey = "";
//raw text string path
var pdf = PdfDocument.FromFile("document_scaled_compressed.pdf");

string text = pdf.ExtractAllText();

Console.WriteLine(text);
using IronPdf;
using System;

IronPdf.License.LicenseKey = "";
//raw text string path
var pdf = PdfDocument.FromFile("document_scaled_compressed.pdf");

string text = pdf.ExtractAllText();

Console.WriteLine(text);
Imports IronPdf
Imports System

IronPdf.License.LicenseKey = ""
'raw text string path
Dim pdf = PdfDocument.FromFile("document_scaled_compressed.pdf")

Dim text As String = pdf.ExtractAllText()

Console.WriteLine(text)
VB   C#

1. 匯入必要的函式庫

要開始使用,您需要匯入所需的命名空間。 在上述程式碼範例中,匯入了 IronPdf 命名空間,其中包含處理 PDF 所需的基本功能。 此外,System 命名空間也被匯入以進行一般的系統級操作。

using IronPdf;
using System;
using IronPdf;
using System;
Imports IronPdf
Imports System
VB   C#

2. 設定 IronPDF 授權金鑰

IronPDF需要有效的授權密鑰才能在生產環境中使用。 在此代碼範例中,有一行是用來設定許可證金鑰的。 然而,在您提供的程式碼中,授權碼被留空 ""。 在生產環境中使用 IronPDF 時,請確保用有效的授權鍵替換掉空字串。

IronPdf.License.LicenseKey = "Your_License_Key_Here";
IronPdf.License.LicenseKey = "Your_License_Key_Here";
IronPdf.License.LicenseKey = "Your_License_Key_Here"
VB   C#

3. 載入 PDF 文件

下一步是載入並解析 PDF 文件。在提供的程式碼中,使用了 PdfDocument.FromFile 方法通過檔名 "document_scaled_compressed.pdf" 載入 PDF,並將其指派給 pdf 變數。 此 PDF 文件將用於文本提取。

var pdf = PdfDocument.FromFile("document_scaled_compressed.pdf");
var pdf = PdfDocument.FromFile("document_scaled_compressed.pdf");
Dim pdf = PdfDocument.FromFile("document_scaled_compressed.pdf")
VB   C#

4. 從 PDF 文件中提取文本

IronPDF提供了一種從載入的PDF文件中提取文本的簡單方法。 這提取所有文字此方法可以從PDF的每一頁提取所有文本內容,並將其存儲在名為text字符串變量中,該變量用來將PDF轉換為文本。

string text = pdf.ExtractAllText();
string text = pdf.ExtractAllText();
Dim text As String = pdf.ExtractAllText()
VB   C#

5. 顯示提取的文本

最後一步是顯示提取的文本。 在程式碼中,Console.WriteLine 會將提取的文本輸出並寫入至控制台。 這是一個用於除錯或向使用者展示文字的有用方法。

Console.WriteLine(text);
Console.WriteLine(text);
Console.WriteLine(text)
VB   C#

從 PDF 文件中提取的文本

如何在C#中讀取PDF文件,圖7:從PDF文件中提取的文本

從 PDF 文件中提取的文本

結論

本文指南開發者如何在 C# 中有效地使用 PDF 文件,使用IronPDF圖書館 它首先展示了專用 Visual Studio 專案的設置,接著通過 NuGet 套件管理器簡單地安裝了 IronPDF。 接下來,文章提供了逐步說明,解釋如何匯入必要的庫,設置IronPDF授權密鑰,載入PDF文件,提取文本內容,並顯示所有頁面中的提取文本。 您也可以使用 C# 將提取的文本保存到 TXT 文件中。

以其使用者友好的方式和全面的功能,IronPDF作為自動化文件流程、資料提取以及從HTML、URL和圖像創建PDF的不可或缺工具,它是增強涉及C#中PDF文件處理的軟體開發項目的寶貴資產。

使用 讀取 PDF 文件的完整文章IronPDF可以在以下位置找到操作指南頁面. 代碼範例在C# PDF閱讀器也可用。 如需使用 IronPDF 的更多程式碼範例,請造訪此範例頁面. IronPDF 還提供廣泛的文檔來回答所有開發人員的問題,並提供全方位的實際支援。 IronPDF 提供免費試用授權讓用戶在決定購買前,可以探索其全部功能永久授權.

< 上一頁
如何在 C# 中添加 PDF Stamper
下一個 >
如何在 .NET 庫中壓縮 PDF 檔案

準備開始了嗎? 版本: 2024.12 剛剛發布

免費 NuGet 下載 總下載次數: 11,622,374 查看許可證 >