跳至頁尾內容
使用 IRONPDF

如何在 C# 讀取 PDF 文件

本文將使用IronPDF for .NET,這是一個用於讀取 PDF 檔案的 C# PDF 函式庫。

如何使用 IronPDF 閱讀 PDF 文件

  1. 如果尚未下載,請下載 Visual Studio。 設定環境並安裝 IronPDF 庫。
  2. 使用PdfDocument.FromFile方法開啟並載入所需的 PDF 檔案。
  3. 利用 IronPDF 的ExtractAllText方法檢索內容。
  4. 根據需要分析或處理擷取的文字。
  5. 將擷取的文字列印到控制台以供閱讀。

IronPDF。

IronPDF是一個功能強大的 C# PDF 閱讀器庫,它使開發人員能夠輕鬆處理 PDF 文件。 IronPDF 憑藉其豐富的功能和強大的效能,簡化了 PDF 文件的處理,使用戶能夠輕鬆讀取、提取和操作 PDF 內容。 無論您是要自動化文件處理流程、提取資料和影像進行分析,還是從頭開始建立 PDF,IronPDF 都提供了一套全面的工具來簡化這些任務。

本文探討如何使用IronPDF在 C# 中有效處理 PDF,展示了 IronPDF 的多功能性和價值,使其成為開發人員軟體開發過程中必不可少的工具。

建立新的 Visual Studio 項目

在深入探討編碼方面之前,讓我們先建立一個新的Visual Studio C# 控制台應用程式專案。 該專案將作為一個專門的工作空間,用於開發和實際案例展示。

  1. 若要啟動此流程,請啟動 Visual Studio,然後導覽至"檔案"選單,選擇"新建",再選擇"專案",建立新專案。

如何在 C# 中讀取 PDF 文件,圖 1:在 Visual Studio 中導覽至"建立專案"對話框 在 Visual Studio 中,導覽至"建立專案"對話方塊。

  1. 此操作將彈出一個新窗口,讓您有機會指定項目模板。 為了簡單起見,請選擇"控制台應用程式"模板,然後按一下位於視窗左下角的"下一步"按鈕繼續。

如何在 C# 中讀取 PDF 文件,圖 2:在 Visual Studio 中建立一個新項目 在 Visual Studio 中建立一個新項目

  1. 在後續的視窗中,系統會提示您為項目指定名稱並指定所需的項目位置。 填寫完這些細節後,點擊"下一步"按鈕繼續。

如何在 C# 中讀取 PDF 文件,圖 3:設定項目 配置專案

  1. 在此步驟中,選擇您喜歡的目標框架,然後按一下"建立"按鈕完成專案建立過程。

如何在 C# 中讀取 PDF 文件,圖 4:.NET Framework 選擇 .NET Framework 選擇

現在您的專案已經穩固建立,下一個關鍵步驟是安裝IronPDF

安裝 IronPDF。

IronPDF提供了多種下載和安裝 PDF 庫的選項。 在本指南中,我們將重點介紹如何使用 NuGet 套件管理器安裝 IronPDF,這是一種高效且廣泛採用的方法。

  1. 在 Visual Studio 中,導覽至"工具"選單,然後將遊標優雅地懸停在"NuGet 套件管理器"選項上。
  2. 從擴充功能表中,選擇"NuGet 解決方案套件管理員"。

如何在 C# 中讀取 PDF 文件,圖 5:導航到 NuGet 套件管理器 導覽至 NuGet 套件管理器

  1. 選擇此選項後,將開啟一個新視窗。 在這個精簡後的視窗中,導覽至"瀏覽"選單,然後在搜尋列中輸入"IronPDF"。
  2. 螢幕將顯示可用的 IronPDF 軟體包。 若要繼續操作,請從清單中選擇最新軟體包,然後按一下"安裝"選項執行此選擇。

如何在 C# 中讀取 PDF 文件,圖 6:在 NuGet 套件管理器 UI 中搜尋並安裝 IronPdf 套件 在 NuGet 套件管理器介面中搜尋並安裝 IronPdf 套件。

對於那些更喜歡命令列方式的用戶來說,NuGet 套件管理器控制台提供了一種優雅的途徑。 只需開啟此控制台,輸入以下命令,然後按"Enter"鍵:

Install-Package IronPdf

您也可以選擇直接從NuGet 網站連結取得軟體包。

使用 IronPDF 讀取 PDF 文件

本節將展示如何使用 IronPDF 使用 C# 程式語言開啟和閱讀完整的 PDF 檔案。

using IronPdf;
using System;

class Program
{
    static void Main()
    {
        // Set the license key for IronPDF if available
        IronPdf.License.LicenseKey = "Your_License_Key_Here";

        // Load the PDF document from a specified file path
        var pdf = PdfDocument.FromFile("document_scaled_compressed.pdf");

        // Extract all text from the loaded PDF
        string text = pdf.ExtractAllText();

        // Output the extracted text to the console
        Console.WriteLine(text);
    }
}
using IronPdf;
using System;

class Program
{
    static void Main()
    {
        // Set the license key for IronPDF if available
        IronPdf.License.LicenseKey = "Your_License_Key_Here";

        // Load the PDF document from a specified file path
        var pdf = PdfDocument.FromFile("document_scaled_compressed.pdf");

        // Extract all text from the loaded PDF
        string text = pdf.ExtractAllText();

        // Output the extracted text to the console
        Console.WriteLine(text);
    }
}
$vbLabelText   $csharpLabel

1. 導入必要的庫

首先,您需要匯入所需的命名空間。 在上面的程式碼範例中,匯入了IronPdf命名空間,其中包含處理 PDF 的基本函數。 此外, System命名空間也被導入,用於一般的系統級操作。

using IronPdf;
using System;
using IronPdf;
using System;
$vbLabelText   $csharpLabel

2. 設定 IronPDF 許可證密鑰

IronPDF需要在生產環境中使用時擁有有效的許可證密鑰。 在程式碼範例中,有一行需要設定許可證密鑰。 但是,在您提供的程式碼中,許可證金鑰為空"" 。 在生產環境中使用時,請確保將空字串替換為 IronPDF 提供的有效許可證金鑰。

IronPdf.License.LicenseKey = "Your_License_Key_Here";
IronPdf.License.LicenseKey = "Your_License_Key_Here";
$vbLabelText   $csharpLabel

3. 載入 PDF 文檔

下一步是載入並解析 PDF 檔案。在提供的程式碼中,使用PdfDocument.FromFile方法載入文件名為"document_scaled_compressed.pdf"的 PDF 文件,並將其賦值給pdf變數。 此PDF文件將用於提取文字。

var pdf = PdfDocument.FromFile("document_scaled_compressed.pdf");
var pdf = PdfDocument.FromFile("document_scaled_compressed.pdf");
$vbLabelText   $csharpLabel

4. 從PDF文件中提取文本

IronPDF 提供了一種從已載入的 PDF 文件中提取文字的簡單方法。 ExtractAllText方法可以從 PDF 的每一頁中提取所有文字內容,並將其儲存在名為text 的**字串**變數中,其作用相當於將 PDF 轉換為文字。

string text = pdf.ExtractAllText();
string text = pdf.ExtractAllText();
$vbLabelText   $csharpLabel

5. 顯示提取的文本

最後一步是顯示提取的文字。 在程式碼中, Console.WriteLine會將擷取的文字列印並寫入控制台。 這是一種用於調試或向用戶展示文字的有效方法。

Console.WriteLine(text);
Console.WriteLine(text);
$vbLabelText   $csharpLabel

輸出:從 PDF 文件中提取的文本

如何在 C# 中讀取 PDF 文件,圖 7:從 PDF 文件中提取的文本 從 PDF 文件中提取的文本

結論

本文指導開發人員如何使用IronPDF庫在 C# 中有效地處理 PDF 文件。 它首先示範如何設定一個專用的 Visual Studio 項目,然後透過 NuGet 套件管理器直接安裝了 IronPDF。 文章隨後提供了逐步解釋如何匯入必要的庫、設定 IronPDF 許可證密鑰、加載 PDF 文件、提取文字內容以及顯示從所有頁面提取的文本。 您也可以使用 C# 將提取的文字儲存到 TXT 檔案。

IronPDF憑藉其用戶友好的方法和全面的功能,成為自動化文件處理、資料提取以及從 HTML、URL 和圖像創建 PDF 的不可或缺的工具,使其成為增強涉及 C# 中 PDF 文件處理的軟體開發專案的寶貴資產。

有關使用IronPDF讀取 PDF 檔案的完整文章,請參閱以下操作指南頁面C# PDF 閱讀器的程式碼範例也已提供。 有關使用 IronPDF 的更多程式碼範例,請造訪此範例頁面。 IronPDF 也提供豐富的文檔,解答所有開發人員的問題,並提供全面的實務支援。 IronPDF 提供免費試用許可證,以便用戶在決定購買永久許可證之前探索其全部功能。

常見問題解答

如何在C#中載入PDF文檔?

您可以使用PdfDocument.FromFile方法在 C# 中載入 PDF 文檔,只需提供要載入的 PDF 文件路徑即可。

如何使用 C# 從 PDF 中提取文字?

IronPDF 中的ExtractAllText方法用於從已載入的 PDF 文件中提取所有文字內容,有助於資料擷取和操作。

如何在 Visual Studio 中建立一個新項目,以便使用 C# 處理 PDF 文件?

要設定一個新項目,請在 Visual Studio 中建立一個 C# 控制台應用程序,並使用 NuGet 套件管理器安裝 IronPDF 庫。

在生產環境中部署 PDF 庫是否需要許可證金鑰?

是的,要在生產環境中使用 IronPDF,需要一個有效的許可證金鑰才能存取其全部功能。

我可以使用 C# 將 HTML 內容轉換為 PDF 文件嗎?

是的,IronPDF 允許將 HTML 內容轉換為 PDF 文檔,因此可用於從網頁或 HTML 字串建立 PDF。

在 C# 中使用 PDF 庫進行文件處理有哪些優點?

使用 IronPDF 可以簡化 PDF 自動化、資料擷取和建立等任務,並透過提供可靠的文件處理功能來增強軟體專案。

開發者可以在哪裡找到更多關於在 C# 中使用 PDF 庫的範例?

開發者可以在 IronPDF 的官方網站上找到更多範例和文檔,其中包括各種用例的指南和範例程式碼。

該PDF庫是否提供試用版供評估?

是的,IronPDF 提供免費試用許可證,使用者可以在決定購買之前探索該庫的功能。

如何使用 C# 從 PDF 擷取文字來排查問題?

確保使用PdfDocument.FromFile正確載入 PDF 文件,並檢查控制台輸出中是否有任何錯誤或異常以取得指導。

IronPDF 能否從影像建立 PDF 檔案?

是的,IronPDF 可以從影像產生 PDF,在文件建立方面提供了靈活性,並支援多種輸入格式。

IronPDF 是否相容於 .NET 10,是否可以用於在 C# 中讀取 PDF 檔案?

是的,IronPDF 完全相容於 .NET 10,支援在 .NET 10 專案中使用PdfDocument.FromFileExtractAllText等方法讀取、擷取和操作 PDF 檔案。它已獲得 .NET 10 及更早版本的官方支援。

柯蒂斯·週
技術撰稿人

Curtis Chau擁有卡爾頓大學電腦科學學士學位,專長於前端開發,精通Node.js、TypeScript、JavaScript和React。他熱衷於打造直覺美觀的使用者介面,喜歡使用現代框架,並擅長撰寫結構清晰、視覺效果出色的使用者手冊。

除了開發工作之外,柯蒂斯對物聯網 (IoT) 也抱有濃厚的興趣,致力於探索硬體和軟體整合的創新方法。閒暇時,他喜歡玩遊戲和製作 Discord 機器人,將他對科技的熱愛與創造力結合。