跳過到頁腳內容
使用IRONPDF

如何在C#中讀取PDF文件

本文將使用IronPDF for .NET,這是一個 C# PDF 函式庫,用於讀取 PDF 檔案。

如何使用IronPDF閱讀 PDF 文件

  1. 如果尚未下載,請下載 Visual Studio。 設定環境並安裝IronPDF庫。
  2. 使用PdfDocument.FromFile方法開啟並載入所需的 PDF 檔案。
  3. 利用 IronPDF 的 ExtractAllText 方法檢索內容。
  4. 根據需要分析或處理擷取的文字。
  5. 將擷取的文字列印到控制台以供閱讀。

IronPDF

IronPDF是一個功能強大的 C# PDF 閱讀器庫,它使開發人員能夠輕鬆處理 PDF 文件。 IronPDF憑藉其豐富的功能和強大的效能,簡化了 PDF 文件的處理,使用戶能夠輕鬆地讀取、提取和操作 PDF 內容。 無論您是要自動化文件處理流程、提取資料和影像進行分析,還是從頭開始建立 PDF, IronPDF都提供了一套全面的工具來簡化這些任務。

本文探討如何使用IronPDF在 C# 中有效處理 PDF,展示了 IronPDF 的多功能性和價值,使其成為開發人員軟體開發過程中必不可少的工具。

建立新的 Visual Studio 項目

在深入探討編碼方面之前,讓我們先建立一個新的Visual Studio C# 控制台應用程式專案。 該專案將作為一個專門的工作空間,用於開發和實際案例展示。

  1. 若要啟動此流程,請啟動 Visual Studio,然後導覽至"檔案"選單,選擇"新建",再選擇"專案",建立新專案。

如何在 C# 中讀取 PDF 文件,圖 1:在 Visual Studio 中導航到 在 Visual Studio 中,導覽至"建立專案"對話方塊。

  1. 此操作將彈出一個新窗口,讓您有機會指定項目模板。 為了簡單起見,請選擇"控制台應用程式"模板,然後按一下位於視窗左下角的"下一步"按鈕繼續。

如何在 C# 中讀取 PDF 文件,圖 2:在 Visual Studio 中建立一個新專案 在 Visual Studio 中建立一個新項目

  1. 在後續的視窗中,系統會提示您為項目指定名稱並指定所需的項目位置。 填寫完這些細節後,點擊"下一步"按鈕繼續。

如何在 C# 中讀取 PDF 文件,圖 3:設定項目 配置專案

  1. 在此步驟中,選擇您喜歡的目標框架,然後按一下"建立"按鈕完成專案建立過程。

如何在 C# 中讀取 PDF 文件,圖 4: .NET Framework選擇 .NET Framework選擇

現在您的專案已經穩固建立,下一個關鍵步驟是安裝IronPDF

安裝IronPDF

IronPDF提供了多種下載和安裝 PDF 庫的選項。 在本指南中,我們將重點介紹如何使用NuGet套件管理器安裝IronPDF ,這是一種高效且廣泛採用的方法。

  1. 在 Visual Studio 中,導覽至"工具"選單,然後將遊標優雅地懸停在"NuGet套件管理器"選項上。
  2. 從擴充功能表中,選擇"NuGet解決方案套件管理員"。

如何在 C# 中讀取 PDF 文件,圖 5:導航至NuGet套件管理器 導航至NuGet套件管理器

  1. 選擇此選項後,將開啟一個新視窗。 在這個精簡的視窗中,導覽至"瀏覽"功能表,然後在搜尋列中輸入"IronPDF"。
  2. 螢幕將顯示可用的IronPDF軟體包。 若要繼續操作,請從清單中選擇最新軟體包,然後按一下"安裝"選項執行此選擇。

如何在 C# 中讀取 PDF 文件,圖 6:在NuGet套件管理器 UI 中搜尋並安裝IronPDF套件 在NuGet套件管理器介面中搜尋並安裝IronPDF套件。

對於那些更喜歡命令列方式的用戶來說, NuGet套件管理器控制台提供了一種優雅的途徑。 只需開啟此控制台,輸入以下命令,然後按"Enter"鍵:

Install-Package IronPdf

您也可以選擇直接從NuGet網站連結取得軟體包。

使用IronPDF讀取 PDF 文件

本節將展示如何使用IronPDF使用 C# 程式語言開啟和閱讀完整的 PDF 檔案。

using IronPdf;
using System;

class Program
{
    static void Main()
    {
        // Set the license key for IronPDF if available
        IronPdf.License.LicenseKey = "Your_License_Key_Here";

        // Load the PDF document from a specified file path
        var pdf = PdfDocument.FromFile("document_scaled_compressed.pdf");

        // Extract all text from the loaded PDF
        string text = pdf.ExtractAllText();

        // Output the extracted text to the console
        Console.WriteLine(text);
    }
}
using IronPdf;
using System;

class Program
{
    static void Main()
    {
        // Set the license key for IronPDF if available
        IronPdf.License.LicenseKey = "Your_License_Key_Here";

        // Load the PDF document from a specified file path
        var pdf = PdfDocument.FromFile("document_scaled_compressed.pdf");

        // Extract all text from the loaded PDF
        string text = pdf.ExtractAllText();

        // Output the extracted text to the console
        Console.WriteLine(text);
    }
}
$vbLabelText   $csharpLabel

1. 導入必要的庫

首先,您需要匯入所需的命名空間。 在上面的程式碼範例中,導入了 IronPdf 命名空間,其中包含處理 PDF 的基本函數。 此外,還導入了 System 命名空間,用於一般的系統級操作。

using IronPdf;
using System;
using IronPdf;
using System;
$vbLabelText   $csharpLabel

2. 設定IronPDF許可證密鑰

IronPDF需要在生產環境中使用時擁有有效的許可證密鑰。 在程式碼範例中,有一行需要設定許可證密鑰。 但是,在您提供的程式碼中,許可證金鑰為空 ""。 在生產環境中使用時,請確保將空字串替換為IronPDF提供的有效許可證金鑰。

IronPdf.License.LicenseKey = "Your_License_Key_Here";
IronPdf.License.LicenseKey = "Your_License_Key_Here";
$vbLabelText   $csharpLabel

3. 載入 PDF 文檔

下一步是載入並解析 PDF 檔案。在提供的程式碼中,使用 PdfDocument.FromFile 方法載入文件名為"document_scaled_compressed.pdf"的 PDF 文件,並將其賦值給pdf變數。 此PDF文件將用於提取文字。

var pdf = PdfDocument.FromFile("document_scaled_compressed.pdf");
var pdf = PdfDocument.FromFile("document_scaled_compressed.pdf");
$vbLabelText   $csharpLabel

4. 從PDF文件中提取文本

IronPDF提供了一種從已載入的 PDF 文件中提取文字的簡單方法。 ExtractAllText方法可以從 PDF 的每一頁中提取所有文字內容,並將其儲存在名為text 的**字串**變數中,其作用相當於將 PDF 轉換為文字。

string text = pdf.ExtractAllText();
string text = pdf.ExtractAllText();
$vbLabelText   $csharpLabel

5. 顯示提取的文本

最後一步是顯示提取的文字。 在程式碼中, Console.WriteLine會將擷取的文字列印並寫入控制台。 這是一種用於調試或向用戶展示文字的有效方法。

Console.WriteLine(text);
Console.WriteLine(text);
$vbLabelText   $csharpLabel

輸出:從 PDF 文件中提取的文本

如何在 C# 中讀取 PDF 文件,圖 7:從 PDF 文件中提取的文本 從 PDF 文件中提取的文本

結論

本文指導開發人員如何使用IronPDF庫在 C# 中有效地處理 PDF 文件。 它首先示範如何設定一個專用的 Visual Studio 項目,然後透過NuGet套件管理器直接安裝了IronPDF 。 文章隨後提供了逐步解釋如何匯入必要的庫、設定IronPDF許可證密鑰、加載 PDF 文件、提取文字內容以及顯示從所有頁面提取的文本。 您也可以使用 C# 將提取的文字儲存到 TXT 檔案。

IronPDF憑藉其用戶友好的方法和全面的功能,成為自動化文件處理、資料提取以及從 HTML、URL 和圖像創建 PDF 的不可或缺的工具,使其成為增強涉及 C# 中 PDF 文件處理的軟體開發專案的寶貴資產。

有關使用IronPDF讀取 PDF 檔案的完整文章,請參閱以下操作指南頁面C# PDF 閱讀器的程式碼範例也已提供。 有關使用IronPDF 的更多程式碼範例,請造訪此範例頁面。 IronPDF也提供豐富的文檔,解答所有開發人員的問題,並提供全面的實務支援。 IronPDF提供免費試用許可證,以便用戶在決定購買永久許可證之前探索其全部功能。

常見問題解答

如何在 C# 中加載 PDF 文檔?

您可以使用 PdfDocument.FromFile 方法通過提供您希望加載的 PDF 的文件路徑來在 C# 中加載 PDF 文檔。

使用 C# 從 PDF 提取文本的方法是什麼?

IronPDF 中的 ExtractAllText 方法用於從加載的 PDF 文檔中提取所有文本內容,幫助實現數據檢索和操作。

如何在 Visual Studio 中設置一個新項目以使用 C# 處理 PDF?

要設置新項目,請在 Visual Studio 中創建一個 C# 控制台應用程序,並使用 NuGet 包管理器安裝 IronPDF 庫。

在生產環境中實施 PDF 庫是否需要許可密鑰?

是的,需要有效的許可密鑰才能在生產環境中使用 IronPDF 以訪問其全部功能。

我可以使用 C# 將 HTML 內容轉換為 PDF 文件嗎?

是的,IronPDF 允許將 HTML 內容轉換為 PDF 文件,這對於從網頁或 HTML 字串創建 PDF 十分有用。

在 C# 中使用 PDF 庫進行文檔處理的優勢是什麼?

使用 IronPDF 簡化了 PDF 自動化、數據提取和創建等任務,通過提供可靠的文檔處理能力來提升軟件項目。

開發者可以在哪裡找到更多關於在 C# 中使用 PDF 庫的例子?

開發者可以在 IronPDF 的官方網站上找到額外的示例和文檔,其中包括用於各種用例的指南和示例代碼。

PDF 庫是否提供試用版以供評估?

是的,IronPDF 提供免費試用許可證,允許用戶在購買前探索庫的功能。

在使用 C# 從 PDF 提取文本時,我如何排解問題?

確保使用 PdfDocument.FromFile 正確加載 PDF 文件,並檢查控制台輸出中的任何錯誤或異常以獲取指導。

IronPDF 可以從圖像創建 PDF 嗎?

是的,IronPDF 可以從圖像生成 PDF,提供了靈活的文檔創建選項,並支持各種輸入格式。

IronPDF與.NET 10兼容於C#中閱讀PDF嗎?

是的,IronPDF完全兼容.NET 10—支持在.NET 10專案中使用如PdfDocument.FromFileExtractAllText等方法進行PDF的閱讀、提取和操作。它在.NET 10上與早期版本一起獲得正式支持。

Curtis Chau
技術作家

Curtis Chau 擁有卡爾頓大學計算機科學學士學位,專注於前端開發,擅長於 Node.js、TypeScript、JavaScript 和 React。Curtis 熱衷於創建直觀且美觀的用戶界面,喜歡使用現代框架並打造結構良好、視覺吸引人的手冊。

除了開發之外,Curtis 對物聯網 (IoT) 有著濃厚的興趣,探索將硬體和軟體結合的創新方式。在閒暇時間,他喜愛遊戲並構建 Discord 機器人,結合科技與創意的樂趣。

Iron Support Team

We're online 24 hours, 5 days a week.
Chat
Email
Call Me