跳過到頁腳內容
使用IRONPDF

如何在C#中逐行閱讀PDF

你可能認為 PDF 是靜態文檔,但它們正變得越來越動態。 借助 PDF,您可以製作出既具有互動性又可共享的文件。 您可以透過閱讀 Adobe 網站上 Acrobat SDK 中的"便攜式文件格式參考"來了解 PDF 的結構。以程式設計方式建立 PDF 的兩個最常見原因是:

  1. 對於需要圖形和格式的新聞通訊和其他數位出版物,這些圖形和格式無法透過可直接列印的 PDF 實現。
  2. 在電子書或數位雜誌中創造互動性。

以程式設計方式讀取 PDF 文件是一項艱鉅的任務,因為從 PDF 文件中提取文字並非易事。 PDF 的結構很複雜,尤其是因為它還可以包含圖像。 那麼,如果開發人員需要在不使用 Adobe Acrobat 的情況下逐行從 PDF 文件中獲取文本,該如何解決呢? 答案是 IronPDF C# PDF 庫。 本教學將介紹如何使用 IronPDF C# 函式庫以程式設計方式在 C# 中讀取 PDF 檔案。

如何在 C# 中逐行讀取 PDF 文件

本文內容如下:

  1. IronPDF:AC# PDF 庫
  2. 閱讀PDF文件的步驟
  3. 在 Visual Studio 中建立一個 C# 項目 4.使用 NuGet 套件管理器安裝 IronPDF 庫
  4. 編寫讀取 PDF 檔案的程式碼
  5. 結論:閱讀PDF的最佳庫

IronPDF:一個 C# PDF 庫

IronPDF 是一個 .NET PDF 程式庫,它為開發人員提供了一種簡單且強大的方法來產生和讀取 PDF 文件。 它從一開始就被設計成與 .NET Core、ASP.NET Core 和 .NET Standard 相容。

IronPDF 為開發者提供豐富的 API,用於建立、操作和產生 PDF 檔案。 開發者可以使用其直覺的 API,以程式設計方式建立新的 PDF 檔案或開啟現有的 PDF 檔案。 該程式庫支援各種文檔,例如在 PDF 文件中產生的圖像、影片、文字檔案和向量圖形。

讓我們來看看如何使用 IronPDF 逐行讀取 PDF 檔案。

在 Visual Studio 中建立一個 C# 項目

我將使用 Visual Studio 2022 來建立 C# 專案。 任何版本都應該可以使用,但為了獲得更好的體驗,建議使用最新版本。 IronPDF 與微軟最新版本的 .NET 框架 .NET 6 相容性良好。如果您需要更全面的支援和更高的穩定性,建議使用此框架。

接下來,請依照下列步驟在 Microsoft Visual Studio 中建立 C# 專案:

  1. 開啟 Visual Studio 2022。
  2. 點選底部的"建立新項目"按鈕。
  3. 為本教學選擇"控制台應用程式"範本。 您可以根據自己的需求使用任何模板。
  4. 給專案取一個合適的名字。
  5. 選擇 .NET 6 框架,因為它是最新的,並且具有擴充支援。
  6. 點選"創建"按鈕。

依照上述步驟,您就可以在 Visual Studio 中輕鬆建立一個 C# 專案。 現在是時候安裝 IronPDF 庫了。 您可以使用現有項目與 IronPDF 庫一起使用。 您必須開啟一個作業並安裝庫。 下一節,我們將學習如何安裝 IronPDF 庫。

安裝 IronPdf 函式庫

IronPDF 支援以多種方式安裝 IronPDF 庫。 IronPDF 是一個庫,允許您在各種場景中使用它。 您可以使用 NuGet 套件安裝程序,然後透過套件管理器控制台使用它。 只需執行以下命令,IronPDF 庫就會安裝到您的專案中:

Install-Package IronPdf

或者,您也可以下載 IronPDF C# 庫,並將其 ZIP 檔案解壓縮到硬碟上的任何資料夾——無需安裝。 首先,開啟要安裝 IronPDF 的 Visual Studio 專案。 進入 IDE 後,在解決方案資源管理器中按一下"專案引用",然後按一下"新增參考"。 搜尋並選擇我們之前下載的"IronPDF"壓縮檔案。 按一下"確定"按鈕,IronPDF 將被新增為項目中的引用。

現在,我們的專案已準備好在 IronPDF 上運行。 讓我們開始編寫逐行讀取PDF文件的程式碼。

編寫讀取 PDF 檔案的程式碼

現在我將向您展示如何僅用兩行程式碼讀取 PDF 檔案。 IronPDF的功能非常出色且有效率。 我們來看一個程式碼範例:

using IronPdf;
using System.Drawing;

// Select the Desired PDF File
using PdfDocument PDF = PdfDocument.FromFile("test.pdf");

// Using ExtractAllText() method to extract all text from the PDF
string line = PDF.ExtractAllText();

// Get all Images
IEnumerable<Image> AllImages = PDF.ExtractAllImages();

// View text in the console
Console.WriteLine(line);
using IronPdf;
using System.Drawing;

// Select the Desired PDF File
using PdfDocument PDF = PdfDocument.FromFile("test.pdf");

// Using ExtractAllText() method to extract all text from the PDF
string line = PDF.ExtractAllText();

// Get all Images
IEnumerable<Image> AllImages = PDF.ExtractAllImages();

// View text in the console
Console.WriteLine(line);
Imports IronPdf
Imports System.Drawing

' Select the Desired PDF File
Private PdfDocument As using

' Using ExtractAllText() method to extract all text from the PDF
Private line As String = PDF.ExtractAllText()

' Get all Images
Private AllImages As IEnumerable(Of Image) = PDF.ExtractAllImages()

' View text in the console
Console.WriteLine(line)
$vbLabelText   $csharpLabel

上述程式碼用於讀取 PDF 檔案。在FromFile參數中,我們指定輸入 PDF 檔案的路徑。然後, ExtractAllText函數從測試 PDF 的所有頁面中提取文字。 我們可以將文字儲存到文字檔案中,或在控制台中顯示它。 您可以在IronPDF 文字擷取範例頁面上查看更多教學。 我們可以將以下函數編寫成可在程式中任何位置使用的函數形式,如下所示:

private void Extract()
{
    // Select the Desired PDF File
    using PdfDocument PDF = PdfDocument.FromFile("any.pdf");

    // Using ExtractAllText() method to extract all text from the PDF
    string line = PDF.ExtractAllText();

    // View text in the console
    Console.WriteLine(line);
}
private void Extract()
{
    // Select the Desired PDF File
    using PdfDocument PDF = PdfDocument.FromFile("any.pdf");

    // Using ExtractAllText() method to extract all text from the PDF
    string line = PDF.ExtractAllText();

    // View text in the console
    Console.WriteLine(line);
}
Private Sub Extract()
	' Select the Desired PDF File
	Using PDF As PdfDocument = PdfDocument.FromFile("any.pdf")
	
		' Using ExtractAllText() method to extract all text from the PDF
		Dim line As String = PDF.ExtractAllText()
	
		' View text in the console
		Console.WriteLine(line)
	End Using
End Sub
$vbLabelText   $csharpLabel

我們來看看 IronPDF 產生的輸出結果。

輸出文字

如何在 C# 中逐行讀取 PDF:圖 1

IronPDF能夠完美提取文本,沒有任何錯誤。 結果一流。

結論:最佳 PDF 閱讀庫

許多開發人員在其軟體或其他程式中使用不同的 PDF 閱讀庫。 有多種庫可用於操作和讀取 PDF 文件。 然而,IronPDF 是處理所有涉及 PDF 操作的最佳庫。

許多行業和領域都使用 PDF 生成程式來產生和列印 PDF 文件。 市面上有許多函式庫,例如 PDF Sharp 函式庫和許多其他 .NET 函式庫,它們可以讓你使用自己的內容快速建立 PDF。 但是,用於程式化產生 PDF 的最佳庫是 IronPDF。 IronPDF 提供多種功能,包括加密、密碼保護以及將 MS Office 格式轉換為 PDF。 使用 IronPDF,您可以輕鬆使用這些強大的工具建立 PDF 文件。

IronPDF 是一個免費庫,但商業用途需要付費。 提供 30 天的試用期,可以在生產環境中進行測試。 IronPDF 的價格非常實惠,目前您只需支付兩款軟體的價格,即可購買一套包含 5 款不同軟體的完整套裝。 您可以在IronPDF 許可頁面上找到所有有關定價方案的資訊。

常見問題解答

如何用 C# 逐行讀取 PDF 檔案?

使用 IronPDF,您可以使用 PdfDocument.FromFile() 方法逐行讀取 PDF 檔案,然後再使用 ExtractAllText() 方法逐行擷取文字內容。

使用 .NET PDF 函式庫閱讀 PDF 有什麼好處?

IronPDF for .NET 這樣的 .NET PDF 函式庫簡化了從複雜的 PDF 結構中讀取和擷取文字的過程,讓開發人員可以輕鬆地以程式化的方式處理文件。

我可以使用 IronPDF 從 PDF 中提取圖片以及文字嗎?

是的,IronPDF 允許您使用其全面的 API 從 PDF 檔案中擷取文字和影像,該 API 提供了存取 PDF 中各種元素的方法。

在 C# 專案中安裝 IronPDF 的最佳方式是什麼?

您可以使用 NuGet Package Manager,使用 Install-Package IronPdf 命令或在 Visual Studio 中将其添加为引用,在您的 C# 项目中安装 IronPDF。

是否可以使用 .NET 函式庫保護 PDF 檔案?

IronPDF 支援 PDF 加密和密碼保護,讓您可以在 C# 應用程式中以程式化的方式保護 PDF 文件。

以程式方式產生 PDF 的常見用例有哪些?

開發人員通常會產生 PDF 用於數位出版、建立互動內容、分享文件,並確保不同平台上的文件格式一致。

IronPDF 與其他 PDF 函式庫的功能比較如何?

IronPDF 因其強大的功能而備受推崇,包括 PDF 生成、文字和圖像擷取、加密和格式轉換,因此成為開發人員的首選。

IronPDF 可以用於 .NET Core 應用程式嗎?

是的,IronPDF 與 .NET Core、ASP.NET Core 和 .NET Standard 相容,讓您可以將其無縫整合到現代 .NET 應用程式中。

IronPDF 是否與 .NET 10 完全相容?

是的,IronPDF 可與 .NET 10 完美配合,充分利用新的運行時間和語言增強功能。您可以在 .NET 10 專案中使用它來讀取、寫入、轉換和編輯 PDF,而不需要額外的設定。

.NET 10 中的哪些改進有益於 IronPDF 的性能?

IronPDF for .NET 10 提供了一些增強功能,如減少記憶體分配、更快的 JIT 性能、改進的 ASP.NET Core 功能,以及 IronPDF 可以利用的運行時優化 - 因此,渲染、轉換和文本/圖像提取等任務可以更高效地運行。這些優點適用於使用 IronPDF 的桌面、Web 和雲端應用程式。

Curtis Chau
技術作家

Curtis Chau 擁有卡爾頓大學計算機科學學士學位,專注於前端開發,擅長於 Node.js、TypeScript、JavaScript 和 React。Curtis 熱衷於創建直觀且美觀的用戶界面,喜歡使用現代框架並打造結構良好、視覺吸引人的手冊。

除了開發之外,Curtis 對物聯網 (IoT) 有著濃厚的興趣,探索將硬體和軟體結合的創新方式。在閒暇時間,他喜愛遊戲並構建 Discord 機器人,結合科技與創意的樂趣。