在 C# 中讀取 PDF 文件

IronPDF C# PDF 函式庫的 PdfDocument.ExtractAllText 方法非常適合用於基本的 PDF 文本讀取任務。 此方法能夠無縫處理原始 PDF 文件中的空格和編碼差異問題。

PdfDocument.ExtractTextFromPage 從特定的 PDF 頁面中讀取文本。 在下面的例子中,我們看到它被迭代地用於從特定頁面範圍中檢索文本內容。

IronPDF 也可以從 PDFs 中提取原始圖像。 為此,請使用下面 PdfDocument 類中的其中一個方法:

  • ExtractAllImages:以 IronSoftware.Drawing.AnyBitmap 對象的形式返回 PDF 中嵌入的所有圖像。
  • ExtractAllRawImages:以原始字節(byte[])的形式檢索所有嵌入的圖像。
  • ExtractImagesFromPage:提取索引頁面中包含的圖像。
  • ExtractImagesFromPages:與 ExtractImagesFromPage 相同,但可從特定頁面範圍或單獨頁面列表中提取。
  • ExtractRawImagesFromPageExtractRawImagesFromPages:與前兩個方法相同,但會將提取的圖像以字節數組而非 IronSoftware.Drawing.AnyBitmap 對象的形式返回。
class="hsg-featured-snippet">

如何在 C# 中讀取 PDF 文件

  1. 下載 IronPDF C# 函式庫
  2. 從 PDF 中提取圖像或文本
  3. 在特定文檔中讀取並查找文字
  4. 查看原始文檔的 PDF 輸出

了解更多關於 ExtractTextFromPage 方法的信息

準備好開始了嗎?
Nuget 下載 16,154,058 | 版本: 2025.11 剛剛發布