在 C# 中讀取 PDF 檔案

IronPDF C# PDF 函式庫中的 PdfDocument.ExtractAllText 方法,非常適合用於標準的 PDF 文字讀取任務。 此方法能無縫處理原始 PDF 文件中的空白字元與編碼差異。

PdfDocument.ExtractTextFromPage 會從 PDF 的特定頁面讀取文字。 在下方的範例中,我們可以看到它被反覆使用來從特定範圍的頁面中擷取文字內容。

IronPDF 亦可從 PDF 檔案中擷取原始圖像。 為此,請使用下方 PdfDocument 類別中的任一方法:

  • ExtractAllImages:將 PDF 中嵌入的所有圖片以 IronSoftware.Drawing.AnyBitmap 物件的形式返回。
  • ExtractAllRawImages:將所有嵌入的圖片擷取為原始位元組清單 (byte[])。
  • ExtractImagesFromPage:從已建立索引的頁面中擷取所含的圖片。
  • ExtractImagesFromPages:與 ExtractImagesFromPage 相同,但僅針對特定頁碼範圍或個別頁碼清單。
  • ExtractRawImagesFromPageExtractRawImagesFromPages:運作方式與前兩種方法相同,但會將擷取的圖片以位元組陣列形式返回,而非 IronSoftware.Drawing.AnyBitmap 物件。

Learn more about ExtractTextFromPage Method

準備開始了嗎?
Nuget 下載 19,014,616 | 版本: 2026.5 just released
Still Scrolling Icon

還在往下捲動嗎?

想要快速確認成果嗎? PM > Install-Package IronPdf
執行範例 觀看您的 HTML 轉為 PDF。