在 C# 中讀取 PDF 文件

IronPDF C# PDF 庫中的 PdfDocument.ExtractAllText 方法非常適合普通的 PDF 文字讀取任務。 該方法能夠毫無問題地處理來源 PDF 文件中的空格和編碼差異。

PdfDocument.ExtractTextFromPage 讀取 PDF 中特定頁面的文字。 在下面的範例中,我們可以看到它被迭代地用於從特定範圍的頁面中檢索文字內容。

IronPDF也可以從PDF中擷取原始影像。 為此,請使用以下 PdfDocument 類別中的任一方法:

  • ExtractAllImages : 傳回 PDF 中嵌入的所有影像作為 IronSoftware.Drawing.AnyBitmap 物件。
  • ExtractAllRawImages : 以原始位元組清單的形式檢索所有嵌入的圖像 (byte[])。
  • ExtractImagesFromPage : 擷取索引頁上所包含的圖片。
  • ExtractImagesFromPages : 與 ExtractImagesFromPage 相同,但來自特定的頁面範圍或單一頁面清單。
  • ExtractRawImagesFromPages :與前兩個方法的工作方式相同,但返回提取的圖像為位元組數組而不是 IronSoftware.Drawing.AnyBitmap 物件。

Learn more about ExtractTextFromPage Method

準備好開始了嗎?
Nuget 下載 17,803,474 | 版本: 2026.3 剛剛發布
Still Scrolling Icon

還在滾動嗎?

想快速取得證據? PM > Install-Package IronPdf
運行範例看著你的HTML程式碼變成PDF檔。