在 C# 中讀取 PDF 文件

IronPDF C# PDF 庫中的PdfDocument.ExtractAllText方法非常適合讀取普通的 PDF 文字。 該方法能夠毫無問題地處理來源 PDF 文件中的空格和編碼差異。

PdfDocument.ExtractTextFromPage從 PDF 的特定頁面讀取文字。 在下面的範例中,我們可以看到它被迭代地用於從特定範圍的頁面中檢索文字內容。

IronPDF也可以從PDF中擷取原始影像。 為此,可以使用PdfDocument類別中的以下任一方法:

  • ExtractAllImages :將 PDF 中嵌入的所有映像作為IronSoftware.Drawing.AnyBitmap物件傳回。
  • ExtractAllRawImages :以原始位元組清單( byte[] )的形式檢索所有嵌入的映像。
  • ExtractImagesFromPage :提取索引頁面上包含的映像。
  • ExtractImagesFromPages :與ExtractImagesFromPage相同,但從特定的頁面範圍或單一頁面清單中提取映像。
  • ExtractRawImagesFromPageExtractRawImagesFromPages :與前兩個方法的工作方式相同,但傳回擷取的映像為位元組數組,而不是IronSoftware.Drawing.AnyBitmap物件。

Learn more about ExtractTextFromPage Method

準備好開始了嗎?
Nuget 下載 17,012,929 | 版本: 2025.12 剛剛發布