在 C# 中讀取 PDF 文件
IronPDF C# PDF 庫中的PdfDocument.ExtractAllText方法非常適合讀取普通的 PDF 文字。 該方法能夠毫無問題地處理來源 PDF 文件中的空格和編碼差異。
PdfDocument.ExtractTextFromPage從 PDF 的特定頁面讀取文字。 在下面的範例中,我們可以看到它被迭代地用於從特定範圍的頁面中檢索文字內容。
IronPDF也可以從PDF中擷取原始影像。 為此,可以使用PdfDocument類別中的以下任一方法:
ExtractAllImages:將 PDF 中嵌入的所有映像作為IronSoftware.Drawing.AnyBitmap物件傳回。ExtractAllRawImages:以原始位元組清單(byte[])的形式檢索所有嵌入的映像。ExtractImagesFromPage:提取索引頁面上包含的映像。ExtractImagesFromPages:與ExtractImagesFromPage相同,但從特定的頁面範圍或單一頁面清單中提取映像。ExtractRawImagesFromPage和ExtractRawImagesFromPages:與前兩個方法的工作方式相同,但傳回擷取的映像為位元組數組,而不是IronSoftware.Drawing.AnyBitmap物件。
如何在C#中讀取PDF文件
- 下載適用於 C# 的 IronPDF 庫
- 從 PDF 文件中提取圖像或文字
- 閱讀並尋找特定文檔中的單字
- 查看原始文件的 PDF 輸出
準備好開始了嗎?
Nuget 下載 17,012,929 | 版本: 2025.12 剛剛發布





