在 C# 中讀取 PDF 檔案
IronPDF C# PDF 函式庫中的 PdfDocument.ExtractAllText 方法,非常適合用於標準的 PDF 文字讀取任務。 此方法能無縫處理原始 PDF 文件中的空白字元與編碼差異。
PdfDocument.ExtractTextFromPage 會從 PDF 的特定頁面讀取文字。 在下方的範例中,我們可以看到它被反覆使用來從特定範圍的頁面中擷取文字內容。
IronPDF 亦可從 PDF 檔案中擷取原始圖像。 為此,請使用下方 PdfDocument 類別中的任一方法:
ExtractAllImages:將 PDF 中嵌入的所有圖片以IronSoftware.Drawing.AnyBitmap物件的形式返回。ExtractAllRawImages:將所有嵌入的圖片擷取為原始位元組清單 (byte[])。ExtractImagesFromPage:從已建立索引的頁面中擷取所含的圖片。ExtractImagesFromPages:與ExtractImagesFromPage相同,但僅針對特定頁碼範圍或個別頁碼清單。ExtractRawImagesFromPage和ExtractRawImagesFromPages:運作方式與前兩種方法相同,但會將擷取的圖片以位元組陣列形式返回,而非IronSoftware.Drawing.AnyBitmap物件。
如何在 C# 中讀取 PDF 檔案
- 下載適用於 C# 的 IronPDF 函式庫
- 從 PDF 中擷取圖片或文字
- 在特定文件中閱讀與搜尋文字
- 檢視原始文件的 PDF 輸出
準備開始了嗎?
Nuget 下載 19,014,616 | 版本: 2026.5 just released

