在 C# 中讀取 PDF 文件

從一種文檔格式過渡到另一種格式時,提取文本和圖像可以促進數據遷移。 提取的內容可以保存為更可訪問和可編輯的格式,從而降低數據丟失的風險。

嵌入的圖像和文本可以獨立於PDF文檔提取。 提取的文本將是普通字符串,而提取的圖像將是圖像緩衝格式,然後可以導出或進一步處理。

使用 extractText 方法提取文本,使用 extractRawImages 方法從PDF文檔中提取圖像。

這是一個更正和注釋的示例,說明如何執行此操作:

在上述C#代碼中:

  • 我們使用 IronPDF 函式庫加載PDF文檔。
  • 調用 ExtractText() 方法從PDF檢索文本。 此文本會輸出到控制台。
  • 使用 ExtractImages() 方法提取圖像,圖像存儲在字節數組中。 每個圖像然後都以指定的文件名存儲到文件系統中。

有關如何使用這些方法的更詳細說明,請訪問 IronPDF文檔

探索更多有關使用IronPDF閱讀PDF文本的信息

準備好開始了嗎?
版本: 2025.11 剛剛發布