在C#中讀取PDF檔案

提取文本和圖像可以在從一種文件格式過渡到另一種格式時促進數據遷移。提取的內容可以保存在更加易於訪問和編輯的格式中,減少數據丟失的風險。

嵌入的圖像和文本可以獨立於 PDF 文件進行提取。提取的文本將是普通字符串,而提取的圖像將是圖像緩衝區格式,然後可以導出或進一步處理。

使用 extractText 方法來提取文本,並使用 extractRawImages 方法從 PDF 文件中提取圖像。