在C#中讀取PDF檔案
提取文字和圖像可以在從一種文件格式轉換到另一種文件格式時促進數據遷移。 提取的內容可以保存在更易於訪問和編輯的格式中,減少數據丟失的風險。
嵌入的圖像和文字可以獨立於PDF文件提取。 提取的文字將以普通字符串形式存在,而提取的圖像將以圖像緩衝區格式存在,然後可以導出或進一步處理。
使用 extractText
方法來提取文字,以及 extractRawImages
方法來從 PDF 文件中提取圖像。
如需更詳細的有關如何使用這些方法的說明,請訪問IronPDF 文件檔案.