在C#中讀取PDF檔案
提取文字和圖像可以在從一種文件格式轉換到另一種文件格式時促進數據遷移。 提取的內容可以保存在更易於訪問和編輯的格式中,減少數據丟失的風險。
嵌入的圖像和文字可以獨立於PDF文件提取。 提取的文字將以普通字符串形式存在,而提取的圖像將以圖像緩衝區格式存在,然後可以導出或進一步處理。
使用extractText
方法從 PDF 文件中提取文本,並使用extractRawImages
方法從 PDF 文件中提取圖像。
欲了解有關如何使用這些方法的詳細說明,請訪問IronPDF 文件。