在C#中阅读PDF文件

在从一种文档格式过渡到另一种格式时,提取文本和图像可促进数据迁移。提取的内容可以更易于访问和编辑的格式保存,从而降低数据丢失的风险。

嵌入的图像和文本可以独立于 PDF 文档提取。提取的文本将是普通字符串,而提取的图像将是图像缓冲格式,然后可以导出或进一步处理。

使用 extractText 方法提取文本,使用 extractRawImages 方法提取 PDF 文档中的图像。