在 C# 中读取 PDF 文件 来自 IronPDF C# PDF 库的 PdfDocument.ExtractAllText 方法非常适合用于简单的 PDF 文本读取任务。 此方法可以处理源 PDF 文档中的空白和编码不一致问题。 PdfDocument.ExtractTextFromPage 从 PDF 的特定页面读取文本。 在下面的示例中,我们看到它被迭代使用以从特定页面范围中获取文本内容。 IronPDF 也可以从 PDF 中提取原始图像。 为此,请使用下面 PdfDocument 类的方法之一: ExtractAllImages:返回嵌入在 PDF 中的所有图像,以 IronSoftware.Drawing.AnyBitmap 对象形式。 ExtractAllRawImages:以原始字节列表(byte[])形式检索所有嵌入图像。 ExtractImagesFromPage:提取索引页面上包含的图像。 ExtractImagesFromPages:与 ExtractImagesFromPage 相同,但适用于特定页面范围或多个单独页面。 ExtractRawImagesFromPage 和 ExtractRawImagesFromPages:与前两个方法相同,但以字节数组形式返回提取的图像,而不是 IronSoftware.Drawing.AnyBitmap 对象。 class="hsg-featured-snippet"> 如何在 C# 中读取 PDF 文件 下载 IronPDF C# 库 从 PDF 中提取图像或文本 读取并查找特定文档中的词 查看来自原始文档的 PDF 输出 了解更多关于 ExtractTextFromPage 方法的信息 在 GitHub 上查看 代码 https://github.com/iron-software/IronPdf.Examples/tree/main/examples/reading-pdf-text 下载 ZIP 相关教程 相关操作指南 类文档 获取语言包 下载IronPDF DLL 报告此页面的问题 准备开始了吗? Nuget 下载 16,154,058 | 版本: 2025.11 刚刚发布 免费 NuGet 下载 总下载量:16,154,058 查看许可证