using IronPdf; // Disable local disk access or cross-origin requests Installation.EnableWebSecurity = true; // Instantiate Renderer var renderer = new ChromePdfRenderer(); // Create a PDF from a HTML string using C# var pdf = renderer.RenderHtmlAsPdf("<h1>Hello World</h1>"); // Export to a file or Stream pdf.SaveAs("output.pdf"); // Advanced Example with HTML Assets // Load external html assets: Images, CSS and JavaScript. // An optional BasePath 'C:\site\assets\' is set as the file location to load assets from var myAdvancedPdf = renderer.RenderHtmlAsPdf("<img src='icons/iron.png'>", @"C:\site\assets\"); myAdvancedPdf.SaveAs("html-with-assets.pdf");

使用IRONPDF

C# 将 PDF 转换为文本（代码示例）

Name: IronPDF
Brand: Iron Software
Availability: InStock
Rating: 4.87 (307 reviews)

奇佩戈-卡琳达

2022年七月17日

更新 2024年二月8日

本文概述了.NET 开发人员将 PDF 文件转换为 TXT 格式以便更有效访问的过程。

如何使用 C# 将 PDF 转换为文本文件

下载将 PDF 转换为文本的 C# 库
在 Visual Studio 中创建新项目
将库安装到项目中
使用 PdfDocument.FromFile 函数打开 PDF 文档
查看提取的输出文本

教程涵盖的主题

IronPDF
以编程方式创建 PDF 文件的步骤
步骤 1：创建 C# 项目
第 2 步：安装 IronPDF 库
- 方法 1：NuGet 软件包管理器
- 方法 2：NuGet 软件包管理器控制台
方法 3：使用 DLL 文件
第 3 步：添加 IronPDF 命名空间
第 4 步：将 PDF 转换为文本
输出
结论

IronPDF

IronPdf 是一个用于生成 PDF 的 .NET 库。这是一个本地 .NET 库，不依赖于外部 DLL 或其他工具。 IronPDF 是一个用 C# 和 .NET 编写的跨平台库，提供处理 PDF 文档所需的所有功能。它包含文档渲染、表单编辑、文本提取、文件加密以及其他功能。所有这些操作都可以通过直观的 API 执行，该 API 已在 Windows 窗体、WPF、ASP.NET MVC 等各种平台上进行了广泛测试。

当前发布的 IronPDF 可让您轻松访问这些功能：

PDF 生成
PDF 加密
PDF 表单字段配有模板和验证逻辑
文本提取从PDF中提取（OCR）
可填写表格
只读访问文档内部（查看、导航、注释）：
访问元数据和文档属性（标题、关键词、作者、主题）：
IronPDF还包含一些额外的辅助类，可帮助将HTML文档转换为格式齐全的PDF文件并进行文本提取。 IronPDF 提供了非常简单的 API，可将 PDF 转换为文本文件。
让我们从如何使用 IronPDF 库将 PDF 文档转换为文本文件开始。

将 PDF 文档转换为文本文件的步骤

第一步是在 Visual Studio 中创建一个 C# 项目。您可以根据自己的需要选择任何 C# 应用程序模板。为简单起见，本教程将使用控制台应用程序模板。您可以使用已有的 C# 项目将 PDF 转换为 TXT 文件。

步骤 1：创建 C#; 项目

在 Visual Studio 中创建一个 C# 项目或打开一个现有项目。建议使用最新版本的 Visual Studio，以便顺利开展工作。按照给出的步骤在 Visual Studio 中创建 C# 项目。

打开 Visual Studio。
选择 C# 控制台应用程序模板或打开现有项目。
为项目正名。
选择 .NET Framework 6.0 版本。这是最新、最稳定的 .NET Framework，但您也可以根据自己的需要选择其他任何 .NET Framework。

第 2 步：安装 IronPDF 库

IronPdf 还具有安装过程简单的特点，既能加快开发时间，又能减少混乱。 IronPDF 库提供多种安装方式：

使用 NuGet 软件包管理器
使用 NuGet 软件包管理器控制台
由 DLL 文件提供

方法 1：NuGet 软件包管理器

要使用 NuGet 包管理器，请按照给出的步骤打开 "包管理器 "选项卡。

打开 C# 项目，然后点击工具 > NuGet 包管理器 > 为解决方案管理 NuGet 包。

C# 将 PDF 转换为文本 (代码示例)，图 0：导航到 NuGet 包管理器

导航到NuGet包管理器

现在进入浏览选项卡并搜索IronPDF。
从搜索结果中选择IronPDF并点击安装。这将安装 IronPDF 库，允许项目与 IronPDF 库一起使用。
NuGet 包管理器搜索结果中的 IronPdf 包

方法 2：NuGet 软件包管理器控制台

使用软件包管理器控制台安装 IronPdf 库是最简单的方法。请遵循以下简单步骤：

打开软件包管理器控制台。
在控制台中写下以下一行，然后按回车键。这将立即安装 IronPDF 库。

Install-Package IronPdf

C# 将 PDF 转换为文本（代码示例），图 2：NuGet 包管理器控制台 UI 中显示的安装进度

NuGet 包管理器控制台 UI 中显示的安装进度

方法 3：使用 DLL 文件

您可以从Iron Software网站下载IronPDF DLL文件。下载完成后，将其用作项目中的参考。

请访问IronPDF 安装指南以获取更详细的安装指南。

IronPDF 库的安装工作现已完成。以下步骤将指导您将 PDF 文件转换为文本文件。

第 3 步：添加 IronPDF 命名空间

要使用 IronPDF，必须在每个代码文件中添加 IronPDF 命名空间。在每个相关代码文件的顶部写入以下一行代码。它将使您能够在程序中使用 IronPDF 的功能。

using IronPdf;

using IronPdf;

Imports IronPdf

$vbLabelText $csharpLabel

第 4 步：将 PDF 文档转换为文本文件

现在，我们必须将 PDF 文件转换为 TXT 文件或仅提取文本。因此，请将以下示例代码写入您的代码文件：

using IronPdf;
using System.Drawing;

// Extracting image and text content from PDF Document

// Open a 128-bit encrypted PDF
using PdfDocument pdf = PdfDocument.FromFile("encrypted.pdf", "password");
// Get all text to put in a search index
string allText = pdf.ExtractAllText();
Console.WriteLine(allText);

using IronPdf;
using System.Drawing;

// Extracting image and text content from PDF Document

// Open a 128-bit encrypted PDF
using PdfDocument pdf = PdfDocument.FromFile("encrypted.pdf", "password");
// Get all text to put in a search index
string allText = pdf.ExtractAllText();
Console.WriteLine(allText);

Imports IronPdf
Imports System.Drawing

' Extracting image and text content from PDF Document

' Open a 128-bit encrypted PDF
Private PdfDocument As using
' Get all text to put in a search index
Private allText As String = pdf.ExtractAllText()
Console.WriteLine(allText)

$vbLabelText $csharpLabel

首先，使用FromFile 函数打开 PDF 文档，该函数属于PdfDocument 类。在参数中，传递文件名和密码（如果有）。之后，使用ExtractAllText 函数从PDF文件中提取所有文本，并将其存储在名为allText的变量中。然后，在控制台中显示输出文本

输出

C# 将 PDF 转换为文本（代码示例），图 3：从 PDF 文档中提取的文本

从PDF文档中提取的文本

这是 IronPDF 提取的输出文本。这是 PDF 文件上看到的相同文本，展示了 IronPDF 的准确性非常精确。

结论

本文展示了如何使用 IronPDF for .NET PDF 库轻松提取 PDF 文件中的文本。要做到这一点，只需编写几行代码，而且准确率很高。此外，IronPDF 还有许多有用的功能，如 HTML 到 PDF 的转换、PDF 格式化工具以及 PDF 编辑所必须的众多核心 PDF 功能。 IronPdf 还消除了对 Adobe Acrobat 的依赖。

IronPDF 免费用于开发目的，还提供用于生产测试的免费试用。 IronPdf 提供多种定价方案，您可以根据自己的需求进行选择。 IronPDF 的价格相对明显低于其竞争对手。从个人到大型公司，价格各不相同，这证明它是一种性能令人印象深刻的引人注目的购买方式。

C# 将 PDF 转换为文本（代码示例），图 4：Iron Software 套件的定价计划

Iron Software 套件的定价计划

此外，Iron Software 还提供五套 Iron Software 套装，价格仅为两套。有关更多信息，请访问Iron Software 许可详细信息。

奇佩戈-卡琳达

立即与工程团队聊天

软件工程师

Chipego 拥有出色的倾听技巧，这帮助他理解客户问题并提供智能解决方案。他在 2023 年加入 Iron Software 团队，此前他获得了信息技术学士学位。IronPDF 和 IronOCR 是 Chipego 主要专注的两个产品，但他对所有产品的了解每天都在增长，因为他不断找到支持客户的新方法。他喜欢 Iron Software 的合作氛围，公司各地的团队成员贡献他们丰富的经验，以提供有效的创新解决方案。当 Chipego 离开办公桌时，你经常可以发现他在看书或踢足球。

< 前一页
将字节数组保存为PDF C#（代码示例）

下一步 >
如何将多页扫描成一个 PDF 文件