使用IRONPDF

如何在C#中读取PDF文件

更新 2024年三月24日
分享:

本文将使用 IronPDF for .NET,一个用于读取 PDF 文件的 C# PDF 库。

如何使用 IronPDF 阅读 PDF 文件

1.下载 Visual Studio(如果尚未下载)。设置环境并安装 IronPDF 库。

2.使用 PDFDocument.FromFile 方法打开并加载所需的 PDF 文件。

3.利用 IronPDF 的 ExtractAllText 方法获取内容。

4.根据需要分析或处理提取的文本。

5.在控制台中打印提取的文本以供阅读。

IronPDF

IronPDFIronPDF 是一款功能强大的 C# PDF 阅读器库,可帮助开发人员轻松处理 PDF 文档。凭借其丰富的特性和功能,IronPDF 简化了 PDF 文档处理任务,使用户能够轻松阅读、提取和处理 PDF 内容。无论您是要实现文档处理自动化、提取数据和图像进行分析,还是要从头开始创建 PDF,IronPDF 都能提供一套全面的工具来简化这些任务。

本文将探讨如何使用 C# 高效处理 PDF。 IronPDF展示了其作为开发人员软件开发过程中必不可少的工具的多功能性和价值。

创建一个新的 Visual Studio 项目

在开始编码之前,让我们先创建一个全新的 Visual Studio C# 控制台应用程序项目。该项目将作为开发和实际示例的专用工作区。

1.要启动此过程,请启动 Visual Studio 并创建一个新项目,方法是导航至 "文件 "菜单并选择 "新建",然后选择 "项目"。

如何用 C# 阅读 PDF 文件,图 1:导航至 Visual Studio 中的 创建项目 对话框

导航至 Visual Studio 中的 "创建项目 "对话框

2.此操作将提示出现一个新窗口,为您提供指定项目模板的机会。为简单起见,请选择 "控制台应用程序 "模板,然后点击窗口左下角的下一步按钮。

如何用 C# 阅读 PDF 文件,图 2:在 Visual Studio 中创建新项目

在 Visual Studio 中创建一个新项目

3.在接下来的窗口中,系统会提示您为项目指定一个名称,并指定所需的项目位置。完成这些细节后,单击下一步按钮继续。

如何用 C# 阅读 PDF 文件,图 3:配置项目

配置项目

4.在此步骤中,请选择您喜欢的目标框架,然后单击创建按钮结束项目创建过程。

如何在 C# 中读取 PDF 文件,图 4:.NET 框架选择

.NET框架选择

现在您的项目已经确立,下一个关键步骤涉及安装 IronPDF.

安装 IronPDF

IronPDF 提供了下载和安装 PDF 库的多种选择。在本指南中,我们将重点介绍使用 NuGet 包管理器安装 IronPDF,这是一种熟练且被广泛采用的方法。

1.在 Visual Studio 中,导航至 "工具 "菜单,然后将光标优雅地悬停在 "NuGet 包管理器 "选项上。

2.从扩展菜单中选择 "解决方案的 NuGet 包管理器"。

如何用 C# 阅读 PDF 文件,图 5:导航至 NuGet 包管理器

导航至 NuGet 软件包管理器

3.选择该选项后,将打开一个新窗口。在这个精致的窗口中,导航到 "浏览 "菜单,然后在搜索栏中输入 "IronPDF"。

4.屏幕将显示可用的 IronPDF 软件包。要继续操作,请从列表中选择最新的软件包,然后点击 "安装 "选项执行该选择。

如何用 C# 阅读 PDF 文件,图 6:在 NuGet 软件包管理器用户界面中搜索并安装 IronPdf 软件包

在 NuGet 软件包管理器用户界面中搜索并安装 IronPdf 软件包

对于喜欢使用命令行方式的用户,NuGet 软件包管理器控制台提供了一个优雅的途径。只需打开该控制台,输入以下命令,然后按 "回车键 "即可:

Install-Package IronPdf

您还可以选择直接从 NuGet 网站 链接。

使用 IronPDF 阅读 PDF 文件

本节将介绍如何在 IronPDF 的帮助下使用 C# 编程语言打开并读取完整的 PDF 文件。

using IronPdf;
using System;

IronPdf.License.LicenseKey = "";
//raw text string path
var pdf = PdfDocument.FromFile("document_scaled_compressed.pdf");

string text = pdf.ExtractAllText();

Console.WriteLine(text);
using IronPdf;
using System;

IronPdf.License.LicenseKey = "";
//raw text string path
var pdf = PdfDocument.FromFile("document_scaled_compressed.pdf");

string text = pdf.ExtractAllText();

Console.WriteLine(text);
Imports IronPdf
Imports System

IronPdf.License.LicenseKey = ""
'raw text string path
Dim pdf = PdfDocument.FromFile("document_scaled_compressed.pdf")

Dim text As String = pdf.ExtractAllText()

Console.WriteLine(text)
VB   C#

1.导入必要的库

要开始使用,您需要导入所需的命名空间。在上面的代码示例中,导入了 IronPdf 命名空间,其中包含处理 PDF 的基本功能。此外,还导入了 System 命名空间,用于一般的系统级操作。

using IronPdf;
using System;
using IronPdf;
using System;
Imports IronPdf
Imports System
VB   C#

2.设置 IronPDF 许可证密钥

IronPDF 需要有效的许可证密钥才能在生产环境中使用。在代码示例中,有一行应该设置许可证密钥。然而,在您提供的代码中,许可证密钥是空的""。在生产环境中使用 IronPDF 时,请确保用有效的许可证密钥替换空字符串。

IronPdf.License.LicenseKey = "Your_License_Key_Here";
IronPdf.License.LicenseKey = "Your_License_Key_Here";
IronPdf.License.LicenseKey = "Your_License_Key_Here"
VB   C#

3.加载 PDF 文档

下一步是加载和解析 PDF 文件。在提供的代码中,"PdfDocument.FromFile "方法用于加载文件名为 "document_scaled_compressed.pdf "的 PDF 文件,并将其赋值给 pdf 变量。该 PDF 文件将用于文本提取。

var pdf = PdfDocument.FromFile("document_scaled_compressed.pdf");
var pdf = PdfDocument.FromFile("document_scaled_compressed.pdf");
Dim pdf = PdfDocument.FromFile("document_scaled_compressed.pdf")
VB   C#

4.从 PDF 文档中提取文本

IronPDF 提供了从加载的 PDF 文档中提取文本的直接方法。文本提取 提取所有文本 该方法可以从 PDF 的每一页中提取所有文本内容,并将其存储在名为 textstring 变量中,其作用是将 PDF **** 转换为文本。

string text = pdf.ExtractAllText();
string text = pdf.ExtractAllText();
Dim text As String = pdf.ExtractAllText()
VB   C#

5.显示提取的文本

最后一步是显示提取的文本。在代码中,Console.WriteLine 会将提取的文本打印并写入控制台。这是调试或向用户展示文本的有用方法。

Console.WriteLine(text);
Console.WriteLine(text);
Console.WriteLine(text)
VB   C#

输出 从 PDF 文件中提取的文本

如何用 C# 阅读 PDF 文件,图 7:从 PDF 文件中提取的文本

从 PDF 文件中提取的文本

结论

本文将指导开发人员通过使用 IronPDF 库。文章首先说明了一个专用 Visual Studio 项目的设置,然后通过 NuGet 包管理器直接安装 IronPDF。然后,文章逐步讲解了如何导入必要的库、设置 IronPDF 许可证密钥、加载 PDF 文件、提取文本内容以及显示从所有页面提取的文本。您还可以使用 C# 将提取的文本保存到 TXT 文件中。

该软件使用方便,功能全面、 IronPDF 是自动化文档处理、数据提取以及从 HTML、URL 和图像中创建 PDF 的不可或缺的工具,使其成为增强涉及用 C# 处理 PDF 文件的软件开发项目的宝贵资产。

使用该工具读取 PDF 文件的完整文章 IronPDF 可在以下网站找到 方法页面.上的代码示例 C# PDF 阅读器 也可用。有关使用 IronPDF 的更多代码示例,请访问以下网站 示例页面.IronPDF 还提供了大量的文档来回答所有开发人员的问题,并提供全面的实践支持。IronPDF 提供免费的 试用许可 因此,用户在决定购买之前,可以探索其全部功能。 永久许可证.

< 前一页
如何在C#中添加PDF印章
下一步 >
如何在.NET库中压缩PDF文件

准备开始了吗? 版本: 2024.9 刚刚发布

免费NuGet下载 总下载量: 10,746,704 查看许可证 >