使用IRONPDF

如何在C#中读取PDF文件

乔尔迪·巴尔迪亚

2023年十一月13日

更新 2024年三月24日

本文将使用IronPDFfor .NET，一个用于读取 PDF 文件的 C# PDF 库。

如何使用 IronPDF 阅读 PDF 文件

如果尚未下载，请下载 Visual Studio。设置环境并安装IronPDF库。
使用PDFDocument.FromFile打开并加载所需PDF文件的方法。
使用 IronPDF 的 ExtractAllText 方法来检索内容。
根据需要分析或处理提取的文本。
在控制台中打印提取的文本以进行阅读。

IronPDF

IronPDF，适用于C#的强大PDF阅读器库，使开发人员能够轻松处理PDF文档。凭借其广泛的功能和能力，IronPDF 简化了 PDF 文档处理的任务，使用户能够轻松读取、提取和操作 PDF 内容。无论您是自动化文档处理、提取数据和图像以进行分析，还是从零开始创建PDF，IronPDF都提供了全面的工具集来简化这些任务。

本文探讨了使用C#进行高效PDF处理的世界，使用IronPDF展示了其作为开发人员软件开发过程中必不可少的工具的多功能性和价值。

创建新的 Visual Studio 项目

在深入研究编码方面之前，让我们先开始设置一个新的Visual StudioC# 控制台应用程序项目。该项目将作为开发和实际示例的专用工作区。

要启动此过程，请启动 Visual Studio，并通过导航到“文件”菜单并选择“新建”然后选择“项目”来创建一个新项目。
在 Visual Studio 中导航到创建项目对话框
此操作将弹出一个新窗口，提供您指定项目模板的机会。为了简化操作，选择“控制台应用程序”模板，然后点击位于窗口左下角的下一步按钮。
在Visual Studio中创建一个新项目
在接下来的窗口中，系统会提示您为项目指定一个名称并指定所需的项目位置。一旦这些详细信息到位，点击 下一步 按钮继续。
配置项目
在此步骤中，选择您喜欢的目标框架，并通过点击创建按钮来完成项目创建过程。
*.NET Framework 选择***
现在你的项目已经稳步建立，接下来的重要步骤就是安装IronPDF.

安装 IronPDF

IronPDF提供多种选项来下载和安装PDF库。在本指南中，将重点放在通过NuGet包管理器安装IronPDF，这是一个高效且广泛采用的方法。

在 Visual Studio 中，导航到“工具”菜单上，优雅地将光标悬停在“NuGet 包管理器”选项上。
从扩展菜单中，选择“NuGet 包管理器用于解决方案”。
导航到NuGet包管理器
选择此选项后，将会打开一个新窗口。在这个精炼的窗口中，导航到“浏览”菜单，并在搜索栏中输入“IronPDF”。
屏幕将显示可用的IronPDF软件包。要继续，请从列表中选择最新的软件包，然后单击“安装”选项来执行此选择。
在 NuGet 包管理器 UI 中搜索并安装 IronPdf 包
对于那些偏好命令行方法的人来说，NuGet 包管理器控制台提供了一种优雅的途径。只需打开此控制台，输入以下命令，然后按“Enter”键：

Install-Package IronPdf

您还可以选择直接从NuGet 网站链接。

使用 IronPDF 阅读 PDF 文件

本节将展示如何使用IronPDF通过C#编程语言打开和读取完整的PDF文件。

using IronPdf;
using System;

IronPdf.License.LicenseKey = "";
//raw text string path
var pdf = PdfDocument.FromFile("document_scaled_compressed.pdf");

string text = pdf.ExtractAllText();

Console.WriteLine(text);

using IronPdf;
using System;

IronPdf.License.LicenseKey = "";
//raw text string path
var pdf = PdfDocument.FromFile("document_scaled_compressed.pdf");

string text = pdf.ExtractAllText();

Console.WriteLine(text);

Imports IronPdf
Imports System

IronPdf.License.LicenseKey = ""
'raw text string path
Dim pdf = PdfDocument.FromFile("document_scaled_compressed.pdf")

Dim text As String = pdf.ExtractAllText()

Console.WriteLine(text)

1. 导入必要的库

要开始使用，您需要导入所需的命名空间。在上述代码示例中，导入了IronPdf命名空间，其中包含处理PDF的基本功能。此外，System 命名空间也被导入用于一般的系统级操作。

using IronPdf;
using System;

using IronPdf;
using System;

Imports IronPdf
Imports System

2. 设置IronPDF许可证密钥

IronPDF需要有效的许可证密钥才能在生产环境中使用。在代码示例中，有一行需要设置许可证密钥。但是，在您提供的代码中，许可证密钥被留空 ""。在生产环境中使用IronPDF时，请确保将空字符串替换为有效的许可证密钥。

IronPdf.License.LicenseKey = "Your_License_Key_Here";

IronPdf.License.LicenseKey = "Your_License_Key_Here";

IronPdf.License.LicenseKey = "Your_License_Key_Here"

3. 加载PDF文档

下一步是加载和解析PDF文件。在提供的代码中，使用PdfDocument.FromFile方法通过文件名"document_scaled_compressed.pdf"加载PDF，并将其分配给pdf变量。此PDF文件将用于文本提取。

var pdf = PdfDocument.FromFile("document_scaled_compressed.pdf");

var pdf = PdfDocument.FromFile("document_scaled_compressed.pdf");

Dim pdf = PdfDocument.FromFile("document_scaled_compressed.pdf")

4. 从PDF文档中提取文本

IronPDF提供了一种从加载的PDF文档中提取文本的简便方法。 "(《世界人权宣言》)提取所有文本该方法可以从 PDF 的每一页中提取所有文本内容，并将其存储在名为 text 的 string 变量中，其作用是将 PDF **** 转换为文本。

string text = pdf.ExtractAllText();

string text = pdf.ExtractAllText();

Dim text As String = pdf.ExtractAllText()

5. 显示提取的文本

最后一步是显示提取的文本。在代码中，Console.WriteLine 将打印并将提取的文本写入控制台。这是一种用于调试或向用户显示文本的有用方法。

Console.WriteLine(text);

Console.WriteLine(text);

Console.WriteLine(text)

从PDF文件中提取的文本输出

如何用 C# 阅读 PDF 文件，图 7：从 PDF 文件中提取的文本

从PDF文件中提取的文本

结论

这篇文章指导开发人员使用C#有效地处理PDF文件IronPDF图书馆它开始通过展示如何设置专用的Visual Studio项目，并接着通过NuGet包管理器简单安装IronPDF。该文章接着提供了逐步解释如何导入必要的库、设置IronPDF许可证密钥、加载PDF文件、提取文本内容以及显示所有页面中提取的文本。您还可以使用C#将提取的文本保存到TXT文件中。

凭借其用户友好的方法和全面的功能，IronPDF作为自动化文档流程、数据提取和从HTML、URL以及图像创建PDF的不可或缺的工具，它是增强涉及C#中的PDF文件处理的软件开发项目的宝贵资产。

使用IronPDF读取PDF文件的完整文章IronPDF可在以下网站找到方法页面. 代码示例在C# PDF 阅读器也可以使用。有关更多使用IronPDF的代码示例，请访问此页面示例页面. IronPDF还提供详尽的文档，解答所有开发者的问题，并提供全面的动手支持。 IronPDF 提供免费的试用许可因此，用户在决定购买之前，可以探索其全部功能。永久许可证.

乔尔迪·巴尔迪亚

立即与工程团队聊天

软件工程师

Jordi 最擅长 Python、C# 和 C++，当他不在 Iron Software 运用技能时，他会进行游戏编程。作为产品测试、产品开发和研究的负责人之一，Jordi 为持续的产品改进增添了极大的价值。多样化的经验让他充满挑战和参与感，他说这是他在 Iron Software 工作中最喜欢的方面之一。Jordi 在佛罗里达州迈阿密长大，并在佛罗里达大学学习计算机科学和统计学。

< 前一页
如何在C#中添加PDF印章

下一步 >
如何在.NET库中压缩PDF文件