使用IRONPDF

C# 读取 PDF 文件:简单教程

如果您是一名开发人员,您可能在尝试阅读 PDF 文件中的文本时遇到过问题。您可能遇到过以下一种或多种情况。

  1. 您正在开发一个将两个 PDF 文档作为输入并找出文档相似度的应用程序。

  2. 您正在开发一个需要使用IronPDF读取PDF文档并返回字数的应用程序。

  3. 您正在开发一个应用程序,该应用程序使用IronPDF从PDF文件中提取数据,并将其放入结构化数据库中。

  4. 您正在开发一个需要提取PDF文本内容并将其转换为字符串的应用程序。

  5. 在 IronPDF 开发之前,使用 C# 从 PDF 文件中提取数据是一项困难而复杂的任务。

    IronPDF 库概述 是一个使开发人员更容易读取 PDF 文件的库。

    您可以探索更多关于IronPDF 和 Iron Software Suite 产品的信息。

    只需两行代码,您就可以读取 PDF 文件并在 C# 文本框中显示数据。 是的,只有两行代码。 您还可以从PDF中提取所有图像。 此外,您还可以使用这些图片创建另一个文档,或根据自己的要求在应用程序中显示这些图片。

    让我们向您展示如何做到这一点。

    我们可以通过应用程序逐步选择任何 PDF 文件,然后显示其内容。

    以下步骤将向您展示如何用 C# 阅读 PDF 文件:

    先修知识:

  6. C# 编程基础知识

  7. C# GUI 控件的基本知识

    我在设计本教程时考虑到,即使是没有编程背景的人也能有所进步。

    谁应该阅读此内容

    任何学习 C# 的新手都应该知道如何使用 IronPDF 读取 PDF 文件,因为这肯定会在您的职业生涯中用到。

    专业开发人员也应该阅读此文,以便能够理解 IronPDF 库,它可以帮助我们读取、生成和处理 PDF 文档。

    现在,我们如何在项目中使用该库来阅读 PDF 文件?

    我将使用一个 Windows 窗体应用程序进行演示。 您可以根据自己的偏好使用控制台应用程序、WPF 应用程序或 ASP.NET 网络应用程序。

    IronPDF 库的另一大优势是它可以与 C# 和 VB.NET 一起使用。

    让我们立即开始演示。


步骤 1:创建 Visual Studio 项目

打开 Visual Studio。 我正在使用 Visual Studio 2019。

单击 "创建新项目":

C# 阅读 PDF 文件:简单教程,图 3:创建新项目

创建新项目

现在,从模板中选择 Windows 窗体应用程序,按 "下一步",就会出现以下窗口。 输入项目名称。 我撰写了 "使用 IronPDF 阅读 PDF"。

C# 读取 PDF 文件:简单教程,图 16:通过 Visual Studio 配置项目

通过 Visual Studio 配置项目

现在,点击 "下一步",将出现以下窗口。 从下拉菜单中选择".NET Core 3.1"。

C# 读取 PDF 文件:简单教程,图 9:.NET Core 3.1 版本

.NET Core 3.1 版本

点击 "创建 "按钮,项目将如下图所示创建。

C# 读取PDF文件:简单教程,图6:新的Windows窗体应用程序的初始阶段

新的 Windows Forms 应用程序的初始阶段


第 2 步:安装 IronPDF NuGet 软件包

单击菜单栏中的项目菜单,将出现一个下拉列表。 选择 "管理 NuGet 包",然后点击它。 将出现以下窗口:

C# 读取 PDF 文件:简单教程,图 1:NuGet 包管理器

NuGet 包管理器

现在,点击 "浏览"。 将出现以下窗口:

C# 读取 PDF 文件:简单教程,图 2:NuGet 包管理器 UI

NuGet 包管理器用户界面

在搜索框中键入 IronPdf,然后按 "Enter "键。 将出现以下窗口:

C# 读取 PDF 文件:简单教程,图 4:NuGet 解决方案

NuGet 解决方案

选择并点击 IronPdf。 将出现以下窗口:

C# 读取 PDF 文件:简单教程,图 7:安装免费 IronPDF

安装免费IronPdf

按下 "安装 "按钮,等待安装完成。 安装成功后将出现以下窗口:

C#读取PDF文件:简单教程,图5:IronPdf for .NET

IronPdf for .NET

按下 "OK "按钮,您就可以开始了。

注意:下载 NuGet 软件包还有其他方法。 您还可以使用包管理器控制台安装IronPdf; 为此,请打开软件包管理器控制台并编写以下代码:

Install-Package IronPdf

您还可以在IronPDF 的 NuGet 软件包页面上下载它。

将打开以下 Readme.txt 文件:

C# 读取 PDF 文件:简单教程,图 12:IronPdf 的自述文件和代码示例

IronPdf 的自述文件及代码示例

我建议您查看所有链接,并探索更多关于此库的IronPDF代码示例


步骤 3:设计 Windows 窗体应用程序

创建项目并安装 NuGet 软件包后,下一步就是设计一个 Windows 窗体应用程序,要求用户浏览文件并显示其内容。

打开 Form1 设计:

C# 读取 PDF 文件:简单教程,图 14:Form1 设计 UI

Form1 设计 UI

点击窗口左侧的工具栏:

C#读取PDF文件:简单教程,图15:Label和TextBox的工具箱UI

标签和文本框的工具箱用户界面

搜索标签,并将其拖放到表单设计中

命名标签。 在这里,我将其命名为 "C# Read Pdf using IronPDF"。

C# 读取 PDF 文件:简单教程,图 20:已添加标签的 Form1 UI

添加了标签的Form1用户界面

接下来,拖放一个文本框(用于显示文件路径)、三个按钮(一个用于浏览文件,一个用于使用IronPDF读取PDF文件,第三个按钮用于“清除文本”字段),以及一个RichTextBox(用于读取和显示文件内容)。

将文本框和 RichTextBox 的 "只读属性 "设置为 "假"。 这样,用户才能读懂内容和文件路径。

C#读取PDF文件:简单教程,图10:已完全设计的Form1

Form1 完全设计


第 4 步:添加用于浏览 PDF 文件的后端代码

双击 "浏览 "按钮,将出现以下窗口:

private void Browse_Click(object sender, EventArgs e)
{
}
private void Browse_Click(object sender, EventArgs e)
{
}
Private Sub Browse_Click(ByVal sender As Object, ByVal e As EventArgs)
End Sub
$vbLabelText   $csharpLabel

接下来,在 Browse_Click 函数中编写以下代码:

private void Browse_Click(object sender, EventArgs e)
{
    OpenFileDialog browseFile = new OpenFileDialog
    {
        InitialDirectory = @"D:\",
        Title = "Browse Pdf Files",
        CheckFileExists = true,
        CheckPathExists = true,
        DefaultExt = "pdf",
        Filter = "pdf files (*.pdf)
*.pdf",
        FilterIndex = 2,
        RestoreDirectory = true,
        ReadOnlyChecked = true,
        ShowReadOnly = true
    };
    if (browseFile.ShowDialog() == DialogResult.OK)
    {
        FilePath.Text = browseFile.FileName;
    }
}
private void Browse_Click(object sender, EventArgs e)
{
    OpenFileDialog browseFile = new OpenFileDialog
    {
        InitialDirectory = @"D:\",
        Title = "Browse Pdf Files",
        CheckFileExists = true,
        CheckPathExists = true,
        DefaultExt = "pdf",
        Filter = "pdf files (*.pdf)
*.pdf",
        FilterIndex = 2,
        RestoreDirectory = true,
        ReadOnlyChecked = true,
        ShowReadOnly = true
    };
    if (browseFile.ShowDialog() == DialogResult.OK)
    {
        FilePath.Text = browseFile.FileName;
    }
}
Private Sub Browse_Click(ByVal sender As Object, ByVal e As EventArgs)
	Dim browseFile As New OpenFileDialog With {
		.InitialDirectory = "D:\",
		.Title = "Browse Pdf Files",
		.CheckFileExists = True,
		.CheckPathExists = True,
		.DefaultExt = "pdf",
		.Filter = "pdf files (*.pdf) *.pdf",
		.FilterIndex = 2,
		.RestoreDirectory = True,
		.ReadOnlyChecked = True,
		.ShowReadOnly = True
	}
	If browseFile.ShowDialog() = DialogResult.OK Then
		FilePath.Text = browseFile.FileName
	End If
End Sub
$vbLabelText   $csharpLabel

OpenFileDialogue 将创建 Windows Forms 应用程序的文件对话框控件的实例。

我将初始路径设置为 D 盘;您可以将其设置为任何路径。

我已经将DefaultExt = "pdf"设置为我们只需要读取PDF文件。

我使用了一个过滤器,这样浏览文件对话框只会显示要选择的 PDF 文件。

用户点击 "确定 "后,文件路径字段中将显示文件路径。

让我们运行解决方案并测试 "浏览 "按钮。

C# 读取 PDF 文件:简单教程图 10:Form1 用户界面

Form1 用户界面

按下 "浏览 "按钮,将出现以下窗口:

C# 阅读 PDF 文件:简易教程,图 11:浏览文件对话框以选择 PDF 文件

浏览文件对话框以选择 PDF 文件

选择文件(我正在选择IronPDFTest.pdf),然后按“打开”。 将出现以下窗口。

C# 读取 PDF 文件:简单教程,第 13 图:C# 中的 PDF

在 C# 中生成 PDF

现在让我们编写 "读取 "按钮后面的代码,以读取文件。


第 5 步:添加使用 IronPDF 读取 PDF 文档的后端代码

您可能会认为阅读 PDF 文件的代码非常复杂,难以编写和理解。

不用担心。 IronPdf 化繁为简,让一切都变得如此简单。 我们只需使用两行代码就能轻松读取 PDF 文件。

请访问 Form1 Design 并 "双击""阅读 "按钮。 将出现以下窗口:

private void Read_Click(object sender, EventArgs e)
{
}
private void Read_Click(object sender, EventArgs e)
{
}
Private Sub Read_Click(ByVal sender As Object, ByVal e As EventArgs)
End Sub
$vbLabelText   $csharpLabel

添加命名空间using IronPdf以导入IronPDF库:

using System;
using IronPdf;
using System;
using IronPdf;
Imports System
Imports IronPdf
$vbLabelText   $csharpLabel

Read_Click函数中编写以下代码:

private void Read_Click(object sender, EventArgs e)
{
    using PdfDocument pdf = PdfDocument.FromFile(FilePath.Text);
    FileContent.Text = pdf.ExtractAllText(); 
}
private void Read_Click(object sender, EventArgs e)
{
    using PdfDocument pdf = PdfDocument.FromFile(FilePath.Text);
    FileContent.Text = pdf.ExtractAllText(); 
}
Private Sub Read_Click(ByVal sender As Object, ByVal e As EventArgs)
	Using pdf As PdfDocument = PdfDocument.FromFile(FilePath.Text)
		FileContent.Text = pdf.ExtractAllText()
	End Using
End Sub
$vbLabelText   $csharpLabel

FilePath 是显示我们想要读取的 PDF 文档位置的文本字段的名称。 我们将动态获取文件的位置。

使用 IronPDF 的 ExtractAllText 是 IronPDF 的功能,可提取 PDF 页面中的所有数据。 然后,这些数据将显示在富文本框中,并命名为 "文件内容"。

接下来,让我们编写 "清除按钮 "后面的代码。 如果您希望在阅读完 PDF 文档后清除屏幕,这只是一个附加项目。

双击 "清除按钮",您将看到以下代码:

void Clear_Click(object sender, EventArgs e)
{
}
void Clear_Click(object sender, EventArgs e)
{
}
Private Sub Clear_Click(ByVal sender As Object, ByVal e As EventArgs)
End Sub
$vbLabelText   $csharpLabel

Clear_Click函数中编写以下代码:

void Clear_Click(object sender, EventArgs e)
{
    FileContent.Text = "";
    FilePath.Text = "";
}
void Clear_Click(object sender, EventArgs e)
{
    FileContent.Text = "";
    FilePath.Text = "";
}
Private Sub Clear_Click(ByVal sender As Object, ByVal e As EventArgs)
	FileContent.Text = ""
	FilePath.Text = ""
End Sub
$vbLabelText   $csharpLabel

运行解决方案

单击 "浏览 "按钮,选择您要阅读的文档。 以我为例,我正在阅读 IronPDF.pdf 文件:

C# 阅读 PDF 文件:简单教程,图 8:PDF 文档

PDF 文档

按下 "打开 "按钮,将出现以下窗口:

C# 读取 PDF 文件:简单教程,图 13:选择了 PDF 文件的应用程序

应用程序中选择的PDF文件

按 "阅读 "按钮。 它将读取文件并显示如下所示的内容。

C# 读取 PDF 文件:简单教程,图 19:显示 PDF 文本内容

显示PDF文本内容


摘要

这是一个解决方案示例。 无论 PDF 文件中有多少页、图像或文本,IronPDF 都能提取所有文本和图像,供您用于任何目的。 您只需获得该库的许可证即可开始使用。

本教程至此完成。 希望您已经理解了所有内容,如果您有任何疑问,请随时在评论区发表。

您可以下载项目压缩文件。 如果您希望购买 Iron 软件的全套产品,我们的特价优惠意味着您现在只需花两份的价格就可以买到所有产品。 如果您需要有关许可证和支持的更多详细信息,请点击Iron Software的定价信息。 您还可以获取免费试用许可证

Chipego
软件工程师
Chipego 拥有出色的倾听技巧,这帮助他理解客户问题并提供智能解决方案。他在 2023 年加入 Iron Software 团队,此前他获得了信息技术学士学位。IronPDF 和 IronOCR 是 Chipego 主要专注的两个产品,但他对所有产品的了解每天都在增长,因为他不断找到支持客户的新方法。他喜欢 Iron Software 的合作氛围,公司各地的团队成员贡献他们丰富的经验,以提供有效的创新解决方案。当 Chipego 离开办公桌时,你经常可以发现他在看书或踢足球。
< 前一页
一键生成.NET PDF
下一步 >
如何为PDF文档设置密码保护