使用IRONPDF

如何在C#中读取PDF文件

更新 2024年二月25日
分享:

程序化 PDF 处理在金融、医疗保健、法律和教育等行业至关重要,这些行业需要处理、分析和提取 PDF 文档中的关键信息,用于数据分析、文档管理和自动化等目的。 尽管这项任务很重要,但也很有挑战性。

IronPDF:C# PDF 库

IronPdf 使您能够轻松处理难以置信的艰巨任务。 它可以轻松编辑 PDF 文档中的文本,与在文本文档中处理文本文件的方式类似,同时允许您在任何操作系统中导出文件。 IronPDF 应用程序涵盖了查看、修改和提取 PDF 内容的完整过程。

使用 IronPDF 迈出正确的一步

使用任何装有 IronPDF 软件的计算机都可以快速、轻松地阅读和编写 PDF 文件格式的文本。 安装是一项简单的任务。 这是学习用 C# 阅读 PDF 文件的最佳途径。 您也可以免费下载 IronPDF 进行开发。 如果您探索 IronPdf,您会发现该库提供了广泛的功能,使 PDF 的使用变得非常简单。 利用空闲时间探索课程!有几个使用 HTML 创建 PDF 的 C# 示例了解如何通过阅读 PDF 创建最佳输出。

使用 IronPDF 阅读 PDF 文件

第 1 步:安装 IronPDF 软件包

开始时,您需要安装 IronPDF NuGet 软件包在您的.NET 项目中,您可以使用这些工具。 您可以在 Visual Studio 中打开软件包管理器控制台,然后输入以下命令:

Install-Package IronPdf

第 2 步:导入 IronPDF 库

接下来,您需要在代码中导入 IronPdf 库,方法是在文件顶部添加以下语句:

using IronPdf;
using IronPdf;
Imports IronPdf
VB   C#

第 3 步:加载 PDF 文档

导入 IronPdf 库后,您可以通过以下代码将 PDF 文档加载到您的代码中:

PdfDocument pdf = PdfDocument.FromFile(@"C:\dotnet.pdf");
var outputPath = "Example.pdf";
pdf.SaveAs(outputPath);
PdfDocument pdf = PdfDocument.FromFile(@"C:\dotnet.pdf");
var outputPath = "Example.pdf";
pdf.SaveAs(outputPath);
Dim pdf As PdfDocument = PdfDocument.FromFile("C:\dotnet.pdf")
Dim outputPath = "Example.pdf"
pdf.SaveAs(outputPath)
VB   C#

步骤 4:从 PDF 中提取文本

IronPdf 提供了一系列从现有 PDF 文件中提取文本的方法。例如,您可以使用以下代码片段开始从 PDF 中提取文本并将其打印到控制台:

string text = pdf.ExtractText();
Console.Writeline(text);
string text = pdf.ExtractText();
Console.Writeline(text);
Dim text As String = pdf.ExtractText()
Console.Writeline(text)
VB   C#

使用上述代码,您可以从 PDF 文件中提取文本.

如何用 C# 阅读 PDF 文件,图 1:使用 IronPDF 从 PDF 中提取文本

使用 IronPDF 从 PDF 中提取文本

步骤 5:将 PDF 栅格化为图像

让我们使用 IronPDF 将 PDF 文件栅格化为图像使用 IronPDF。 首先,导入所需的库:

using System.Linq;
using IronPdf;
using IronSoftware.Drawing;
using System.Linq;
using IronPdf;
using IronSoftware.Drawing;
Imports System.Linq
Imports IronPdf
Imports IronSoftware.Drawing
VB   C#

然后,代码使用光栅化图像文件 "方法将 PDF 文档的所有页面以图像文件的形式提取到文件夹中。 提取的图像可以保存为 PNG 或 JPG 文件,还可以指定图像的尺寸和页面范围。

// Extract all pages to a folder as image files
pdf.RasterizeToImageFiles(@"C:\image\folder\*.png");

// Dimensions and page ranges may be specified
pdf.RasterizeToImageFiles(@"C:\image\folder\example_pdf_image_*.jpg", 100, 80);
// Extract all pages to a folder as image files
pdf.RasterizeToImageFiles(@"C:\image\folder\*.png");

// Dimensions and page ranges may be specified
pdf.RasterizeToImageFiles(@"C:\image\folder\example_pdf_image_*.jpg", 100, 80);
' Extract all pages to a folder as image files
pdf.RasterizeToImageFiles("C:\image\folder\*.png")

' Dimensions and page ranges may be specified
pdf.RasterizeToImageFiles("C:\image\folder\example_pdf_image_*.jpg", 100, 80)
VB   C#

最后,代码使用ToBitmap 方法将 PDF 文档的所有页面提取为 "AnyBitmap "对象,以便在代码中进一步处理和操作。

// Extract all pages as AnyBitmap objects
AnyBitmap [] pdfBitmaps = pdf.ToBitmap();
// Extract all pages as AnyBitmap objects
AnyBitmap [] pdfBitmaps = pdf.ToBitmap();
' Extract all pages as AnyBitmap objects
Dim pdfBitmaps() As AnyBitmap = pdf.ToBitmap()
VB   C#

上述代码演示了如何使用 IronPDF 提取 PDF 文件的内容,并将提取的数据保存为图像文件或 AnyBitmap 对象,以便进一步处理。

第 7 步:处理 PDF 页面

让我们学习如何操作 PDF 文档的页面通过使用 IronPDF 阅读 PDF 文件。

代码首先使用删除页面 "方法:

pdf.RemovePages(1, 2);
pdf.RemovePages(1, 2);
pdf.RemovePages(1, 2)
VB   C#

删除页面 "方法需要两个参数:要删除的起始页面(在本例中,第 2 页表示为 1,因为页码从 0 开始)以及要删除的页数(在这种情况下,2 页).

第 6 步:保存 PDF

最后,您可以使用保存为 "方法. 保存 PDF 文件的代码如下:

pdf.SaveAs(OutputPath);
pdf.SaveAs(OutputPath);
pdf.SaveAs(OutputPath)
VB   C#

IronPDF兼容性

IronPDF 与包括 .NET 7 在内的所有最新 .NET Framework 高度兼容。它还支持 .NET Blazor 和 .NET MAUI,这是微软最新推出的网络开发工具。 该库与这些框架的兼容性使开发人员可以将 IronPDF 无缝集成到他们的应用程序中,并利用其强大的功能。

IronPDF 的主要功能之一是能够在 .NET Blazor 和 .NET MAUI 中读取 PDF 文件。 该功能使开发人员能够快速、轻松地从 PDF 文件中读取和提取数据,并将其用于 .NET 应用程序中。 这种能力在处理大量数据时尤其有用。 开发人员在其 .NET 项目中使用 IronPDF 时不需要任何其他库。

获取更多信息本教程中与 .NET Blazor 一起工作的 IronPDF for .NET并了解将 IronPDF 与 .NET MAUI 相集成在 IronPDF 网站上。

结论

总之,以编程方式阅读 PDF 文件在各行各业都至关重要。 IronPDF 提供了一个全面的解决方案来处理这项任务,它具有从 PDF 文件中读取、修改和提取内容的广泛功能。IronPDF 易于安装和使用,只需几个简单的步骤。

该库提供了以下方法从 PDF 文档中提取文本, 将 PDF 光栅化为图像您还可以在 PDF 文档中操作页面并保存 PDF 文件。 无论您是程序化 PDF 处理的新手还是经验丰富的开发人员,IronPDF 都是让您的技能更上一层楼的完美工具。

如果您正在为用 C# 阅读 PDF 文件寻找可靠高效的解决方案,IronPDF 值得您一试,尤其是它的许可选项和定价信息和一个免费试用可用。 您可以在下图中查看 IronPDF 提供的更多计划。 您可以选择符合您需求的软件包。

如何用 C# 阅读 PDF 文件,图 2:IronPDF 许可价格

IronPDF 许可价格

< 前一页
如何在C#中将Word转换为PDF(教程)
下一步 >
您应该购买IronPDF吗?

准备开始了吗? 版本: 2024.12 刚刚发布

免费NuGet下载 总下载量: 11,781,565 查看许可证 >