使用IRONPDF

如何在C#中读取PDF文件

更新 2024年二月25日
分享:

程序化 PDF 处理对于金融、医疗保健、法律和教育等行业至关重要,这些行业需要从 PDF 文档中处理、分析和提取关键信息,以实现数据分析、文档管理和自动化等目的。尽管这项任务非常重要,但也具有一定的挑战性。

IronPDF:PDF 库

IronPDF 能让您轻松处理极其困难的任务。它可以轻松编辑 PDF 文档中的文本,就像在文本文档中处理文本文件一样,同时还能在任何操作系统中导出文件。IronPDF 应用程序涵盖了查看、修改和提取 PDF 内容的整个过程。

利用 IronPDF 迈出正确的一步

使用任何装有 IronPDF 软件的电脑,都能快速、轻松地阅读和书写 PDF 文件格式的文本。安装过程非常简单。这是学习用 C# 阅读 PDF 文件的最佳方法。您还可以免费下载 IronPDF 进行开发。如果你探索 IronPDF,你会发现该库提供了广泛的功能,让 PDF 的使用变得非常简单。利用空闲时间探索课程! 有几个 C# 示例 了解如何通过阅读 PDF 创建最佳输出。

使用 IronPDF 阅读 PDF 文件

第 1 步:安装 IronPDF 软件包

开始时,您需要 安装 IronPDF NuGet 软件包到您的 .NET 项目中。您可以在 Visual Studio 中打开软件包管理器控制台,然后输入以下命令:

Install-Package IronPdf

第 2 步:导入 IronPDF 库

接下来,您需要在文件顶部添加以下语句,将 IronPDF 库导入到您的代码中:

using IronPdf;
using IronPdf;
Imports IronPdf
VB   C#

第 3 步:加载 PDF 文档

导入 IronPDF 库后,您可以使用以下代码将 PDF 文档加载到代码中:

PdfDocument pdf = PdfDocument.FromFile(@"C:\dotnet.pdf");
var outputPath = "Example.pdf";
pdf.SaveAs(outputPath);
PdfDocument pdf = PdfDocument.FromFile(@"C:\dotnet.pdf");
var outputPath = "Example.pdf";
pdf.SaveAs(outputPath);
Dim pdf As PdfDocument = PdfDocument.FromFile("C:\dotnet.pdf")
Dim outputPath = "Example.pdf"
pdf.SaveAs(outputPath)
VB   C#

第 4 步:从 PDF 中提取文本

IronPDF 提供了一系列从现有 PDF 文件中提取文本的方法。例如,您可以使用以下代码片段开始从 PDF 文件中提取文本并打印到控制台:

string text = pdf.ExtractText();
Console.Writeline(text);
string text = pdf.ExtractText();
Console.Writeline(text);
Dim text As String = pdf.ExtractText()
Console.Writeline(text)
VB   C#

使用上述代码,您可以 从 PDF 文件中提取文本.

如何用 C# 阅读 PDF 文件,图 1:使用 IronPDF 从 PDF 中提取文本

使用 IronPDF 从 PDF 中提取文本

第 5 步:将 PDF 光栅化为图像

让我们 将 PDF 文件栅格化为图像 使用 IronPDF。首先,导入所需的库:

using System.Linq;
using IronPdf;
using IronSoftware.Drawing;
using System.Linq;
using IronPdf;
using IronSoftware.Drawing;
Imports System.Linq
Imports IronPdf
Imports IronSoftware.Drawing
VB   C#

然后,代码使用 光栅化图像文件 方法将 PDF 文档的所有页面提取为图像文件保存到文件夹中。提取的图像可以保存为 PNG 或 JPG 文件,还可以指定图像的尺寸和页面范围。

// Extract all pages to a folder as image files
pdf.RasterizeToImageFiles(@"C:\image\folder\*.png");

// Dimensions and page ranges may be specified
pdf.RasterizeToImageFiles(@"C:\image\folder\example_pdf_image_*.jpg", 100, 80);
// Extract all pages to a folder as image files
pdf.RasterizeToImageFiles(@"C:\image\folder\*.png");

// Dimensions and page ranges may be specified
pdf.RasterizeToImageFiles(@"C:\image\folder\example_pdf_image_*.jpg", 100, 80);
' Extract all pages to a folder as image files
pdf.RasterizeToImageFiles("C:\image\folder\*.png")

' Dimensions and page ranges may be specified
pdf.RasterizeToImageFiles("C:\image\folder\example_pdf_image_*.jpg", 100, 80)
VB   C#

最后,代码使用 转位图 方法将 PDF 文档的所有页面提取为 AnyBitmap 对象,这些对象可在代码中进一步处理和操作。

// Extract all pages as AnyBitmap objects
AnyBitmap [] pdfBitmaps = pdf.ToBitmap();
// Extract all pages as AnyBitmap objects
AnyBitmap [] pdfBitmaps = pdf.ToBitmap();
' Extract all pages as AnyBitmap objects
Dim pdfBitmaps() As AnyBitmap = pdf.ToBitmap()
VB   C#

上述代码演示了如何使用 IronPDF 提取 PDF 文件的内容,并将提取的数据保存为图像文件或 AnyBitmap 对象,以便进一步处理。

第 7 步:操作 PDF 页面

让我们学习如何 翻页 使用 IronPDF 读取 PDF 文件。

代码首先使用 删除页面 方法:

pdf.RemovePages(1, 2);
pdf.RemovePages(1, 2);
pdf.RemovePages(1, 2)
VB   C#

删除页面 "方法需要两个参数:要删除的起始页面 (在本例中,第 2 页表示为 1,因为页码从 0 开始) 以及要删除的页数 (在这种情况下,2 页).

第六步:保存 PDF

最后,你可以使用 保存为 方法。保存 PDF 文件的代码如下:

pdf.SaveAs(OutputPath);
pdf.SaveAs(OutputPath);
pdf.SaveAs(OutputPath)
VB   C#

IronPDF 兼容性

IronPDF 与包括 .NET 7 在内的所有最新 .NET 框架高度兼容。它还支持.NET Blazor和.NET MAUI,这些都是微软为网络开发提供的最新产品。该库与这些框架的兼容性使开发人员可以将 IronPDF 无缝集成到他们的应用程序中,并利用其强大的功能。

IronPDF 的主要功能之一是能在 .NET Blazor 和 .NET MAUI 中读取 PDF 文件。这一功能使开发人员能够快速、轻松地从 PDF 文件中读取和提取数据,并在 .NET 应用程序中使用它们。在处理大量数据时,这一功能尤其有用。开发人员在其.NET项目中使用 IronPDF 时不需要任何其他库。

获取更多有关 IronPDF 与 .NET Blazor 协同工作.NET MAUI 在 IronPDF 网站上。

结论

总之,以编程方式读取 PDF 文件在各行各业都至关重要。IronPDF 提供了一个全面的解决方案来处理这项任务,它具有从 PDF 文件中读取、修改和提取内容的广泛功能。IronPDF 易于安装和使用,只需几个简单的步骤。

该库提供了以下方法 摘录, 将 PDF 光栅化为图像IronPDF 可帮助您处理 PDF 文件、操作页面并保存 PDF 文件。无论您是 PDF 程序处理的新手还是经验丰富的开发人员,IronPDF 都是将您的技能提升到新水平的完美工具。

如果你正在为用 C# 阅读 PDF 文件寻找一个可靠高效的解决方案,IronPDF 值得一试,尤其是它的 许可证从 $749 开始和一个 免费试用 可用。您可以在下图中查看 IronPDF 提供的更多计划。您可以选择符合自己需求的套餐。

如何用 C# 阅读 PDF 文件,图 2:IronPDF 许可价格

IronPDF 许可价格

< 前一页
如何在C#中将Word转换为PDF(教程)
下一步 >
您应该购买IronPDF吗?

准备开始了吗? 版本: 2024.10 刚刚发布

免费NuGet下载 总下载量: 11,108,738 查看许可证 >