using IronPdf; // Disable local disk access or cross-origin requests Installation.EnableWebSecurity = true; // Instantiate Renderer var renderer = new ChromePdfRenderer(); // Create a PDF from a HTML string using C# var pdf = renderer.RenderHtmlAsPdf("<h1>Hello World</h1>"); // Export to a file or Stream pdf.SaveAs("output.pdf"); // Advanced Example with HTML Assets // Load external html assets: Images, CSS and JavaScript. // An optional BasePath 'C:\site\assets\' is set as the file location to load assets from var myAdvancedPdf = renderer.RenderHtmlAsPdf("<img src='icons/iron.png'>", @"C:\site\assets\"); myAdvancedPdf.SaveAs("html-with-assets.pdf");

使用IRONPDF

如何在C#中读取PDF文件

雷根·彭

2023年二月22日

更新 2024年二月25日

程序化 PDF 处理在金融、医疗保健、法律和教育等行业至关重要，这些行业需要处理、分析和提取 PDF 文档中的关键信息，用于数据分析、文档管理和自动化等目的。尽管这项任务很重要，但也很有挑战性。

IronPDF：C# PDF 库

IronPdf 使您能够轻松处理难以置信的艰巨任务。它可以轻松编辑 PDF 文档中的文本，与在文本文档中处理文本文件的方式类似，同时允许您在任何操作系统中导出文件。 IronPDF 应用程序涵盖了查看、修改和提取 PDF 内容的完整过程。

使用 IronPDF 迈出正确的一步

使用任何装有 IronPDF 软件的计算机都可以快速、轻松地阅读和编写 PDF 文件格式的文本。安装是一项简单的任务。这是学习用 C# 阅读 PDF 文件的最佳途径。您也可以免费下载 IronPDF 进行开发。如果您探索 IronPdf，您会发现该库提供了广泛的功能，使 PDF 的使用变得非常简单。利用空闲时间探索课程!有几个使用 HTML 创建 PDF 的 C# 示例了解如何通过阅读 PDF 创建最佳输出。

使用 IronPDF 阅读 PDF 文件

第 1 步：安装 IronPDF 软件包

开始时，您需要安装 IronPDF NuGet 软件包在您的.NET 项目中，您可以使用这些工具。您可以在 Visual Studio 中打开软件包管理器控制台，然后输入以下命令：

Install-Package IronPdf

第 2 步：导入 IronPDF 库

接下来，您需要在代码中导入 IronPdf 库，方法是在文件顶部添加以下语句：

using IronPdf;

using IronPdf;

Imports IronPdf

第 3 步：加载 PDF 文档

导入 IronPdf 库后，您可以通过以下代码将 PDF 文档加载到您的代码中：

PdfDocument pdf = PdfDocument.FromFile(@"C:\dotnet.pdf");
var outputPath = "Example.pdf";
pdf.SaveAs(outputPath);

PdfDocument pdf = PdfDocument.FromFile(@"C:\dotnet.pdf");
var outputPath = "Example.pdf";
pdf.SaveAs(outputPath);

Dim pdf As PdfDocument = PdfDocument.FromFile("C:\dotnet.pdf")
Dim outputPath = "Example.pdf"
pdf.SaveAs(outputPath)

步骤 4：从 PDF 中提取文本

IronPdf 提供了一系列从现有 PDF 文件中提取文本的方法。例如，您可以使用以下代码片段开始从 PDF 中提取文本并将其打印到控制台：

string text = pdf.ExtractText();
Console.Writeline(text);

string text = pdf.ExtractText();
Console.Writeline(text);

Dim text As String = pdf.ExtractText()
Console.Writeline(text)

使用上述代码，您可以从 PDF 文件中提取文本.

如何用 C# 阅读 PDF 文件，图 1：使用 IronPDF 从 PDF 中提取文本

使用 IronPDF 从 PDF 中提取文本

步骤 5：将 PDF 栅格化为图像

让我们使用 IronPDF 将 PDF 文件栅格化为图像使用 IronPDF。首先，导入所需的库：

using System.Linq;
using IronPdf;
using IronSoftware.Drawing;

using System.Linq;
using IronPdf;
using IronSoftware.Drawing;

Imports System.Linq
Imports IronPdf
Imports IronSoftware.Drawing

然后，代码使用光栅化图像文件 "方法将 PDF 文档的所有页面以图像文件的形式提取到文件夹中。提取的图像可以保存为 PNG 或 JPG 文件，还可以指定图像的尺寸和页面范围。

// Extract all pages to a folder as image files
pdf.RasterizeToImageFiles(@"C:\image\folder\*.png");

// Dimensions and page ranges may be specified
pdf.RasterizeToImageFiles(@"C:\image\folder\example_pdf_image_*.jpg", 100, 80);

// Extract all pages to a folder as image files
pdf.RasterizeToImageFiles(@"C:\image\folder\*.png");

// Dimensions and page ranges may be specified
pdf.RasterizeToImageFiles(@"C:\image\folder\example_pdf_image_*.jpg", 100, 80);

' Extract all pages to a folder as image files
pdf.RasterizeToImageFiles("C:\image\folder\*.png")

' Dimensions and page ranges may be specified
pdf.RasterizeToImageFiles("C:\image\folder\example_pdf_image_*.jpg", 100, 80)

最后，代码使用ToBitmap 方法将 PDF 文档的所有页面提取为 "AnyBitmap "对象，以便在代码中进一步处理和操作。

// Extract all pages as AnyBitmap objects
AnyBitmap [] pdfBitmaps = pdf.ToBitmap();

// Extract all pages as AnyBitmap objects
AnyBitmap [] pdfBitmaps = pdf.ToBitmap();

' Extract all pages as AnyBitmap objects
Dim pdfBitmaps() As AnyBitmap = pdf.ToBitmap()

上述代码演示了如何使用 IronPDF 提取 PDF 文件的内容，并将提取的数据保存为图像文件或 AnyBitmap 对象，以便进一步处理。

第 7 步：处理 PDF 页面

让我们学习如何操作 PDF 文档的页面通过使用 IronPDF 阅读 PDF 文件。

代码首先使用删除页面 "方法:

pdf.RemovePages(1, 2);

pdf.RemovePages(1, 2);

pdf.RemovePages(1, 2)

删除页面 "方法需要两个参数：要删除的起始页面(在本例中，第 2 页表示为 1，因为页码从 0 开始)以及要删除的页数(在这种情况下，2 页).

第 6 步：保存 PDF

最后，您可以使用保存为 "方法. 保存 PDF 文件的代码如下：

pdf.SaveAs(OutputPath);

pdf.SaveAs(OutputPath);

pdf.SaveAs(OutputPath)

IronPDF兼容性

IronPDF 与包括 .NET 7 在内的所有最新 .NET Framework 高度兼容。它还支持 .NET Blazor 和 .NET MAUI，这是微软最新推出的网络开发工具。该库与这些框架的兼容性使开发人员可以将 IronPDF 无缝集成到他们的应用程序中，并利用其强大的功能。

IronPDF 的主要功能之一是能够在 .NET Blazor 和 .NET MAUI 中读取 PDF 文件。该功能使开发人员能够快速、轻松地从 PDF 文件中读取和提取数据，并将其用于 .NET 应用程序中。这种能力在处理大量数据时尤其有用。开发人员在其 .NET 项目中使用 IronPDF 时不需要任何其他库。

获取更多信息本教程中与 .NET Blazor 一起工作的 IronPDF for .NET并了解将 IronPDF 与 .NET MAUI 相集成在 IronPDF 网站上。

结论

总之，以编程方式阅读 PDF 文件在各行各业都至关重要。 IronPDF 提供了一个全面的解决方案来处理这项任务，它具有从 PDF 文件中读取、修改和提取内容的广泛功能。IronPDF 易于安装和使用，只需几个简单的步骤。

该库提供了以下方法从 PDF 文档中提取文本, 将 PDF 光栅化为图像您还可以在 PDF 文档中操作页面并保存 PDF 文件。无论您是程序化 PDF 处理的新手还是经验丰富的开发人员，IronPDF 都是让您的技能更上一层楼的完美工具。

如果您正在为用 C# 阅读 PDF 文件寻找可靠高效的解决方案，IronPDF 值得您一试，尤其是它的许可选项和定价信息和一个免费试用可用。您可以在下图中查看 IronPDF 提供的更多计划。您可以选择符合您需求的软件包。

如何用 C# 阅读 PDF 文件，图 2：IronPDF 许可价格

IronPDF 许可价格

雷根·彭

立即与工程团队聊天

软件工程师

Regan毕业于雷丁大学，拥有电子工程学士学位。在加入Iron Software之前，他的前工作职位要求他专注于单一任务；他在Iron Software最喜欢的是能进行多种工作，无论是增加销售价值、技术支持、产品开发还是营销。他喜欢了解开发人员如何使用Iron Software的库，并利用这些知识不断改进文档和开发产品。

< 前一页
如何在 C# 中将 Word (Docx) 转换为 PDF（教程）

下一步 >
您应该购买IronPDF吗？