C# PDF 解析器

This article was translated from English: Does it need improvement?
Translated
View the article in English

有了正确的工具,就可以很容易地用 C# 处理 PDF,并利用 .NET 应用程序所需的所有功能,包括使用 C# 解析 PDF 文件的功能。本教程将使用 IronPDF(一个 C# 库)来实现这一功能,只需几个简单的步骤。

适用于PDF的C# NuGet库

安装使用 NuGet

Install-Package IronPdf
Java PDF JAR

下载 DLL

下载DLL

手动安装到你的项目中

适用于PDF的C# NuGet库

安装使用 NuGet

Install-Package IronPdf
Java PDF JAR

下载 DLL

下载DLL

手动安装到你的项目中

开始在您的项目中使用IronPDF,并立即获取免费试用。

第一步:
green arrow pointer

查看 IronPDFNuget 用于快速安装和部署。它有超过800万次下载,正在使用C#改变PDF。

适用于PDF的C# NuGet库 nuget.org/packages/IronPdf/
Install-Package IronPdf

考虑安装 IronPDF DLL 直接。下载并手动安装到您的项目或GAC表单中: IronPdf.zip

手动安装到你的项目中

下载DLL

C# 解析 PDF 文件

解析 PDF 文件相当简单。在下面的代码中,我们使用 ExtractAllText 方法从整个 PDF 文档中提取每一行文本。随后,你可以看到提取出的 PDF 内容的并排输出。

:path=/static-assets/pdf/content-code-examples/how-to/csharp-parse-pdf-parse-pdf.cs
using IronPdf;

// Select the desired PDF File
PdfDocument pdf = PdfDocument.FromFile("sample.pdf");

// Extract all text from an pdf
string allText = pdf.ExtractAllText();

// Extract all text from page 1
string page1Text = pdf.ExtractTextFromPage(0);
Imports IronPdf

' Select the desired PDF File
Private pdf As PdfDocument = PdfDocument.FromFile("sample.pdf")

' Extract all text from an pdf
Private allText As String = pdf.ExtractAllText()

' Extract all text from page 1
Private page1Text As String = pdf.ExtractTextFromPage(0)
VB   C#

查看解析后的 PDF 内容

我们使用 C# 表单向您显示上述代码执行过程中解析的 PDF 内容。该输出提供了 PDF 中的准确文本,因此您可以将其用于满足个人或客户文档需求。

~ PDF

~ C# 表格


图书馆快速访问

文档

阅读《API 参考》,了解有关 IronPDF 及其所有功能的文档。

文档