C#PDF解析器
This article was translated from English: Does it need improvement?
TranslatedView the article in English
使用正确的工具,在C#中处理PDF文件可以变得很容易,并且可以利用.NET应用程序所需的所有功能,包括使用C#解析PDF文件的能力。 本教程将使用 IronPDF,一个 C# 库,仅通过几个简单的步骤来实现这一点。
开始使用IronPDF
立即在您的项目中开始使用IronPDF,并享受免费试用。
如何用 C# 解析 PDF 文件
- 下载 C# PDF 解析器库
- 在 Visual Studio 中安装
- 使用
提取所有文本
方法提取每一行文本 - 使用
从页面提取文本
方法 - 查看解析后的 PDF 内容
C# 解析 PDF 文件
解析 PDF 文件相当容易。 在下面的代码中,我们使用ExtractAllText
方法从整个PDF文档中提取每一行文本。 稍后,您可以看到提取的PDF内容的并排输出。
:path=/static-assets/pdf/content-code-examples/how-to/csharp-parse-pdf-parse-pdf.cs
using IronPdf;
// Select the desired PDF File
PdfDocument pdf = PdfDocument.FromFile("sample.pdf");
// Extract all text from an pdf
string allText = pdf.ExtractAllText();
// Extract all text from page 1
string page1Text = pdf.ExtractTextFromPage(0);
Imports IronPdf
' Select the desired PDF File
Private pdf As PdfDocument = PdfDocument.FromFile("sample.pdf")
' Extract all text from an pdf
Private allText As String = pdf.ExtractAllText()
' Extract all text from page 1
Private page1Text As String = pdf.ExtractTextFromPage(0)
VB C#
查看解析的PDF内容
我们使用了一个C#表单来显示上述代码执行中解析的PDF内容。 这个输出提供了PDF中的确切文本,您可以将其用于您的个人或客户文档需求。