在实际环境中测试
在生产中测试无水印。
随时随地为您服务。
在软件开发的动态环境中,处理和展示各种格式的数据至关重要。 其中,便携式文档格式 (PDF) 作为一个广泛使用且标准化的文档共享格式,它脱颖而出。 在 C# 编程语言领域中,无缝查看 PDF 文件的能力是不可或缺的。
C#的多功能性使其成为跨领域开发强大应用程序的热门选择。 PDF格式确保文档的完整性和跨平台的一致展示。 将PDF查看功能集成到C#应用程序中可以帮助开发者提升用户体验,简化工作流程,保存并为处理各行业的文件提供高效的解决方案。
这篇文章探讨了使用C#查看PDF的重要性,介绍了两个强大的库 - PDFsharp 和 IronPDF - 并逐步说明如何安装和使用它们来查看 PDF。
PDFsharp 作为一个强大的开源库,在C#编程领域中,它为开发者提供了一个多功能的PDF操作工具集。 除了在创建和修改PDF方面的能力外,PDFsharp还因其在无缝集成PDF查看功能到C#应用程序中的能力而脱颖而出。 这个库以其轻巧的设计和用户友好的方式著称,使开发人员可以轻松地导航和操作PDF文档。 在我们探索PDFsharp的功能并深入研究其实际应用时,显然这个库对于那些寻求在其C#项目中提高文档管理效率的人来说是一项宝贵的资产。
IronPDF 是一个强大且功能丰富的库,使开发人员能够以前所未有的容易处理PDF操作的复杂领域。 设计简洁且具多功能性,IronPDF 使用户能够轻松创建、编辑和 阅读 PDF 文档 在他们的C#应用程序中。 除了其基本功能之外,IronPDF还通过高级功能如HTML到PDF转换、对各种图像格式的支持以及复杂PDF操作的无缝处理而脱颖而出。
当我们深入了解IronPDF的功能时,就会发现这个库不仅仅是一个用于基本PDF任务的工具,而是为希望通过先进的PDF功能提升其C#项目的开发者提供的全面解决方案。 IronPDF正确处理PDF,并将数据字符串格式化为可读字符串。
在使用 IronPDF 进行 PDF 查看之前,必须先安装该库。 您可以轻松添加 IronPDF 将其通过 NuGet 包管理器或包管理控制台添加到您的项目中。 只需运行以下命令:
Install-Package IronPdf
该命令将安装 IronPDF 软件包及其依赖项,使您能够开始将其功能集成到 C# 应用程序中。
类似于 IronPDF, PDFsharp 可以使用 NuGet 包管理器或包管理器控制台进行安装。 执行以下命令以安装 PDFsharp:
Install-Package PdfSharp
此命令将安装 PDFsharp 库,使其可在 C# 项目中使用。
在本节中,我们将讨论如何使用PDFsharp查看和打开PDF文件,并将提取的结果打印到控制台。 在下面的代码示例中将使用 PDFsharp 查看 PDF 文件内容。
using System;
using PdfSharp.Pdf;
using PdfSharp.Pdf.IO;
class Program
{
static void Main()
{
// Specify the pdf path
string pdfFilePath = "output.pdf";
// Open the PDF document
PdfDocument document = PdfReader.Open(pdfFilePath, PdfDocumentOpenMode.Import);
// Iterate through each page of the document
for (int pageIndex = 0; pageIndex < document.PageCount; pageIndex++)
{
// Get the current page, Extract text from the page
string page = document.Pages [pageIndex].Contents.Elements.GetDictionary(0).Stream.ToString();
// Print the text to the console
Console.WriteLine($"Page {pageIndex + 1} Content:\n{page}\n");
}
Console.ReadLine(); // Wait for user input before closing the console
}
}
using System;
using PdfSharp.Pdf;
using PdfSharp.Pdf.IO;
class Program
{
static void Main()
{
// Specify the pdf path
string pdfFilePath = "output.pdf";
// Open the PDF document
PdfDocument document = PdfReader.Open(pdfFilePath, PdfDocumentOpenMode.Import);
// Iterate through each page of the document
for (int pageIndex = 0; pageIndex < document.PageCount; pageIndex++)
{
// Get the current page, Extract text from the page
string page = document.Pages [pageIndex].Contents.Elements.GetDictionary(0).Stream.ToString();
// Print the text to the console
Console.WriteLine($"Page {pageIndex + 1} Content:\n{page}\n");
}
Console.ReadLine(); // Wait for user input before closing the console
}
}
Imports Microsoft.VisualBasic
Imports System
Imports PdfSharp.Pdf
Imports PdfSharp.Pdf.IO
Friend Class Program
Shared Sub Main()
' Specify the pdf path
Dim pdfFilePath As String = "output.pdf"
' Open the PDF document
Dim document As PdfDocument = PdfReader.Open(pdfFilePath, PdfDocumentOpenMode.Import)
' Iterate through each page of the document
For pageIndex As Integer = 0 To document.PageCount - 1
' Get the current page, Extract text from the page
Dim page As String = document.Pages (pageIndex).Contents.Elements.GetDictionary(0).Stream.ToString()
' Print the text to the console
Console.WriteLine($"Page {pageIndex + 1} Content:" & vbLf & "{page}" & vbLf)
Next pageIndex
Console.ReadLine() ' Wait for user input before closing the console
End Sub
End Class
此C#代码正确地使用PDFsharp库来读取和提取PDF文件中的文本内容。程序首先指定一个PDF文件的路径,假设该文件名为“output.PDF”。然后,它以导入模式打开PDF文档,允许提取内容。 该代码继续遍历文档的PDF页面,提取每一页的实际PDF内容,并将其打印到控制台。
提取的文本是通过访问页面内容并将其转换为字符串获得的。 输出包括页码及其对应的内容。 最后,程序在关闭控制台前等待用户输入。 请注意,代码假设示例PDF具有简单的结构,对于更复杂的场景,可能需要进行额外的解析和处理。
使用IronPDF查看PDF比使用PDFsharp简单得多,只需几行代码即可完成。
using IronPdf;
using IronSoftware.Drawing;
using System;
var pdf = PdfDocument.FromFile("output.pdf");
string text = pdf.ExtractAllText();
Console.WriteLine(text);
using IronPdf;
using IronSoftware.Drawing;
using System;
var pdf = PdfDocument.FromFile("output.pdf");
string text = pdf.ExtractAllText();
Console.WriteLine(text);
Imports IronPdf
Imports IronSoftware.Drawing
Imports System
Private pdf = PdfDocument.FromFile("output.pdf")
Private text As String = pdf.ExtractAllText()
Console.WriteLine(text)
这段 C# 代码使用 IronPDF 库从名为 "output.PDF "的 PDF 文件中提取文本内容。首先,它导入了必要的命名空间,然后使用 PdfDocument.FromFile()
IronPDF 的方法。随后,它使用
ExtractAllText方法从 PDF 文档中提取所有文本内容,并将其存储在名为 "text" 的字符串变量中。最后,使用
Console.WriteLine` 方法将提取的文本打印到控制台。()方法。 此代码通过IronPDF库提供的功能,简化了从PDF中提取文本的过程,使其简洁直观。
PDFsharp和IronPDF都为开发者提供了具有吸引力的功能,寻求多功能的解决方案。 PDFsharp, 一个开源库,提供了一个轻量级和用户友好的工具包,使其成为基本PDF任务和集成到C#项目的绝佳选择。 它的功能在高效浏览和操作PDF文档方面表现出色。 另一方面, IronPDF 作为一个强大的、功能丰富的库,专为全面的PDF操作设计。 它的高级功能,如HTML到PDF的转换和对各种其他图像文件格式的支持,使其成为开发者提升其C#项目的强大工具,拥有先进的PDF功能。
虽然两个库都有其优点,但IronPDF凭借其广泛的功能集、简便性和多功能性脱颖而出,成为赢家。 使用 IronPDF 查看 PDF 文件的简洁代码示例展示了其易用性和提取文本内容的有效性。 该库的全面功能使其成为开发人员处理复杂PDF任务的宝贵资产,使IronPDF成为那些希望将高级PDF功能无缝集成到其C#应用程序中的人的推荐选择。
IronPDF 可免费用于开发,并附带一个 免费试用. 要了解更多使用IronPDF查看PDF内容的信息,请访问 这里. 要查看更多代码示例,请访问 此 page.