产品比较

使用IronPDF查看PDF替代方案的PDFsharp

Chipego
奇佩戈-卡琳达
2023年十二月24日
分享:

在软件开发的动态环境中,处理和展示各种格式的数据至关重要。 在这些格式中,可移植文档格式(PDF)是用于文档共享的广泛使用且标准化的格式。 在 C# 编程语言领域中,无缝查看 PDF 文件的能力是不可或缺的。

C#的多功能性使其成为跨领域开发强大应用程序的热门选择。 PDF格式确保文档的完整性和跨平台的一致展示。 将PDF查看功能集成到C#应用程序中可以帮助开发者提升用户体验,简化工作流程,保存并为处理各行业的文件提供高效的解决方案。

本文探讨了使用 C# 查看 PDF 的重要性,介绍了两个强大的库——PDFsharpIronPDF 的 PDF 操作综合功能,并提供了安装和使用它们查看 PDF 的分步说明。

PDFsharp

PDFsharp 作为 C# 编程领域的一个强大开源库,为开发人员提供了一个多功能的 PDF 操作工具包。 除了在创建和修改PDF方面的能力外,PDFsharp还因其在无缝集成PDF查看功能到C#应用程序中的能力而脱颖而出。 这个库以其轻巧的设计和用户友好的方式著称,使开发人员可以轻松地导航和操作PDF文档。 在我们探索PDFsharp的功能并深入研究其实际应用时,显然这个库对于那些寻求在其C#项目中提高文档管理效率的人来说是一项宝贵的资产。

2.IronPDF

IronPDF 的广泛功能概览 是一个强大且功能丰富的库,使开发人员能够以前所未有的轻松掌握复杂的 PDF 操作领域。 IronPDF 的设计注重简单性和多功能性,使用户能够在 C# 应用程序中轻松创建、编辑和读取 PDF 文档,使用 IronPDF。 除了其基本功能之外,IronPDF还通过高级功能如HTML到PDF转换、对各种图像格式的支持以及复杂PDF操作的无缝处理而脱颖而出。

当我们深入了解IronPDF的功能时,就会发现这个库不仅仅是一个用于基本PDF任务的工具,而是为希望通过先进的PDF功能提升其C#项目的开发者提供的全面解决方案。 IronPdf 处理 PDF 并将数据字符串格式化为可读字符串。

3. 安装 IronPDF

在使用 IronPDF 进行 PDF 查看之前,必须先安装该库。 您可以轻松地通过NuGet包管理器添加IronPDF到您的项目中,使用NuGet包管理器或包管理器控制台。 只需运行以下命令:

Install-Package IronPdf

该命令将安装 IronPDF 软件包及其依赖项,使您能够开始将其功能集成到 C# 应用程序中。

4. 安装 PDFsharp

与IronPDF类似,PDFsharp 可以通过NuGet包管理器或包管理器控制台进行安装。 执行以下命令以安装 PDFsharp:

Install-Package PdfSharp

此命令将安装 PDFsharp 库,使其可在 C# 项目中使用。

5. PDFsharp 查看 PDF 页面内容

在本节中,我们将讨论如何使用 PDFsharp 查看和打开 PDF 文件,并将提取的结果打印到控制台。 在下面的代码示例中,我们将使用 PDFsharp 查看 PDF 文件内容。

using System;
using PdfSharp.Pdf;
using PdfSharp.Pdf.IO;
class Program
{
    static void Main()
    {
        // Specify the pdf path
        string pdfFilePath = "output.pdf";
        // Open the PDF document
        PdfDocument document = PdfReader.Open(pdfFilePath, PdfDocumentOpenMode.Import);
        // Iterate through each page of the document
        for (int pageIndex = 0; pageIndex < document.PageCount; pageIndex++)
        {
            // Get the current page, Extract text from the page
            string page = document.Pages[pageIndex].Contents.Elements.GetDictionary(0).Stream.ToString();
            // Print the text to the console
            Console.WriteLine($"Page {pageIndex + 1} Content:\n{page}\n");
        }
        Console.ReadLine(); // Wait for user input before closing the console
    }
}
using System;
using PdfSharp.Pdf;
using PdfSharp.Pdf.IO;
class Program
{
    static void Main()
    {
        // Specify the pdf path
        string pdfFilePath = "output.pdf";
        // Open the PDF document
        PdfDocument document = PdfReader.Open(pdfFilePath, PdfDocumentOpenMode.Import);
        // Iterate through each page of the document
        for (int pageIndex = 0; pageIndex < document.PageCount; pageIndex++)
        {
            // Get the current page, Extract text from the page
            string page = document.Pages[pageIndex].Contents.Elements.GetDictionary(0).Stream.ToString();
            // Print the text to the console
            Console.WriteLine($"Page {pageIndex + 1} Content:\n{page}\n");
        }
        Console.ReadLine(); // Wait for user input before closing the console
    }
}
Imports Microsoft.VisualBasic
Imports System
Imports PdfSharp.Pdf
Imports PdfSharp.Pdf.IO
Friend Class Program
	Shared Sub Main()
		' Specify the pdf path
		Dim pdfFilePath As String = "output.pdf"
		' Open the PDF document
		Dim document As PdfDocument = PdfReader.Open(pdfFilePath, PdfDocumentOpenMode.Import)
		' Iterate through each page of the document
		For pageIndex As Integer = 0 To document.PageCount - 1
			' Get the current page, Extract text from the page
			Dim page As String = document.Pages(pageIndex).Contents.Elements.GetDictionary(0).Stream.ToString()
			' Print the text to the console
			Console.WriteLine($"Page {pageIndex + 1} Content:" & vbLf & "{page}" & vbLf)
		Next pageIndex
		Console.ReadLine() ' Wait for user input before closing the console
	End Sub
End Class
$vbLabelText   $csharpLabel

此C#代码正确地使用PDFsharp库来读取和提取PDF文件中的文本内容。程序首先指定一个PDF文件的路径,假设该文件名为“output.PDF”。然后,它以导入模式打开PDF文档,允许提取内容。 该代码继续遍历文档的PDF页面,提取每一页的实际PDF内容,并将其打印到控制台。

提取的文本是通过访问页面内容并将其转换为字符串获得的。 输出包括页码及其对应的内容。 最后,程序在关闭控制台前等待用户输入。 请注意,代码假设示例PDF具有简单的结构,对于更复杂的场景,可能需要进行额外的解析和处理。

使用 IronPDF 的 PDFsharp 查看 PDF 替代方案:图 1 - 控制台输出: Hello World - 使用 PDFsharp 库从 output.PDF 文件中提取的内容。

6. IronPDF 查看 PDF 文件

使用 IronPDF 查看 PDF 比 PDFsharp 简单得多,只需几行代码即可完成。

using IronPdf;
using IronSoftware.Drawing;
using System;
var pdf = PdfDocument.FromFile("output.pdf");
string text = pdf.ExtractAllText();
Console.WriteLine(text);
using IronPdf;
using IronSoftware.Drawing;
using System;
var pdf = PdfDocument.FromFile("output.pdf");
string text = pdf.ExtractAllText();
Console.WriteLine(text);
Imports IronPdf
Imports IronSoftware.Drawing
Imports System
Private pdf = PdfDocument.FromFile("output.pdf")
Private text As String = pdf.ExtractAllText()
Console.WriteLine(text)
$vbLabelText   $csharpLabel

此 C# 代码使用 IronPDF 库从名为 "output.PDF" 的 PDF 文件中提取文本内容。最初,它导入必要的命名空间,然后使用 IronPDF 的 PdfDocument.FromFile() 方法加载 PDF 文档。 随后,它使用ExtractAllText方法从PDF文档中提取所有文本内容,并将其存储在一个名为“text”的字符串变量中。最后,使用Console.WriteLine()方法将提取的文本打印到控制台。 此代码通过IronPDF库提供的功能,简化了从PDF中提取文本的过程,使其简洁直观。

使用 IronPDF 的 PDFsharp 查看 PDF 替代品:图 2 - 控制台输出:“Hello World” - 使用 IronPDF 库从 output.PDF 文件中提取的内容。

7.结论

PDFsharp和IronPDF都为开发者提供了具有吸引力的功能,寻求多功能的解决方案。 PDFsharp,一个开源库,提供轻量级且用户友好的工具包,使其成为用于基本PDF任务和集成到C#项目中的优秀选择。 它的功能在高效浏览和操作PDF文档方面表现出色。 另一方面,利用 IronPDF 进行高级 PDF 功能 是一个强大且功能丰富的库,专为综合 PDF 操作而设计。 它的高级功能,如HTML到PDF的转换和对各种其他图像文件格式的支持,使其成为开发者提升其C#项目的强大工具,拥有先进的PDF功能。

虽然两个库都有其优点,但IronPDF凭借其广泛的功能集、简便性和多功能性脱颖而出,成为赢家。 使用 IronPDF 查看 PDF 文件的简洁代码示例展示了其易用性和提取文本内容的有效性。 该库的全面功能使其成为开发人员处理复杂PDF任务的宝贵资产,使IronPDF成为那些希望将高级PDF功能无缝集成到其C#应用程序中的人的推荐选择。

IronPDF 可免费用于开发,并附带高级 PDF 功能探索的免费试用版。 要了解更多关于使用IronPDF查看PDF内容的信息,请访问提取文本和图像的详细指南。 要查看更多代码示例,请访问IronPDF HTML to PDF 代码示例页面。

Chipego
软件工程师
Chipego 拥有出色的倾听技巧,这帮助他理解客户问题并提供智能解决方案。他在 2023 年加入 Iron Software 团队,此前他获得了信息技术学士学位。IronPDF 和 IronOCR 是 Chipego 主要专注的两个产品,但他对所有产品的了解每天都在增长,因为他不断找到支持客户的新方法。他喜欢 Iron Software 的合作氛围,公司各地的团队成员贡献他们丰富的经验,以提供有效的创新解决方案。当 Chipego 离开办公桌时,你经常可以发现他在看书或踢足球。
< 前一页
IronPDF与PdfPig的比较
下一步 >
IronPDF 与 DinktoPdf 的比较