产品比较

使用IronPDF查看PDF替代方案的PDFsharp

发布 2023年十二月24日
分享:

在软件开发的动态环境中,处理和展示各种格式的数据至关重要。 其中,便携式文档格式 (PDF) 作为一个广泛使用且标准化的文档共享格式,它脱颖而出。 在 C# 编程语言领域中,无缝查看 PDF 文件的能力是不可或缺的。

C#的多功能性使其成为跨领域开发强大应用程序的热门选择。 PDF格式确保文档的完整性和跨平台的一致展示。 将PDF查看功能集成到C#应用程序中可以帮助开发者提升用户体验,简化工作流程,保存并为处理各行业的文件提供高效的解决方案。

这篇文章探讨了使用C#查看PDF的重要性,介绍了两个强大的库 - PDFsharpIronPDF - 并逐步说明如何安装和使用它们来查看 PDF。

PDFsharp

PDFsharp 作为一个强大的开源库,在C#编程领域中,它为开发者提供了一个多功能的PDF操作工具集。 除了在创建和修改PDF方面的能力外,PDFsharp还因其在无缝集成PDF查看功能到C#应用程序中的能力而脱颖而出。 这个库以其轻巧的设计和用户友好的方式著称,使开发人员可以轻松地导航和操作PDF文档。 在我们探索PDFsharp的功能并深入研究其实际应用时,显然这个库对于那些寻求在其C#项目中提高文档管理效率的人来说是一项宝贵的资产。

2.IronPDF

IronPDF 是一个强大且功能丰富的库,使开发人员能够以前所未有的容易处理PDF操作的复杂领域。 设计简洁且具多功能性,IronPDF 使用户能够轻松创建、编辑和 阅读 PDF 文档 在他们的C#应用程序中。 除了其基本功能之外,IronPDF还通过高级功能如HTML到PDF转换、对各种图像格式的支持以及复杂PDF操作的无缝处理而脱颖而出。

当我们深入了解IronPDF的功能时,就会发现这个库不仅仅是一个用于基本PDF任务的工具,而是为希望通过先进的PDF功能提升其C#项目的开发者提供的全面解决方案。 IronPDF正确处理PDF,并将数据字符串格式化为可读字符串。

3. 安装 IronPDF

在使用 IronPDF 进行 PDF 查看之前,必须先安装该库。 您可以轻松添加 IronPDF 将其通过 NuGet 包管理器或包管理控制台添加到您的项目中。 只需运行以下命令:

Install-Package IronPdf

该命令将安装 IronPDF 软件包及其依赖项,使您能够开始将其功能集成到 C# 应用程序中。

4. 安装 PDFsharp

类似于 IronPDF, PDFsharp 可以使用 NuGet 包管理器或包管理器控制台进行安装。 执行以下命令以安装 PDFsharp:

Install-Package PdfSharp

此命令将安装 PDFsharp 库,使其可在 C# 项目中使用。

5. PDFsharp 查看 PDF 页面内容

在本节中,我们将讨论如何使用PDFsharp查看和打开PDF文件,并将提取的结果打印到控制台。 在下面的代码示例中将使用 PDFsharp 查看 PDF 文件内容。

using System;
using PdfSharp.Pdf;
using PdfSharp.Pdf.IO;
class Program
{
    static void Main()
    {
        // Specify the pdf path
        string pdfFilePath = "output.pdf";
        // Open the PDF document
        PdfDocument document = PdfReader.Open(pdfFilePath, PdfDocumentOpenMode.Import);
        // Iterate through each page of the document
        for (int pageIndex = 0; pageIndex < document.PageCount; pageIndex++)
        {
            // Get the current page, Extract text from the page
            string page = document.Pages [pageIndex].Contents.Elements.GetDictionary(0).Stream.ToString();
            // Print the text to the console
            Console.WriteLine($"Page {pageIndex + 1} Content:\n{page}\n");
        }
        Console.ReadLine(); // Wait for user input before closing the console
    }
}
using System;
using PdfSharp.Pdf;
using PdfSharp.Pdf.IO;
class Program
{
    static void Main()
    {
        // Specify the pdf path
        string pdfFilePath = "output.pdf";
        // Open the PDF document
        PdfDocument document = PdfReader.Open(pdfFilePath, PdfDocumentOpenMode.Import);
        // Iterate through each page of the document
        for (int pageIndex = 0; pageIndex < document.PageCount; pageIndex++)
        {
            // Get the current page, Extract text from the page
            string page = document.Pages [pageIndex].Contents.Elements.GetDictionary(0).Stream.ToString();
            // Print the text to the console
            Console.WriteLine($"Page {pageIndex + 1} Content:\n{page}\n");
        }
        Console.ReadLine(); // Wait for user input before closing the console
    }
}
Imports Microsoft.VisualBasic
Imports System
Imports PdfSharp.Pdf
Imports PdfSharp.Pdf.IO
Friend Class Program
	Shared Sub Main()
		' Specify the pdf path
		Dim pdfFilePath As String = "output.pdf"
		' Open the PDF document
		Dim document As PdfDocument = PdfReader.Open(pdfFilePath, PdfDocumentOpenMode.Import)
		' Iterate through each page of the document
		For pageIndex As Integer = 0 To document.PageCount - 1
			' Get the current page, Extract text from the page
			Dim page As String = document.Pages (pageIndex).Contents.Elements.GetDictionary(0).Stream.ToString()
			' Print the text to the console
			Console.WriteLine($"Page {pageIndex + 1} Content:" & vbLf & "{page}" & vbLf)
		Next pageIndex
		Console.ReadLine() ' Wait for user input before closing the console
	End Sub
End Class
VB   C#

此C#代码正确地使用PDFsharp库来读取和提取PDF文件中的文本内容。程序首先指定一个PDF文件的路径,假设该文件名为“output.PDF”。然后,它以导入模式打开PDF文档,允许提取内容。 该代码继续遍历文档的PDF页面,提取每一页的实际PDF内容,并将其打印到控制台。

提取的文本是通过访问页面内容并将其转换为字符串获得的。 输出包括页码及其对应的内容。 最后,程序在关闭控制台前等待用户输入。 请注意,代码假设示例PDF具有简单的结构,对于更复杂的场景,可能需要进行额外的解析和处理。

PDFsharp 使用 IronPDF 查看 PDF 的替代方案:图 1 - 控制台输出:Hello World--使用 PDFsharp 库从 output.PDF 文件中提取的内容。

6. IronPDF 查看 PDF 文件

使用IronPDF查看PDF比使用PDFsharp简单得多,只需几行代码即可完成。

using IronPdf;
using IronSoftware.Drawing;
using System;
var pdf = PdfDocument.FromFile("output.pdf");
string text = pdf.ExtractAllText();
Console.WriteLine(text);
using IronPdf;
using IronSoftware.Drawing;
using System;
var pdf = PdfDocument.FromFile("output.pdf");
string text = pdf.ExtractAllText();
Console.WriteLine(text);
Imports IronPdf
Imports IronSoftware.Drawing
Imports System
Private pdf = PdfDocument.FromFile("output.pdf")
Private text As String = pdf.ExtractAllText()
Console.WriteLine(text)
VB   C#

这段 C# 代码使用 IronPDF 库从名为 "output.PDF "的 PDF 文件中提取文本内容。首先,它导入了必要的命名空间,然后使用 PdfDocument.FromFile()IronPDF 的方法。随后,它使用ExtractAllText方法从 PDF 文档中提取所有文本内容,并将其存储在名为 "text" 的字符串变量中。最后,使用Console.WriteLine` 方法将提取的文本打印到控制台。()方法。 此代码通过IronPDF库提供的功能,简化了从PDF中提取文本的过程,使其简洁直观。

PDFsharp 使用 IronPDF 查看 PDF 替代文件:图 2 - 控制台输出:Hello World--使用 IronPDF 库从 output.PDF 文件中提取的内容。

7.结论

PDFsharp和IronPDF都为开发者提供了具有吸引力的功能,寻求多功能的解决方案。 PDFsharp, 一个开源库,提供了一个轻量级和用户友好的工具包,使其成为基本PDF任务和集成到C#项目的绝佳选择。 它的功能在高效浏览和操作PDF文档方面表现出色。 另一方面, IronPDF 作为一个强大的、功能丰富的库,专为全面的PDF操作设计。 它的高级功能,如HTML到PDF的转换和对各种其他图像文件格式的支持,使其成为开发者提升其C#项目的强大工具,拥有先进的PDF功能。

虽然两个库都有其优点,但IronPDF凭借其广泛的功能集、简便性和多功能性脱颖而出,成为赢家。 使用 IronPDF 查看 PDF 文件的简洁代码示例展示了其易用性和提取文本内容的有效性。 该库的全面功能使其成为开发人员处理复杂PDF任务的宝贵资产,使IronPDF成为那些希望将高级PDF功能无缝集成到其C#应用程序中的人的推荐选择。

IronPDF 可免费用于开发,并附带一个 免费试用. 要了解更多使用IronPDF查看PDF内容的信息,请访问 这里. 要查看更多代码示例,请访问 page.

< 前一页
IronPDF与PdfPig的比较
下一步 >
IronPDF 与 DinktoPdf 的比较

准备开始了吗? 版本: 2024.9 刚刚发布

免费NuGet下载 总下载量: 10,731,156 查看许可证 >