产品比较

使用IronPDF查看PDF替代方案的PDFsharp

发布 2023年十二月24日
分享:

在软件开发的动态环境中,处理和展示各种格式的数据至关重要。其中,便携式文档格式 (PDF) PDF 是一种广泛使用的标准化文档共享格式。在 C# 编程语言领域,无缝查看 PDF 的能力是不可或缺的。

C# 的通用性使其成为开发跨领域强大应用程序的热门选择。PDF 作为一种格式,可确保文档的完整性和跨平台的一致呈现。将 PDF 查看功能集成到 C# 应用程序中,使开发人员能够增强用户体验、简化工作流程、保存并提供高效的解决方案来处理各行各业的文档。

本文探讨了使用 C# 查看 PDF 的意义,并介绍了两个功能强大的库,它们分别是:C# PDF 浏览器库和 C# PDF 浏览器库。 PDFsharpIronPDF - 并逐步说明如何安装和使用它们来查看 PDF。

1.PDFsharp

PDFsharp PDFsharp 是 C# 编程领域中一个功能强大的开源库,它为开发人员提供了一个多功能的 PDF 操作工具包。除了创建和修改 PDF 的功能外,PDFsharp 还能将 PDF 查看功能无缝集成到 C# 应用程序中。该库以其轻量级设计和用户友好的方法而闻名,使开发人员能够毫不费力地浏览和操作 PDF 文档。随着我们对 PDFsharp 功能的探索和实际应用的深入,我们可以清楚地看到,对于那些在 C# 项目中寻求高效解决方案以加强文档管理的人来说,该库是一笔宝贵的财富。

2.IronPDF

IronPDF IronPDF 是一款功能强大、特性丰富的库,可帮助开发人员轻松驾驭复杂的 PDF 操作领域。IronPDF 在设计时充分考虑了简洁性和多功能性,使用户能够毫不费力地创建、编辑和处理 PDF 文件。 阅读 PDF 文档 在他们的 C# 应用程序中。除基本功能外,IronPDF 还具有 HTML 至 PDF 转换、支持各种图像格式以及无缝处理复杂 PDF 操作等高级功能。

当我们深入研究 IronPDF 的功能时,就会发现这个库不仅仅是一个完成基本 PDF 任务的工具,它还是一个全面的解决方案,可以帮助开发人员利用复杂的 PDF 功能提升他们的 C# 项目。IronPDF 可以处理 PDF,并将数据字符串正确格式化为可读字符串。

3.安装 IronPDF

在使用 IronPDF 浏览 PDF 之前,必须先安装该库。您可以轻松添加 IronPDF 到你的项目中。只需运行以下命令即可:

Install-Package IronPdf

该命令将安装 IronPDF 软件包及其依赖项,使您能够开始将其功能集成到 C# 应用程序中。

4.安装 PDFsharp

与 IronPDF 类似、 PDFsharp 可使用 NuGet 软件包管理器或软件包管理器控制台安装。执行以下命令安装 PDFsharp:

Install-Package PdfSharp

此命令将安装 PDFsharp 库,使其可在 C# 项目中使用。

5.PDFsharp 查看 PDF 页面内容

在本节中,我们将讨论如何使用 PDFsharp 查看和打开 PDF 文件,并将提取的结果打印到控制台。下面的代码示例将使用 PDFsharp 查看 PDF 文件内容。

using System;
using PdfSharp.Pdf;
using PdfSharp.Pdf.IO;
class Program
{
    static void Main()
    {
        // Specify the pdf path
        string pdfFilePath = "output.pdf";
        // Open the PDF document
        PdfDocument document = PdfReader.Open(pdfFilePath, PdfDocumentOpenMode.Import);
        // Iterate through each page of the document
        for (int pageIndex = 0; pageIndex < document.PageCount; pageIndex++)
        {
            // Get the current page, Extract text from the page
            string page = document.Pages [pageIndex].Contents.Elements.GetDictionary(0).Stream.ToString();
            // Print the text to the console
            Console.WriteLine($"Page {pageIndex + 1} Content:\n{page}\n");
        }
        Console.ReadLine(); // Wait for user input before closing the console
    }
}
using System;
using PdfSharp.Pdf;
using PdfSharp.Pdf.IO;
class Program
{
    static void Main()
    {
        // Specify the pdf path
        string pdfFilePath = "output.pdf";
        // Open the PDF document
        PdfDocument document = PdfReader.Open(pdfFilePath, PdfDocumentOpenMode.Import);
        // Iterate through each page of the document
        for (int pageIndex = 0; pageIndex < document.PageCount; pageIndex++)
        {
            // Get the current page, Extract text from the page
            string page = document.Pages [pageIndex].Contents.Elements.GetDictionary(0).Stream.ToString();
            // Print the text to the console
            Console.WriteLine($"Page {pageIndex + 1} Content:\n{page}\n");
        }
        Console.ReadLine(); // Wait for user input before closing the console
    }
}
Imports Microsoft.VisualBasic
Imports System
Imports PdfSharp.Pdf
Imports PdfSharp.Pdf.IO
Friend Class Program
	Shared Sub Main()
		' Specify the pdf path
		Dim pdfFilePath As String = "output.pdf"
		' Open the PDF document
		Dim document As PdfDocument = PdfReader.Open(pdfFilePath, PdfDocumentOpenMode.Import)
		' Iterate through each page of the document
		For pageIndex As Integer = 0 To document.PageCount - 1
			' Get the current page, Extract text from the page
			Dim page As String = document.Pages (pageIndex).Contents.Elements.GetDictionary(0).Stream.ToString()
			' Print the text to the console
			Console.WriteLine($"Page {pageIndex + 1} Content:" & vbLf & "{page}" & vbLf)
		Next pageIndex
		Console.ReadLine() ' Wait for user input before closing the console
	End Sub
End Class
VB   C#

这段 C# 代码正确地利用了 PDFsharp 库来读取和提取 PDF 文件中的文本内容。程序首先指定 PDF 文件的路径,假定文件名为 "output.PDF"。然后以导入模式打开 PDF 文档,以便提取内容。代码继续遍历 PDF 文档的各个页面,提取每个页面的实际 PDF 内容,并将其打印到控制台。

提取的文本是通过访问页面内容并将其转换为字符串获得的。输出包括页码及其相应内容。最后,程序会等待用户输入,然后关闭控制台。请注意,代码假定样本 PDF 结构简单,对于更复杂的情况,可能需要额外的解析和处理。

PDFsharp 使用 IronPDF 查看 PDF 的替代方案:图 1 - 控制台输出:Hello World--使用 PDFsharp 库从 output.PDF 文件中提取的内容。

6.IronPDF 查看 PDF 文件

使用 IronPDF 查看 PDF 文件要比 PDFsharp 简单得多,只需几行代码即可完成。

using IronPdf;
using IronSoftware.Drawing;
using System;
var pdf = PdfDocument.FromFile("output.pdf");
string text = pdf.ExtractAllText();
Console.WriteLine(text);
using IronPdf;
using IronSoftware.Drawing;
using System;
var pdf = PdfDocument.FromFile("output.pdf");
string text = pdf.ExtractAllText();
Console.WriteLine(text);
Imports IronPdf
Imports IronSoftware.Drawing
Imports System
Private pdf = PdfDocument.FromFile("output.pdf")
Private text As String = pdf.ExtractAllText()
Console.WriteLine(text)
VB   C#

这段 C# 代码使用 IronPDF 库从名为 "output.PDF "的 PDF 文件中提取文本内容。首先,它导入了必要的命名空间,然后使用 PdfDocument.FromFile()方法。随后,它会使用ExtractAllText方法从 PDF 文档中提取所有文本内容,并将其存储到名为 "text "的字符串变量中。最后,使用Console.WriteLine` 将提取的文本打印到控制台()方法。借助 IronPDF 库提供的功能,这段代码简化了从 PDF 中提取文本的过程,使其简洁明了。

PDFsharp 使用 IronPDF 查看 PDF 替代文件:图 2 - 控制台输出:Hello World--使用 IronPDF 库从 output.PDF 文件中提取的内容。

7.结论

PDFsharp 和 IronPDF 都为寻求多功能解决方案的开发人员提供了引人注目的功能。 PDFsharp是一个开放源代码库,提供了一个轻量级和用户友好的工具包,使其成为基本 PDF 任务和集成到 C# 项目中的绝佳选择。它在高效浏览和操作 PDF 文档方面的功能非常突出。另一方面、 IronPDF 作为一个功能丰富的强大库,它专为全面的 PDF 操作而设计。其先进的功能,如 HTML 到 PDF 的转换以及对其他各种图像文件格式的支持,使其成为开发人员的强大工具,旨在通过复杂的 PDF 功能提升其 C# 项目。

虽然这两个库都有各自的优点,但 IronPDF 凭借其广泛的功能集、简洁性和多功能性脱颖而出。使用 IronPDF 查看 PDF 文件的简明代码示例展示了其在提取文本内容方面的易用性和有效性。该库的全面功能使其成为开发人员处理复杂 PDF 任务的宝贵资产,因此 IronPDF 是那些希望将高级 PDF 功能无缝集成到其 C# 应用程序中的人的推荐选择。

IronPDF 可免费用于开发,并附带一个 免费试用.如需了解使用 IronPDF 查看 PDF 内容的更多信息,请访问 这里.要查看更多代码示例,请访问 page.

< 前一页
IronPDF与PdfPig的比较
下一步 >
IronPDF 与 DinktoPdf 的比较

准备开始了吗? 版本: 2024.10 刚刚发布

免费NuGet下载 总下载量: 11,108,738 查看许可证 >