在实际环境中测试
在生产中测试无水印。
随时随地为您服务。
PDF (便携式文档格式) PDF 文件被广泛用于共享和展示文档,有时您可能需要将 PDF 文件分割成多个文件。无论您是要提取特定页面、将大型文档划分为较小的部分,还是要为每个章节创建单独的文件,在各种情况下,分割 PDF 都是一项非常有价值的任务。
在本文中,我们将学习如何使用 C# 来分割 PDF。C# 是一门通用且功能强大的语言,有几个库可以让您相对直接地操作 PDF。我们将探讨以下两个用于在 C# 中分割 PDF 的库。
1.首先安装 iText7 库
2.从输入的 PDF 文件创建一个 PdfReader。
3.使用 PdfDocument 处理 PDF 内容。
4.计算每个分割文件的页数。
5.设置初始页面范围值。
6.使用循环处理每个分割文件。
7.为当前分割文件创建一个新的 PdfDocument。
8.将原始文档中的页面复制到新文档中。
9.为下一次迭代更新页面范围值。
10.保存完成输出的 PDF。
11.重复直至创建所有文件:
12.继续处理指定数量的分割文件。
IronPDF 是一个功能强大的 C# 库,设计用于处理 PDF 文件。它提供以下功能 创造, 修改和 提取 从 PDF 文档中获取内容。开发人员可以从头开始生成 PDF 文件、编辑现有 PDF 文件,以及 合并或拆分 它们。此外,IronPDF 还擅长将 HTML 内容转换为 PDF 格式,这对生成报告或文档非常有用。由于支持数字签名、安全功能和高质量输出,IronPDF 简化了 .NET 应用程序中与 PDF 相关的任务。
iTextSharp (iText 7) 是一个广泛使用的库,用于在 .NET 框架中处理 PDF 文件。它为以编程方式创建、修改和提取 PDF 文档内容提供了强大的功能。开发人员可以使用 iTextSharp 在 PDF 文件中添加文本、图像、表格和其他图形元素。此外,它还支持文档组装、数字签名,并符合存档和可访问性标准。iTextSharp 最初是一个 Java 库,现已移植到 .NET,并拥有一个活跃的开发人员和用户社区。
安装 IronPDF NuGet 软件包 使用 Visual Studio 中的软件包管理器控制台,请按照以下步骤操作:
1.在 Visual Studio 中,转到工具 -> NuGet 包管理器 -> 包管理器控制台。
2.使用以下命令安装 IronPDF NuGet 软件包:
:ProductInstall
这将下载并安装 IronPDF 软件包及其依赖项到您的项目中。安装完成后,您就可以开始在 C# 项目中使用 IronPDF 执行 PDF 相关任务了。
您也可以使用 Visual Studio 中的 NuGet 软件包管理器安装 IronPDF,或直接将软件包添加到项目文件中。另一种方法是从 官方网站 并将其手动添加到您的项目中。每种方法都提供了一种将 IronPDF 集成到 C# 项目中以实现 PDF 相关功能的直接方法。
安装 iTextSharp 使用 Visual Studio 中的软件包管理器控制台,可以按照以下步骤操作:
1.在 Visual Studio 中,转到工具 -> NuGet 包管理器 -> 包管理器控制台。
2.使用以下命令安装 iTextSharp NuGet 软件包:
Install-Package itext7
这将下载并安装 iTextSharp 软件包及其依赖项到你的项目中。安装完成后,您就可以开始在 C# 项目中使用 iTextSharp 处理 PDF 了。
我们可以使用 IronPDF 将 PDF 文件分割成多个 PDF 文件。它提供了一种简单的方法来实现这一目标。以下代码将 PDF 源文件作为输入,并将其分割为多个 PDF 文件。
static void Main(string [] args)
{
string file = "input.pdf"'
// Call the SplitPdf method to split the PDF
SplitPdfUsingIronPDF(file, "output_split", NumberOfSplitFiles);
}
static void SplitPdfUsingIronPDF(string inputPdfPath, string outputFolder, int NumberOfSplitFiles)
{
PdfDocument sourceFile = PdfDocument.FromFile(inputPdfPath);
int firstPage = 1;
int lastPage = 2;
int totalPageInOneFile = sourceFile.PageCount / NumberOfSplitFiles;
for (int i = 1; i <= NumberOfSplitFiles; i++)
{
// Copy multiple pages into a new document
PdfDocument newSplitPDF = sourceFile.CopyPages(firstPage,lastPage);
string name = $@"{outputFolder}\SplitPDF_IronPDF_{i}.pdf";
newSplitPDF.SaveAs(name);
firstPage = lastPage + 1;
lastPage += totalPageInOneFile;
}
}
static void Main(string [] args)
{
string file = "input.pdf"'
// Call the SplitPdf method to split the PDF
SplitPdfUsingIronPDF(file, "output_split", NumberOfSplitFiles);
}
static void SplitPdfUsingIronPDF(string inputPdfPath, string outputFolder, int NumberOfSplitFiles)
{
PdfDocument sourceFile = PdfDocument.FromFile(inputPdfPath);
int firstPage = 1;
int lastPage = 2;
int totalPageInOneFile = sourceFile.PageCount / NumberOfSplitFiles;
for (int i = 1; i <= NumberOfSplitFiles; i++)
{
// Copy multiple pages into a new document
PdfDocument newSplitPDF = sourceFile.CopyPages(firstPage,lastPage);
string name = $@"{outputFolder}\SplitPDF_IronPDF_{i}.pdf";
newSplitPDF.SaveAs(name);
firstPage = lastPage + 1;
lastPage += totalPageInOneFile;
}
}
Shared Sub Main(ByVal args() As String)
'INSTANT VB TODO TASK: The following line uses invalid syntax:
' string file = "input.pdf"' SplitPdfUsingIronPDF(file, "output_split", NumberOfSplitFiles); } static void SplitPdfUsingIronPDF(string inputPdfPath, string outputFolder, int NumberOfSplitFiles) { PdfDocument sourceFile = PdfDocument.FromFile(inputPdfPath); int firstPage = 1; int lastPage = 2; int totalPageInOneFile = sourceFile.PageCount / NumberOfSplitFiles; for(int i = 1; i <= NumberOfSplitFiles; i++) { PdfDocument newSplitPDF = sourceFile.CopyPages(firstPage,lastPage); string name = string.Format("{0}\SplitPDF_IronPDF_{1}.pdf", outputFolder, i); newSplitPDF.SaveAs(name); firstPage = lastPage + 1; lastPage += totalPageInOneFile; } }
这段代码的目的是使用 IronPDF 库将给定的 PDF 文件分割成多个较小的 PDF 文件。定义 SplitPdfUsingIronPDF 方法就是为了实现这一功能。
inputPdfPath:表示输入 PDF 文件路径的字符串 (例如,"input.pdf").
3.分割文件数:一个整数,表示原始 PDF 将被分割成多少个较小的 PDF 文件。
在 SplitPdfUsingIronPDF 方法内部:
1.通过从指定的 inputPdfPath 加载 PDF,创建名为 sourceFile 的 PdfDocument 对象。
2.两个整数变量 firstPage 和 lastPage 被初始化。它们代表了分割的页面范围。
4.循环迭代从 1 到 NumberOfSplitFiles:
5.创建一个名为 newSplitPDF 的新 PdfDocument 对象。
6.页面从 firstPage 到 lastPage (包容性) 从源文件复制到 newSplitPDF。
7.生成的较小 PDF 文件的保存文件名为 "SplitPDF_IronPDF_1.pdf"。 (第一次分割) 在指定的输出文件夹中。
8.firstPage 和 lastPage 值会在下一次迭代时更新。
应将 "input.pdf "替换为输入 PDF 文件的实际路径。确保在项目中正确安装并引用了 IronPDF 库。
输出文件创建为
现在,我们将使用 iTextSharp 将 PDF 文档分割成多个 PDF 文件。以下代码将源文件作为输入,并将 PDF 文档分割成多个较小的文件。
static void Main(string [] args)
{
string inputPath = "input.pdf";
// Output PDF files path (prefix for the generated files)
string outputPath = "output_split";
int NumberOfSplitFiles = 3;
// Call the SplitPdf method to split the PDF
SplitPdfUsingiTextSharp(inputPath, outputPath, NumberOfSplitFiles);
}
static void SplitPdfUsingiTextSharp(string inputPdfPath, string outputFolder, int NumberOfSplitFiles)
{
using (PdfReader Reader = new PdfReader(inputPdfPath))
{
using (PdfDocument doc = new PdfDocument(Reader))
{
int totalPageInOneFile = doc.GetNumberOfPages() / NumberOfSplitFiles;
int firstPage = 1;
int lastPage = totalPageInOneFile; // int pagenumber
for (int i = 1; i <= NumberOfSplitFiles; i++)
{
string filename = $@"{outputFolder}\SplitPDF_iTextSharp_{i}.pdf";
using (PdfDocument pdfDocument = new PdfDocument(new PdfWriter(filename))) // create output file
{
//pdfDocument.get
doc.CopyPagesTo(firstPage, lastPage, pdfDocument);
}
firstPage = lastPage + 1;
lastPage += totalPageInOneFile;
}
}
}
}
static void Main(string [] args)
{
string inputPath = "input.pdf";
// Output PDF files path (prefix for the generated files)
string outputPath = "output_split";
int NumberOfSplitFiles = 3;
// Call the SplitPdf method to split the PDF
SplitPdfUsingiTextSharp(inputPath, outputPath, NumberOfSplitFiles);
}
static void SplitPdfUsingiTextSharp(string inputPdfPath, string outputFolder, int NumberOfSplitFiles)
{
using (PdfReader Reader = new PdfReader(inputPdfPath))
{
using (PdfDocument doc = new PdfDocument(Reader))
{
int totalPageInOneFile = doc.GetNumberOfPages() / NumberOfSplitFiles;
int firstPage = 1;
int lastPage = totalPageInOneFile; // int pagenumber
for (int i = 1; i <= NumberOfSplitFiles; i++)
{
string filename = $@"{outputFolder}\SplitPDF_iTextSharp_{i}.pdf";
using (PdfDocument pdfDocument = new PdfDocument(new PdfWriter(filename))) // create output file
{
//pdfDocument.get
doc.CopyPagesTo(firstPage, lastPage, pdfDocument);
}
firstPage = lastPage + 1;
lastPage += totalPageInOneFile;
}
}
}
}
Shared Sub Main(ByVal args() As String)
Dim inputPath As String = "input.pdf"
' Output PDF files path (prefix for the generated files)
Dim outputPath As String = "output_split"
Dim NumberOfSplitFiles As Integer = 3
' Call the SplitPdf method to split the PDF
SplitPdfUsingiTextSharp(inputPath, outputPath, NumberOfSplitFiles)
End Sub
Shared Sub SplitPdfUsingiTextSharp(ByVal inputPdfPath As String, ByVal outputFolder As String, ByVal NumberOfSplitFiles As Integer)
Using Reader As New PdfReader(inputPdfPath)
Using doc As New PdfDocument(Reader)
'INSTANT VB WARNING: Instant VB cannot determine whether both operands of this division are integer types - if they are then you should use the VB integer division operator:
Dim totalPageInOneFile As Integer = doc.GetNumberOfPages() / NumberOfSplitFiles
Dim firstPage As Integer = 1
Dim lastPage As Integer = totalPageInOneFile ' int pagenumber
For i As Integer = 1 To NumberOfSplitFiles
Dim filename As String = $"{outputFolder}\SplitPDF_iTextSharp_{i}.pdf"
Using pdfDocument As New PdfDocument(New PdfWriter(filename)) ' create output file
'pdfDocument.get
doc.CopyPagesTo(firstPage, lastPage, pdfDocument)
End Using
firstPage = lastPage + 1
lastPage += totalPageInOneFile
Next i
End Using
End Using
End Sub
上述代码演示了如何使用 iTextSharp 将大型 PDF 文件分割成小块。每个较小的 PDF 文档将包含原始文档的一部分。
1.主要功能封装在 SplitPdfUsingiTextSharp 方法中。
2.上述方法需要三个参数:inputPdfPath、outputFolder 和 NumberOfSplitFiles。
在 SplitPdfUsingiTextSharp 方法内部:
1.通过从指定的 inputPdfPath 加载 PDF,创建名为 Reader 的 PdfReader 对象。
2.一个名为 DOC 的 PdfDocument 对象通过阅读器被初始化。
3.源 PDF 中的总页数除以 NumberOfSplitFiles,以确定每个较小的 PDF 应包含多少页。
从 1 到 NumberOfSplitFiles 的循环迭代:
1.创建一个新的较小的 PDF 文件,文件名为 "SplitPDF_iTextSharp_1.pdf"。 (第一次分割) 在指定的输出文件夹中。
2.在这个新的 PDF 文档中 (pdfDocument), 页面是从原始文件中复制的:
4.较小的 PDF 将被保存。
5.为下一次迭代更新 firstPage 和 lastPage 值。
确保 iTextSharp 库已正确安装并在项目中引用。将 "input.pdf "替换为输入 PDF 文件的实际路径。
要比较使用 iTextSharp 和 IronPDF 的两种拆分方法,让我们根据几个因素对它们进行评估:
易于使用:
iTextSharp: iTextSharp 方法包括创建一个 PdfReader、PdfDocument 和 PdfWriter。它计算页面范围并将页面复制到新文档中。这种方法需要了解 iTextSharp API。
代码可读性:
iTextSharp: 代码涉及更多步骤,因此稍长,阅读起来可能更复杂。
性能:
iTextSharp: 重复创建和处理 PdfDocument 实例可能会影响性能。
内存使用:
iTextSharp: 创建多个 PdfDocument 实例将消耗更多内存。
总之,iTextSharp 和 IronPDF 都为用 C# 来分割 PDF 文件提供了强大的解决方案,两者各有千秋。IronPDF 因其简单性、可读性和更直接的方法可能带来的更好性能而脱颖而出。
在多功能性和易用性之间寻求平衡的开发人员可能会发现 IronPDF 是一个令人信服的选择。此外,IronPDF 还提供了 免费试用.最终,如何在 iTextSharp 和 IronPDF 之间做出选择取决于各个项目的要求和偏好的开发风格。