在生產環境中測試,無水印。
在任何需要的地方都能運行。
獲得 30 天的全功能產品。
在幾分鐘內上手運行。
試用產品期間完全訪問我們的支援工程團隊
在本教程中,我們將研究如何使用兩個不同的 PDF 庫在 C# 中從 PDF(可攜式文檔格式)文件提取文本和圖像。
在當今現代的網路時代,有許多函式庫可以從 PDF 檔案中提取文字和圖片,以便解析和閱讀。 今天,我們將使用兩個強大的 PDF 函式庫,IronPDF 和 QuestPDF,從 PDF 文件中提取文本。通過比較這兩個函式庫如何處理簡單的文本提取任務,我們可以確定哪個更適合處理這類高級 PDF 任務。 在我們進入比較部分之前,讓我們先花點時間來看看每個庫的簡介。
QuestPDF 是一個先進的開源 PDF 生成庫,專門為 .NET 開發人員設計。 它使用現代聲明式 API,使用戶能夠以極大的靈活性和精確度定義和生成複雜的 PDF 佈局。 雖然 QuestPDF 主要專注於文件生成而非文本提取,但它提供了一種簡潔、直觀的方法來從頭開始構建文件並操作文件中的不同元素。 這使其特別適合需要自訂動態 PDF 內容的應用程式。
IronPDF 是一個多功能的 PDF 處理庫,專為使在 C# 中處理 PDF 變得更加簡單和高效而設計。 與 QuestPDF 不同,IronPDF 專為 PDF 生成和操作而設計。 其提供的功能包括PDF加密,對編輯和註釋現有PDF的廣泛支持,將各種文檔轉換為PDF格式,添加頁眉和頁腳(可用於顯示頁碼),編輯文檔元數據,多線程和異步支持,以及高級PDF轉換工具。
除了豐富的功能集之外,IronPDF 提供全面的跨平台支持,支持 .NET 5/6/7、.NET Core 和 .NET Framework。 它也完全相容於 Windows、macOS、Linux 和 Azure、AWS 等雲端平台,是跨平台 .NET 應用程式的極佳選擇。
在今天的範例中,我們將使用這兩個庫從我們的範例發票 PDF 文件中提取文字。
首先,我們將看看QuestPDF是否能勝任這項任務。
不幸的是,雖然QuestPDF在處理PDF創建和某些PDF任務的性能方面表現出色,但目前並不提供文字提取功能。 雖然QuestPDF並非專為從現有PDF文件中提取文本而設計,但它確實提供了一些基礎工具來處理PDF文件,這些工具可以通過額外的邏輯或第三方整合來擴展,以支持文本提取。 例如,可使用 QuestPDF 生成具有結構化內容的 PDF 文件,並可實施自訂解決方案,以便使用第三方庫根據文件的結構提取內容。
文字擷取 僅僅是 IronPDF 在處理 PDF 時擅長的任務之一,只需幾行代碼,我們就能從整個 PDF 文件中擷取文字。 這可以在以下代碼片段中看到:
using IronPdf;
public class Program
{
public static void main(string[] args)
{
PdfDocument pdf = PdfDocument.FromFile("exampleInvoice.pdf");
string text = pdf.ExtractAllText();
Console.WriteLine(text);
}
}
using IronPdf;
public class Program
{
public static void main(string[] args)
{
PdfDocument pdf = PdfDocument.FromFile("exampleInvoice.pdf");
string text = pdf.ExtractAllText();
Console.WriteLine(text);
}
}
Imports IronPdf
Public Class Program
Public Shared Sub main(ByVal args() As String)
Dim pdf As PdfDocument = PdfDocument.FromFile("exampleInvoice.pdf")
Dim text As String = pdf.ExtractAllText()
Console.WriteLine(text)
End Sub
End Class
IronPDF 提供了簡單的 API 用於提取文本,這對注重效率的開發者來說是理想的選擇。 僅需三行程式碼,我們就能擷取 PDF 文件中的文本內容,並顯示出來以供閱讀。 從這裡開始,您可以輕鬆地保存提取的文本以供進一步使用或操作。
另一方面,由於功能比 IronPDF 等庫更有限,QuestPDF 無法處理諸如文本提取之類的任務。 雖然它可以處理其他任務,例如 PDF 生成和基本操作,但您需要實施外部庫才能提取文本。
當涉及提取文字時。 QuestPDF 透過其社群授權可免費用於私人專案,但也提供商業授權的選擇。
這兩個庫都準確且可靠,但最終的選擇取決於您的專案需求。
若要更深入比較這些程式庫,請查看完整的部落格IronPDF vs QuestPDF。