使用 IRONPDF

如何在 C# 中讀取 PDF 檔案

已更新 2024年2月25日
分享:

在金融、醫療、法律和教育等行業中,程式化的 PDF 處理至關重要,因為需要從 PDF 文件中處理、分析和提取關鍵資訊,以用於數據分析、文件管理和自動化等目的。儘管其重要性顯而易見,但這項任務可能具挑戰性。

IronPDF:一個 C# PDF 庫

IronPDF 使你能夠輕鬆處理極其困難的任務。它允許你像處理文本文檔中的文本文件一樣輕鬆編輯 PDF 文檔中的文本,同時允許你在任何操作系統中匯出文件。IronPDF 應用程序涵蓋了查看、修改和提取 PDF 內容的整個過程。

選擇 IronPDF 的正確步驟

使用 IronPDF 軟件,任何計算機都可以快速且輕鬆地讀取和寫入 PDF 文件格式的文本。安裝這個簡單任務是最佳方法來學習如何在 C# 中讀取 PDF 文件。您還可以免費下載 IronPDF 進行開發。如果您探索 IronPDF,您會發現該庫提供了豐富的功能,使使用 PDF 變得非常容易。在您的空閒時間探索這些類別。! 有幾個 C# 範例 可用來學習如何從讀取PDF中創建最佳輸出。

使用 IronPDF 閱讀 PDF 文件

第一步:安裝 IronPDF 套件

要開始,您需要 安裝IronPDF 將 NuGet 套件引入您的 .NET 專案。您可以通過在 Visual Studio 中打開套件管理器控制台,並輸入以下命令來實現:

Install-Package IronPdf

步驟 2:導入 IronPDF 程式庫

接下來,您需要在程式碼中導入 IronPDF 程式庫,請在檔案頂部加入以下語句:

using IronPdf;
using IronPdf;
Imports IronPdf
VB   C#

步驟 3:載入 PDF 文件

當您引入了 IronPDF 庫之後,您可以使用以下程式碼將 PDF 文件載入到您的程式中:

PdfDocument pdf = PdfDocument.FromFile(@"C:\dotnet.pdf");
var outputPath = "Example.pdf";
pdf.SaveAs(outputPath);
PdfDocument pdf = PdfDocument.FromFile(@"C:\dotnet.pdf");
var outputPath = "Example.pdf";
pdf.SaveAs(outputPath);
Dim pdf As PdfDocument = PdfDocument.FromFile("C:\dotnet.pdf")
Dim outputPath = "Example.pdf"
pdf.SaveAs(outputPath)
VB   C#

步驟 4:從 PDF 中提取文字

IronPDF 提供了一系列方法來從現有的 PDF 文件中提取文字。例如,您可以使用以下程式碼片段從 PDF 文件中開始提取文字並將其打印在控制台上:

string text = pdf.ExtractText();
Console.Writeline(text);
string text = pdf.ExtractText();
Console.Writeline(text);
Dim text As String = pdf.ExtractText()
Console.Writeline(text)
VB   C#

使用上面的程式碼,您可以 從 PDF 檔案中提取文字.

如何在 C# 中读取 PDF 文件,图1:使用 IronPDF 从 PDF 中提取文本

使用 IronPDF 從 PDF 中提取文本

步驟 5:將 PDF 光柵化為圖像

讓我們 將PDF文件光柵化為圖像 使用 IronPDF。首先,匯入所需的程式庫:

using System.Linq;
using IronPdf;
using IronSoftware.Drawing;
using System.Linq;
using IronPdf;
using IronSoftware.Drawing;
Imports System.Linq
Imports IronPdf
Imports IronSoftware.Drawing
VB   C#

程式碼接著使用 轉換為圖像文件 方法將 PDF 文件的所有頁面提取到文件夾中作為圖像文件。提取的圖像可以保存為 PNG 或 JPG 文件,並且還可以指定圖像的尺寸和頁碼範圍。

// Extract all pages to a folder as image files
pdf.RasterizeToImageFiles(@"C:\image\folder\*.png");

// Dimensions and page ranges may be specified
pdf.RasterizeToImageFiles(@"C:\image\folder\example_pdf_image_*.jpg", 100, 80);
// Extract all pages to a folder as image files
pdf.RasterizeToImageFiles(@"C:\image\folder\*.png");

// Dimensions and page ranges may be specified
pdf.RasterizeToImageFiles(@"C:\image\folder\example_pdf_image_*.jpg", 100, 80);
' Extract all pages to a folder as image files
pdf.RasterizeToImageFiles("C:\image\folder\*.png")

' Dimensions and page ranges may be specified
pdf.RasterizeToImageFiles("C:\image\folder\example_pdf_image_*.jpg", 100, 80)
VB   C#

最後,程式碼使用 ToBitmap 提取 PDF 文件所有頁面為 AnyBitmap 對象的方法,可在程式碼中進一步處理和操作。

// Extract all pages as AnyBitmap objects
AnyBitmap [] pdfBitmaps = pdf.ToBitmap();
// Extract all pages as AnyBitmap objects
AnyBitmap [] pdfBitmaps = pdf.ToBitmap();
' Extract all pages as AnyBitmap objects
Dim pdfBitmaps() As AnyBitmap = pdf.ToBitmap()
VB   C#

上面的代碼展示了如何使用 IronPDF 提取 PDF 檔案的內容,並將提取的資料保存為圖像檔案或 AnyBitmap 對象以進一步處理。

步驟 7:操作 PDF 頁面

讓我們學習如何 操作頁面 使用 IronPDF 讀取 PDF 文件來處理 PDF 檔案中的頁面。

代碼首先使用 IronPDF 從 PDF 文件中移除第二頁和第三頁。 RemovePages 方法:

pdf.RemovePages(1, 2);
pdf.RemovePages(1, 2);
pdf.RemovePages(1, 2)
VB   C#

RemovePages 方法需要兩個參數:要移除的起始頁面 (在這個例子中,第 2 頁表示為 1,因為頁碼是從 0 開始計算的。) 要移除的頁數 (在這種情況下,2頁).

步驟 6: 儲存 PDF

最後,您可以使用將 PDF 檔案儲存到本地系統。 保存為 方法。儲存 PDF 檔案的程式碼如下:

pdf.SaveAs(OutputPath);
pdf.SaveAs(OutputPath);
pdf.SaveAs(OutputPath)
VB   C#

IronPDF 兼容性

IronPDF 與所有最新的 .NET 框架高度兼容,包括 .NET 7。它還支持 .NET Blazor 和 .NET MAUI,這是 Microsoft 最新的 Web 開發產品。該庫與這些框架的兼容性使開發人員可以將 IronPDF 無縫集成到其應用程序中,並利用其強大的功能。

IronPDF 的主要功能之一是能夠在 .NET Blazor 和 .NET MAUI 中讀取 PDF 文件。此功能使開發人員能夠快速輕鬆地讀取和提取 PDF 文件中的數據,並在 .NET 應用程序中使用它們。這種能力在處理大量數據時尤其有用。開發人員在他們的 .NET 項目中使用 IronPDF 時不需要任何其他庫。

了解更多信息 IronPDF 與 .NET Blazor 一起使用.NET MAUI 在 IronPDF 的網站上

結論

總之,以程式方式讀取 PDF 文件對於各行各業來說都是至關重要的。IronPDF 提供了一個全面的解決方案,透過提供廣泛的功能來讀取、修改和提取 PDF 文件中的內容。IronPDF 安裝和使用非常簡單,只需幾個簡單的步驟。

該庫提供的方法可以 提取文字, 將 PDF 光柵化為圖像, 操作頁面,並保存 PDF 文件。無論您是程式化 PDF 處理的新手還是經驗豐富的開發人員,IronPDF 都是升級您技能的完美工具。

如果您正在尋求一個可靠且高效的 C# PDF 閱讀解決方案,IronPDF 值得探索,特別是其 許可證起價從$749開始,和一個 免費試用 可用。您可以在下圖中看到IronPDF提供的更多方案。您可以選擇符合您需求的套裝方案。

如何在 C# 中讀取 PDF 檔,圖 2:IronPDF 授權價格

IronPDF 授權價格

< 上一頁
如何在 C# 中將 Word 轉換為 PDF(教程)
下一個 >
您應該購買IronPDF嗎?

準備開始了嗎? 版本: 2024.10 剛剛發布

免費 NuGet 下載 總下載次數: 10,993,239 查看許可證 >