使用 IRONPDF

如何在 C# 中讀取 PDF 檔案

坎納帕特·烏頓潘

2023年2月22日

已更新 2024年2月25日

程式化的 PDF 處理在金融、醫療保健、法律和教育等行業中至關重要。這些行業需要處理、分析和提取 PDF 文件中的關鍵信息，用於數據分析、文件管理和自動化等目的。儘管這項任務很重要，但可能會很具挑戰性。

IronPDF: 一個 C# PDF 程式庫

IronPDF 讓您輕鬆處理極其艱難的任務。它允許輕鬆編輯 PDF 文件中的文本，類似於在文本文件中編輯文本，同時允許您在任何操作系統中匯出文件。 IronPDF 應用程式涵蓋了查看、修改和提取 PDF 內容的完整過程。

選擇使用 IronPDF 邁向正確的步伐

使用任何配備IronPDF軟體的電腦，可以快速且輕鬆地讀寫PDF檔案格式的文字。安裝是一個簡單的任務。這是學習用 C# 讀取 PDF 文件的最佳方式。您也可以免费下载 IronPDF 以进行开发。如果您探索IronPDF，您會注意到該庫提供了廣泛的功能，使使用PDF變得非常容易。在空閒時間探索課程!有幾個使用 HTML 創建 PDF 的 C# 範例可用來學習如何從讀取PDF中創建最佳輸出。

使用 IronPDF 閱讀 PDF 文件

步驟 1：安裝 IronPDF 套件

首先，您需要安裝 IronPDF NuGet 套件到您的 .NET 專案中。您可以通過在 Visual Studio 中打開套件管理器控制台並輸入以下命令來執行此操作：

Install-Package IronPdf

第 2 步：導入 IronPDF 庫

接下來，您需要透過在檔案的頂部加入以下語句來將 IronPDF 庫導入到您的代碼中：

using IronPdf;

using IronPdf;

Imports IronPdf

步驟三：載入 PDF 文件

一旦導入了IronPDF庫，您可以使用以下代碼將PDF文檔加載到您的代碼中：

PdfDocument pdf = PdfDocument.FromFile(@"C:\dotnet.pdf");
var outputPath = "Example.pdf";
pdf.SaveAs(outputPath);

PdfDocument pdf = PdfDocument.FromFile(@"C:\dotnet.pdf");
var outputPath = "Example.pdf";
pdf.SaveAs(outputPath);

Dim pdf As PdfDocument = PdfDocument.FromFile("C:\dotnet.pdf")
Dim outputPath = "Example.pdf"
pdf.SaveAs(outputPath)

步驟 4：從 PDF 中提取文字

IronPDF 提供了一系列方法來從現有的 PDF 文件中提取文本。例如，您可以使用以下程式碼片段從 PDF 中開始提取文本，並將其打印到控制台上：

string text = pdf.ExtractText();
Console.Writeline(text);

string text = pdf.ExtractText();
Console.Writeline(text);

Dim text As String = pdf.ExtractText()
Console.Writeline(text)

使用上面的程式碼，您可以從 PDF 檔案中提取文字.

如何在 C# 中读取 PDF 文件，图1：使用 IronPDF 从 PDF 中提取文本

使用 IronPDF 從 PDF 提取文本

步驟 5：將 PDF 光柵化為圖像

讓我們使用 IronPDF 將 PDF 文件光柵化為圖像使用 IronPDF。首先，匯入所需的庫：

using System.Linq;
using IronPdf;
using IronSoftware.Drawing;

using System.Linq;
using IronPdf;
using IronSoftware.Drawing;

Imports System.Linq
Imports IronPdf
Imports IronSoftware.Drawing

程式碼接著使用RasterizeToImageFiles 方法將 PDF 文件的所有頁面提取到夾中作為圖像文件。提取的影像可以儲存為 PNG 或 JPG 檔案，也可以指定影像的尺寸和頁面範圍。

// Extract all pages to a folder as image files
pdf.RasterizeToImageFiles(@"C:\image\folder\*.png");

// Dimensions and page ranges may be specified
pdf.RasterizeToImageFiles(@"C:\image\folder\example_pdf_image_*.jpg", 100, 80);

// Extract all pages to a folder as image files
pdf.RasterizeToImageFiles(@"C:\image\folder\*.png");

// Dimensions and page ranges may be specified
pdf.RasterizeToImageFiles(@"C:\image\folder\example_pdf_image_*.jpg", 100, 80);

' Extract all pages to a folder as image files
pdf.RasterizeToImageFiles("C:\image\folder\*.png")

' Dimensions and page ranges may be specified
pdf.RasterizeToImageFiles("C:\image\folder\example_pdf_image_*.jpg", 100, 80)

最後，程式碼使用ToBitmap 方法將 PDF 文件的所有頁面提取為 AnyBitmap 對象，可以在代碼中進一步處理和操作。

// Extract all pages as AnyBitmap objects
AnyBitmap [] pdfBitmaps = pdf.ToBitmap();

// Extract all pages as AnyBitmap objects
AnyBitmap [] pdfBitmaps = pdf.ToBitmap();

' Extract all pages as AnyBitmap objects
Dim pdfBitmaps() As AnyBitmap = pdf.ToBitmap()

上面的代碼展示了如何使用 IronPDF 提取 PDF 檔案的內容，並將提取的資料保存為圖像檔案或 AnyBitmap 對象以進一步處理。

步驟7：操作 PDF 頁面

讓我們學習如何操作 PDF 文件的頁面使用 IronPDF 讀取 PDF 文件。

該程式碼首先使用將 PDF 文件中的第 2 和第 3 頁刪除RemovePages 方法:

pdf.RemovePages(1, 2);

pdf.RemovePages(1, 2);

pdf.RemovePages(1, 2)

RemovePages 方法需要兩個參數：要移除的起始頁面(在這個例子中，第 2 頁表示為 1，因為頁碼是從 0 開始計算的。)要移除的頁數(在這種情況下，2頁).

步驟 6：儲存 PDF

最後，您可以使用該功能將 PDF 檔儲存到本地系統中。SaveAs 方法. 保存 PDF 檔案的程式碼如下：

pdf.SaveAs(OutputPath);

pdf.SaveAs(OutputPath);

pdf.SaveAs(OutputPath)

IronPDF 相容性

IronPDF 與所有最新的 .NET 框架高度兼容，包括 .NET 7。它還支持 .NET Blazor 和 .NET MAUI，這些是微軟最新的網頁開發產品。該程式庫與這些框架的兼容性使開發人員能夠將IronPDF無縫集成到他們的應用程式中，並利用其強大的功能。

IronPDF 的主要功能之一是能在 .NET Blazor 和 .NET MAUI 中讀取 PDF 檔案。此功能使開發人員能夠快速輕鬆地從 PDF 文件中讀取和提取數據，並在 .NET 應用程序中使用這些數據。這項功能在處理大量數據時特別有用。開發人員在其 .NET 專案中使用 IronPDF 時，不需要其他任何函式庫。

獲取更多相關資訊IronPDF 在此教程中與 .NET Blazor 配合使用並了解將 IronPDF 與 .NET MAUI 集成在 IronPDF 的網站上

結論

總之，以程式方式閱讀 PDF 文件在各行各業中至關重要。 IronPDF 提供全面的解決方案，通過提供廣泛的功能來讀取、修改和提取 PDF 檔案中的內容。IronPDF 的安裝和使用都非常簡單，只需幾個簡單的步驟即可完成。

此程式庫提供方法來從PDF文件中提取文本, 將 PDF 光柵化為圖像，操作頁面並保存 PDF 文件。無論您是程式化 PDF 處理的新手還是經驗豐富的開發者，IronPDF 都是將您的技能提升到新一個層次的完美工具。

如果您正在尋找可靠且高效的解決方案來在 C# 中讀取 PDF 文件，IronPDF 值得探索，特別是它的許可選項和定價資訊，和一個免費試用可用。您可以在下圖中看到IronPDF提供的更多方案。您可以選擇符合您需求的套件。

如何在 C# 中讀取 PDF 檔，圖 2：IronPDF 授權價格

IronPDF 授權價格

坎納帕特·烏頓潘

立即與工程團隊聊天

軟體工程師

在成為軟體工程師之前，Kannapat 在日本北海道大學完成了環境資源博士學位。在攻讀學位期間，Kannapat 也成為了車輛機器人實驗室的成員，該實驗室隸屬於生物生產工程學系。2022 年，他利用自己的 C# 技能，加入了 Iron Software 的工程團隊，專注於 IronPDF 的開發。Kannapat 珍視這份工作，因為他可以直接向負責撰寫大部分 IronPDF 程式碼的開發人員學習。除了同儕學習外，Kannapat 還享受在 Iron Software 工作的社交方面。當他不在撰寫程式碼或文件時，Kannapat 通常會在 PS5 上玩遊戲或重看《最後生還者》。

< 上一頁
如何在C#中將Word（Docx）轉換為PDF（教程）

下一個 >
您應該購買IronPDF嗎？