使用 IRONPDF

如何在 C# 中讀取 PDF 檔案

程式化的 PDF 處理在金融、醫療保健、法律和教育等行業中至關重要。這些行業需要處理、分析和提取 PDF 文件中的關鍵信息,用於數據分析、文件管理和自動化等目的。 儘管這項任務很重要,但可能會很具挑戰性。

IronPDF:C# PDF 庫

IronPDF 讓您輕鬆處理極其艱難的任務。 它允許輕鬆編輯 PDF 文件中的文本,類似於在文本文件中編輯文本,同時允許您在任何操作系統中匯出文件。 IronPDF 應用程式涵蓋了查看、修改和提取 PDF 內容的完整過程。

選擇使用 IronPDF 邁向正確的步伐

使用任何配備IronPDF軟體的電腦,可以快速且輕鬆地讀寫PDF檔案格式的文字。 安裝是一個簡單的任務。 這是學習用 C# 讀取 PDF 文件的最佳方式。 您也可以免费下载 IronPDF 以进行开发。 如果您探索IronPDF,您會注意到該庫提供了廣泛的功能,使使用PDF變得非常容易。 在閒暇時間探索課程!有多個使用 HTML 創建 PDF 的 C# 示例可供學習如何從閱讀 PDF 創建最佳輸出。

使用 IronPDF 閱讀 PDF 文件

步驟 1:安裝 IronPDF 套件

首先,您需要將IronPDF NuGet 套件安裝到您的 .NET 專案中。 您可以通過在 Visual Studio 中打開套件管理器控制台並輸入以下命令來執行此操作:

Install-Package IronPdf

第 2 步:導入 IronPDF 庫

接下來,您需要透過在檔案的頂部加入以下語句來將 IronPDF 庫導入到您的代碼中:

using IronPdf;
using IronPdf;
Imports IronPdf
$vbLabelText   $csharpLabel

步驟三:載入 PDF 文件

一旦導入了IronPDF庫,您可以使用以下代碼將PDF文檔加載到您的代碼中:

PdfDocument pdf = PdfDocument.FromFile(@"C:\dotnet.pdf");
var outputPath = "Example.pdf";
pdf.SaveAs(outputPath);
PdfDocument pdf = PdfDocument.FromFile(@"C:\dotnet.pdf");
var outputPath = "Example.pdf";
pdf.SaveAs(outputPath);
Dim pdf As PdfDocument = PdfDocument.FromFile("C:\dotnet.pdf")
Dim outputPath = "Example.pdf"
pdf.SaveAs(outputPath)
$vbLabelText   $csharpLabel

步驟 4:從 PDF 中提取文字

IronPDF 提供了一系列方法來從現有的 PDF 文件中提取文本。例如,您可以使用以下程式碼片段從 PDF 中開始提取文本,並將其打印到控制台上:

string text = pdf.ExtractText();
Console.Writeline(text);
string text = pdf.ExtractText();
Console.Writeline(text);
Dim text As String = pdf.ExtractText()
Console.Writeline(text)
$vbLabelText   $csharpLabel

使用上述程式碼,您可以從 PDF 檔案中提取文本

如何在 C# 中讀取 PDF 文件,圖 1:使用 IronPDF 從 PDF 中提取文字

使用 IronPDF 從 PDF 提取文字

步驟 5:將 PDF 光柵化為圖像

讓我們使用IronPDF將PDF文件光柵化為圖像。 首先,匯入所需的庫:

using System.Linq;
using IronPdf;
using IronSoftware.Drawing;
using System.Linq;
using IronPdf;
using IronSoftware.Drawing;
Imports System.Linq
Imports IronPdf
Imports IronSoftware.Drawing
$vbLabelText   $csharpLabel

然後,程式碼使用RasterizeToImageFiles方法將 PDF 文件的所有頁面作為圖片檔案提取到資料夾中。 提取的影像可以儲存為 PNG 或 JPG 檔案,也可以指定影像的尺寸和頁面範圍。

// Extract all pages to a folder as image files
pdf.RasterizeToImageFiles(@"C:\image\folder\*.png");

// Dimensions and page ranges may be specified
pdf.RasterizeToImageFiles(@"C:\image\folder\example_pdf_image_*.jpg", 100, 80);
// Extract all pages to a folder as image files
pdf.RasterizeToImageFiles(@"C:\image\folder\*.png");

// Dimensions and page ranges may be specified
pdf.RasterizeToImageFiles(@"C:\image\folder\example_pdf_image_*.jpg", 100, 80);
' Extract all pages to a folder as image files
pdf.RasterizeToImageFiles("C:\image\folder\*.png")

' Dimensions and page ranges may be specified
pdf.RasterizeToImageFiles("C:\image\folder\example_pdf_image_*.jpg", 100, 80)
$vbLabelText   $csharpLabel

最後,該程式碼使用ToBitmap方法將 PDF 文件的所有頁面提取為AnyBitmap對象,這些對象可以在程式碼中進一步處理和操作。

// Extract all pages as AnyBitmap objects
AnyBitmap [] pdfBitmaps = pdf.ToBitmap();
// Extract all pages as AnyBitmap objects
AnyBitmap [] pdfBitmaps = pdf.ToBitmap();
' Extract all pages as AnyBitmap objects
Dim pdfBitmaps() As AnyBitmap = pdf.ToBitmap()
$vbLabelText   $csharpLabel

上述代碼展示了如何使用 IronPDF 提取 PDF 文件的內容,並將提取的數據保存為圖像文件或AnyBitmap對象以進行進一步處理。

步驟7:操作 PDF 頁面

讓我們學習如何使用IronPDF通過閱讀PDF文件來操作PDF文檔的頁面

首先,程式碼使用RemovePages 方法從 PDF 文件中刪除第二頁和第三頁:

pdf.RemovePages(1, 2);
pdf.RemovePages(1, 2);
pdf.RemovePages(1, 2)
$vbLabelText   $csharpLabel

RemovePages 方法接收兩個參數:起始刪除頁的數字(在此例中為第 2 頁,用 1 表示,因為頁碼從 0 開始)和要刪除的頁數(在此例中為 2 頁)。

步驟 6:儲存 PDF

最後,您可以使用SaveAs 方法將 PDF 文件儲存到本地系統。 保存 PDF 檔案的程式碼如下:

pdf.SaveAs(OutputPath);
pdf.SaveAs(OutputPath);
pdf.SaveAs(OutputPath)
$vbLabelText   $csharpLabel

IronPDF 相容性

IronPDF 與所有最新的 .NET 框架高度兼容,包括 .NET 7。它還支持 .NET Blazor 和 .NET MAUI,這些是微軟最新的網頁開發產品。 該程式庫與這些框架的兼容性使開發人員能夠將IronPDF無縫集成到他們的應用程式中,並利用其強大的功能。

IronPDF 的主要功能之一是能在 .NET Blazor 和 .NET MAUI 中讀取 PDF 檔案。 此功能使開發人員能夠快速輕鬆地從 PDF 文件中讀取和提取數據,並在 .NET 應用程序中使用這些數據。 這項功能在處理大量數據時特別有用。 開發人員在其 .NET 專案中使用 IronPDF 時,不需要其他任何函式庫。

在此教學中了解 IronPDF 與 .NET Blazor 的運作,並在 IronPDF 的網站上學習與 .NET MAUI 整合 IronPDF

結論

總之,以程式方式閱讀 PDF 文件在各行各業中至關重要。 IronPDF 提供全面的解決方案,通過提供廣泛的功能來讀取、修改和提取 PDF 檔案中的內容。IronPDF 的安裝和使用都非常簡單,只需幾個簡單的步驟即可完成。

該程式庫提供的方法包括從PDF文件中提取文字將PDF光柵化為圖像、操作頁面以及保存PDF檔案。 無論您是程式化 PDF 處理的新手還是經驗豐富的開發者,IronPDF 都是將您的技能提升到新一個層次的完美工具。

如果您正在尋找一個可靠且高效的解決方案來在 C# 中讀取 PDF 文件,IronPDF 值得探究,尤其是其授權方案和定價資訊,以及免費試用。 您可以在下圖中看到IronPDF提供的更多方案。 您可以選擇符合您需求的套件。

如何在 C# 中讀取 PDF 檔案,圖 2:IronPDF 授權價格

IronPDF 授權價格

Chipego
奇佩戈·卡林达
軟體工程師
Chipego 擁有天生的傾聽技能,這幫助他理解客戶問題,並提供智能解決方案。他在獲得信息技術理學學士學位後,于 2023 年加入 Iron Software 團隊。IronPDF 和 IronOCR 是 Chipego 專注的兩個產品,但隨著他每天找到新的方法來支持客戶,他對所有產品的了解也在不斷增長。他喜歡在 Iron Software 的協作生活,公司內的團隊成員從各自不同的經歷中共同努力,創造出有效的創新解決方案。當 Chipego 離開辦公桌時,他常常享受讀好書或踢足球的樂趣。
< 上一頁
如何在C#中將Word(Docx)轉換為PDF(教程)
下一個 >
您應該購買IronPDF嗎?