跳過到頁腳內容
使用IRONPDF

如何在C#中讀取PDF文件

程序化的PDF處理在金融、醫療、法律和教育等行業中至關重要,這些行業需要從PDF文件中處理、分析和提取關鍵信息,用於數據分析、文件管理和自動化等目的。 儘管其重要性,這項任務可能具有挑戰性。

IronPDF:C# PDF程式庫

IronPDF讓您能夠輕鬆處理極其困難的任務。 它允許您輕鬆編輯PDF文件中的文本,類似於您在文本文件中操作文本文檔的方式,並且允許您在任何操作系統中匯出文件。 IronPDF應用涵蓋了查看、修改和提取PDF內容的完整過程。

使用IronPDF採取正確的步驟

使用IronPDF軟體,文本可以在任何電腦上快速輕鬆地讀寫PDF文件格式。 安裝是一項簡單的任務。 這是學習在C#中讀取PDF文件的最佳方式。 您也可以免費下載IronPDF進行開發。 如果您探索IronPDF,您會發現該程式庫提供了豐富的功能,使得PDF的使用非常容易。 在閒暇時探索類別!這裡有幾個使用HTML創建PDF的C#示例可用於學習如何從閱讀PDF中創建最佳輸出。

使用IronPDF閱讀PDF文件

步驟1:安裝IronPDF包

首先,您需要將IronPDF NuGet套件安裝到您的.NET專案中。 您可以通過在Visual Studio中打開套件管理控制台並輸入以下命令來完成此操作:

Install-Package IronPdf

步驟2:導入IronPDF程式庫

接下來,您需要通過在文件頂部添加以下語句將IronPDF程式庫導入到您的代碼中:

using IronPdf;
using IronPdf;
$vbLabelText   $csharpLabel

步驟3:載入PDF文件

導入IronPDF程式庫後,您可以通過使用以下代碼將PDF文件載入到代碼中:

// Load the PDF document from file path
PdfDocument pdf = PdfDocument.FromFile(@"C:\dotnet.pdf");

// Define the output path for the saved PDF
var outputPath = "Example.pdf";

// Save the PDF document to the specified output path
pdf.SaveAs(outputPath);
// Load the PDF document from file path
PdfDocument pdf = PdfDocument.FromFile(@"C:\dotnet.pdf");

// Define the output path for the saved PDF
var outputPath = "Example.pdf";

// Save the PDF document to the specified output path
pdf.SaveAs(outputPath);
$vbLabelText   $csharpLabel

步驟4:從PDF中提取文本

IronPDF提供了一系列方法從現有的PDF文件中提取文本。例如,您可以開始從PDF中提取文本並使用以下代碼片段將其打印到控制台:

// Extract text from the loaded PDF document
string text = pdf.ExtractText();

// Print the extracted text to the console
Console.WriteLine(text);
// Extract text from the loaded PDF document
string text = pdf.ExtractText();

// Print the extracted text to the console
Console.WriteLine(text);
$vbLabelText   $csharpLabel

使用上述代碼,您可以從PDF文件中提取文本

在C#中如何讀取PDF文件,圖1:使用IronPDF從PDF中提取文本 使用IronPDF從PDF中提取文本

步驟5:將PDF光柵化為圖像

讓我們使用IronPDF來將PDF文件光柵化為圖像。 首先,導入所需的程式庫:

using System.Linq;
using IronPdf;
using IronSoftware.Drawing;
using System.Linq;
using IronPdf;
using IronSoftware.Drawing;
$vbLabelText   $csharpLabel

然後使用RasterizeToImageFiles方法將PDF文件的所有頁面提取到資料夾中作為圖像文件。 提取的圖像可以儲存為PNG或JPG文件,還可以指定圖像的尺寸和頁面範圍。

// Extract all pages to a folder as image files with PNG format
pdf.RasterizeToImageFiles(@"C:\image\folder\*.png");

// Extract all pages to JPG images with specified dimensions
pdf.RasterizeToImageFiles(@"C:\image\folder\example_pdf_image_*.jpg", 100, 80);
// Extract all pages to a folder as image files with PNG format
pdf.RasterizeToImageFiles(@"C:\image\folder\*.png");

// Extract all pages to JPG images with specified dimensions
pdf.RasterizeToImageFiles(@"C:\image\folder\example_pdf_image_*.jpg", 100, 80);
$vbLabelText   $csharpLabel

最後,代碼使用AnyBitmap對象,這些對象可以在代碼中進一步處理和操作。

// Extract all pages as AnyBitmap objects for further processing
AnyBitmap[] pdfBitmaps = pdf.ToBitmap();
// Extract all pages as AnyBitmap objects for further processing
AnyBitmap[] pdfBitmaps = pdf.ToBitmap();
$vbLabelText   $csharpLabel

上述代碼演示了如何使用IronPDF提取PDF文件的內容並將提取的數據儲存為圖像文件或AnyBitmap對象以便進一步處理。

步驟7:操作PDF頁面

讓我們學習如何使用IronPDF操作PDF文件的頁面

代碼首先使用RemovePages方法移除PDF文件中的第二頁和第三頁:

// Remove pages two and three from the PDF document
pdf.RemovePages(1, 2);
// Remove pages two and three from the PDF document
pdf.RemovePages(1, 2);
$vbLabelText   $csharpLabel

RemovePages方法接受兩個參數:要移除的起始頁(在本例中是第2頁,表示為1,因為頁碼從0開始)和要移除的頁數(在本例中是2頁)。

步驟6:保存PDF

最後,您可以使用SaveAs方法將PDF文件保存到本地系統。 保存PDF文件的代碼如下:

// Save the PDF document to a specified output path
pdf.SaveAs(outputPath);
// Save the PDF document to a specified output path
pdf.SaveAs(outputPath);
$vbLabelText   $csharpLabel

IronPDF兼容性

IronPDF與所有最新的.NET Framework高度兼容,包括.NET 7。它還支持.NET Blazor和.NET MAUI,這是微軟最新的網頁開發產品。 該程式庫與這些框架的兼容性使開發者能夠無縫地將IronPDF整合到他們的應用中,並利用其強大的功能。

IronPDF的一個主要特點是其在.NET Blazor和.NET MAUI中讀取PDF文件的能力。 此功能使開發者能夠快速輕鬆地讀取和從PDF文件中提取數據並用於.NET應用。 此功能在處理大量數據時尤為有用。 開發者在其.NET項目中使用IronPDF不需要其他任何程式庫。

在這篇教程中獲得有關IronPDF在.NET Blazor上工作的更多信息,並在IronPDF的網站上學習類整合IronPDF與.NET MAUI

結論

總之,程序化的PDF文件閱讀在各個行業中至關重要。 IronPDF提供了一個全面的解決方案,通過提供讀取、修改和提取PDF文件內容的豐富功能來處理這一任務。IronPDF只需幾個簡單的步驟即可安裝和使用。

該程式庫提供方法從PDF文件中提取文本將PDF光柵化為圖像、操作頁面和保存PDF文件。 無論您是程序化PDF處理的新手還是經驗豐富的開發者,IronPDF都是提升您技術能力的完美工具。

如果您在C#中尋找一個可靠且高效的讀取PDF文件的解決方案,IronPDF值得探索,特別是其許可選項和定價信息,並提供免費試用。 您可以在下面的圖片中查看更多由IronPDF提供的方案。 您可以選擇符合您需求的套件。

在C#中如何讀取PDF文件,圖2:IronPDF授權價格 IronPDF授權價格

常見問題解答

如何在 C# 中讀取 PDF 檔案?

您可以透過在 .NET 專案中使用 NuGet 套件管理器先安裝 IronPDF。然後,匯入函式庫並使用其載入和讀取 PDF 文檔,擷取文字並在主控台中顯示。

哪些行業受益於程式化的 PDF 處理?

金融、醫療保健、法律和教育等行業從程式化的 PDF 處理中大大受益,因為這可以使用如 IronPDF 之類的工具進行高效數據分析、文件管理和任務自動化。

如何使用 C# 從 PDF 文檔中擷取數據?

使用 IronPDF,您可以透過載入 PDF 並利用 ExtractText 等方法程式化地讀取和處理內容來擷取數據。

我可以在 C# 中將 PDF 檔案轉換成圖像嗎?

是的,使用 IronPDF,您可以使用 RasterizeToImageFiles 方法將 PDF 檔案轉換成圖像,允許將頁面保存為 PNG 或 JPG 格式的圖像檔案。

IronPDF 與最新的 .NET Framework兼容嗎?

IronPDF 與所有最新的 .NET Framework兼容,包括 .NET 7。它也支持 .NET Blazor 和 .NET MAUI,實現與各類應用程序的集成。

如何使用 C# 修改和保存 PDF 文件?

使用 IronPDF 對 PDF 文件進行修改後,您可以使用 SaveAs 方法保存更改,指定修改後文件的輸出路徑。

在 .NET 項目中使用 PDF 函式庫涉及哪些步驟?

要在 .NET 項目中使用 IronPDF,通過 NuGet 安裝函式庫,將其匯入項目,然後使用其功能程式化地載入、閱讀和處理 PDF 文檔。

IronPDF 在 .NET 中的 PDF 處理是否需要其他函式庫?

不,IronPDF 是獨立函式庫,不需要額外的函式庫,便於將其集成到您的 .NET 項目中以進行全面的 PDF 處理。

IronPDF 的 PDF 處理的主要特色是什麼?

IronPDF 提供如文字擷取、PDF 光柵化為圖像、頁面操作及兼容最新的 .NET Framework等特點,成為在 C# 中處理 PDF 檔案的強大工具。

IronPDF 是否與 .NET 10 完全相容?

是的,IronPDF開箱即可支持.NET 10(以及之前版本如.NET 9、8、7、6)。您可以在.NET 10中使用IronPDF構建應用程序,而無需特殊配置或手段。

Curtis Chau
技術作家

Curtis Chau 擁有卡爾頓大學計算機科學學士學位,專注於前端開發,擅長於 Node.js、TypeScript、JavaScript 和 React。Curtis 熱衷於創建直觀且美觀的用戶界面,喜歡使用現代框架並打造結構良好、視覺吸引人的手冊。

除了開發之外,Curtis 對物聯網 (IoT) 有著濃厚的興趣,探索將硬體和軟體結合的創新方式。在閒暇時間,他喜愛遊戲並構建 Discord 機器人,結合科技與創意的樂趣。

Iron Support Team

We're online 24 hours, 5 days a week.
Chat
Email
Call Me