在實際環境中測試
在生產環境中測試無浮水印。
在任何需要的地方都能運作。
本文將使用 IronPDF for .NET,一個用於閱讀PDF檔案的C# PDF庫。
使用 PdfDocument.FromFile
開啟並加載所需 PDF 文件的方法。
使用 IronPDF 的ExtractAllText
方法來檢索內容。
根據需要分析或操作提取的文字。
IronPDF, 一個強大的 C# PDF 閱讀器庫,能夠讓開發者輕鬆地處理 PDF 文件。IronPDF 擁有豐富的功能和強大的能力,使得 PDF 文件處理變得簡單,讓使用者可以輕鬆地讀取、提取和操作 PDF 內容。不論是自動化文件處理、提取數據和圖像進行分析,還是從頭創建 PDF 文件,IronPDF 都提供了一整套工具來簡化這些任務。
這篇文章探討了使用 C# 進行高效 PDF 處理的世界 IronPDF,展示了它作為開發人員在軟體開發過程中的基本工具的多功能性和價值。
在進入程式碼部分之前,我們先從設定一個全新的 Visual Studio C# 控制台應用程序項目。這個項目將作為開發和實踐範例的專門工作區。
導航到 Visual Studio 中的建立專案對話框
在 Visual Studio 中創建新專案
配置專案
.NET 框架選擇
隨著您的專案現在已經穩固建立,下一個關鍵步驟涉及安裝 IronPDF.
IronPDF 提供了多種下載和安裝PDF庫的選項。為了這個指南,我們將專注於使用NuGet包管理器來安裝IronPDF,這是一種高效且廣泛採用的方法。
在Visual Studio中,導航到"工具"菜單,然後優雅地將游標懸停在"NuGet包管理器"選項上。
導航至 NuGet 套件管理員
選擇此選項後,將會開啟一個新視窗。在此精簡視窗中,導航到「瀏覽」選單,並在搜尋欄輸入「IronPDF」。
在 NuGet 套件管理器用戶界面中搜尋並安裝 IronPDF 套件
對於偏好命令行方式的人來說,NuGet 套件管理器控制台提供了一個優雅的途徑。只需打開此控制台,輸入以下命令,然後按“Enter”鍵:
Install-Package IronPdf
您還可以選擇直接從 NuGet網站 連結
本節將展示如何使用 C# 編程語言並通過 IronPDF 打開和讀取完整的 PDF 文件。
using IronPdf;
using System;
IronPdf.License.LicenseKey = "";
//raw text string path
var pdf = PdfDocument.FromFile("document_scaled_compressed.pdf");
string text = pdf.ExtractAllText();
Console.WriteLine(text);
using IronPdf;
using System;
IronPdf.License.LicenseKey = "";
//raw text string path
var pdf = PdfDocument.FromFile("document_scaled_compressed.pdf");
string text = pdf.ExtractAllText();
Console.WriteLine(text);
Imports IronPdf
Imports System
IronPdf.License.LicenseKey = ""
'raw text string path
Dim pdf = PdfDocument.FromFile("document_scaled_compressed.pdf")
Dim text As String = pdf.ExtractAllText()
Console.WriteLine(text)
要開始,您需要導入所需的命名空間。在上述範例代碼中,導入了 IronPdf
命名空間,該命名空間包含處理 PDF 的基本功能。另外,還導入了 System
命名空間以進行一般系統級操作。
using IronPdf;
using System;
using IronPdf;
using System;
Imports IronPdf
Imports System
IronPDF 需要有效的授權金鑰才能在生產環境中使用。在代碼範例中,有一行應設置授權金鑰。然而,在您提供的代碼中,授權金鑰被留空了""
。確保在生產環境中使用時,將空字串替換為IronPDF提供的有效授權金鑰。
IronPdf.License.LicenseKey = "Your_License_Key_Here";
IronPdf.License.LicenseKey = "Your_License_Key_Here";
IronPdf.License.LicenseKey = "Your_License_Key_Here"
接下來的步驟是加載並解析 PDF 文件。在提供的代碼中,使用 PdfDocument.FromFile
方法根據文件名 "document_scaled_compressed.pdf" 加載 PDF,並將其賦值給 pdf 變量。此 PDF 文件將用於文本提取。
var pdf = PdfDocument.FromFile("document_scaled_compressed.pdf");
var pdf = PdfDocument.FromFile("document_scaled_compressed.pdf");
Dim pdf = PdfDocument.FromFile("document_scaled_compressed.pdf")
IronPDF提供了一種簡單的方法來從載入的PDF文件中提取文字。 提取所有文字
此方法可以從PDF的每一頁提取所有文本內容,並將其存儲在名為text的字符串變量中,該變量用來將PDF轉換為文本。
string text = pdf.ExtractAllText();
string text = pdf.ExtractAllText();
Dim text As String = pdf.ExtractAllText()
最後一步是顯示提取的文本。在代碼中,Console.WriteLine 將打印並將提取的文本寫入控制台。這是一個用於調試或向用戶呈現文本的有用方法。
Console.WriteLine(text);
Console.WriteLine(text);
Console.WriteLine(text)
從 PDF 文件中提取的文字
本文指導開發人員如何在 C# 中有效地處理 PDF 文件,使用 IronPDF。 IronPDF 庫。 它首先說明了專用 Visual Studio 專案的設置,並通過 NuGet 套件管理器進行了簡單的 IronPDF 安裝。文章隨後提供了逐步說明,描述如何導入必要的庫、設置 IronPDF 註冊金鑰、載入 PDF 文件、提取文本內容以及顯示所有頁面中提取的文本。您還可以使用 C# 將提取的文本保存到 TXT 文件中。
其用戶友好的方法和全面的功能, IronPDF 作為自動化文件處理、數據提取和從 HTML、URL 及圖像創建 PDF 的必備工具,成為提升處理 C# 中 PDF 文件的軟件開發項目的寶貴資產。
完整文章《使用 中讀取 PDF 文件》 IronPDF 可以在以下位置找到 操作指南頁面. 範例代碼在 C# PDF閱讀器 也可用。如需更多使用IronPDF的程式碼範例,請訪問此 範例頁面. IronPDF 也提供了廣泛的文件,以回答所有開發者的問題並提供全面的實踐支援。IronPDF 提供免費 試用授權 讓用戶在決定購買前,可以探索其全部功能 永久授權.