跳至頁尾內容
.NET 幫助

Parseint C#(開發者使用指南)

在 C# 中處理資料時,開發人員經常需要將數字的文字表示形式轉換為整數。 這項被稱為"解析整數"的任務對於各種應用都至關重要,從處理使用者輸入到從 PDF 等文件中提取資料。 雖然 C# 提供了強大的整數解析方法,但當處理非結構化或半結構化資料(例如 PDF 中的資料)時,該過程可能會變得更加複雜。

這時, IronPDF (一個針對 .NET 開發人員的強大 PDF 函式庫)就派上用場了。 使用 IronPDF,您可以從 PDF 中提取文本,並利用 C# 的解析功能將此文本轉換為可用的數值資料。 無論您是在分析發票、報告或表單,將 C# 的解析工具與 IronPDF 結合使用,都能簡化 PDF 資料的處理,使您能夠將字串格式的數字轉換為整數。

在本文中,我們將深入探討如何在 C# 中使用 ParseInt 將數字的字串表示形式轉換為整數,以及 IronPDF 如何簡化從 PDF 中提取和解析數值資料的過程。

C# 中的 ParseInt 是什麼?

整數解析基礎

在 C# 中,將字串值(例如"123")轉換為整數通常使用int.Parse()Convert.ToInt32()來完成。 這些方法可以幫助開發人員將文字資料轉換為可用於計算和驗證的數值。

  • int.Parse(string s):將字串轉換為整數。 如果字串不是有效的整數,則拋出異常。
  • Convert.ToInt32(string s):將字串轉換為整數,對空輸入進行特殊處理。

以下是使用int.Parse()轉換字串的範例:

string numberString = "123";
// Convert the string to an integer using int.Parse
int num = int.Parse(numberString);
Console.WriteLine(num); // Output: 123
string numberString = "123";
// Convert the string to an integer using int.Parse
int num = int.Parse(numberString);
Console.WriteLine(num); // Output: 123
$vbLabelText   $csharpLabel

或者,使用 Convert 類別:

string numericString = "123";
// Convert the string to an integer using Convert.ToInt32
int result = Convert.ToInt32(numericString);
Console.WriteLine(result); // Outputs: 123
string numericString = "123";
// Convert the string to an integer using Convert.ToInt32
int result = Convert.ToInt32(numericString);
Console.WriteLine(result); // Outputs: 123
$vbLabelText   $csharpLabel

Convert 類別可讓您安全地轉換字串和其他資料類型。 當字串變數可能表示空值或無效值時,它尤其有用,因為Convert.ToInt32()傳回預設值(本例中為 0),而不是拋出例外。

預設值和錯誤處理

開發人員在將字串轉換為整數時經常面臨的一個問題是處理無效或非數字輸入。 如果數字的字串表示形式不正確,則像int.Parse()這樣的方法會拋出異常。 但是, Convert.ToInt32()有一個內建的無效字串回退機制。

以下範例示範了解析時如何處理預設值:

string invalidString = "abc";
// Convert will return 0 instead of throwing an exception for invalid input
int result = Convert.ToInt32(invalidString);
Console.WriteLine(result); // Outputs: 0
string invalidString = "abc";
// Convert will return 0 instead of throwing an exception for invalid input
int result = Convert.ToInt32(invalidString);
Console.WriteLine(result); // Outputs: 0
$vbLabelText   $csharpLabel

如果想要更精確地轉換字串,可以使用int.TryParse() ,它會傳回一個布林值,指示轉換是否成功:

string invalidInput = "abc";
// Attempt to parse using TryParse, which avoids exceptions for invalid input
if (int.TryParse(invalidInput, out int result))
{
    Console.WriteLine(result);
}
else
{
    Console.WriteLine("Parsing failed.");
}
string invalidInput = "abc";
// Attempt to parse using TryParse, which avoids exceptions for invalid input
if (int.TryParse(invalidInput, out int result))
{
    Console.WriteLine(result);
}
else
{
    Console.WriteLine("Parsing failed.");
}
$vbLabelText   $csharpLabel

在這種情況下, TryParse()使用 out 參數來儲存轉換後的整數,這使得方法能夠在不拋出異常的情況下傳回一個值。 如果轉換失敗,else 語句將會執行,而不是直接導致程式崩潰。 否則,程式將顯示從輸入字串中成功解析出的數字結果。 在預期會出現轉換失敗且您希望避免程式崩潰的情況下,使用int.TryParse會很有幫助。

使用 IronPDF 解析 PDF 中的數據

為什麼選擇 IronPDF 進行資料解析?

! Parseint C#(開發者使用方法):圖 1

處理 PDF 檔案時,您可能會遇到包含字串值形式的數字資料的表格或非結構化文字。 為了提取和處理這些數據,將字串轉換為整數至關重要。 IronPDF 讓這一過程變得簡單,它既靈活又強大,可以讀取 PDF 內容並執行諸如將字串轉換為數值之類的操作。

以下是IronPDF的一些主要功能:

  • HTML 轉 PDF 轉換: IronPDF 可以將HTML 內容(包括 CSS、圖片和 JavaScript)轉換為格式完整的 PDF。 這對於將動態網頁或報表渲染成 PDF 檔案尤其有用。
  • PDF 編輯:使用 IronPDF,您可以對現有的 PDF 文件進行操作,添加文字、圖像和圖形,以及編輯現有頁面的內容。 *文字和圖像提取:*該庫可讓您從 PDF 中提取文字和圖像,從而輕鬆解析和分析 PDF 內容。 浮水印:**也可以在 PDF 文件中添加浮水印,用於品牌推廣或版權保護。

IronPDF入門指南

要開始使用IronPDF ,您首先需要安裝它。 如果已經安裝了 IronPDF 庫,則可以跳到下一節;否則,以下步驟將介紹如何安裝 IronPDF 庫。

透過 NuGet 套件管理器控制台

若要使用 NuGet 套件管理器主控台安裝 IronPDF ,請開啟 Visual Studio 並導覽至套件管理器主控台。 然後運行以下命令:

// Command to install IronPDF package via the Package Manager Console
Install-Package IronPdf

透過 NuGet 套件管理器取得解決方案

開啟 Visual Studio,前往"工具 -> NuGet 套件管理員 -> 管理解決方案的 NuGet 套件",然後搜尋 IronPDF。 接下來,您只需選擇您的專案並點擊"安裝",IronPDF 就會新增到您的專案中。

! Parseint C#(開發者使用方法):圖 2

安裝 IronPDF 後,您只需在程式碼頂部新增正確的 using 語句即可開始使用 IronPDF:

using IronPdf;
using IronPdf;
$vbLabelText   $csharpLabel

解鎖免費試用

IronPDF 提供免費試用,試用期間可完全使用所有功能。 造訪IronPDF 網站下載試用版,開始將進階 PDF 處理功能整合到您的 .NET 專案中。

範例:從 PDF 檔案中提取和解析數字

以下 C# 程式碼示範如何使用 IronPDF 從 PDF 中提取文本,然後使用正規表示式來尋找和解析提取的文本中的所有數值。 此程式碼可以處理整數和小數,並清除貨幣符號等非數字字元。

using IronPdf;
using System.Text.RegularExpressions;

public class Program
{
    public static void Main(string[] args)
    {
        // Load a PDF file
        PdfDocument pdf = PdfDocument.FromFile("example.pdf");

        // Extract all text from the PDF
        string text = pdf.ExtractAllText();

        // Print the extracted text (for reference)
        Console.WriteLine("Extracted Text: ");
        Console.WriteLine(text);

        // Parse and print all numbers found in the extracted text
        Console.WriteLine("\nParsed Numbers:");

        // Use regular expression to find all number patterns, including integers and decimals
        var numberMatches = Regex.Matches(text, @"\d+(\.\d+)?");

        // Iterate through all matched numbers and print them
        foreach (Match match in numberMatches)
        {
            // Print each matched number
            Console.WriteLine($"{match.Value}");
        }
    }
}
using IronPdf;
using System.Text.RegularExpressions;

public class Program
{
    public static void Main(string[] args)
    {
        // Load a PDF file
        PdfDocument pdf = PdfDocument.FromFile("example.pdf");

        // Extract all text from the PDF
        string text = pdf.ExtractAllText();

        // Print the extracted text (for reference)
        Console.WriteLine("Extracted Text: ");
        Console.WriteLine(text);

        // Parse and print all numbers found in the extracted text
        Console.WriteLine("\nParsed Numbers:");

        // Use regular expression to find all number patterns, including integers and decimals
        var numberMatches = Regex.Matches(text, @"\d+(\.\d+)?");

        // Iterate through all matched numbers and print them
        foreach (Match match in numberMatches)
        {
            // Print each matched number
            Console.WriteLine($"{match.Value}");
        }
    }
}
$vbLabelText   $csharpLabel

輸入PDF

! Parseint C#(開發者使用方法):圖 3

控制台輸出

! Parseint C#(開發者使用方法):圖 4

程式碼說明

1.從PDF中提取文字:

程式碼首先使用 IronPDF 載入 PDF 文件。 然後它會從 PDF 文件中提取所有文字。

2.使用正規表示式找出數字:

程式碼使用正規表示式(一種匹配文字的模式)來搜尋提取的文字並尋找任何數字。 此正規表示式會找出整數(例如 12345)和小數(例如 50.75)。

3.解析和列印數字:

找到數字後,程式會將每個數字列印到控制台。 這包括整數和小數。

4.為什麼需要正規表示式:

正規表示式之所以被使用,是因為它們是尋找文字中模式(例如數字)的強大工具。 它們可以處理帶有符號(如貨幣符號 $)的數字,使處理過程更加靈活。

常見挑戰以及 IronPDF 如何解決這些挑戰

從複雜的 PDF 結構中提取乾淨資料通常會得到字串值,這些字串值可能需要進一步處理,例如將字串轉換為整數。 以下是一些常見挑戰以及 IronPDF 如何提供協助:

PDF格式錯誤

PDF 檔案通常包含以文字格式顯示的數字(例如,"1,234.56"或"12,345 美元")。 要正確處理這些數字,需要確保數字的字串表示形式為正確的解析格式。 IronPDF 允許您乾淨地提取文本,並且您可以使用字串操作方法(例如Replace() )在轉換之前調整格式。

例子:

string formattedNumber = "1,234.56"; // String value with commas
// Remove commas from the string to clean it
string cleanNumber = formattedNumber.Replace(",", "");
// Convert the cleaned string to an integer by first converting to double then to integer
int result = Convert.ToInt32(Convert.ToDouble(cleanNumber));
Console.WriteLine(result); // Outputs: 1234
string formattedNumber = "1,234.56"; // String value with commas
// Remove commas from the string to clean it
string cleanNumber = formattedNumber.Replace(",", "");
// Convert the cleaned string to an integer by first converting to double then to integer
int result = Convert.ToInt32(Convert.ToDouble(cleanNumber));
Console.WriteLine(result); // Outputs: 1234
$vbLabelText   $csharpLabel

處理文字中的多個數值

在複雜的 PDF 檔案中,數值可能以不同的格式出現,或分散在不同的位置。 使用 IronPDF,您可以提取所有文本,然後使用正規表示式有效地查找字串並將其轉換為整數。

結論

在 C# 中解析整數是開發人員的基本技能,尤其是在處理使用者輸入或從各種來源提取資料時。 雖然像int.Parse()Convert.ToInt32()這樣的內建方法很有用,但處理非結構化或半結構化資料(例如 PDF 中的文字)可能會帶來額外的挑戰。 這時 IronPDF 就派上了用場,它提供了一個強大而直接的解決方案,可以從 PDF 中提取文字並在 .NET 應用程式中使用它。

使用IronPDF ,您可以輕鬆地從複雜的 PDF 文件(包括掃描文件)中提取文本,並將這些資料轉換為可用的數值。 IronPDF 具備掃描 PDF 的 OCR 功能和強大的文字擷取工具,即使是處理複雜的資料格式,也能簡化資料處理流程。

無論您是處理發票、財務報告或任何其他包含數位資料的文檔,將 C# 的 ParseInt 方法與 IronPDF 結合使用都將幫助您更有效率、更準確地工作。

不要讓複雜的 PDF 文件拖慢您的開發進程——開始使用IronPDF是探索 IronPDF 如何增強您的工作流程的絕佳機會,何不嘗試一下,看看它如何簡化您的下一個項目?

常見問題解答

如何在C#中將字串轉換為整數?

在 C# 中,可以使用int.Parse()方法或Convert.ToInt32()方法將字串轉換為整數。如果字串不是有效的整數, int.Parse()方法會拋出例外,而對於空輸入, Convert.ToInt32()回傳 0。

int.Parse() 和 Convert.ToInt32() 有什麼不同?

int.Parse()用於直接將字串轉換為整數,如果格式無效則會拋出異常。 `Convert.ToInt32 Convert.ToInt32()可以透過傳回預設值 0 來處理空值,這使得它在某些應用程式中更加安全。

int.TryParse() 如何增強解析過程中的錯誤處理?

int.TryParse()透過傳回布林值來增強錯誤處理,該布林值指示轉換的成功或失敗,並且它使用 out 參數來儲存結果,而不會因無效輸入而拋出異常。

IronPDF 如何協助從 PDF 檔案中擷取文字進行解析?

IronPDF 透過提供強大的功能(例如文字和圖像提取)簡化了從 PDF 中提取文字的過程,使開發人員能夠輕鬆存取字串數據,並使用 C# 將其解析為數值。

安裝像 IronPDF 這樣的 PDF 庫需要哪些步驟?

若要安裝 IronPDF,請使用 Visual Studio 中的 NuGet 套件管理器控制台並執行命令Install-Package IronPdf ,或使用 NuGet 套件管理器視窗搜尋並安裝該程式庫。

從 PDF 檔案中解析數值資料時可能會遇到哪些挑戰?

由於PDF文件中存在逗號和各種數位格式等格式問題,解析PDF中的數位資料可能相當具有挑戰性。 IronPDF透過擷取乾淨的文字來提供協助,擷取的文字隨後可以使用正規表示式進行處理。

正規表示式如何幫助從PDF中提取數值資料?

正規表示式可讓開發人員識別文字中的模式,例如帶有符號的數字,從而方便從使用 IronPDF 提取的 PDF 文字中提取和轉換數字資料。

是否可以從掃描的PDF文件中提取文字?

是的,IronPDF 包含 OCR(光學字元辨識)功能,可以從掃描的 PDF 中提取文本,將掃描的圖像轉換為可編輯和可搜尋的文本。

將正規表示式與 IronPDF 結合使用有哪些好處?

正規表示式透過實現靈活的文字搜尋和模式匹配來完善 IronPDF,這對於處理複雜的文字擷取場景(例如尋找和轉換數字)至關重要。

Jacob Mellor,Team Iron 首席技術官
首席技術長

Jacob Mellor 是 Iron Software 的首席技術官,也是一位富有遠見的工程師,率先開發了 C# PDF 技術。作為 Iron Software 核心程式碼庫的最初開發者,他自公司成立之初便參與塑造了其產品架構,並與執行長 Cameron Rimington 一起將其發展成為一家擁有 50 多名員工、服務於 NASA、特斯拉和全球政府機構的公司。

Jacob 於 1998 年至 2001 年在曼徹斯特大學獲得土木工程一級榮譽學士學位。 1999 年,他在倫敦創辦了自己的第一家軟體公司;2005 年,他創建了自己的第一個 .NET 元件。此後,他專注於解決微軟生態系統中的複雜問題。

他的旗艦產品 IronPDF 和 IronSuite .NET 庫在全球 NuGet 上的安裝量已超過 3000 萬次,其基礎程式碼持續為全球開發者工具提供支援。憑藉 25 年的商業經驗和 41 年的程式設計專長,Jacob 始終致力於推動企業級 C#、Java 和 Python PDF 技術的創新,同時指導下一代技術領導者。