跳過到頁腳內容
.NET幫助

C# 字串分割(開發者的工作原理)

字串操作是 C# 程式設計的基本範疇。 無論是格式化輸出、解析輸入或處理文字資料,有效處理字串的能力都是至關重要的。 在各種字串操作技術中,最通用和最常用的方法之一是 String.Split 方法。

String.Split 方法可以多種形式使用,包括拆分由指定字串或單一字元分隔的字串。 它可讓您將較大的字串分解為較小的子串,使處理和分析文字資料更加容易。 無論你是處理簡單的逗號分隔清單還是解析複雜的資料格式,了解如何使用 String.Split 方法都是關鍵。

對於初學者來說,學習使用 String.Split 方法分割字串是一項基本技能。 它不僅有助於理解基於字串的陣列和陣列元素的基礎知識,還為更進階的字串操作任務奠定了基礎。 在本教程中,我們將探討如何有效地使用 String.Split 方法,從基本概念開始,逐步過渡到更複雜的應用。

理解 String.Split 方法

什麼是 String.Split 方法?

C# 中的 String.Split 方法是一個基本函數,用於將字串分割成子字串陣列。 當您需要根據特定的字元或字串(稱為分隔符)分割字串時,它尤其有用。 該方法會返回一個包含每個子串的陣列。

String.Split 的基本語法

String.Split 方法可以用多種形式使用,但其最基本的形式是傳遞單一字元或字串作為分隔符號。 下面是一個簡單的例子:

string inputString = "apple,banana,cherry";
string[] fruits = inputString.Split(',');
string inputString = "apple,banana,cherry";
string[] fruits = inputString.Split(',');
Dim inputString As String = "apple,banana,cherry"
Dim fruits() As String = inputString.Split(","c)
$vbLabelText   $csharpLabel

在這個例子中,inputString 被拆分成一個名為 fruits 的數組,其中每個元素代表一個以逗號分隔的子字串。

瞭解回傳的字串陣列

當您使用 String.Split 方法時,它會傳回字串陣列 (string[])。 此陣列的每個元素代表原始字串的子串,該子串是根據所提供的分隔符分割的。

// Continuing from the previous example
// fruits[0] = "apple"
// fruits[1] = "banana"
// fruits[2] = "cherry"
// Continuing from the previous example
// fruits[0] = "apple"
// fruits[1] = "banana"
// fruits[2] = "cherry"
' Continuing from the previous example
' fruits[0] = "apple"
' fruits[1] = "banana"
' fruits[2] = "cherry"
$vbLabelText   $csharpLabel

在這個陣列中,fruits[0] 包含"apple",fruits[1] 包含"banana",依此類推。 值得注意的是,在進行字串分割作業後,原始字串仍保持不變。

處理空陣列元素

有時候,翻譯結果可能會包含空字串,尤其是當有連續的分隔符或分隔符出現在字串的開頭或結尾時。 瞭解如何處理這些空陣列元素對於精確的資料處理至關重要。

使用單一分隔符分割字串

使用單字元分隔符分割

Split 方法最常見的用途之一是使用單一字元作為分隔符號來拆分輸入字串。 這對於解析資料特別有用,因為在這些資料中,每個資訊之間都有特定的符號(如逗號或空格)分隔。

string line = "hello world";
string[] words = line.Split(' ');
string line = "hello world";
string[] words = line.Split(' ');
Dim line As String = "hello world"
Dim words() As String = line.Split(" "c)
$vbLabelText   $csharpLabel

在這個例子中,字串 line 被拆分成兩個單字"hello"和"world",並使用空格字元作為分隔符號。

處理空的子字串

使用單字元定界符時,您可能會在結果陣列中遇到空子串,尤其是當該定界符重複出現或出現在字串的開頭或結尾時。

舉例來說

string value = "one,,three";
string[] parts = value.Split(',');
string value = "one,,three";
string[] parts = value.Split(',');
Dim value As String = "one,,three"
Dim parts() As String = value.Split(","c)
$vbLabelText   $csharpLabel

這段程式碼將產生一個包含三個元素的陣列:["one", "", "three"]。 中間的空字串是由連續的逗號造成的。

使用 String.Split 根據分隔符號分隔字串

String.Split 方法擅長處理需要根據簡單分隔符號分隔字串的情況。 這是一種直接將字串分割成可管理部分的方法,使其成為 C# 中字串操作的必要工具。

使用多重分隔符

多字元進階分割

C# 中的 String.Split 方法不限於單一分隔符號; 它也可以處理多重分隔符。 此功能在處理使用不同類型分隔符的字串時特別有用。

舉例來說,如果有一個字串以逗號、分號和空格分隔,您可以使用這三個字元做為分隔符來分割這個字串:

string complexData = "apple, banana; cherry orange";
char[] delimiters = new char[] { ',', ';', ' ' };
string[] fruits = complexData.Split(delimiters, StringSplitOptions.RemoveEmptyEntries);
string complexData = "apple, banana; cherry orange";
char[] delimiters = new char[] { ',', ';', ' ' };
string[] fruits = complexData.Split(delimiters, StringSplitOptions.RemoveEmptyEntries);
Dim complexData As String = "apple, banana; cherry orange"
Dim delimiters() As Char = { ","c, ";"c, " "c }
Dim fruits() As String = complexData.Split(delimiters, StringSplitOptions.RemoveEmptyEntries)
$vbLabelText   $csharpLabel

在這段程式碼片段中,complexData 被拆分成一個陣列 fruits,使用逗號、分號和空格作為分隔符號。 StringSplitOptions.RemoveEmptyEntries 選項用於刪除連續分隔符號導致的任何空數組元素。

處理分割字串中的分隔符號

使用多重分隔符時,必須考慮這些字元會如何影響分割過程。 String.Split 方法將分隔符號數組中的每個字元獨立處理。

根據各種分隔符號分割字串

這種靈活性允許更複雜的字串分割情境。 您可以使用分隔符數組來精確指定您想要的字串分割方式,以容納字串中的各種格式和結構。

使用多重定界符分割字串的實用範例

考慮一種情況,您要處理的字串包含不同類型的資料,並以不同的字元分隔:

string mixedData = "Name: John; Age: 30, Location: USA";
char[] mixedDelimiters = new char[] { ':', ';', ',', ' ' };
string[] dataElements = mixedData.Split(mixedDelimiters, StringSplitOptions.RemoveEmptyEntries);
string mixedData = "Name: John; Age: 30, Location: USA";
char[] mixedDelimiters = new char[] { ':', ';', ',', ' ' };
string[] dataElements = mixedData.Split(mixedDelimiters, StringSplitOptions.RemoveEmptyEntries);
Dim mixedData As String = "Name: John; Age: 30, Location: USA"
Dim mixedDelimiters() As Char = { ":"c, ";"c, ","c, " "c }
Dim dataElements() As String = mixedData.Split(mixedDelimiters, StringSplitOptions.RemoveEmptyEntries)
$vbLabelText   $csharpLabel

在這個例子中,@@--CODE-22766--@@ 被有效地拆分成有意義的部分,例如 @@--CODE-22767--@@、@@--CODE-22768--@@、@@--CODE-22769--@@、@@--CODE-22770--@@ 等等,使用冒號、分號、逗號和空格的組合作為分隔符號。

String.Split 與 IronPDF 集成

C# String Split (How it Works For Developers):圖 1 - IronPDF for .NET:C# PDF Library

來自 Iron Software 的 IronPDF 是用 C# 處理 PDF 的全面函式庫。 它提供的功能包括建立、編輯和處理 PDF 文件。 String.Split 方法的一個有趣應用是使用 IronPDF 處理從 PDF 中提取的文字資料。 此整合體現了字串操作技術在處理真實世界資料時的重要性。

IronPDF 的核心功能是其HTML轉PDF功能,可確保佈局和樣式保持不變。 它可將網頁內容轉換成 PDF,適用於報告、發票和文件。 您可以輕鬆地將 HTML 檔案、URL 和 HTML 字串轉換為 PDF。

using IronPdf;

class Program
{
    static void Main(string[] args)
    {
        var renderer = new ChromePdfRenderer();

        // 1. Convert HTML String to PDF
        var htmlContent = "<h1>Hello, IronPDF!</h1><p>This is a PDF from an HTML string.</p>";
        var pdfFromHtmlString = renderer.RenderHtmlAsPdf(htmlContent);
        pdfFromHtmlString.SaveAs("HTMLStringToPDF.pdf");

        // 2. Convert HTML File to PDF
        var htmlFilePath = "path_to_your_html_file.html"; // Specify the path to your HTML file
        var pdfFromHtmlFile = renderer.RenderHtmlFileAsPdf(htmlFilePath);
        pdfFromHtmlFile.SaveAs("HTMLFileToPDF.pdf");

        // 3. Convert URL to PDF
        var url = "http://ironpdf.com"; // Specify the URL
        var pdfFromUrl = renderer.RenderUrlAsPdf(url);
        pdfFromUrl.SaveAs("URLToPDF.pdf");
    }
}
using IronPdf;

class Program
{
    static void Main(string[] args)
    {
        var renderer = new ChromePdfRenderer();

        // 1. Convert HTML String to PDF
        var htmlContent = "<h1>Hello, IronPDF!</h1><p>This is a PDF from an HTML string.</p>";
        var pdfFromHtmlString = renderer.RenderHtmlAsPdf(htmlContent);
        pdfFromHtmlString.SaveAs("HTMLStringToPDF.pdf");

        // 2. Convert HTML File to PDF
        var htmlFilePath = "path_to_your_html_file.html"; // Specify the path to your HTML file
        var pdfFromHtmlFile = renderer.RenderHtmlFileAsPdf(htmlFilePath);
        pdfFromHtmlFile.SaveAs("HTMLFileToPDF.pdf");

        // 3. Convert URL to PDF
        var url = "http://ironpdf.com"; // Specify the URL
        var pdfFromUrl = renderer.RenderUrlAsPdf(url);
        pdfFromUrl.SaveAs("URLToPDF.pdf");
    }
}
Imports IronPdf

Friend Class Program
	Shared Sub Main(ByVal args() As String)
		Dim renderer = New ChromePdfRenderer()

		' 1. Convert HTML String to PDF
		Dim htmlContent = "<h1>Hello, IronPDF!</h1><p>This is a PDF from an HTML string.</p>"
		Dim pdfFromHtmlString = renderer.RenderHtmlAsPdf(htmlContent)
		pdfFromHtmlString.SaveAs("HTMLStringToPDF.pdf")

		' 2. Convert HTML File to PDF
		Dim htmlFilePath = "path_to_your_html_file.html" ' Specify the path to your HTML file
		Dim pdfFromHtmlFile = renderer.RenderHtmlFileAsPdf(htmlFilePath)
		pdfFromHtmlFile.SaveAs("HTMLFileToPDF.pdf")

		' 3. Convert URL to PDF
		Dim url = "http://ironpdf.com" ' Specify the URL
		Dim pdfFromUrl = renderer.RenderUrlAsPdf(url)
		pdfFromUrl.SaveAs("URLToPDF.pdf")
	End Sub
End Class
$vbLabelText   $csharpLabel

範例情境:擷取和處理 PDF 內容

想像您有一份 PDF 文件,其中包含一張項目清單,每個項目都以逗號或分號分隔。 使用 IronPDF,您可以從 PDF 中提取此文字數據,然後使用 String.Split 方法解析和處理資訊。

using IronPdf;
using IronSoftware.Drawing;

class ProcessPdf
{
    static void Main()
    {
        // Load the PDF document
        var pdf = PdfDocument.FromFile("List.pdf");
        // Extract text from the PDF using IronPDF
        string pdfText = pdf.ExtractAllText();
        // Define delimiters for splitting text
        char[] delimiters = new char[] { ',', ';' };
        // Split the extracted text using delimiters
        string[] items = pdfText.Split(delimiters, StringSplitOptions.RemoveEmptyEntries);
        // Iterate through the items array and print each element
        foreach (var item in items)
        {
            Console.WriteLine(item.Trim()); // Trim to remove any leading or trailing whitespace
        }
    }
}
using IronPdf;
using IronSoftware.Drawing;

class ProcessPdf
{
    static void Main()
    {
        // Load the PDF document
        var pdf = PdfDocument.FromFile("List.pdf");
        // Extract text from the PDF using IronPDF
        string pdfText = pdf.ExtractAllText();
        // Define delimiters for splitting text
        char[] delimiters = new char[] { ',', ';' };
        // Split the extracted text using delimiters
        string[] items = pdfText.Split(delimiters, StringSplitOptions.RemoveEmptyEntries);
        // Iterate through the items array and print each element
        foreach (var item in items)
        {
            Console.WriteLine(item.Trim()); // Trim to remove any leading or trailing whitespace
        }
    }
}
Imports IronPdf
Imports IronSoftware.Drawing

Friend Class ProcessPdf
	Shared Sub Main()
		' Load the PDF document
		Dim pdf = PdfDocument.FromFile("List.pdf")
		' Extract text from the PDF using IronPDF
		Dim pdfText As String = pdf.ExtractAllText()
		' Define delimiters for splitting text
		Dim delimiters() As Char = { ","c, ";"c }
		' Split the extracted text using delimiters
		Dim items() As String = pdfText.Split(delimiters, StringSplitOptions.RemoveEmptyEntries)
		' Iterate through the items array and print each element
		For Each item In items
			Console.WriteLine(item.Trim()) ' Trim to remove any leading or trailing whitespace
		Next item
	End Sub
End Class
$vbLabelText   $csharpLabel

在這個例子中,pdfText 可能包含一個類似 item1,item2;item3 的字串,它實際上被拆分成一個包含每個項目的 items 陣列。

以下是將用於此專案的 PDF:

!C# String Split (How it Works For Developers):圖 2 - 輸入 PDF "List.pdf",其中包含產品清單及其各自的價格。

OUTPUT 由程式提供。

! C# 字串分割(開發人員的工作原理):圖 3 - 使用 IronPDF 提取 PDF 中的所有文本,然後使用 String.Split 方法和分隔符分割提取的文本的程式輸出。

IronPDF 和 String.Split:一種協同方法

IronPDF 用於 PDF 操作,而原生 C# String.Split 方法用於字串處理,二者結合體現了不同庫和功能和諧使用的強大之處。 它展示了 C# 及其函式庫如何為開發人員提供廣泛的工具包,以有效率地處理各種格式和資料類型。

結論

在本教程中,我們使用 String.Split 方法探索了 C# 中字串操作的豐富世界。 我們從基本知識開始,瞭解如何使用單字元和多字元定界符分割字串。 我們深入研究了處理空數組元素等特殊情況,並探討了 String.Split 方法的不同重載的意義,尤其是在處理各種拆分場景時。

我們也看到,String.Split 不僅僅是一個理論概念,而是現實世界應用中的實用工具。 透過與 IronPDF 的整合,我們展示了一個真實的使用案例,說明如何處理從 PDF 擷取的文字 - 這是現代軟體開發的常見需求。

IronPDF 提供 免費試用,為您的 C# PDF 處理需求提供全面的解決方案。

請記住,您所寫的每一行程式碼、分割的每一個字串、解決的每一個問題,都會讓您在程式設計的道路上更進一步。 持續探索、持續學習,最重要的是持續編碼!

常見問題解答

怎樣在 C# 中將 HTML 轉換為 PDF?

您可以使用 IronPDF 的 RenderHtmlAsPdf 方法將 HTML 字符串轉換為 PDF。您還可以使用 RenderHtmlFileAsPdf 將 HTML 文件轉換為 PDF。

什麼是 C# 中的 String.Split 方法?

C# 中的 String.Split 方法用於根據指定的分隔符將字符串分成子字符串數組。這對於解析字符串和處理文字資料至關重要。

我可以使用 String.Split 處理來自 PDF 的文字嗎?

是的,您可以使用 IronPDF 從 PDF 文檔中提取文字,然後應用 String.Split 方法來解析和分析提取的信息。

使用多個分隔符進行字符串拆分的優勢是什麼?

使用 String.Split 與多個分隔符可幫助您處理具有不同分隔符的字符串,這有助於靈活解析複雜資料格式。

如何在 C# 中拆分字符串時移除空條目?

您可以使用 StringSplitOptions.RemoveEmptyEntriesString.Split 配合使用,以移除結果數組中的任何空元素,這對於忽略連續分隔符引起的空子字符串非常有用。

字符串拆分在文字資料處理中的實際用例是什麼?

實際用例包括解析逗號分隔值或處理從 PDF 中提取的文字資料,這可以通過使用 IronPDF 和 C# 中的 String.Split 方法來實現。

String.Split 如何處理較長的分隔符?

String.Split 方法可以使用字符串作為分隔符,除了單個字符以外,這對於需要用單詞或字符序列作為分隔符的更複雜的拆分場景非常有用。

使用 String.Split 會修改原始字符串嗎?

不,使用 String.Split 後原始字符串不會改變。該方法返回一個新的子字符串數組,而不改變原始字符串。

在 C# 中使用 String.Split 的基本語法是什麼?

String.Split 的基本語法為傳遞一個分隔符,可以是單個字符或字符串。例如:string[] parts = inputString.Split(',');,其中逗號為分隔符。

為什麼掌握字符串操作對 C# 開發人員很重要?

掌握字符串操作,包括使用 String.Split,對 C# 開發人員來說至關重要,因為它能夠高效解析和處理各種應用中的文字資料,從而提高總體編程能力。

Jacob Mellor, Team Iron 首席技術官
首席技術官

Jacob Mellor是Iron Software的首席技術官,也是開創C# PDF技術的前瞻性工程師。作為Iron Software核心代碼庫的原始開發者,他自公司成立以來就塑造了公司的產品架構,並與CEO Cameron Rimington將公司轉型為服務NASA、Tesla以及全球政府機構的50多人公司。

Jacob擁有曼徹斯特大學土木工程一級榮譽學士學位(1998年–2001年)。他於1999年在倫敦開立首家軟體公司,並於2005年建立了他的第一個.NET組件,專注於解決Microsoft生態系統中的複雜問題。

他的旗艦作品IronPDF和Iron Suite .NET程式庫全球已獲得超過3000萬次NuGet安裝,他的基礎代碼不斷在全球各地驅動開發者工具。擁有25年以上的商業經驗和41年的編碼專業知識,Jacob仍然專注於推動企業級C#、Java和Python PDF技術的創新,同時指導下一代技術領導者。

鋼鐵支援團隊

我們每週 5 天,每天 24 小時在線上。
聊天
電子郵件
打電話給我