Regular Expression là gì và cách sử dụng nó trong C#

uocmo_kchodoi

Moderator
13/10/11
747
55
0
26
phù thủy xứ
REGULAR EXPRESSION TRONG C#
Khái niệm: Regular Expression hay tiếng Việt được gọi là Biểu thức chính quy, là một cấu trúc rất mạnh để mô tả một chuỗi theo cách thống nhất chung.

Regular Expression bao gồm tập hợp các ký tự, toán tử hay ký hiệu toán học nhằm biểu thị một chuỗi theo cấu trúc chung mà mọi người học theo. Có thể xem Regular Expression như một loại tiếng lóng dùng chung trong lập trình.

Bạn có thể trích lọc một hay nhiều chuỗi có cấu trúc chung từ một đoạn văn bản hay một chuỗi ra.

Bạn có thể tìm kiếm, thay đổi nội dung của chuỗi một cách dễ dàng. Thay vì phải ngồi cắt chuỗi mỏi mệt như trước đây.

Từ đây, với Regular Expression. Bạn hoàn toàn có thể trích lọc dữ liệu từ các đoạn html theo ý.

1. Construct cho định nghĩa Regular Expression trong C#

Có nhiều loại ký tự, toán tử và construct đa dạng mà giúp bạn định nghĩa Regular Expression trong C#. Bạn theo các link sau để có chi tiết về các construct này.

2. Lớp Regex trong C#

Lớp Regex trong C# được sử dụng để biểu diễn một Regular Expression. Nó có các phương thức được sử dụng phổ biến sau:


1. public bool IsMatch(string input)
Chỉ rằng có hay không Regular Expression đã cho trong Regex constructor này tìm thấy một match trong chuỗi đầu vào đã xác định

2. public bool IsMatch(string input, int startat)
Chỉ rằng có hay không Regular Expression đã cho trong Regex constructor này tìm thấy một match trong chuỗi đầu vào đã xác định, bắt đầu tại vị trí startat đã cho trong chuỗi

3. public static bool IsMatch(string input, string pattern)
Chỉ rằng có hay không Regular Expression đã cho tìm thấy một match trong chuỗi đầu vào đã xác định

4. public MatchCollection Matches(string input)
Tìm kiếm chuỗi đầu vào đã xác định về tất cả sự xuất hiện của một Regular Expression

5. public string Replace(string input, string replacement)
Trong một chuỗi đầu vào đã xác định, thay thế tất cả chuỗi mà so khớp với một Regular Expression pattern với một chuỗi thay thế đã cho

6. public string[] Split(string input)
Chia một chuỗi đầu vào thành một mảng các chuỗi phụ tại vị trí được định nghĩa bởi một Regular Expression pattern đã xác định trong Regex constructor

Để có danh sách đầy đủ các phương thức và thuộc tính, bạn vui lòng đọc Microsoft Documentation về C#.

Ví dụ 1

Ví dụ sau so khớp với các từ mà bắt đầu với 'S':

using System;
using System.Text.RegularExpressions;
namespace VietJackCsharp
{
class TestCsharp
{
private static void showMatch(string text, string expr)
{
Console.WriteLine("Expression: " + expr);
MatchCollection mc = Regex.Matches(text, expr);
foreach (Match m in mc)
{
Console.WriteLine(m);
}
}

static void Main(string[] args)
{
Console.WriteLine("Vi du minh hoa Regular Expression trong C#");
Console.WriteLine("-----------------------------------------");

string str = "Sao hom nay lai thay sao suyen son sang";

Console.WriteLine("So khop voi cac tu bat dau bang chu cai 'S': ");
showMatch(str, @"\bS\S*");
Console.ReadKey();
}
}
}

Nếu bạn không sử dụng lệnh Console.ReadKey(); thì chương trình sẽ chạy và kết thúc luôn (nhanh quá đến nỗi bạn không kịp nhìn kết quả). Lệnh này cho phép chúng ta nhìn kết quả một cách rõ ràng hơn.

Biên dịch và chạy chương trình C# trên sẽ cho kết quả sau:

Ví dụ 2

Ví dụ sau so khớp với các từ mà bắt đầu với 's' và kết thúc với 'n':

using System;
using System.Text.RegularExpressions;
namespace VietJackCsharp
{
class TestCsharp
{
private static void showMatch(string text, string expr)
{
Console.WriteLine("Expression: " + expr);
MatchCollection mc = Regex.Matches(text, expr);
foreach (Match m in mc)
{
Console.WriteLine(m);
}
}

static void Main(string[] args)
{
Console.WriteLine("Vi du minh hoa Regular Expression trong C#");
Console.WriteLine("-----------------------------------------");

string str = "Sao hom nay lai thay sao suyen son sang";

Console.WriteLine("So khop voi tu bat dau bang 's' va ket thuc bang 'n':");
showMatch(str, @"\bs\S*n\b");
Console.ReadKey();
}
}
}

Biên dịch và chạy chương trình C# trên sẽ cho kết quả sau:

Ví dụ 3

Ví dụ sau thay thế các white space:

using System;
using System.Text.RegularExpressions;
namespace VietJackCsharp
{
class TestCsharp
{
static void Main(string[] args)
{
Console.WriteLine("Vi du minh hoa Regular Expression trong C#");
Console.WriteLine("-----------------------------------------");

string str1 = "Hello World ";
string pattern = "\\s+";
string str2 = " ";
Regex rgx = new Regex(pattern);
string result = rgx.Replace(str1, str2);

Console.WriteLine("Chuoi ban dau: {0}", str1);
Console.WriteLine("Chuoi sau khi da thay the: {0}", result);

Console.ReadKey();
}
}
}

Biên dịch và chạy chương trình C# trên sẽ cho kết quả sau:


Nguồn: vietjack.com​
 
Sửa lần cuối:

Bài Trước

Tìm hiểu về xử lý ngoại lệ trong C#

Bài Tiếp

Sử dụng Escape Character trong C# như thế nào?

Đăng nhập

CHAT
  1. songngu @ songngu: hi, vậy thì tốt quá. Tuy không sử dụng tiếng Hàn nhưng cũng ráng học vài câu xã giao :D
  2. B @ BichKhoa blog: Sau mỗi bài đăng, nếu bạn có hỏi gì post ngày dưới bài đăng nhé!
  3. B @ BichKhoa blog: Chào cả nhà! Có ai hứng thú với tiếng Hàn không nhỉ? Mình sẽ chia sẻ tài liệu học tại box Tiếng Hàn nhé?
  4. Phong Cầm @ Phong Cầm: chào Thịnh
  5. H @ Hoàng Thịnh: :))
  6. H @ Hoàng Thịnh: Chào cả nhà. Tớ đã trở lại :d
  7. Hide Nguyễn @ Hide Nguyễn: Chào cả nhà. Buổi chiều vui vẻ :)
  8. Khoai @ Khoai: Vậy hết Trung Thu rồi ta?
  9. Khoai @ Khoai: AFF CUP 2021 Việt Nam chung bảng với đội Mã, Indo rồi. Qủa này kịch tính lắm đây.
  10. VnKienThuc @ VnKienThuc: Còn hi vọng còn đá kkk
  11. Khoai @ Khoai: Vòng loại 3 này có điểm là một thành công đáng tự hào rồi. Rất khó để chen vào top 2. Rất rất khó.
  12. Phong Cầm @ Phong Cầm: Mong chờ ông Park kết thúc hợp đồng với shopee hic. E đang mong chờ trận bóng vào Tết này.
  13. VnKienThuc @ VnKienThuc: Tin rất HOT: Tuyển bóng đá futsal Việt Nam đã giành quyền đi tiếp, sau khi hoà CH Séc 1 - 1. Chúc mừng tuyển Việt Nam!
  14. VnKienThuc @ VnKienThuc: và không vào. Fans Man Utd ra khỏi hang được rồi kkk
  15. VnKienThuc @ VnKienThuc: Man U vừa ghi bàn p89, ăn quả Pen 90+3. Và...??
  16. VnKienThuc @ VnKienThuc: Chào buổi tối cả nhà. Online vui vẻ!
  17. VnKienThuc @ VnKienThuc: Shoutbox has been pruned!

VnKienthuc lúc này