编程语言
首页 > 编程语言> > C# 正则表达式

C# 正则表达式

作者:互联网

代码示例

  1 using System;
  2 using System.Collections.Generic;
  3 using System.ComponentModel;
  4 using System.Data;
  5 using System.Drawing;
  6 using System.Linq;
  7 using System.Text;
  8 using System.Threading.Tasks;
  9 using System.Windows.Forms;
 10 using System.Text.RegularExpressions;
 11 
 12 namespace RegularExpression
 13 {
 14     public partial class Form1 : Form
 15     {
 16         public Form1()
 17         {
 18             InitializeComponent();
 19         }
 20 
 21         private void Form1_Load(object sender, EventArgs e)
 22         {
 23 
 24         }
 25 
 26         private void BtnRegexTest_Click(object sender, EventArgs e)
 27         {
 28             string sInput = TextValue.Text.Trim();
 29             //CheckPostcode(sInput);    //判断邮编
 30             //CheckPhone(sInput);     //判断电话号码
 31             //CheckIdCard(sInput);    //验证中国身份证号
 32             CheckEmail(sInput);     //验证邮箱
 33 
 34         }
 35 
 36         #region 验证邮箱
 37         /// <summary>
 38         /// 验证邮箱
 39         /// </summary>
 40         /// <param name="sVal">传递的邮箱</param>
 41         private void CheckPostcode(string sVal)
 42         {
 43             //第一邮政编码的验证
 44             //邮政编码是六位的纯数字
 45             //用IsMacth这个函数
 46 
 47             bool bReturn = Regex.IsMatch(sVal, "^[0-9]{6}$");
 48             if (bReturn)
 49                 MessageBox.Show("是邮编");
 50             else
 51                 MessageBox.Show("不是邮编");
 52             //[]字符组,表示在字符组中罗列出来的字符串,任意取单个
 53             //{}表示匹配指定的数量,有如下几种形式:
 54             //{n}表示匹配n个
 55             //{n,}匹配从n开始,上不封顶
 56             //{n,m}匹配从n开始到m个
 57             //[0-9]{6},这样写表示只要你输入的字符串中有满足六位数字就返回True,所以aaa123456、123456aaa判定为True
 58             // ^ 表示从某个字符串开始
 59             // $ 表示以某个字符串结尾
 60         } 
 61         #endregion
 62 
 63         #region 手机号判定
 64         /// <summary>
 65         /// 验证手机号
 66         /// </summary>
 67         /// <param name="sVal">传递输入的号码</param>
 68         private void CheckPhone(string sVal)
 69         {
 70             //bool bReturn = Regex.IsMatch(sVal, "^[0-9]{11}$");
 71             //继续升级代码,加强判断
 72             //bool bReturn = Regex.IsMatch(sVal, "^1[3-9][0-9]{9}$");
 73 
 74             //[0-9]等价于 \d,@表示里面的都是字符,不需要转义
 75             // \D与\d相反,表示所有的非数字
 76             bool bReturn = Regex.IsMatch(sVal, @"^1[3-9]\d{9}$");
 77 
 78             if (bReturn)
 79                 MessageBox.Show("是手机号", "信息提示", MessageBoxButtons.OK, MessageBoxIcon.Information);
 80             else
 81                 MessageBox.Show("不是手机号", "信息提示", MessageBoxButtons.OK, MessageBoxIcon.Exclamation);
 82 
 83         }
 84         #endregion
 85 
 86         #region 验证中国居民身份证号
 87         /// <summary>
 88         /// 验证中国居民身份证号
 89         /// </summary>
 90         /// <param name="sVal">传递输入的身份证号</param>
 91         private void CheckIdCard(string sVal)
 92         {
 93             //身份证原理(前提是中国居民的身份证号)
 94             //要么是15位,要么是18位,如果是18位末尾要么是数字,要么是小写或大写的X
 95             //bool bReturn = Regex.IsMatch(sVal, "^([1-9][0-9]{14}|[1-9][0-9]{16}[0-9Xx])$");
 96             //bool bReturn = Regex.IsMatch(sVal, "^[1-9][0-9]{14}$|^[1-9][0-9]{16}[0-9Xx]$");
 97 
 98             //用 ? 稍加改进
 99             bool bReturn = Regex.IsMatch(sVal, "^[1-9][0-9]{14}([0-9]{2}[0-9Xx])?$");
100 
101             if (bReturn)
102                 MessageBox.Show("是身份证号", "信息提示", MessageBoxButtons.OK, MessageBoxIcon.Information);
103             else
104                 MessageBox.Show("不是身份证号", "信息提示", MessageBoxButtons.OK, MessageBoxIcon.Exclamation);
105 
106             //正则表达式 | 竖杠表示或,运算级别最低
107             //知识点 ?问号,限定符,限定前面的表达式出现0次或者1次;终止贪婪模式
108 
109         }
110         #endregion
111 
112         #region 验证邮箱
113         /// <summary>
114         /// 验证邮箱
115         /// </summary>
116         /// <param name="sVal">传第递输入的邮箱</param>
117         private void CheckEmail(string sVal)
118         {
119             //邮箱至少有一个@符号。@右边一般为一个一级域名或者二级域名
120             //bool bReturn = Regex.IsMatch(sVal, @"^[-a-zA-Z0-9_.]+@[-a-zA-Z0-9]+(\.[A-za-z]+){1,2}$");
121 
122             bool bReturn = Regex.IsMatch(sVal, @"^\w+([-.]\w+)*@\w+([-\.]\w+)*\.\w+([-.]\w)*$");
123 
124             if (bReturn)
125                 MessageBox.Show("是邮箱", "信息提示", MessageBoxButtons.OK, MessageBoxIcon.Information);
126             else
127                 MessageBox.Show("不是邮箱", "信息提示", MessageBoxButtons.OK, MessageBoxIcon.Exclamation);
128             // . 点,表示:除了\ n 和 \r之外的任何单个字符
129             // \w :匹配包括下划线的任何单个字符,接近于[A-Za-z0-9_](排除unicode字符外,就是等价)
130         } 
131         #endregion
132     }
133 }

 

1、元字符

特定含义的字符

代码 说明
. 匹配除换行符以外的任意字符
\w 匹配字母或数字或下划线或汉字
\s 匹配任意的空白符
\d 匹配数字
\b 匹配单词的开始或结束
^ 匹配字符串的开始(在集合字符里[^a]表示非(不匹配)的意思)
$ 匹配字符串的结束

2、反义字符

多用于查找除某个字符以外其他字符均可以的情况

代码 说明
\W 匹配任意不是字母、数字、下划线、汉字的字符
\S 匹配任意不是空白符的字符
\D 匹配任意非数字的字符
\B 匹配不是单词开头或结束的位置
[^X] 匹配除了X以外的任意字符
[^sfdcx] 匹配除了sfdcx这几个字母以外的任意字符

 

3、限定字符

多用于重复匹配次数

代码 说明
* 重复零次或更多次
+ 重复一次或更多次
? 重复零次或一次
{n} 重复n次
{n,} 重复n次或更多次
{n,m} 重复n到m次

 

4、转义字符

前面加 \

 

5、字符分支

用 | 将不同条件分割开来

 

6、字符分组

多用于将多个字符重复,主要通过 ( ) 进行分组

例如:(\d\w){3} 重复匹配3次 (\d\w)

常用分组语法

分类 代码 说明
捕获 (exp) 匹配exp,并捕获文本到自动命名的组里
(?<name>exp) 匹配exp,并捕获文本到名称为name的组里,也可以写成 (?'name'exp)
(?:exp) 匹配exp,不捕获匹配的文本,也不给此分组分配组号
零宽断言 (?=exp) 匹配exp前面的位置
(?<=exp) 匹配exp后面的位置
(?!exp) 匹配后面跟的不是exp的位置
(?<!exp) 匹配前面不是exp的位置
注释 (?#comment) 这种类型的分组不对正则表达式的处理产生任何影响,用于提供注释让人阅读

 

7、懒惰匹配和贪婪匹配

贪婪匹配:正则表达式中包含重复的限定符时,通常的行为是匹配 尽可能多 的字符。

懒惰匹配:有时候需要匹配尽可能少的字符。

常用的懒惰匹配限定符如下

代码 说明
*? 重复任意次,尽可能少重复
+? 重复一次或更多次,但尽可能少重复
?? 重复0次或一次,但尽可能少重复
{n,m}? 重复n到m次,但尽可能少重复
{n,}? 重复n次以上,但尽可能少重复

 

8、后向引用

使用小括号指定一个子表达式后,匹配这个子表达式的文本(也就是此分组捕获的内容)可以在表达式或其它程序中作进一步的处理。默认情况下,每个分组会自动拥有一个组号,规则是:从左向右,以分组的左括号为标志,第一个出现的分组的组号为1,第二个为2,以此类推

示例:\b(\w+)\b\s+\1\b可以用来匹配重复的单词,像go go, 或者kitty kitty。

这个表达式首先是一个单词,也就是单词开始处和结束处之间的多于一个的字母或数字(\b(\w+)\b),这个单词会被捕获到编号为1的分组中,然后是1个或几个空白符(\s+),最后是分组1中捕获的内容(也就是前面匹配的那个单词)(\1)。

你也可以自己指定子表达式的组名。要指定一个子表达式的组名,请使用这样的语法:(?<Word>\w+)(或者把尖括号换成'也行:(?'Word'\w+)),这样就把\w+的组名指定为Word了。要反向引用这个分组捕获的内容,你可以使用\k<Word>,所以上一个例子也可以写成这样:\b(?<Word>\w+)\b\s+\k<Word>\b

9、零宽断言

有时候需要查找某些匹配之前或之后的东西,这个时候就需要用到们像\b,^,$那样用于指定一个位置,这个位置应该满足一定的条件(即断言),因此它们也被称为零宽断言

(?=exp)也叫零宽度正预测先行断言,它断言自身出现的位置的后面能匹配表达式exp。比如\b\w+(?=ing\b),匹配以ing结尾的单词的前面部分(除了ing以外的部分),如查找I'm singing while you're dancing.时,它会匹配sing和danc。

(?<=exp)也叫零宽度正回顾后发断言,它断言自身出现的位置的前面能匹配表达式exp。比如(?<=\bre)\w+\b会匹配以re开头的单词的后半部分(除了re以外的部分),例如在查找reading a book时,它匹配ading。

参考文章:点这里

 

标签:字符,匹配,C#,sVal,正则表达式,exp,bReturn,重复
来源: https://www.cnblogs.com/xunzf0402/p/16442510.html