正则表达式
作者:互联网
正则表达式
正则表达式就是利用一些特殊符号的组合去字符串中筛选出符合条件的数据。
正则表达式是一门独立的语言,如果想在python代码中使用,则需要借助内置模块re。
字符组
使用中括号括起来的就是字符组,字符串默认单个字符进行匹配。
[0-9] 意为匹配0-9之间的任意一个数字
[a-z]意为匹配a-z之间的任意一个字母
[A-Z]意为匹配A-Z之间的任意一个字母
[0-9a-zA-Z]意为匹配任意一个数字或字母
特殊符号
特殊字符也默认单个字符进行匹配
‘.’意为匹配除换行符之外的任意字符。
‘\d’意为匹配数字。
‘^’意为匹配字符串的开始。
‘$’意为匹配字符串的结束。
‘^’和‘$’组合可以精准限制要查找的数据。
a|b 意为匹配字符a或字符b。
()意为匹配括号内的表达式,也表示一个组。
[...]意为匹配字符组中的字符。
[^...]意为匹配除了字符组中字符的所有字符。
量词
1.表达式在没有量词修饰的情况下,都是单个的匹配。
2.量词必须结合(字符串、特殊组合等)一起使用,不能单独出现。
3.量词只能影响前面的一个表达式。
‘*’意为重复零次或更多次。
‘+’意为重复一次或更多次。
‘?’意为重复零次或一次。
{n}意为重复n次。
{n,}意为重复n次或更多次。
{n,m}意为重复n到m次。
贪婪匹配与非贪婪匹配
贪婪匹配指的是在符合条件的情况下尽可能的多匹配。
正则表达式中的量词默认是贪婪匹配
非贪婪匹配指的是在符合条件的情况下尽可能的少匹配。
在量词后面加问号即可将贪婪匹配转为非贪婪匹配。
标签:字符,量词,匹配,正则表达式,贪婪,字符串 来源: https://www.cnblogs.com/ljys/p/15598951.html