一入python深似海--正則表達式
作者:互联网
字符串是编程时涉及到的最多的一种数据结构。对字符串进行操作的需求差点儿无处不在。比方推断一个字符串是否是一个合法的Email地址。尽管能够编程提取@前后的子串,再分别推断是否是单词和域名,但这样做不但麻烦,并且代码难以复用。
正則表達式是一种用来匹配字符串的强有力的武器。它的设计思想是用一种描写叙述性的语言来给字符串定义一个规则,凡是符合规则的字符串,我们juice觉得它“匹配”了,否则,该字符串就是不合法的。
所以我们推断一个字符串是否是合法的Email的方法是:
1.创建一个匹配Email的正則表達式;
2.用该正則表達式去匹配用户的输入来推断是否合法。
因为正則表達式也是用字符串表示的,所以,我们要首先了解怎样用字符来表述字符。
一、匹配单个字符
在正則表達式中,假设直接给出字符,就是精确匹配。
\d能够匹配一个数字
\w能够匹配一个字母或数字
. 能够匹配随意一个字符
如,‘00\d' 能够匹配'007'。但无法匹配 '00A';
二、匹配边长的字符
要匹配变长的字符。在正則表達式中,用 * 表示随意个字符(包括0个),用 + 表示至少一个字符,用 ? 表示0个或1个字符,用 {n} 表示n个字符。用{n,m} 表示n-m个字符:
如,\d{3}\s+\d{3,8}表示,三个数字。至少一个空格,3-8个数字
三、进阶
要做更精确地匹配,能够用 [ ] 表示范围,
比方:
-
[0-9a-zA-Z\_]
能够匹配一个数字、字母或者下划线。 -
[0-9a-zA-Z\_]+
能够匹配至少由一个数字、字母或者下划线组成的字符串,比方'a100'
,'0_Z'
,'Py3000'
等等; -
[a-zA-Z\_][a-zA-Z\_]*
能够匹配由字母或下划线开头,后接随意个由一个数字、字母或者下划线组成的字符串,也就是Python合法的变量。 -
[a-zA-Z\_][a-zA-Z\_]{0, 19}
更精确地限制了变量的长度是1-20个字符(前面1个字符+后面最多19个字符)。
A|B
能够匹配A或B。所以[P|p]ython
能够匹配'Python'
或者'python'
。
^
表示行的开头。^\d
表示必须以数字开头。
标签:匹配,python,正則,zA,表達式,字符串,深似海,个字符 来源: https://www.cnblogs.com/mqxnongmin/p/10959198.html