python 正則表示式及其規則
阿新 • • 發佈:2018-12-14
1定義:
正則表示式(Regular Expression)是一種文字模式,包括普通字元(例如,a 到 z 之間的字母)和特殊字元(稱為"元字元")。
正則表示式使用單個字串來描述、匹配一系列匹配某個句法規則的字串。
2正則規則
- 單個字元:
普通字元:簡單來說就是一對一的完全匹配
[]:匹配【】中的任意一個字元
[a-z]:匹配a~z之間的字元(所有訊息字母)
[0-9]:匹配0~9之間的字元(所有數字)
[A-Z0-9]:匹配所有的大寫字母和數字
[^abc]:匹配除abc外的所有字元,^代表非
. :點,匹配除'\n'換行符以外的任意字元
\d:匹配所有的數字,等價於[0-9]
\D:匹配所有的非數字,等價於[^0-9]
\w:匹配所有的數字、字母(中文)、下劃線任意字元
\W:匹配所有的非字元的字元(\w的取反)
\s:匹配所有的空白符(\n、\t、\t、空格等)
\S:匹配所有的非空白符
\b:詞邊界匹配(開頭、結尾、標點、空格)
\B:非詞邊界匹配
- 次數控制
*:前面的字元出現任意次
+:前面的字元出現至少一次
?:前面的字元出現至多一次
{m}:指定次數,m表示出現的次數
{m,}:至少指定次數
{m,n}:指定範圍內的次數,m到n次之間
{,n}:至多n次,相當於{0,n}
正則的匹配預設都是貪婪的(最大限度的匹配)
- 邊界限定
-
- ^:以指定的內容開頭
- $:以指定的內容結尾
- 示例