1. 程式人生 > >python 正則表示式及其規則

python 正則表示式及其規則

1定義:

正則表示式(Regular Expression)是一種文字模式,包括普通字元(例如,a 到 z 之間的字母)和特殊字元(稱為"元字元")。

正則表示式使用單個字串來描述、匹配一系列匹配某個句法規則的字串。

2正則規則

  • 單個字元:

普通字元:簡單來說就是一對一的完全匹配

[]:匹配【】中的任意一個字元

[a-z]:匹配a~z之間的字元(所有訊息字母)

[0-9]:匹配0~9之間的字元(所有數字)

[A-Z0-9]:匹配所有的大寫字母和數字

[^abc]:匹配除abc外的所有字元,^代表非

. :點,匹配除'\n'換行符以外的任意字元

\d:匹配所有的數字,等價於[0-9]

\D:匹配所有的非數字,等價於[^0-9]

\w:匹配所有的數字、字母(中文)、下劃線任意字元

\W:匹配所有的非字元的字元(\w的取反)

\s:匹配所有的空白符(\n、\t、\t、空格等)

\S:匹配所有的非空白符

\b:詞邊界匹配(開頭、結尾、標點、空格)

\B:非詞邊界匹配

  • 次數控制

*:前面的字元出現任意次

+:前面的字元出現至少一次

?:前面的字元出現至多一次

{m}:指定次數,m表示出現的次數

{m,}:至少指定次數

{m,n}:指定範圍內的次數,m到n次之間

{,n}:至多n次,相當於{0,n}

正則的匹配預設都是貪婪的(最大限度的匹配)

  • 邊界限定
    • ^:以指定的內容開頭
    • $:以指定的內容結尾
    • 示例