Python正則表達式-基礎
阿新 • • 發佈:2019-04-15
group 正則表達 取反 可用 code 使用 正則 print 匹配
Python正則表達式-基礎
本文轉載自昔日暖陽,原文地址:http://www.osheep.cn/4806.html
python使用正則,需要先引入re模塊
import re
匹配符
單個字符表達式 | 含義 |
---|---|
[0-9] | 0123456789任意之一 |
[a-z] | 小寫字母任意之一 |
[A-Z] | 大寫字母任意之一 |
\d | 等同於[0-9] |
\D | 等同於[^0-9] 匹配非數字,即\d 的取反 |
\w | 等同於[a-z0-9A-Z_] 匹配大小寫字母、數字和下劃線 |
\W | 等同於[^a-z0-9A-Z_] 等同於上一條取反 |
. | 一個任意字符 |
匹配模式
匹配模式表達式 | 含義 |
---|---|
? | 指定字符一次或者不出現 |
+ | 至少出現一次 |
* | 出現任意次,包括不出現 |
^ | 從字符串開頭進行匹配 |
$ | 匹配到字符串的結尾 |
() | 分組符、也可用於或匹配 |
案例一:匹配郵箱
- 匹配126,163郵箱地址
# 匹配126,163郵箱地址 ret = re.match(r"^[0-9a-zA-Z_]{4,20}@(163|126)\.com$", '[email protected]') if ret: print('符合要求 - ', ret.group(), ret.group(1)) else: print('不符合要求!')
案例二:匹配郵箱並進行分組取值
- 匹配126,163郵箱地址
# 使用()對匹配值進行分組,可以方便的取得匹配值
# 分組1表示@前面的字符串
# 分組2表示163或者126
ret = re.match(r"^([0-9a-zA-Z_]{4,20})@(163|126)\.com$", '[email protected]')
if ret:
print('符合要求 - ', ret.group(), ret.group(1), ret.group(2))
else:
print('不符合要求!')
案例三:在正則表達式中使用分組
- 匹配網頁源代碼塊
# 在正則表達式中使用分組
# 使用\分組數表示需要使用的分組
ret = re.match(r"^<(\w+)>.*</(\1)>$", '<h1>hello</h1>')
if ret:
print('符合要求 - ', ret.group())
else:
print('不符合要求!')
- 使用多個分組
# 在正則表達式中使用分組
# 使用\分組數表示需要使用的分組,這裏表示多個分組
ret = re.match(r"^<(\w+)><(\w+)>.*</(\2)></(\1)>$", '<body><h1>hello</h1></body>')
if ret:
print('符合要求 - ', ret.group())
else:
print('不符合要求!')
案例四:在正則表達式中對分組進行命名
- 對分組進行命名 語法:標記分組 ?P
引用分組 ?P=name
# 在正則表達式中使用分組
# 使用\分組數表示需要使用的分組,這裏表示多個分組
ret = re.match(r"^<(?P<p1>\w+)><(?P<p2>\w+)>.*</(?P=p2)></(?P=p1)>$", '<body><h1>hello</h1></body>')
if ret:
print('符合要求 - ', ret.group())
else:
print('不符合要求!')
Python正則表達式-基礎