1. 程式人生 > >模組3 re + 正則表示式

模組3 re + 正則表示式

1. 正則表示式 匹配字串
元字元
. 除了換行
\w 數字, 字母, 下劃線
\d 數字
\s 空白符
\n
\t
\b 單詞的邊界
\W 非xxx
\D
\S
[] 字元組
[^xxx] 非xxxx
^ 字串的開始
$ 字串的結束
| 或者
量詞
* 0->n
+ 1->n
? 0->1
{p} p次
{p,q} p->q次
{p,} 至少p次

貪婪和惰性
.*
.+
惰性:
.*?寶寶 儘可能少的匹配

轉義 \\\\n => \\n => \n
正則前面加r

分組 ()


2. 在python中使用正則. re
(?P<name>正則)
1. search() 搜尋. 搜尋到第一個結果返回
2. match() 匹配. 收到一個結果返回. 從頭開始匹配
3. findall() 查詢所有匹配結果
4. finditer() 返回迭代器.
5. compile() 編譯
6. group("name") 獲取資料
7. re.S 幹掉 . 的換行


sub
subn
split