day 23 re模組 正則表示式
阿新 • • 發佈:2018-11-16
一 . 正則表示式
元字元:除了換行符外的任意字元
. : 匹配除了換行符意外的任意字元
/w : 匹配數字,字母,下劃線
/s : 匹配空白符
/b : 匹配單詞的末尾
/d : 匹配數字
/W : 匹配除了數字,字母,下劃線
/D : 匹配數字數字
/S : 匹配除了空白符
^ : 開頭
$ : 結尾
[ ] : 字元組
[ ^ ] : 除了字元組內的元素外
量詞,也叫限定符
* { 0,n}
+ { 1, n}
? { 0, 1}
{p} p 次
{p,} p次或更多次
{p,q} 從p次到q次
. *
. +
. * ? :爬蟲常用的
分組()
\ n 換行
\ \ n \ n
\.
\ /
\ ?
二 . re 模組
findall () 獲取到匹配的所有內容
finditer() 匹配到所有內容,返回迭代器
search() 搜尋,查到了就返回
match() 匹配,從頭開始匹配
r '' (?P<name>正則)''