Python標準庫--re模塊

阿新 • • 發佈：2017-06-02

spa 編程斜杠不能當前對象需要 sum pri

re:正則表達式

__all__ = [
    "match", "fullmatch", "search", "sub", "subn", "split",
    "findall", "finditer", "compile", "purge", "template", "escape",
    "error", "A", "I", "L", "M", "S", "X", "U",
    "ASCII", "IGNORECASE", "LOCALE", "MULTILINE", "DOTALL", "VERBOSE",
    "UNICODE",
]

一些常量

I = IGNORECASE = sre_compile.SRE_FLAG_IGNORECASE # 
 ignore case
# 使匹配對大小寫不敏感
L = LOCALE = sre_compile.SRE_FLAG_LOCALE # assume current 8-bit locale
# 影響 "w, "W, "b, 和 "B，這取決於當前的本地化設置。 locales 是 C 語言庫中的一項功能，是用來為需要考慮不同語言的編程提供幫助的。
# 舉個例子，如果你正在處理法文文本，你想用 "w+ 來匹配文字，但 "w 只匹配字符類 [A-Za-z]；它並不能匹配 "é" 或 "?"。 如果你的系統配置適當且本地化設置為法語，那麽內部的 C 函數將告訴程序 "é" 也應該被認為是一個字母。 

# 當在編譯正則表達式時使用 LOCALE 標誌會得到用這些 C 函數來處理 "w 後的編譯對象；這會更慢，但也會象你希望的那樣可以用 "w+ 來匹配法文文本。
M = MULTILINE = sre_compile.SRE_FLAG_MULTILINE # make anchors look for newline
# 使用 "^" 只匹配字符串的開始，而 $ 則只匹配字符串的結尾和直接在換行前（如果有的話）的字符串結尾。
# 當本標誌指定後，"^" 匹配字符串的開始和字符串中每行的開始。同樣的， $ 元字符匹配字符串結尾和字符串中每行的結尾（直接在每個換行之前）。
S = DOTALL = sre_compile.SRE_FLAG_DOTALL # 
 make dot match newline
# 使 "." 特殊字符完全匹配任何字符，包括換行；沒有這個標誌， "." 匹配除了換行外的任何字符。
X = VERBOSE = sre_compile.SRE_FLAG_VERBOSE # ignore whitespace and comments
# 當該標誌被指定時，在 RE 字符串中的空白符被忽略，除非該空白符在字符類中或在反斜杠之後；這可以讓你更清晰地組織和縮進 RE。它也可以允許你將註釋寫入 RE，這些註釋會被引擎忽略；註釋用 "#"號 來標識，不過該符號不能在字符串或反斜杠之後。

函數

match() 從頭匹配, 沒有返回空

search() 字符串中查找,返回第一個

pattern = ‘this‘
text = ‘Does this text match this pattern?‘

match = re.match(pattern, text)
search = re.search(pattern, text)

s = search.start()
e = search.end()

print(match)
print(search.re.pattern)
print(search.string)
print(s)
print(e)
print(text[s:e])

"""
None
this
Does this text match this pattern?
5
9
this
"""

complie()

regex = re.compile(pattern)

print(regex.match(text))
print(regex.search(text))

"""
None
<_sre.SRE_Match object; span=(5, 9), match=‘this‘>
"""

findall() 與finditer()

叠代器生成Match實例, 通過group() start() end() 獲取信息

text = ‘abbaaabbbbaaaabbbbbaaa‘
pattern = ‘ab‘

print(re.findall(pattern, text))

ab = re.finditer(pattern, text)

for match in ab:
    print(match)

for match in ab:
    print(str(match.start()) + ‘->‘ + str(match.end()), end=‘=‘)
    print(match.group())


"""
[‘ab‘, ‘ab‘, ‘ab‘]
<_sre.SRE_Match object; span=(0, 2), match=‘ab‘>
<_sre.SRE_Match object; span=(5, 7), match=‘ab‘>
<_sre.SRE_Match object; span=(13, 15), match=‘ab‘>

0->2=ab
5->7=ab
13->15=ab
"""

groups() 所有匹配字符串

group() 整體匹配字符串

group(0) group(1) 按組匹配的字符串

sub() 與 subn()

subn() 返回元祖,包含替換次數

bold = re.compile(r‘\*{2}(.*?)\*{2}‘)

text = "Make this **bold**.  This **too**."

print(text)

print(bold.sub(r‘<b>\1</b>‘, text, count=1))

print(bold.subn(r‘<b>\1</b>‘, text))

"""
Make this **bold**.  This **too**.
Make this <b>bold</b>.  This **too**.
(‘Make this <b>bold</b>.  This **too**.‘, 1)
"""

Python標準庫--re模塊

spa 編程斜杠不能當前對象需要 sum pri re:正則表達式 __all__ = [ "match", "fullmatch", "search", "sub", "subn", "split", "findall", "finditer"

Python標準庫--string模塊

err 分隔 xca provide python 變量 dog upper miss string中包含了處理文本的常量和模板常量 print(string.whitespace) print(string.ascii_lowercase) print(string.

Python標準庫--textwrap模塊

給定 fix rip 調整 wrap 標準庫 wrapper dede 換行符 textwrap通過調整換行符的位置來格式化文本 __all__ = [‘TextWrapper‘, ‘wrap‘, ‘fill‘, ‘dedent‘, ‘indent‘, ‘shorten‘

[python標準庫]Logging模塊

post 日誌信息 tin 方式 asc dha event 如果 bytes 1.模塊簡介　　logging模塊是Python內置的標準模塊，主要用於輸出運行日誌，可以設置輸出日誌的等級、日誌保存路徑、日誌文件回滾等；相比print，具備如下優點：可以通過設置不同的

Python標準庫--itertools模塊

end col map class 條件停止 -- rtm 共享 itertools模塊：處理可叠代對象 chain()和islice()、tee() chain：合並叠代器 islice：切割叠代器，start，end，step tee：復制叠代器，新叠代器共享輸入叠

[python標準庫]Time模塊

time模塊 get ear href -c orm display http 元組在python中，通常有以下幾種方式來表示時間：　時間戳：表示的是從1970年1月1日00:00:00開始按秒計算的偏移量。格式化時間：struct_time元組共有9個元素共

Python標準庫 - re

塊代碼 replace number star 代碼特殊字符 ini sam expr 編寫代碼時, 經常要匹配特定字符串, 或某個模式的字符串, 一般會借助字符串函數, 或正則表達式完成.對於正則表達式, 有些字符具有特殊含義, 需使用反斜杠字符'\'轉

python正則re模塊

爬蟲匹配 match 也會推薦 abcd 輸出顯示 sub() 今日內容：知識點一：正則什麽是正則：就是用一系列具有特殊含義的字符組成一套規則，改規則用來描述具有某一特征的字符串正則就是用來在一個大的字符串中取出符合規則的小字符串為什麽用正則： 1

python 導入re模塊語法及規則

包含正則表達字符規則元素 all dal sub 正則表達式是功能比較強大的模塊，應用在很多地方，抓網頁，數據分析，數據驗證等，下面講述python 導入re模塊語法及規則。 1，re模塊語法 re.match 從頭開始匹配 re.sear

python-23： re 模塊之一

pytho 圖片 inf .com python bubuko 分享圖片 image mage python-23： re 模塊之一

Python基礎之re模塊

== 時區三種第一個特殊功能之間指定特殊字符 asdf 什麽是模塊？　　為了編寫可維護的代碼，我們把很多的函數分組，分別放到不同的文件裏，這樣，每個文件包含的代碼就相對較少，很多編程語言都采用這種組織代碼的方式，在Python中，一個.py文件就稱為一個模塊

python基礎：re模塊匹配時貪婪和非貪婪模式

audio 貪婪數字表達字符串 true 數量我們順序 python貪婪和非貪婪　　正則表達式通常用於在文本中查找匹配的字符串。Python裏數量詞默認是貪婪的（在少數語言裏也可能是默認非貪婪），總是嘗試匹配盡可能多的字符；非貪婪則相反，總是嘗試匹配盡可能少的字

python標準庫:re

影響 obj 換行符 ctr 16px 結束部分 tro local 1，匹配符號 * : 匹配前一個字符0次，1次，多次 + : 匹配前一個字符1次，多次 ? : 匹配前一個字符0次，1次 {n} : 匹配前一個字符n次 {n,} : 匹配前一個字符至少n次 {n,m

Python標準庫筆記(5) — sched模塊

ios6 edi aac err Language func 執行當前 poj 事件調度　　sched模塊內容很簡單，只定義了一個類。它用來最為一個通用的事件調度模塊。　　class sched.scheduler(timefunc, delayfunc)這個

python標準庫介紹——36 popen2 模塊詳解

out tdi move gnu div error python popen pro ==popen2 模塊== ``popen2`` 模塊允許你執行外部命令, 並通過流來分別訪問它的 ``stdin`` 和 ``stdout`` ( 可能還有 ``stderr``

Python標準庫之Sys模塊使用詳解

pri 運行給定 os.path sample 跟蹤 nal print語句 class sys 模塊提供了許多函數和變量來處理 Python 運行時環境的不同部分. 處理命令行參數在解釋器啟動後, argv 列表包含了傳遞給腳本的所有參數, 列表的第一個元素為腳本自身

python標準庫：datetime模塊

times 詳細包括面向對象 www. pos down 基礎構造函數原文地址：http://www.bugingcode.com/blog/python_datetime.html datatime 模塊題共用一些處理日期，時間和時間間隔的函數。這個模塊使用面向對

【python標準庫模塊二】random模塊學習

orm dom random模塊 () import randint pre and imp random模塊是用來生成隨機數的模塊導入random模塊 import random 生成一個0~1的隨機數，浮點數 #隨機生成一個0~1的隨

【python標準庫模塊四】Json模塊和Pickle模塊學習

pre pickle模塊 codes spa 原來 pick 加強 val 文件 Json模塊原來有個eval函數能能夠從字符串中提取出對應的數據類型，比如"{"name":"zhangsan"}"，可以提取出一個字典。json模塊可一樣實現功能，但是更加強大

Python標準庫筆記(10) — itertools模塊

構造 values tools multi 生成 TE product and map() itertools 用於更高效地創建叠代器的函數工具。 itertools 提供的功能受Clojure，Haskell，APL和SML等函數式編程語言的類似功能的啟發。它們的目的

Python標準庫--re模塊

相關推薦