1. 程式人生 > >正則表示式的簡單運用(1)

正則表示式的簡單運用(1)

  用Python從一篇文章中提取關鍵資訊,涉及到不少知識。其中正則表示式這方面的內容很重要,所以我簡單整理了下,方便以後的學習。

  首先,正則表示式是什麼?

  正則表示式,又稱規則表示式(英語:Regular Expression,在程式碼中常簡寫為regex、regexp或RE),電腦科學的一個概念。是對字元串操作的一種邏輯公式,就是用事先定義好的一些特定字元、及這些特定字元的組合,組成一個“規則字串”,這個“規則字串”用來表達對字串的一種過濾邏輯。(節選自百度詞條)

  作用(目的)是什麼呢?

  正則表示式通常被用來檢索、替換那些符合某個模式(規則)的文字。它是一種文字模式,模式描述在搜尋文字時要匹配的一個或多個字串。給定一個正則表示式和另一個字串,我們可以達到如下的目的:

    1. 給定的字串是否符合正則表示式的過濾邏輯(稱作“匹配”)。     2. 可以通過正則表示式,從字串中獲取我們想要的特定部分。   簡單使用例項:   import re     #re模組實現對複雜字串的分析並提取出相關資訊 pattern = re.compile(r'world') match = pattern.search('hello world!') print(re.match(r'.*(world)',('hello world!')).group(1)) if match:     #使用match獲得分組資訊     print(match.group())
### 輸出 ### #  world ''' #將正則表示式編譯成Pattern物件 pattern = re.compile(r'world') #使用Pattern匹配文字,獲得匹配結果,無法匹配時將返回None match = pattern.match('hello world!') #這個例子用match()無法成功匹配 #使用search()查詢匹配的的字串,不存在能匹配的字串時將返回None
'''