正則表示式學習程序（一）re.match()

阿新 • • 發佈：2019-01-29

#正則表示式學習筆記
import re

"""
.匹配任意字元 除換行符
{n}精確匹配前面n個表示式
\s 匹配任意的空白字元
\w 匹配字母數字及下劃線
.* 匹配任意除換行符之外的字元
{n}    精確匹配n個前面表示式。
+  匹配1個或多個的表示式。
( )    匹配括號內的表示式
?  匹配0個或1個由前面的正則表示式定義的片段，非貪婪方式
re.S 如果不使用re.S引數,則只在每一行內進行匹配,如果一行沒有,就換下一行重新開始,不會跨行
"""
#re.match() 嘗試從字串的起始位置匹配一個模式，如果不是起始位置匹配成功的話，match()返回none
#用法：re.match(pattern,string ,flags=0)  flags標誌位，用於控制正則表示式的匹配方式，如：是否區分大小寫，多行匹配等等。
 
"""
1.string與pattern完全相同,成功匹配 
2.string雖然多出一個字母，但pattern匹配完成時，匹配成功，後面的字元不再匹配。 
3.string匹配到最後一個字母時，發現仍然無法完全匹配，匹配失敗。 
"""
content ='Hello 123 4567 World_This is a Regex Demo'
contents ='Hello 123 4567 World_This is a Regex Demo  ada'
result = re.match('Hello\s\d{3}\s\d{4}\s\w{10}.*Demo$', content)
print 
(result)
print(type(result))#<class '_sre.SRE_Match'>
print(len(content))
print(result.group())#返回匹配結果 Hello 123 4567 World_This is a Regex Demo
print(result.span())#輸出範圍 （0,41）
result = re.match('Hello\s\d{3}\s\d{4}\s\w{10}.*Demo', contents)
print(result)  #結果：<_sre.SRE_Match object; span=(0, 41), match='Hello 123 4567 World_This is a Regex Demo'>
 
#泛匹配
result =  re.match('Hello.*Demo$',content)
print(result)  #<_sre.SRE_Match object; span=(0, 41), match='Hello 123 4567 World_This is a Regex Demo'>
print(result.group())  #Hello 123 4567 World_This is a Regex Demo
#匹配目標
content ='Hello 1234567 World_This is a Regex Demo'
result = re.match('Hello\s(\d+)\sWorld.*Demo$',content)
#匹配括號裡面的
print("############")
print(result.group())
print(result.group(1)) #1234567
print(result.span())   #(0,40)
#貪婪匹配
result = re.match('He.*(\d+).*Demo$',content)
print(result.group())
print(result.group(1)) #輸出7  前面的1-6被.*匹配，貪婪模式
#非貪婪模式
result1 = re.match('He.*?(\d+).*Demo$',content)
result2 = re.match('He.*?(\d+).*?Demo$',content)
print(result2.group(1)) #
print(result1.group(1)) #輸出1234567
#匹配模式
content = """Hello 1234567 World_This 
is a Regex Demo
"""
result1 = re.match('^He.*?(\d+).*?Demo$', content)
print(result1) #輸出None  因為有換行符
result2 = re.match('^He.*?(\d+).*?Demo$', content,re.S)
print(result2) #輸出None
print(result2.group(1))#1234567
#轉義
content = 'price is $5.00'
result = re.match('price is $5.00',content)
print(result) #None
result = re.match('price is \$5\.00', content)
print(result)#<_sre.SRE_Match object; span=(0, 14), match='price is $5.00'>
"""
總結：儘量使用泛匹配，使用()得到匹配目標，儘量使用非貪婪模式、有換行符就用re.S
"""

正則表示式學習程序（一）re.match()

#正則表示式學習筆記 import re """ .匹配任意字元除換行符 {n}精確匹配前面n個表示式 \s 匹配任意的空白字元 \w 匹配字母數字及下劃線 .* 匹配任意除換行符之外的字元 {n} 精確匹配n個前面表示式。 + 匹配1個或多個的表示式。 ( )

正則表示式學習筆記（一）

開始和結束 ^ $ '^' 表示開始例如：'^the' 表示以 the 開頭的詞 '$' 表示結束例如：'the$' 表示以 the 結尾的詞 'the' 表示包含 the 的詞

JavaScript 正則表示式學習筆記（一）

名詞解釋正則表示式：Regular Expression，在程式碼中常簡寫為Re

正則表示式進階（一）-- 匹配多連續字元、位置匹配、子表示式使用

之前一篇博文正則表示式入門講了下正則表示式的一些基本使用，這次講一下高階的。還是那句話，要多用，才能夠記住並留在你的大腦皮層。 1. 匹配一個或多個連續字元用+符號， a+，意思是匹配1個或多個

正則表示式學習記錄（持續更新）

特殊字元含義：字元含義字元含義 * 匹配前面的子表示式零次或多次 + 匹配一次或多次 $ 匹配輸入字串的結尾位置，設定RegExg物件的

正則表達式儲備（一）

space mail 定位 per 操作命名打印字符 ron lower 正則表達式用途及概念正則表達式，又稱規則表達式，通常被用來檢索、替換那些符合某個模式(規則)的文本。是對字符串（包括普通字（例如，a 到 z 之間的字母）和特殊字符（稱為“元字符”））操作的一

正則表示式並不難（轉）

對於正則表示式，相信很多人都知道，但是很多人的第一感覺就是難學，因為看第一眼時，覺得完全沒有規律可尋，而且全是一堆各種各樣的特殊符號，完全不知所云。其實只是對正則不瞭解而以，瞭解了你就會發現，原來就這樣啊正則所用的相關字元其實不多，也不難記，更不難懂，唯一難的就是組合起來之後，可讀性比較差，而

python正則表示式詳解（二）：特殊字元序列

內容提要：說明：僅供學習交流使用二、python正則表示式中的特殊字元序列 \number \A \Z \b \B \d \D \s \S \w \W \\ 2.1\number 以相同的序號代表的組所匹配的內容

爬蟲入門系列（五）：正則表示式完全指南（上）

爬蟲入門系列目錄：正則表示式處理文字有如疾風掃秋葉，絕大部分程式語言都內建支援正則表示式，它應用在諸如表單驗證、文字提取、替換等場景。爬蟲系統更是離不開正則表示式，用好正則表示式往往能收到事半功倍的效果。介紹正則表示式前，先來看一個問題，下面這段文字來自豆瓣的某個網頁連結，我對內容

爬蟲入門系列（六）：正則表示式完全指南（下）

爬蟲入門系列目錄：正則表示式是一種更為強大的字串匹配、字串查詢、字串替換等操作工具。上篇講解了正則表示式的基本概念和語法以及re模組的基本使用方式，這節來詳細說說 re 模組作為 Python 正則表示式引擎提供了哪些便利性操作。 >>> import re

Java基礎之List集合（包含JUC）學習程序（一）

Java中重要的集合包主要有Collection和map 複習collectioon,主要是List，Queue和Set List 首先要知道List是一個介面，繼承自collection 其中定義了是元素有序並且可以重複的集合，被稱為序列，並且List允許存放

Python爬蟲之正則表示式的使用（三）

import re html = ''' <div class="slide-page" style="width: 700px;" data-index="1"> <a class="item" target="_blank" href="https:

vb.net正則表示式快速入門（2）

6.使用?*或進行重複?：告訴引擎匹配前導字元0次或一次。事實上是表示前導字元是可選的。（問號）：告訴引擎匹配前導字元1次或多次(空格）*：告訴引擎匹配前導字元0次或多次（星號） <[A-Za-z][A-Za-z0-9]*> 匹配沒有屬性的HTML標籤，“ <”以及“>

正則表示式轉義字元（轉）

字元匹配語法： \d 匹配數字（0~9） ‘\d’匹配8,不匹配12； \D 匹配非數字 ‘\D’匹配c,不匹配3； \w 匹配任意單字元 ‘\w\w’ 匹配A3,不匹配@3； \W 匹配非單字元 ‘\W’匹配@,不匹配c； \s 匹配空白字元 ‘\d\

正則表示式進階（二）-- 回溯引用、前後查詢、嵌入條件

回溯引用是指模式的後半部分引用在前半部分中定義的子表示式回溯引用只能用來引用模式裡的子表示式下面是一個回溯引用的例子只能匹配H1 第8行是不合法的第8行被成功的排除掉了。 \1 \2

正則表示式進行篩選（轉載）

從各個網站查詢最後總結符合自己的專案： // 用來取<div style="line-height:20px;font-size:10pt">內容</div> 中間的內容 String rgex="(?<=<[D,d][I,i

vb.net正則表示式快速入門（1）

深入淺出之正則表示式作者：lzmtw 注:JanGoyvaerts為RegexBuddy寫的教程的譯文前言：半年前我對正則表示式產生了興趣，在網上查詢過不少資料，看過不少的教程，最後在使用一個正則表示式工具RegexBuddy時發現他的教程寫的非常好，可以說是我目前見過最好的正則表示式

vb.net正則表示式快速入門（3）完

作者：lzmtw 10.選擇符正則表示式中“ ¦”表示選擇。你可以用選擇符匹配多個可能的正則表示式中的一個。如果你想搜尋文字“cat”或“dog”，你可以用 < <cat¦dog> > 。如果你想有更多的選擇，你只要擴充套件列表 <

正則表示式-重複匹配（二）

在前面一章中，講了元字元的使用，前面沒有明確說明，那就是每個元字元匹配一個字元，也就是說[\d]匹配任意一個數字。那麼假設我想匹配三位數字怎麼辦，當然可以寫成 \d\d\d 這種形式，但是要是我想匹配10位數字呢，豈不是要寫10次\d。這樣寫當然

jmeter 正則表示式學習（一）--使用詳解

jmeter自帶後置處理器：正則表示式提取器，可以用來提取介面響應裡的資訊，給予後續介面傳參用。例如要提取響應結果裡的token欄位及sex欄位（響應內容為： "token":"83EEAA887F1D2F1AA1CDA9E197810992","sex":0

正則表示式學習程序（一）re.match()

相關推薦