1. 程式人生 > >老男孩帶你了解perl正則表達式中的零寬斷言

老男孩帶你了解perl正則表達式中的零寬斷言

表達式 老男孩 positive 如圖所示

1.1 前言

本文只介紹perl語言正則表達式的零寬斷言功能。

零寬斷言實質:匹配文本裏面的位置。

零寬斷言叫zero-length assertions,也叫lookaround(這個更容易理解)。

包括:lookahead(向前看,零寬度正預測先行斷言),lookbehind(向後看,零寬度正回顧後發斷言)。

從左到右對文本進行匹配,判斷是否符合exp表達式。

名字

表達式

如果子表達式成功則

positive lookahead

(零寬度正預測先行斷言)

(?=subexp)

如果匹配到右邊則成功

negative lookahead

(零寬度負預測先行斷言)

(?!subexp)

如果沒有匹配到右邊則成功

註:成功就是找到對應的

位置

1.2 lookahead 向前看-找到匹配內容前面的位置

技術分享

如圖所示:首先這個是lookahead(向前看)他匹配exp這個詞(oldboy)之前的一個位置,同時是 positive lookahead是表示匹配到exp就成功的意思。

註:先理解lookahead的含義。然後對比理解positive lookahead和negative lookahead的區別。

1.3 lookbehind 向後看,找到匹配內容的後面的位置

lookbehind(向後看),從右向左匹配,判斷是否符合exp表達式。

名字

表達式

如果子表達式成功則

positive lookbehind

(零寬度正回顧後發斷言)

(?<=subexp)

如果匹配到左邊則成功

negative lookbehind

(零寬度負回顧後發斷言)

(?<!subexp)

如果沒有匹配到左邊則成功

#註:成功就是找到對應的位置

技術分享

1.4 lookahead lookbehind區別

技術分享

如圖所示lookahead匹配的位置是在subexp之前,lookbehind匹配的位置是在subexp之後。

1.5 perl常用的轉義字符

轉義字符

含義

\b

單詞的邊界。

\w

表示[a-zA-Z0-9_]中任意一個字符

\W

\w相反表示不在[a-zA-Z0-9_]中的任意字符

\d

[0-9]中的一個數字

\D

不在[0-9]中的任意字符

1.6 案例1:實戰演示:取IP地址

基本格式,紅色就是我們的目標。


[[email protected] oldboy]# ifconfig eth0

eth0 Link encap:Ethernet HWaddr 00:0C:29:3A:C5:88

inet addr:192.168.85.50 Bcast:192.168.85.255 Mask:255.255.255.0

inet6 addr: fe80::20c:29ff:fe3a:c588/64 Scope:Link

UP BROADCAST RUNNING MULTICAST MTU:1500 Metric:1

RX packets:81923 errors:0 dropped:0 overruns:0 frame:0

TX packets:26480 errors:0 dropped:0 overruns:0 carrier:0

collisions:0 txqueuelen:1000

RX bytes:96099065 (91.6 MiB) TX bytes:3459424 (3.2 MiB)


方法一:使用positive lookahead(正常向前看,零寬度正預測先行斷言)

[[email protected] oldboy]# ifconfig eth0 | grep -oP "[0-9.]+(?= Bcast)"

192.168.85.50

[[email protected] oldboy]# ifconfig eth0 | grep -oP "[\d.]+(?= Bcast)"

192.168.85.50

說明:

1.這裏使用lookahead的時候要註意,Bcast前面有兩個空格,匹配時要註意他們。

2.前面已經說過,\d è[0-9]

方法二:使用positive lookbehind(正常向後看,零寬度正回顧後發斷言)


[[email protected] oldboy]# ifconfig eth0 | grep -oP ‘(?<=\baddr:)[\d.]+‘

192.168.85.50

方法三:使用零寬度負預測先行斷言

[[email protected] oldboy]# ifconfig eth0|grep -oP ‘addr:[\d\.]+(?![\d\.])‘

addr:192.168.85.50

但是去掉"addr:"還是需要使用lookbehind(向後看,零寬度正回顧後發斷言)


[[email protected] oldboy]# ifconfig eth0|grep -oP ‘(?<=addr:)[\d\.]+(?![\d\.])‘

192.168.85.50

方法四:使用零寬度負向回顧後發斷言


[[email protected] oldboy]# ifconfig eth0|grep -oP ‘(?<![\d\.])[\d\.]+(?) Bca‘

192.168.85.50 Bca

但是後面的去除需要使用使用零寬度正預測先行斷言


[[email protected] oldboy]# ifconfig eth0|grep -oP ‘(?<![\d\.])[\d\.]+(?)(?= Bca)‘

192.168.85.50


更多精彩關註老男孩linux培訓


本文出自 “老男孩linux培訓” 博客,請務必保留此出處http://oldboy.blog.51cto.com/2561410/1931019

老男孩帶你了解perl正則表達式中的零寬斷言