1. 程式人生 > >SQL中的正則表示式(REGEXP)

SQL中的正則表示式(REGEXP)

   SQL的查詢語句中,有時會需要引進正則表示式為其複雜搜尋指定模式。下面給出一些Regexp在MYSQL語句中應用(非全部):
1) ^
匹配字串的開始部分。
mysql> SELECT 'fo/nfo' REGEXP '^fo$';                   -> 0
mysql> SELECT 'fofo' REGEXP '^fo';                      -> 1
2) $

匹配字串的結束部分。

mysql> SELECT 'fo/no' REGEXP '^fo/no$';                 -> 1
mysql> SELECT 'fo/no' REGEXP '^fo$';                    -> 0
3) .

匹配任何字元(包括回車和新行)。

mysql> SELECT 'fofo' REGEXP '^f.*$';                    -> 1
mysql> SELECT 'fo/r/nfo' REGEXP '^f.*$';                -> 1

4) [:character_class:]

在括號表示式中(使用[和]),[:character_class:]表示與術語類的所有字元匹配的字元類。標準的類名稱是:

alnum

文字數字字元

alpha

文字字元

blank

空白字元

cntrl

控制字元

digit

數字字元

graph

圖形字元

lower

小寫文字字元

print

圖形或空格字元

punct

標點字元

space

空格、製表符、新行、和回車

upper

大寫文字字元

xdigit

十六進位制數字字元

它們代表在ctype(3)手冊頁面中定義的字元類。

特定地區可能會提供其他類名。字元類不得用作範圍的端點。

mysql> SELECT 'justalnums' REGEXP '[[:alnum:]]+';       -> 1

mysql> SELECT '!!' REGEXP '[[:alnum:]]+';               -> 0

5) [[:<:]], [[:>:]]

這些標記表示word邊界。它們分別與word的開始和結束匹配。word是一系列字字元,其前面和後面均沒有字字元。字字元是alnum類中的字母數字字元或下劃線(_)。

mysql> SELECT 'a word a' REGEXP '[[:<:]]word[[:>:]]';   -> 1
mysql> SELECT 'a xword a' REGEXP '[[:<:]]word[[:>:]]';  -> 0

要想在正則表示式中使用特殊字元的文字例項,應在其前面加上2個反斜槓“/”字元。MySQL解析程式負責解釋其中一個,正則表示式庫負責解釋另一個。例如,要想與包含特殊字元“+”的字串“1+2”匹配,在下面的正則表示式中,只有最後一個是正確的:

mysql> SELECT '1+2' REGEXP '1+2';                       -> 0
mysql> SELECT '1+2' REGEXP '1/+2';                      -> 0
mysql> SELECT '1+2' REGEXP '1//+2';                     -> 1

  其他的有關Regexp的語法,可直接參考下表:
字元 含意
/

做為轉意,即通常在"/"後面的字元不按原來意義解釋,如/b/匹配字元"b",當b前面加了反斜杆後//b/,轉意為匹配一個單詞的邊界。
-或-
對正則表示式功能字元的還原,如"*"匹配它前面元字元0次或多次,/a*/將匹配a,aa,aaa,加了"/"後,/a/*/將只匹配"a*"。

^ 匹配一個輸入或一行的開頭,/^a/匹配"an A",而不匹配"An a"
$ 匹配一個輸入或一行的結尾,/a$/匹配"An a",而不匹配"an A"
* 匹配前面元字元0次或多次,/ba*/將匹配b,ba,baa,baaa
+ 匹配前面元字元1次或多次,/ba*/將匹配ba,baa,baaa
? 匹配前面元字元0次或1次,/ba*/將匹配b,ba
(x) 匹配x儲存x在名為$1...$9的變數中
x|y 匹配x或y
{n} 精確匹配n次
{n,} 匹配n次以上
{n,m} 匹配n-m次
[xyz] 字符集(character set),匹配這個集合中的任一一個字元(或元字元)
[^xyz] 不匹配這個集合中的任何一個字元
[/b] 匹配一個退格符
/b 匹配一個單詞的邊界
/B 匹配一個單詞的非邊界
/cX 這兒,X是一個控制符,//cM/匹配Ctrl-M
/d 匹配一個字數字符,//d/ = /[0-9]/
/D 匹配一個非字數字符,//D/ = /[^0-9]/
/n 匹配一個換行符
/r 匹配一個回車符
/s 匹配一個空白字元,包括/n,/r,/f,/t,/v等
/S 匹配一個非空白字元,等於/[^/n/f/r/t/v]/
/t 匹配一個製表符
/v 匹配一個重直製表符
/w 匹配一個可以組成單詞的字元(alphanumeric,這是我的意譯,含數字),包括下劃線,如[/w]匹配"$5.98"中的5,等於[a-zA-Z0-9]
/W 匹配一個不可以組成單詞的字元,如[/W]匹配"$5.98"中的$,等於[^a-zA-Z0-9]。