Oracle 查詢不區分大小寫 (正則函式)
REGEXP_LIKE(欄位名, '(" + keyword+ ")', 'i') " );
Oracle中的Like操作符使用'_'和'%'作為萬用字元,使用就像這樣:
SELECT name FROM test_like WHERE name like '_a%';
即匹配test_like表name列中第2個字母是a的所有行。但是注意,Oracle匹配時區分大小寫的。也就是說上面的查詢時無法查詢到name='SAas'這行的。
Oracle10g中提供的正則表示式功能可以很好的解決這個問題,當然這不是使用正則表示式函式的唯一優點,實際上它比Like操作符強大的多。
正則表示式的語法就不用多說了,現在大多數語言都支援正則表示式了。
下面主要介紹下Oracle中正表示式函式REGEXP_LIKE的使用:
- REGEXP_LIKE(x, pattern [, match_option])
- 當源字串x匹配正則表示式pattern時,返回true。可以使用match_option修改預設匹配選項,該引數可以被設定為:
- - 'c', 說明在進行匹配時區分大小寫(預設選項)
- - 'i', 說明在進行匹配時不區分大小寫
- - 'n' 允許使用可以匹配任意字元的操作符(通常是'.')
- - 'm', 將x作為一個包含多行的字串
舉個例子:
SELECT
上面的SQL語句匹配test_reg表中name列含有兩個連續字元'a'(不區分大小寫)的行,如name='SaAs'。此外,這裡我們還使用了正則表示式中的後引用語法——\n表示重複n次上次匹配的內容,此處(a)\1表示匹配兩個連續的字元'a'。
需要注意的是,後引用必須使用雙括號,否則會出現如下結果:
- SELECT * FROM test_reg WHERE REGEXP_LIKE(name, 'a\1', 'i')
- ORA-12727: 正則表示式中的後向引用無效
最後一點,不要混淆LIKE操作符的萬用字元和正則表示式的語法,也就是說不要再正則表示式中使用LIKE操作符中的萬用字元,如果這樣做會得到未知的結果,因為'_'和'%'會被正則表示式當做普通字元進行匹配。
比如下面這條SQL想要得到name='SaAs'這條記錄,但實際的查詢結果為空。
- SQL> SELECT * FROM test_reg WHERE REGEXP_LIKE(name, '^_(a)\1', 'i');
- NAME
- ----------
實際應該使用:
- SQL> SELECT * FROM test_reg WHERE REGEXP_LIKE(name, '^.(a)\1', 'i');
- NAME
- ----------
- SaAs
Oracle使用正則表示式離不開這4個函式:
1。regexp_like
2。regexp_substr
3。regexp_instr
4。regexp_replace
看函式名稱大概就能猜到有什麼用了。
regexp_like 只能用於條件表示式,和 like 類似,但是使用的正則表示式進行匹配,語法很簡單:
regexp_substr 函式,和 substr 類似,用於拾取合符正則表示式描述的字元子串,語法如下:
regexp_instr 函式,和 instr 類似,用於標定符合正則表示式的字元子串的開始位置,語法如下:
regexp_replace 函式,和 replace 類似,用於替換符合正則表示式的字串,語法如下:
這裡解析一下幾個引數的含義:
1。source_char,輸入的字串,可以是列名或者字串常量、變數。
2。pattern,正則表示式。
3。match_parameter,匹配選項。
取值範圍: i:大小寫不敏感; c:大小寫敏感;n:點號 . 不匹配換行符號;m:多行模式;x:擴充套件模式,忽略正則表示式中的空白字元。
4。position,標識從第幾個字元開始正則表示式匹配。
5。occurrence,標識第幾個匹配組。
6。replace_string,替換的字串。
說了一堆文縐縐的,現在開始例項演練了,在此之前先建好一個表。
01 create table tmp as
02 with data as (
03 select 'like' as id ,'a9999' as str from dual union all
04 select 'like' ,'a9c' from dual union all
05 select 'like' ,'A7007' from dual union all
06 select 'like' ,'123a34cc' from dual union all
07 select 'substr' ,'123,234,345' from dual union all
08 select 'substr' ,'12,34.56:78' from dual union all
09 select 'substr' ,'123456789' from dual union all
10 select 'instr' ,'192.168.0.1' from dual union all
11 select 'replace' ,'(020)12345678' from dual union all
12 select 'replace' ,'001517729C28' from dual
13 )
14 select * from data ;
15
16 select * from tmp ;
17 ID STR
18 ------- -------------
19 like a9999
20 like a9c
21 like A7007
22 like 123a34cc
23 substr 123,234,345
24 substr 12,34.56:78
25 substr 123456789
26 instr 192.168.0.1
27 replace (020)12345678
28 replace 001517729C28
regexp_like 例子:
01 select str from tmp where id='like' and regexp_like(str,'A\d+','i'); -- 'i' 忽略大小寫
02 STR
03 -------------
04 a9999
05 a9c
06 A7007
07 123a3
4cc
08
09 select str from tmp where id='like' and regexp_like(str, 'a\d+');
10 STR
11 -------------
12 a9999
13 a9c
14 123a34cc
15
16 select str from tmp where id='like' and regexp_like(str,'^a\d+');
17 STR
18 -------------
19 a9999
20 a9c
21
22 select str from tmp where id='like' and regexp_like(str,'^a\d+$');
23 STR
24 -------------
25 a9999
regexp_substr 例子:
01 col str format a15;
02 select
03 str,
04 regexp_substr(str,'[^,]+') str,
05 regexp_substr(str,'[^,]+',1,1) str,
06 regexp_substr(str,'[^,]+',1,2) str, -- occurrence 第幾個匹配組
07 regexp_substr(str,'[^,]+',2,1) str -- position 從第幾個字元開始匹配
08 from tmp
09 where id='substr';
10 STR STR STR STR STR
11 --------------- --------------- --------------- --------------- ---------------
12 123,234,345 123 123 234 23
13 12,34.56:78 12 12 34.56:78 2
14 123456789 123456789 123456789 23456789
15
16 select
17 str,
18 regexp_substr(str,'\d') str,
19 regexp_substr(str,'\d+' ,1,1) str,
20 regexp_substr(str,'\d{2}',1,2) str,
21 regexp_substr(str,'\d{3}',2,1) str
22 from tmp
23 where id='substr';
24 STR STR STR STR STR
25 --------------- --------------- --------------- --------------- ---------------
26 123,234,345 1 123 23 234
27 12,34.56:78 1 12 34
28 123456789 1 123456789 34 234
29
30
31 select regexp_substr('123456789','\d',1,level) str --取出每位數字,有時這也是行轉列的方式
32 from dual
33 connect by level<=9
34 STR
35 ---------------
36 1
37 2
38 3
39 4
40 5
41 6
42 7
43 8
44 9
regex_instr 例子:
01 col ind format 9999;
02 select
03 str,
04 regexp_instr(str,'\.' ) ind ,
05 regexp_instr(str,'\.',1,2) ind ,
06 regexp_instr(str,'\.',5,2) ind
07 from tmp where id='instr';
08 STR IND IND IND
09 --------------- ----- ----- -----
10 192.168.0.1 4 8 10
11
12 select
13 regexp_instr('192.168.0.1','\.',1,level) ind , -- 點號. 所在的位置
14 regexp_instr('192.168.0.1','\d',1,level) ind -- 每個數字的位置
15 from dual
16 connect by level <= 9
17 IND IND
18 ----- -----
19 4 1
20 8 2
21 10 3
22 0 5
23 0 6
24 0 7
25 0 9
26 0 11
27 0 0
regex_replace 例子:
01 select
02 str,
03 regexp_replace(str,'020','GZ') str,
04 regexp_replace(str,'(\d{3})(\d{3})','<\2\1>') str -- 將第一、第二捕獲組交換位置,用尖括號標識出來
05 from tmp
06 where id='replace';
07 STR STR STR
08 --------------- --------------- ---------------
09 (020)12345678 (GZ)12345678 (020)<456123>78
10 001517729C28 001517729C28 <517001>729C28
綜合應用的例子:
01 col row_line format a30;
02 with sudoku as (
03 select '020000080568179234090000010030040050040205090070080040050000060289634175010000020' as line
04 from dual
05 ),
06 tmp as (
07 select regexp_substr(line,'\d{9}',1,level) row_line,
08 level col
09 from sudoku
10 connect by level<=9
11 )
12 select regexp_replace( row_line ,'(\d)(\d)(\d)(\d)(\d)(\d)(\d)(\d)(\d)','\1 \2 \3 \4 \5 \6 \7 \8 \9') row_line
13 from tmp
14
15 ROW_LINE
16 ------------------------------
17 0 2 0 0 0 0 0 8 0
18 5 6 8 1 7 9 2 3 4
19 0 9 0 0 0 0 0 1 0
20 0 3 0 0 4 0 0 5 0
21 0 4 0 2 0 5 0 9 0
22 0 7 0 0 8 0 0 4 0
23 0 5 0 0 0 0 0 6 0
24 2 8 9 6 3 4 1 7 5
25 0 1 0 0 0 0 0 2 0