1. 程式人生 > >Oracle 查詢不區分大小寫 (正則函式)

Oracle 查詢不區分大小寫 (正則函式)

//不區分大小寫查詢

 REGEXP_LIKE(欄位名, '(" + keyword+ ")', 'i') " );

Oracle中的Like操作符使用'_'和'%'作為萬用字元,使用就像這樣:

SELECT name FROM test_like WHERE name like '_a%'

即匹配test_like表name列中第2個字母是a的所有行。但是注意,Oracle匹配時區分大小寫的。也就是說上面的查詢時無法查詢到name='SAas'這行的。

Oracle10g中提供的正則表示式功能可以很好的解決這個問題,當然這不是使用正則表示式函式的唯一優點,實際上它比Like操作符強大的多。

正則表示式的語法就不用多說了,現在大多數語言都支援正則表示式了。

下面主要介紹下Oracle中正表示式函式REGEXP_LIKE的使用:

  1. REGEXP_LIKE(x, pattern [, match_option])   
  2. 當源字串x匹配正則表示式pattern時,返回true。可以使用match_option修改預設匹配選項,該引數可以被設定為:   
  3. 'c', 說明在進行匹配時區分大小寫(預設選項)   
  4. 'i', 說明在進行匹配時不區分大小寫   
  5. 'n'   允許使用可以匹配任意字元的操作符(通常是'.')   
  6. 'm', 將x作為一個包含多行的字串  

舉個例子:

SELECT

 * FROM test_reg WHERE REGEXP_LIKE(name'(a)\1''i');  

上面的SQL語句匹配test_reg表中name列含有兩個連續字元'a'(不區分大小寫)的行,如name='SaAs'。此外,這裡我們還使用了正則表示式中的後引用語法——\n表示重複n次上次匹配的內容,此處(a)\1表示匹配兩個連續的字元'a'。

需要注意的是,後引用必須使用雙括號,否則會出現如下結果:

  1. SELECT * FROM test_reg WHERE REGEXP_LIKE(name'a\1''i')   
  2. ORA-12727: 正則表示式中的後向引用無效  

最後一點,不要混淆LIKE操作符的萬用字元和正則表示式的語法,也就是說不要再正則表示式中使用LIKE操作符中的萬用字元,如果這樣做會得到未知的結果,因為'_'和'%'會被正則表示式當做普通字元進行匹配。

比如下面這條SQL想要得到name='SaAs'這條記錄,但實際的查詢結果為空。

  1. SQL> SELECT * FROM test_reg WHERE REGEXP_LIKE(name'^_(a)\1''i');   
  2. NAME  
  3. ----------  

實際應該使用:

  1. SQL> SELECT * FROM test_reg WHERE REGEXP_LIKE(name'^.(a)\1''i');   
  2. NAME  
  3. ----------   
  4. SaAs  

Oracle使用正則表示式離不開這4個函式:

1。regexp_like

2。regexp_substr

3。regexp_instr

4。regexp_replace

看函式名稱大概就能猜到有什麼用了。

regexp_like 只能用於條件表示式,和 like 類似,但是使用的正則表示式進行匹配,語法很簡單:

regexp_like_condition

regexp_substr 函式,和 substr 類似,用於拾取合符正則表示式描述的字元子串,語法如下:

regexp_substr

regexp_instr 函式,和 instr 類似,用於標定符合正則表示式的字元子串的開始位置,語法如下:

regexp_instr

regexp_replace 函式,和 replace 類似,用於替換符合正則表示式的字串,語法如下:

regexp_replace

這裡解析一下幾個引數的含義:

1。source_char,輸入的字串,可以是列名或者字串常量、變數。

2。pattern,正則表示式。

3。match_parameter,匹配選項。

取值範圍: i:大小寫不敏感; c:大小寫敏感;n:點號 . 不匹配換行符號;m:多行模式;x:擴充套件模式,忽略正則表示式中的空白字元。

4。position,標識從第幾個字元開始正則表示式匹配。

5。occurrence,標識第幾個匹配組。

6。replace_string,替換的字串。

說了一堆文縐縐的,現在開始例項演練了,在此之前先建好一個表。

01 create table tmp as

02 with data as (

03   select 'like' as id ,'a9999' as str from dual union all

04   select 'like'       ,'a9c'          from dual union all

05   select 'like'       ,'A7007'        from dual union all

06   select 'like'       ,'123a34cc'     from dual union all

07   select 'substr'     ,'123,234,345'  from dual union all

08   select 'substr'     ,'12,34.56:78'  from dual union all

09   select 'substr'     ,'123456789'    from dual union all

10   select 'instr'      ,'192.168.0.1'  from dual union all

11   select 'replace'    ,'(020)12345678' from dual union all

12   select 'replace'    ,'001517729C28' from dual

13 )

14 select * from data ;

15

16 select * from tmp ;

17 ID      STR

18 ------- -------------

19 like    a9999

20 like    a9c

21 like    A7007

22 like    123a34cc

23 substr  123,234,345

24 substr  12,34.56:78

25 substr  123456789

26 instr   192.168.0.1

27 replace (020)12345678

28 replace 001517729C28

regexp_like 例子:

01 select str from tmp where id='like' and regexp_like(str,'A\d+','i'); -- 'i' 忽略大小寫

02 STR

03 -------------

04 a9999

05 a9c

06 A7007

07 123a3

4cc

08

09 select str from tmp where id='like' and regexp_like(str, 'a\d+');

10 STR

11 -------------

12 a9999

13 a9c

14 123a34cc

15

16 select str from tmp where id='like' and regexp_like(str,'^a\d+');

17 STR

18 -------------

19 a9999

20 a9c

21

22 select str from tmp where id='like' and regexp_like(str,'^a\d+$');

23 STR

24 -------------

25 a9999

regexp_substr 例子:

01 col str format a15;

02 select

03   str,

04   regexp_substr(str,'[^,]+')     str,

05   regexp_substr(str,'[^,]+',1,1) str,

06   regexp_substr(str,'[^,]+',1,2) str,  -- occurrence 第幾個匹配組

07   regexp_substr(str,'[^,]+',2,1) str   -- position 從第幾個字元開始匹配

08 from tmp

09 where id='substr';

10 STR             STR             STR             STR             STR

11 --------------- --------------- --------------- --------------- ---------------

12 123,234,345     123             123             234             23

13 12,34.56:78     12              12              34.56:78        2

14 123456789       123456789       123456789                       23456789

15

16 select

17   str,

18   regexp_substr(str,'\d')        str,

19   regexp_substr(str,'\d+'  ,1,1) str,

20   regexp_substr(str,'\d{2}',1,2) str,

21   regexp_substr(str,'\d{3}',2,1) str

22 from tmp

23 where id='substr';

24 STR             STR             STR             STR             STR

25 --------------- --------------- --------------- --------------- ---------------

26 123,234,345     1               123             23              234

27 12,34.56:78     1               12              34

28 123456789       1               123456789       34              234

29

30

31 select regexp_substr('123456789','\d',1,level) str  --取出每位數字,有時這也是行轉列的方式

32 from dual

33 connect by level<=9

34 STR

35 ---------------

36 1

37 2

38 3

39 4

40 5

41 6

42 7

43 8

44 9

regex_instr 例子:

01 col ind format 9999;

02 select

03   str,

04   regexp_instr(str,'\.'    ) ind ,

05   regexp_instr(str,'\.',1,2) ind ,

06   regexp_instr(str,'\.',5,2) ind

07 from tmp where id='instr';

08 STR               IND   IND   IND

09 --------------- ----- ----- -----

10 192.168.0.1         4     8    10

11

12 select

13   regexp_instr('192.168.0.1','\.',1,level) ind ,  -- 點號. 所在的位置

14   regexp_instr('192.168.0.1','\d',1,level) ind    -- 每個數字的位置

15 from dual

16 connect by level <=  9

17   IND   IND

18 ----- -----

19     4     1

20     8     2

21    10     3

22     0     5

23     0     6

24     0     7

25     0     9

26     0    11

27     0     0

regex_replace 例子:

01 select

02   str,

03   regexp_replace(str,'020','GZ') str,

04   regexp_replace(str,'(\d{3})(\d{3})','<\2\1>') str -- 將第一、第二捕獲組交換位置,用尖括號標識出來

05 from tmp

06 where id='replace';

07 STR             STR             STR

08 --------------- --------------- ---------------

09 (020)12345678   (GZ)12345678    (020)<456123>78

10 001517729C28    001517729C28    <517001>729C28

綜合應用的例子:

01 col row_line format a30;

02 with sudoku as (

03   select '020000080568179234090000010030040050040205090070080040050000060289634175010000020' as line

04   from dual

05 ),

06 tmp as (

07   select regexp_substr(line,'\d{9}',1,level) row_line,

08   level col

09   from sudoku

10   connect by level<=9

11 )

12 select regexp_replace( row_line ,'(\d)(\d)(\d)(\d)(\d)(\d)(\d)(\d)(\d)','\1 \2 \3 \4 \5 \6 \7 \8 \9') row_line

13 from tmp

14

15 ROW_LINE

16 ------------------------------

17 0 2 0 0 0 0 0 8 0

18 5 6 8 1 7 9 2 3 4

19 0 9 0 0 0 0 0 1 0

20 0 3 0 0 4 0 0 5 0

21 0 4 0 2 0 5 0 9 0

22 0 7 0 0 8 0 0 4 0

23 0 5 0 0 0 0 0 6 0

24 2 8 9 6 3 4 1 7 5

25 0 1 0 0 0 0 0 2 0