1. 程式人生 > >MySQL快速回顧:高階查詢操作

MySQL快速回顧:高階查詢操作

8.1 排序資料

檢索出的資料並不是以純粹的隨機順序顯示的。如果不排序,資料一般將以它在底層表中出現的順序顯示。這可以是資料最初新增到表中的順序。但是,如果資料後來進行過更新或刪除,則此順序將會受到MySQL重用回收儲存空間的影響。因此,如果不明確控制的話,不能依賴該排序順序。

關係資料庫設計理論認為,如果不明確規定排序順序,則不應該假定檢索出的資料的順序有意義。

子句的解釋:一個子句通常由一個關鍵字和所提供的資料組成。SQL語句由子句構成,有些子句是必需的,而有些是可選的。

為了明確地排序用SELECT語句檢索出的資料,可使用ORDER BY子句。ORDER BY子句取一個或多個列的名字,據此對輸出進行排序。排序順序有兩種:升序(ASC關鍵字)和降序(DESC關鍵字),

格式:

# 升序(預設不寫就是升序)
SELECT field1,field2,... FROM <table_name> ORDER BY field1,field2,...;
SELECT field1,field2,... FROM <table_name> ORDER BY field1,field2,... ;
# 降序
SELECT field1,field2,... FROM <table_name> ORDER BY field1,field2,... DESC;
# 對field1降序,對field2升序(類似這樣的例子也是可以的)
SELECT field1,field2,... FROM <table_name> ORDER BY field1 DESC,field2 ASC,... ;

注意:

  • 通常,BRDER BY子句中使用的列將是為顯示所選擇的列,但是,實際上並不一定要這樣,用非檢索的列排序資料也是完全合法的。
  • 對於多列的排序,僅在多個行具有相同的field1值時才會按field2排序。也就是優先按ORDER BY子句後的第一個列進行排序,當遇到相同的列,則會按照ORDER BY子句後的第二列來排序,以此類推。
  • 也可以先對ORDER BY子句後的第一個列進行升序或降序,對ORDER BY子句後的第二個列進行降序或升序。
  • 在對文字資料性的資料進行排序時,A與a相同嗎?a位於B之前還是位於Z之後?這些問題不是理論問題,其答案取決於資料庫如何設定。
  • 在字典(dictionary)排序順序中,A被視為與a相同,這是MySQL(和大多數資料庫管理系統)的預設行為。但是,許多資料庫管理員能夠在需要時改變這種行為(如果資料庫包含大量外語字元,可能必須這樣做)。如果確實需要改變這種排序順序,用ORDER BY子句做不到,必須要有資料庫管理員的幫助。
  • ORDER BY子句的位置,應該保證它位於FROM 子句之後。 因為很多關鍵字是可以組合一起的,比如使用LIMIT,它必須位於ORDER BY子句之後。使用子句的次序不對將產生錯誤訊息。
  • 對於字串(varchar)的排序:
    • 對於英文字串的排序,一般會根據字串的首字母:大些字母>小寫字母>特殊字元>數字。如果首位相同繼續排列第二位,直到不同的位。
    • 對於中文的排序:中文字串都大於英文字串,其他的還得根據資料庫所設定的字符集。比如UTF8,GBK等。對於GBK直接排序即可,對於UTF8需要對欄位進行轉碼後排序。然後會從中文字串的第一個字元的首個字母開始排序。
# UTF8
SELECT fiedl1,... FROM <表名>
    ORDER BY CONVERT(field1 using gbk);

單列,多列的升序和降序排序例子就不說了,如果使用ORDER BY子句和LIMIT的組合,則可以找出表的一個列中的最大或最小的值。


小結:學習瞭如何用SELECT語句的ORDER BY子句對檢索出的資料進行排序。

8.2 過濾資料

如果想要按某條件從表中查詢資料,那麼就需要使用WHERE子句來指定搜尋條件(過濾條件)進行過濾。WHERE子句在表名(FROM子句)後給出。

格式:

SELECT  field1,field2,... FROM <表名> WHERE condition1 AND/OR condition2 ...;
  • 在同時使用ORDER BY和WHERE子句時,應該讓ORDER BY位於WHERE之後,否則將會產生錯誤。
  • MySQL在執行匹配時預設不區分大小寫。
  • 用非檢索的列做搜尋條件也是可以的。

搜尋條件是一個表示式,它支援以下操作符

操作符 說明
= 等於
<> 不等於
!= 不等於
< 小於
<= 小於等於
> 大於
>= 大於等於
BETWEEN..AND.. 在指定兩個值之間(都包括)

單值查詢:查詢學生表中名為李四的學生

SELECT stu_name, stu_sex FROM student WHERE stu_name='李四';

不匹配查詢:查詢學生表中女性的學生

SELECT stu_name, stu_sex FROM student WHERE stu_sex<>'男';

範圍查詢:查詢學生表中id從2到4的學生

SELECT stu_name, stu_sex FROM student WHERE stu_id BETWEEN 2 AND 4;
  • BETWEEN匹配範圍中所有的值,包括指定的開始值和結束值。

空值檢查:空值就是NULL,空值不是0不是空字串,使用WHERE子句也可以查詢,下面的例子不是很好,但搜尋條件的格式就是:IS NULL。

SELECT stu_name, stu_sex FROM student WHERE stu_sex IS NULL;

小結:介紹瞭如何使用SELECT語句的WHERE子句過濾返回的資料。也學習瞭如何對相等、不相等、大於、小於、值得範圍以及NULL值等測試。

8.3 組合WHERE子句

可以使用邏輯操作符來進行多個條件的組合查詢。

8.3.1 AND操作符

AND:用在WHERE子句中的關鍵字,表示檢索滿足所有給定條件的行。

格式:

SELECT  field1,field2,... FROM <表名> WHERE condition1 AND condition2 AND ...;

可以有多個過濾條件。

8.3.2 OR操作符

OR:用在WHERE子句中的關鍵字,表示檢索匹配任一給定條件的行。(也就是有任意一個條件滿足就輸出,不用全部同時匹配)

格式:

SELECT  field1,field2,... FROM <表名> WHERE condition1 OR condition2 OR ...;

8.3.3 計算次序

WHERE子句可包含任意數目的AND和OR操作符。並且允許兩者結合以進行復雜和高階的過濾。

但是要注意這兩個操作符的優先順序問題:MySQL優先處理AND操作符.

任何時候使用具有AND和OR操作符的WHERE子句,都應該使用圓括號明確地分組操作符。不要過分依賴預設計算次序,即使它確實是你想要的結果也是如此。而且使用圓括號也沒什麼壞處,還可以消除歧義。

8.3.4 IN操作符

IN:用來指定條件範圍,範圍中的每一個條件都可以進行匹配。IN取合法值的由逗號分隔的清單,全都括在圓括號中。

格式:

SELECT  field1,field2,... FROM <表名> WHERE field1 IN(n,m,...);

IN操作符跟OR操作符的功能是一樣的。

SELECT  field1,field2,... FROM <表名> WHERE field1 IN(n,m,...);
# 等於
SELECT  field1,field2,... FROM <表名> WHERE field1=n OR field1=m OR ...;

IN操作符的優點如下:

  • 在使用長的合法選項清單時,IN操作符的語法更清楚且更直觀。
  • 在使用IN時,計算的次序更容易管理(因為使用的操作符更少)。
  • IN操作符一般比OR操作符清單執行更快。
  • IN的最大優點是可以包含其他SELECT語句,使得能夠更動態地建立WHERE子句。(子查詢以後再說)

8.3.5 NOT操作符

WHERE子句中得NOT操作符有且只有一個功能,那就是否定它之後所跟得任何條件。

MySQL支援使用NOT對IN、BETWEEN和EXIST子句取反,這與多數其他DBMS允許使用NOT對各種條件取反有很大差別。

例子:

# 查詢學生表中學生的性別不為空的學生
SELECT stu_name, stu_sex FROM student WHERE stu_sex IS NOT NULL;
# 查詢學生表中學生的姓名不為小喬的學生
SELECT stu_name, stu_sex FROM student WHERE NOT stu_name='小喬';
# 如果是帶有邏輯運算子,NOT只作用於一個搜尋條件,除非用括號括起來
SELECT stu_name, stu_sex FROM student WHERE NOT (stu_name='小喬' OR stu_name='大喬');

8.4 用萬用字元進行過濾

前面的都是針對具體值過濾的。但有時需要進行模糊查詢,比如:查詢某個字元或子字串開頭的字串,有時查詢包含某個字元或子字串的字串,有時查詢某個字元或子字串結尾的字串。那麼就需要構造一個萬用字元搜尋模式來查詢。

萬用字元(wildcard):用來匹配值的一部分的特殊字元。萬用字元可以在搜尋模式中任意位置使用,並且可以使用多個萬用字元。

搜尋模式(search pattern)由字面值,萬用字元或兩者組合構成的搜尋條件

為在搜尋子句中使用萬用字元,必須使用LIKE操作符。LIKE操作符表示MySQL後跟的搜尋模式利用萬用字元匹配而不是直接相等匹配進行比較。

8.4.1 百分號萬用字元

百分號萬用字元(%):表示任何字元出現任意次數。也就是能夠匹配出現0次以上的字元。

# 以xx開頭或以XX開頭的字串
SELECT field1,field2,... FROM <table_name> WHERE field1 LIKE 'xx%';
# 包含xx或包含XX的字串
SELECT field1,field2,... FROM <table_name> WHERE field1 LIKE '%xx%';
# 以xx結尾或以XX結尾的字串
SELECT field1,field2,... FROM <table_name> WHERE field1 LIKE '%xx';

注意:MySQL是不區分大小寫的,也就是'xx%'可以匹配'XX%'和'xx%'。

如果想要在查詢時區分大小寫,可以加個BINARY關鍵字來區分大小寫:

# 包含xx的字串
SELECT field1,field2,... FROM <table_name> WHERE BINARY field1 LIKE '%xx%';

也可以在建立表的時候,在列定義上加上BINARY關鍵字,就表示該列區分大小寫。

CREATE TABLE <table_name>(
    field1 BINARY,
    ...
);

雖然看似%萬用字元可以匹配任何字元,但是有一個例外,即NULL。即使用搜索模式:'%',也不會匹配到NULL。

還得注意尾空格,尾空格可能會干擾萬用字元匹配,比如搜尋模式為:'%xx '(有個空格)就不會匹配以xx結尾或以XX結尾的字串,而是會匹配以xx 結尾(有個空格)或以XX 結尾(有個空格)的字串。即加了尾空格表示匹配具體的值了,即尾空格。如果想要避免,最好使用函式(TRIM(搜尋模式))來去掉。(函式待說,可以先看這個去空格的函式)

SELECT stu_name FROM student WHERE stu_name LIKE TRIM('%xx ');

8.4.2 下劃線萬用字元

下劃線萬用字元(_):只匹配單個字元。即1個,不能多也不能少,否則就沒有。

# 以xx開頭或以XX開頭長度為3的字串
SELECT field1,field2,... FROM <table_name> WHERE field1 LIKE 'xx_';
# 包含xx或包含XX長度為4的字串
SELECT field1,field2,... FROM <table_name> WHERE field1 LIKE '_xx_';
# 以xx結尾或以XX結尾長度為3的的字串
SELECT field1,field2,... FROM <table_name> WHERE field1 LIKE '_xx';

百分號萬用字元和下劃線萬用字元可以一起使用。

8.4.3 使用萬用字元的技巧

可能注意到了,在搜尋模式中不使用萬用字元,即具體值也可以匹配,如下:

SELECT field1,field2,... FROM <table_name> WHERE field1 LIKE 'xx';
# 等於
SELECT field1,field2,... FROM <table_name> WHERE field1 = 'xx%';

兩者都可以搜尋具體值,使用 哪種好?萬用字元搜尋的處理一般要比前面討論的其他搜尋所花時間更長。

下面給出使用萬用字元要記住的技巧:

  • 不要過渡使用萬用字元。如果其他操作符能達到相同的目的,應該使用其他操作符。
  • 在確實需要使用萬用字元時,除非絕對有必要,否則不要把它們用在搜尋模式的開始處。把萬用字元置於搜尋模式的開始處,搜尋起來是最慢的。
  • 仔細注意萬用字元的位置。如果放錯地方,可能不會返回想要的資料。

總結目前可以優化資料庫的點子:

  • 表定義資料型別的選擇;
  • 不要過渡使用萬用字元,要使用時,除非有必要,否則別使用萬用字元開搜尋模式的開始處。

小結:介紹瞭如何用AND和OR操作符組合成WHERE子句,而且還介紹瞭如何明確地管理計算的次序,如何使用IN和NOT操作符。

8.5 使用正則表示式進行搜尋

前面的過濾例子允許使用匹配、比較和通配操作符查詢資料。對於基本的過濾,學這些就足夠了。但是隨著過濾條件的複雜性的增加,WHERE子句本身的複雜性也有必要增加。

這就是正則表示式變得有用的地方。正則表示式是用來匹配文字的特殊的串(字元集合)。

下面只是做個基礎的正則表示式學習,如果要完整覆蓋正則表示式的以後再整。

正則表示式的作用是匹配文字,將一個模式(正則表示式)和一個文字串進行比較。MySQL用WHERE子句對正則表示式提供了初步的支援,,使用REGEXP關鍵字指定正則表示式,過濾SELECT檢索出的資料。

MySQL僅支援多數正則表示式實現的一個很小的子集。

8.5.1 基本字元匹配

格式:

# fieldN的N表示一個整數。
SELECT field1,field2,... FROM <table_name> WHERE fieldN REGEXP '字串';

比如:

# 會匹配包含喬的姓名的學生。
SELECT stu_name FROM student WHERE stu_name REGEXP '喬';

當然這個例子也可以使用LIKE和萬用字元來操作。下面說一下它們的區別:

  • LIKE匹配整個列。如果被匹配的文字在列值中出現,LIKE將不會找到它,相應的行也不被返回(除非使用萬用字元)。
  • REGEXP關鍵字在列值內進行匹配,如果被匹配的文字在列值中出現,REGEXP將會找到它,相應的行將被返回。

MySQL的正則表示式匹配還是不區分大小寫。如果要區分大小寫,使用BINARY關鍵字,上面也有說。比如:

..... WHERE BINARY fieldN REGEXP '...';
# 或
..... WHERE fieldN REGEXP BINARY  '...';

還可用使用 . (點),. (點)是正則表示式語言中一個特殊的字元,它表示匹配任意一個字元。

# fieldN的N表示一個整數。
SELECT field1,field2,... FROM <table_name> WHERE fieldN REGEXP '.字串';

注意:上面語句中的 .(點)是表示匹配任意一個字元。而不是表示普通鍵盤上的特殊字元.(點)。待會會將怎麼匹配特殊字元。

8.5.2 進行OR匹配

OR操作符前面講了,在這裡的功能也是一樣:為搜尋兩個串之一,但是注意寫法:

SELECT field1,field2,... FROM <table_name> WHERE fieldN REGEXP '字串1|字串2|...';

即:使用 | 表示OR操作符。

8.5.3 匹配幾個字元之一

正則表示式OR操作符的另一種寫法:[],比如:

SELECT field1,field2,... FROM <table_name> WHERE fieldN REGEXP '[字元1字元2...] ...';

[字元1字元2...]:定義一組字元,它的意思是 匹配字元1或匹配字元2等等。

也可以匹配字串

SELECT field1,field2,... FROM <table_name> WHERE fieldN REGEXP '[字串1, 字串2...] ...';

[字串1, 字串2...]:定義一組字串,匹配字串1或匹配字串1中的字元或匹配字串2或匹配字串2中的字元等等。

[] 形式的使用主要是用於有公共的部分,比如我要查詢姓周,周後面帶有 傑 或 雨 的同學(注意:不是包含)就可以這樣使用。

SELECT stu_name FROM student WHERE stu_name REGEXP BINARY '周[雨傑]';

匹配:周杰、周雨、周杰XXX、周雨XXX等。

按上面的例子,下面的這種寫法:

SELECT stu_name FROM student WHERE stu_name REGEXP BINARY '周杰|雨';

如果這樣寫,匹配的是:周杰或雨。

上面的例子除非把字元|括在一個集合中,如:(傑|雨),否則它將應用於整個串。 懂了為什麼有OR為什麼要有:[]的形式了吧。

字元集合還可以被否定,即,它們將匹配指定字元外的任何東西。只需要在集合的開始放置一個^即可。比如:[^123]表示匹配除1或2或3外的任何東西。

8.5.4 匹配範圍

集合可用來定義要匹配的一個或多個字元。例如,下面的集合將匹配數字0到9:

[0123456789]

為簡化這種型別的集合,可使用-來定義個範圍。下面的式子等同於上述數字列表:

[0-9]

範圍不限於完整的集合,[1-3]和[4-9]都是合法的範圍。

下面是一些基礎的字符集總結:

[abc]:表示可能是字元a或是字元b或是字元c中的任意一位
[^abc]:表示不是字元a或是字元b或是字元c中的任意一位
[a-z]:所有的小寫字母
[^a-z]: 不匹配所有的小寫字母
[a-zA-Z]:字母中的任意一位
[^a-zA-Z]或[^(a-zA-Z)]:不匹配字母
[A-Z]:所有的大寫字母
[^A-Z]:不匹配所有的大寫字母
[0-9]:表示任意一位數字(只有一位,則範圍為0到9)
[^0-9]:表示不是任意一位數字

8.5.5 匹配特殊字元

正則表示式語言由具有特定含義的特殊字元構成。比如前面學的.(點)、[]、|、-等,還有一些其他字元。但是這些字元是有特殊含義的,如果要匹配這些特殊字元要怎麼做?

為了匹配特殊字元,必須使用\\為前導。即:\\- 表示查詢特殊字元-; \\. 表示查詢特殊字元.(點),\\\ 表示查詢特殊字元。
這種處理稱為轉義(escaping),正則表示式內具有特殊意義的所有字元都必須以這種方式轉義。

\\也用來引用元字元(具有特殊含義的字元):

元字元 說明
\\f 換頁
\\n 換行
\\r 回車
\\t 製表
\\v 縱向製表

多半正則表示式實現使用單個反斜槓轉義特殊字元,以便能使用這些字元本身。但MySQL要求兩個反斜槓(MySQL自己解釋一個,正則表示式解釋另一個)

8.5.6 匹配字元類

存在找出自己經常使用的數字、所有的字母字元或所有數字字元等的匹配。為了方便工作,可用使用預定義的字符集,稱為字元類(character class)

說明
[:alnum:] 任意字母和數字(同[a-zA-Z0-9])
[:alpha:] 任意字元(同[a-zA-Z])
[:blank:] 空格和製表(同[\\t])
[:cntrl:] ASCII控制字元(ASCII 0到31和127)
[:digit:] 任意數字(同[0-9)
[:graph:] 與[:print:]相同,但不包括空格
[:lower:] 任意小寫字母(同[a-z])
[:print:] 任意可列印字元
[:punct:] 即不在[:alnum:]又不在[:cntrl:]中的任意字元
[:space:] 包括空格在內的任意空白字元(同[\\f\\n\\r\\t\\v])
[:upper:] 任意大寫字母(同[A-Z])
[:xdigit:] 任意十六進位制數字(同[a-fA-F0-9])

不用死記,忘了就看。

8.5.7 匹配多個例項

到目前為止的所有正則表示式都是試圖匹配單次出現。有時需要對匹配的數目進行更強的控制,那麼就需要下面的重複元字元來完成:

元字元 說明
* 0個或多個匹配
+ 1個或多個匹配(等一{1,})
? 0個或1個匹配(等於{0,1})
{n} 指定數目的匹配
{n,} 不少於指定數目的匹配
{n,m} 匹配數目的範圍(m不超過255)

比如:
匹配17級學生的所有學號,17級都是以2017開頭的,然後後面有8位任意數字

... REGEXP '2017[0-9]{8}';
# 或
... REGEXP '2017[[:digit:]]{8}';

[[:digit:]]{8}的解釋:[:digit:]匹配任意數字,因而它為數字的一個集合。{8}確切要求它前面的字元(任意數字)出現8次,所以應該寫成這樣[[:digit:]]{8}:匹配連在一起的任意4位數字。

當然也可以這樣寫:

... REGEXP '2017[0-9][0-9][0-9][0-9][0-9][0-9][0-9][0-9]';

8.5.8 定位符

目前為止的所有例子都是匹配一個串中的任意位置的文字。為了匹配特定的位置,需要定位符:
元字元 | 說明
---|---
^ | 文字的開始(^有兩種意義)
$ | 文字的結尾
[[:<:]] | 詞的開始
[[:>:]] | 詞的結尾

例如,如果想要找出以一個數(包括小數點開始的數)開始的所有產品,要怎麼辦?簡單搜尋[0-9\\.](或[[:digit:]\\.])嗎?這樣是不行的,因為它將在文字內的任意位置查詢匹配。解決的方式就是使用^定位符,如下:

... REGEXP '^[0-9\\.]';

^有兩種用法:

  1. 在集合中(用[和]定義),用它來否定改集合。比如:[^0-9] 表示查詢除任意一個數字外的串,只要有包含一個數字的就不匹配,不論位置在哪。
  2. 用來指串的開始處。比如:^[0-9] 表示在文字中查詢以一個數字開頭的串。

前面說過,LIKE匹配整個串而REGEXO匹配子串。利用定位符,通過用^開始每個表示式,用%結束每個表示式,可用是REGEXP的作用跟LIKE一樣。

額外:可用在不使用資料庫表的情況下用SELECT來測試正則表示式。REGEXP檢查總是返回0(不匹配)或1(匹配)。可用用待文字串的REGEXP來測試表達式。比如

SELECT 'hello' REGEXP '[0-9]';

結果很明顯返回0。


小結:介紹了正則表示式的基礎知識,學習瞭如何在MySQL的SELECT語句中通過REGEXP關鍵字使用它們