1. 程式人生 > >(一)MySQL高階——索引(上)

(一)MySQL高階——索引(上)

一、索引

是幫助mysql高效獲取資料的資料結構。索引的本質就是資料結構,可以簡單理解為:“排好序的快速查詢資料結構”

或者這樣去理解:在資料之外,資料庫系統還維護著滿足特定查詢演算法的資料結構,這些資料結構以某種方式引用(可以理解為指向)資料,這樣就可以在這些資料結構上實現高階查詢演算法。這種資料結構,就是索引。下圖就是一種可能的索引方式示例:

左邊是資料表,一共有兩列七條記錄,最左邊的是資料記錄的實體地址。為了加快Col2的查詢,可以維護一個右邊所示的二叉查詢樹,每個節點分別包含索引鍵值和一個指向對應資料記錄實體地址的指標,這樣就可以運用二叉查詢在一定的複雜度內獲取到相應資料,從而快速的檢索出符合條件的記錄。

一般來說,索引本身也很大, 不可能全部儲存在記憶體中,因此索引往往以索引檔案的形式儲存在磁碟上。

平時常說的索引,如果沒有特別指明,都是指B樹(多路搜尋樹,並不一定是二叉的)結構組織的索引。其中聚集索引,次要索引,覆蓋索引,複合索引,字首索引,唯一索引預設都是使用B+樹索引,統稱索引。當然,除了B+樹這種型別的索引之外,還有雜湊索引等等。

二、索引的優勢

類似圖書館建書目索引,提高資料檢索的效率,降低資料庫的IO成本;

通過索引列對資料進行排序,降低資料排序的成本,降低了CPU的消耗。

三、索引的劣勢

實際上索引也是一張表,該表儲存了主鍵和索引欄位,並指向實體表的記錄,所以索引列也是要佔用空間的。

雖然索引大大提高了查詢速度,同時卻會降低更新表的速度,如對錶進行INSERT、UPDATE和DELETE。因為更新表時,Mysql不僅要儲存資料,還要儲存一下索引檔案每次更新添加了索引列的欄位,都會調整因為更新所帶來的鍵值變化後的索引資訊。

索引只是提高效率的一個因素,如果你的Mysql有大資料量的表,就需要花時間研究建立最優秀的索引,或者優化查詢。

四、索引分類

單值索引:即一個索引只包含單個列,一個表可以有多個單列索引 

唯一索引:索引列的值必須唯一,但允許有空值

複合索引:即一個索引包含多個列

五、索引的基本語法

建立

CREATE [UNIQUE] INDEX indexName ON mytable(columnname(length));
-- 或者
ALTER mytable ADD [UNIQUE] INDEX [indexName] ON (columnname(lengeh));

刪除

DROP INDEX [indexName] ON mytable;

檢視

SHOW INDEX FROM table_name\G

另外補充:使用ALTER命令(有四種方式來新增資料表的索引)

-- 該語句新增一個主鍵,這意味著索引值必須使唯一的,且不能為NULL 
ALTER TABLE tbl_name ADD PRIMARY KEY (column_list)

-- 這條語句建立索引的值必須使唯一的(除了NULL外,NULL可能會出現多次)。
ALTER TABLE tbl_name ADD UNIQUE index_name(column_list)

-- 新增普通索引,索引值可出現多次
ALTER TABLE tbl_name ADD INDEX index_name(column_list)

-- 該語句指定了索引為FULLTEXT,用於全文索引
ALTER TABLE tbl_name ADD FULLTEXT index_name (column_list)

六、適合建立索引的情況

1、主鍵自動建立唯一索引

2、頻繁作為查詢條件的欄位應該建立索引

3、查詢中與其他表關聯的欄位,外來鍵關係建立索引

4、查詢中排序的欄位,排序欄位若通過索引去訪問將大大提高排序速度

5、查詢中統計或者分組欄位

6、單鍵或組合索引的選擇問題(在高併發下傾向建立組合索引)

7、資料重複且分佈平均的表字段,因此應該只為最經常查詢和最經常排序的資料列建立索引

七、不適合建立索引的情況

1、頻繁更新的欄位不適合建立索引,因為每次更新不單單是更新了記錄,還會更新索引

2、Where條件裡用不到的欄位不建立索引

3、表記錄太少

4、經常增刪改的表:提高了查詢速度,同事卻會降低更新表的速度,如對錶進行INSERT、DELETE和UPDATE。因為更新表時,MySQL不僅要儲存資料,還要儲存一下索引檔案

5、如果某個資料列包含許多重複的內容,為它建立索引就沒有太大的實際效果。可以通話以下的話理解這個效果的含義:

假如一個表有10萬行記錄,有一個欄位A只有T和F兩種值,且每個值的分佈概率大約為50%,那麼對這種表A欄位建立索引一般不會提高資料庫的查詢速度。

索引的選擇性是指索引列中不同值的數目與表中記錄數的比。如果一個表中有2000條記錄,表索引列有1980個不同的值,那麼這個索引的選擇性就是1980/2000=0.99。一個索引的選擇性越接近於1,這個索引的效率就越高。

八、效能分析知識

1、MySQL Query Optimizer 

2、MySQL常見瓶頸

CPU:CPU在飽和的時候一般發生在資料裝入記憶體或從磁碟上讀取資料時候

IO:磁碟I/O瓶頸發生在裝入資料遠大於記憶體容量的時候

伺服器硬體的效能瓶頸:top,free,iostat和vmstat來檢視系統的效能狀態

3、Explain