MySQL組合索引和最左匹配原則
當我們的where查詢存在多個條件查詢的時候,我們需要對查詢的列建立組合索引
為什麼不對沒一列建立索引
- 減少開銷
- 覆蓋索引
- 效率高
減少開銷:假如對col1、col2、col3建立組合索引,相當於建立了(col1)、(col1,col2)、(col1,col2,col3)3個索引
覆蓋索引:假如查詢SELECT col1, col2, col3 FROM 表名,由於查詢的欄位存在索引頁中,那麼可以從索引中直接獲取,而不需要回表查詢
效率高:對col1、col2、col3三列分別建立索引,MySQL只會選擇辨識度高的一列作為索引。假設有100w的資料,一個索引篩選出10%的資料,那麼可以篩選出10w的資料;對於組合索引而言,可以篩選出100w*10%*10%*10%=1000條資料
最左匹配原則
假設我們建立(col1,col2,col3)這樣的一個組合索引,那麼相當於對col1列進行排序,也就是我們建立組合索引,以最左邊的為準,只要查詢條件中帶有最左邊的列,那麼查詢就會使用到索引
建立測試表
CREATE TABLE `student` ( `id` int(11) NOT NULL, `name` varchar(10) NOT NULL, `age` int(11) NOT NULL, PRIMARY KEY (`id`), KEY `idx_id_name_age` (`id`,`name`,`age`) ) ENGINE=InnoDB DEFAULT CHARSET=utf8 複製程式碼
填充100w測試資料
DROP PROCEDURE pro10; CREATE PROCEDURE pro10() BEGIN DECLARE i INT; DECLARE char_str varchar(100) DEFAULT 'abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789'; DECLARE return_str varchar(255) DEFAULT ''; DECLARE age INT; SET i = 1; WHILE i < 5000000 do SET return_str = substring(char_str, FLOOR(1 + RAND()*62), 8); SET i = i+1; SET age = FLOOR(RAND() * 100); INSERT INTO student(id, name, age) values(i, return_str, age); END WHILE; END; CALL pro10(); 複製程式碼
場景測試
EXPLAIN SELECT * FROM student WHERE id = 2; 複製程式碼
可以看到該查詢使用到了索引
EXPLAIN SELECT * FROM student WHERE id = 2 AND name = 'defghijk'; 複製程式碼
可以看到該查詢使用到了索引
EXPLAIN SELECT * FROM student WHERE id = 2 AND name = 'defghijk' and age = 8; 複製程式碼
可以看到該查詢使用到了索引
EXPLAIN SELECT * FROM student WHERE id = 2 AND age = 8; 複製程式碼
可以看到該查詢使用到了索引
EXPLAIN SELECT * FROM student WHERE name = 'defghijk' AND age = 8; 複製程式碼
可以看到該查詢沒有使用到索引,型別為index,查詢行數為4989449,幾乎進行了全表掃描,由於組合索引只針對最左邊的列進行了排序,對於name、age只能進行全部掃描
EXPLAIN SELECT * FROM student WHERE name = 'defghijk' AND id = 2; EXPLAIN SELECT * FROM student WHERE age = 8 AND id = 2; EXPLAIN SELECT * FROM student WHEREname = 'defghijk' and age = 8 AND id = 2; 複製程式碼
可以看到如上查詢也使用到了索引,id放前面和放後面查詢到的結果是一樣的,MySQL會找出執行效率最高的一種查詢方式,就是先根據id進行查詢