MySQL語句優化
使用索引的原則:
1.最左字首匹配原則。
mysql會一直向右匹配直到遇到範圍查詢(>、<、between、like)就停止匹配。所以要儘量把“=”條件放在前面,把這些條件放在最後。
不會用到b的索引:
where a=1 and c>0 and b=2
會用到b的索引:
where a=1 and b=2 and c>0
2.儘量選擇區分度高的列作為索引,區分度的公式是count(distinct col)/count(*),表示欄位不重複的比例,比例越大我們掃描的記錄數越少。
3.當取出的資料超過全表資料的20%時,不會使用索引。
4.使用like時注意:
不使用索引:
like ‘%L%’
使用索引:
like ‘L%’
5.儘量將or 轉換為 union all
不使用索引:
select * from user where name=’a’orage=’20’
使用索引:
select * from user where name=’a’union allselect * from user where age=’20’
6.欄位加函式不會使用索引。所以儘量把函式放在數值上
不使用索引:
where truncate(price) = 1
使用索引:
where price > 1 and price < 2
7.如果使用數字作為字元,則數字需要加引號,否則mysql會自動在列上加資料型別轉換函式
不使用索引
where mobile=18534874321
使用索引
where mobile=’18534874321’
8.欄位加運算子不會使用索引。所以儘量把運算放在數值上
不使用索引:
SELECT ACCOUNT_NAME, AMOUNT FROM TRANSACTION WHERE AMOUNT + 3000 >5000;
使用索引:
SELECT ACCOUNT_NAME, AMOUNT FROM TRANSACTION WHERE AMOUNT > 2000 ;
9.使用組合索引時,必須要包括第一個列。
例如
alter table test add index(a,b,c):
不使用索引:
where b=1, c=2
where b=1
where c=2
使用索引:
where a=1, b=1, c=2
where a=1, b=1
where a=1, c=2
10.儘量避免使用is null或is not null
不使用索引:
SELECT … FROM DEPARTMENT WHERE DEPT_CODE IS NOT NULL;
使用索引:
SELECT … FROM DEPARTMENT WHERE DEPT_CODE >0;
11.不等於(!=)不會使用索引
不使用索引:
SELECT ACCOUNT_NAME FROM TRANSACTION WHERE AMOUNT !=0;
使用索引:
SELECT ACCOUNT_NAME FROM TRANSACTION WHERE AMOUNT >0;
12.ORDER BY 子句只在以下的條件下使用索引:
ORDER BY中所有的列必須包含在相同的索引中並保持在索引中的排列順序.
ORDER BY中不能既有ASC也有DESC
例如:
alter table t1 add index(a,b);
alter table t1 add index(c);
不使用索引:
select * from t1 order by a,c; 不在一個索引中
select * from t1 order by b; 沒有出現組合索引的第一列
select * from t1 order by a asc, b desc; 混合ASC和DESC
select * from t1 where a=1 order by c; where和order by用的不是同一個索引,where使用索引,order by不使用。
使用索引:
select * from t1 order by a,b;
select * from t1 order where a=1 order by b;
select * from t1 order where a=1 order by a,b;
select * from t1 order by a desc, b desc;
select * from t1 where c=1 order by c;
13.索引不是越多越好。mysql需要資源來維護索引,任何資料的變更(增刪改)都會連帶修改索引的值。所以,需要平衡考慮索引帶來的查詢加速和增刪改減速。
----------------------------------------------------------------------------------------------------------------------------------
其他注意事項
1.儘量避免使用select *
2.儘量使用表連線(join)代替子查詢select * from t1 where a in (select b from t2)
3.效能方面,表連線 > (not) exists > (not) in
1)用exists代替in
低效:
SELECT *
FROM EMP
WHERE EMPNO > 0
AND DEPTNO IN (SELECT DEPTNO
FROM DEPT
WHERE LOC = ‘MELB’)
高效:
SELECT *
FROM EMP
WHERE EMPNO > 0
AND EXISTS (SELECT ‘X’
FROM DEPT
WHERE DEPT.DEPTNO = EMP.DEPTNO
AND LOC = ‘MELB’)
2)用not exists代替not in
低效:
SELECT …
FROM EMP
WHERE DEPT_NO NOT IN (SELECT DEPT_NO
FROM DEPT
WHERE DEPT_CAT=’A’);
高效:
SELECT ….
FROM EMP E
WHERE NOT EXISTS (SELECT ‘X’
FROM DEPT D
WHERE D.DEPT_NO = E.DEPT_NO
AND DEPT_CAT = ‘A’);
3)用表連線代替exists
exits:
SELECT ENAME
FROM EMP E
WHERE EXISTS (SELECT ‘X’
FROM DEPT
WHERE DEPT_NO = E.DEPT_NO
AND DEPT_CAT = ‘A’);
表連線:
SELECT ENAME
FROM DEPT D,EMP E
WHERE E.DEPT_NO = D.DEPT_NO
AND DEPT_CAT = ‘A’ ;
4.清除不必要的排序
低效:
select count(*) from (select * from user where id > 40 order by id);
高效:
select count(*) from (select * from user where id > 40);
5.having -> where
避免使用HAVING子句, HAVING 只會在檢索出所有記錄之後才對結果集進行過濾. 這個處理需要排序,總計等操作. 如果能通過WHERE子句限制記錄的數目,那就能減少這方面的開銷.
低效:
select * from user group by id having id > 40;
高效:
select * from user where id > 40 group by id;
6.除非確實需要去掉重複的行,否則儘量使用union all而不是union。因為union會自帶distinct操作,代價很大
---------------------------------------------------------------------------------------------------------------------------------
使用explain檢視sql效能
1.explain用法:在select之前加上explain即可。
例如:explain select * from test;
注意:explain並不會真正執行語句,而是隻返回執行計劃。
怎麼看執行計劃?一個簡單的優化原則:令sql讀取儘可能少的行。
2.實戰案例1:
問題語句執行超過5s:
SELECT `branch`.`id`, `branch`.`name`, `branch`.`registered_time`, `branch_region`.`region_id`, `user`.`username`, `user`.`mobile`, count(o.order_id) as order_num
FROM (`branch`)
LEFT JOIN `user` ON `user`.`branch_id` = `branch`.`id`
LEFT JOIN `branch_role` ON `branch_role`.`id` = `user`.`role_id`
LEFT JOIN `branch_region` ON `branch_region`.`branch_id` = `branch_role`.`branch_id`
LEFT JOIN `orders` o ON `branch`.`id` = `o`.`supplier_id`
WHERE branch.id NOT IN (select supplier_id from signing where seller_id=6683 and status < 6)
AND `branch`.`group` = 'SUPPLIER'
AND `branch_role`.`flag` = 'ADMINISTRATOR'
AND `branch`.`status` = 'NORMAL'
GROUP BY `branch`.`id`
ORDER BY `branch`.`registered_time` desc
LIMIT 20;
使用explain檢視執行計劃:
根據“讀取儘可能少的資料”的原則,發現讀取行數最多的步驟讀取了4792行。進而發現這個步驟沒有用到索引(NULL)。而這個沒有用索引的表是orders的supplier_id列。
加索引試試看:
alter table orders add index(supplier_id);
再次使用explain檢視執行計劃:
可以看到這個步驟使用了索引,讀取的行數減少到了599行。
實際執行一下,秒出。
3.explain執行計劃各個欄位的意義:
1)id:語句的執行順序,倒序執行
2)select_type:主要有以下幾個型別:
lsimple:表示簡單的select,沒有union和子查詢
lprimary:最外層的select。在有子查詢的語句中,最外面的select查詢就是primary
lunion:union語句的第二個或者說是後面那一個
lunion result:union的結果
lsubquery: 子查詢中的第一個 select
3)table:涉及的表。
4)type:連線型別。主要有以下幾個:(重點檢視)
lconst:說明只有一個匹配行,使用了主鍵或唯一性索引。通常是最優化的情況。
leq_ref,ref,ref_or_null:表示走了簡單索引
lindex_merge:表示使用了多個索引的組合
lrange:表示通過索引取出了一個範圍內的值。例如where a in (1,2)
lindex:表示對索引進行了全掃描
lALL:表示全表掃描
注意:以上型別從上到下效能越來越差。
5)possible_keys:可供使用的索引
6)keys:實際使用的索引
7)key_gen:索引長度
8)ref:顯示使用哪個列或常數與索引一起從表中選擇行
9)rows:讀取的行數。(重點檢視)
10)Extra:備註