1. 程式人生 > >MySQL效能管理及架構設計:SQL查詢優化、分庫分表

MySQL效能管理及架構設計:SQL查詢優化、分庫分表

1.1 獲取有效能問題SQL的三種方式

通過使用者反饋獲取存在效能問題的SQL;
通過慢查日誌獲取存在效能問題的SQL;
實時獲取存在效能問題的SQL;

1.1.2 慢查日誌分析工具
相關配置引數:

slow_query_log # 啟動停止記錄慢查日誌,慢查詢日誌預設是沒有開啟的可以在配置檔案中開啟(on)
slow_query_log_file # 指定慢查日誌的儲存路徑及檔案,日誌儲存和資料從儲存應該分開儲存

long_query_time # 指定記錄慢查詢日誌SQL執行時間的閥值預設值為10秒通常,對於一個繁忙的系統來說,改為0.001秒(1毫秒)比較合適
log_queries_not_using_indexes #是否記錄未使用索引的SQL

常用工具:mysqldumpslow和pt-query-digest

  pt-query-digest --explain h=127.0.0.1,u=root,p=[email protected]  slow-mysql.log

1.1.3 實時獲取有效能問題的SQL(推薦)

  SELECT id,user,host,DB,command,time,state,info
FROM information_schema.processlist
WHERE TIME>=60

查詢當前伺服器執行超過60s的SQL,可以通過腳本週期性的來執行這條SQL,就能查出有問題的SQL。

1.2 SQL的解析預處理及生成執行計劃(重要)
1.2.1 查詢過程描述(重點!!!)

通過上圖可以清晰的瞭解到MySql查詢執行的大致過程:

傳送SQL語句。
查詢快取,如果命中快取直接返回結果。
SQL解析,預處理,再由優化器生成對應的查詢執行計劃。
執行查詢,呼叫儲存引擎API獲取資料。
返回結果。

1.2.2 查詢快取對效能的影響(建議關閉快取)
第一階段:
相關配置引數:

query_cache_type # 設定查詢快取是否可用
query_cache_size # 設定查詢快取的記憶體大小
query_cache_limit # 設定查詢快取可用的儲存最大值(加上sql_no_cache可以提高效率)
query_cache_wlock_invalidate # 設定資料表被鎖後是否返回快取中的資料 query_cache_min_res_unit # 設定查詢快取分配的記憶體塊的最小單

快取查詢是利用對大小寫敏感的雜湊查詢來實現的,Hash查詢只能進行全值查詢(sql完全一致),如果快取命中,檢查使用者許可權,如果許可權允許,直接返回,查詢不被解析,也不會生成查詢計劃。
在一個讀寫比較頻繁的系統中,建議關閉快取,因為快取更新會加鎖。將query_cache_type設定為off,query_cache_size設定為0。

1.2.3 第二階段:MySQL依照執行計劃和儲存引擎進行互動

這個階段包括了多個子過程:



一條查詢可以有多種查詢方式,查詢優化器會對每一種查詢方式的(儲存引擎)統計資訊進行比較,找到成本最低的查詢方式,這也就是索引不能太多的原因。

1.3 會造成MySQL生成錯誤的執行計劃的原因
1、統計資訊不準確
2、成本估算與實際的執行計劃成本不同

3、給出的最優執行計劃與估計的不同

4、MySQL不考慮併發查詢
5、會基於固定規則生成執行計劃
6、MySQL不考慮不受其控制的成本,如儲存過程,使用者自定義函式

1.4 MySQL優化器可優化的SQL型別
查詢優化器:對查詢進行優化並查詢mysql認為的成本最低的執行計劃。 為了生成最優的執行計劃,查詢優化器會對一些查詢進行改寫
可以優化的sql型別

1、重新定義表的關聯順序;

2、將外連線轉換為內連線;

3、使用等價變換規則;

4、優化count(),min(),max();

5、將一個表示式轉換為常數;
6、子查詢優化;

7、提前終止查詢,如發現一個不成立條件(如where id = -1),立即返回一個空結果;

8、對in()條件進行優化;

1.5 查詢處理各個階段所需要的時間
1.5.1 使用profile(目前已經不推薦使用了)

set profiling = 1; #啟動profile,這是一個session級的配製執行查詢

show profiles; # 查詢每一個查詢所消耗的總時間的資訊

show profiles for query N; # 查詢的每個階段所消耗的時間

1.5.2 performance_schema是5.5引入的一個性能分析引擎(5.5版本時期開銷比較大)
啟動監控和歷史記錄表:use performance_schema

update setup_instruments set enabled='YES',TIME = 'YES' WHERE NAME LIKE 'stage%';

update set_consumbers set enabled='YES',TIME = 'YES' WHERE NAME LIKE 'event%';



1.6 特定SQL的查詢優化
1.6.1 大表的資料修改


1.6.2 大表的結構修改

利用主從複製,先對從伺服器進入修改,然後主從切換
(推薦)

新增一個新表(修改後的結構),老表資料匯入新表,老表建立觸發器,修改資料同步到新表, 老表加一個排它鎖(重新命名), 新表重新命名, 刪除老表。

修改語句這個樣子:

alter table sbtest4 modify c varchar(150) not null default ''

利用工具修改:

1.6.3 優化not in 和 <> 查詢
子查詢改寫為關聯查詢:

二、分庫分表
2.1 分庫分表的幾種方式
分擔讀負載 可通過 一主多從,升級硬體來解決。
2.1.1 把一個例項中的多個數據庫拆分到不同例項(叢集)

拆分簡單,不允許跨庫。但並不能減少寫負載。

2.1.2 把一個庫中的表分離到不同的資料庫中

該方式只能在一定時間內減少寫壓力。

以上兩種方式只能暫時解決讀寫效能問題。

2.1.3 資料庫分片
對一個庫中的相關表進行水平拆分到不同例項的資料庫中

2.1.3.1 如何選擇分割槽鍵

分割槽鍵要能儘可能避免跨分割槽查詢的發生
分割槽鍵要儘可能使各個分割槽中的資料平均

2.1.3.2 分片中如何生成全域性唯一ID

擴充套件:表的垂直拆分和水平拆分