1. 程式人生 > >MySQL日誌文件與分析

MySQL日誌文件與分析

column nbsp 去重 ref bin pri fin n) 比較

1.查詢日誌、慢查詢日誌、二進制日誌對比

查詢日誌 general_log
會記錄用戶的所有操作,其中包含增刪查改等 可以指定輸出為表
慢查詢日誌 slow_log 只要超過定義時間的所有操作語句都記錄 可以指定輸出為表
二進制日誌 log_bin 記錄可能執行更改的所有操作 mysqlbinlog查看

2.日誌的分析

2.1日誌的存儲

數據操作過程中,Mysqld是將接收到的語句按照接收的順序(註意不是執行順序)寫到查詢日誌文件中。一條一條就類似這樣:

# Time: 070927 8:08:52
# [email protected]

: root[root] @ [192.168.0.20]
# Query_time: 372 Lock_time: 136 Rows_sent: 152 Rows_examined: 263630
select id, name from manager where id in (66,10135);

這樣的話,當我們去查看日誌內容時就會灰常費時費神費眼睛。那麽應該怎麽破?

自5.1.6版本起,就有一波新功能出爐,比如查詢日誌可以寫到數據庫系統中的專用表。

MySQL的命令行在啟動時可以加載很多參數,其中就提供了一個日誌專用的參數--log-output,用來指定日誌文件的輸出方式.

--log-output參數可選值有三個:

  • TABLE:記錄到數據庫中的日誌表;
  • FILE:記錄到日誌文件,默認值即為FILE (在5.1.6到5.1.20版本時,默認值為TABLE);
  • NONE:不記錄。

(1)可以是TABLE、FILE、NONE,也可以是TABLE及FILE的組合(用逗號隔開),默認為TABLE。

(2)如果組合中出現了NONE,那麽其它設定都將失效,同時,無論是否啟用日誌功能,也不會記錄任何相關的日誌信息。

(3)作用範圍為全局級別,可用於配置文件,屬動態變量。

(4)啟用mysqld進程時附加--log-output指定日誌輸出類型。

MySQL支持將慢查詢日誌保存到mysql.slow_log這張表中:

技術分享

2.2慢查詢分析工具

如果慢查詢日誌輸出類型已經指定了FILE,在日誌量大的情況下,我們可以借助一些分析工具。

(1)mysqldumpslow mysql 自帶慢查詢日誌分析工具 mysqldumpslow,使用很簡單,可以跟-help來查看具體的用法。 主要功能:統計不同慢sql的出現次數(Count) 執行最長時間(Time), 累計總耗費時間(Time), 等待鎖的時間(Lock), 發送給客戶端的行總數(Rows), 掃描的行總數(Rows), 用戶以及sql語句本身(抽象了一下格式, 比如 limit 1, 20 用 limit N,N 表示).

技術分享

(2)mysqlsla

hackmysql.com推出的一款日誌分析工具

功能非常強大. 數據報表,非常有利於分析慢查詢的原因, 包括執行頻率, 數據量, 查詢消耗等.

技術分享

格式說明如下:

總查詢次數 (queries total), 去重後的sql數量 (unique)輸出報表的內容排序(sorted by)最重大的慢sql統計信息, 包括平均執行時間, 等待鎖時間, 結果行的總數, 掃描的行總數。

Count: sql的執行次數及占總的slow log數量的百分比。

Time: 執行時間, 包括總時間, 平均時間, 最小, 最大時間, 時間占到總慢sql時間的百分比。

95% of Time: 去除最快和最慢的sql, 覆蓋率占95%的sql的執行時間。

Lock Time: 等待鎖的時間。

95% of Lock: 95%的慢sql等待鎖時間。

Rows sent: 結果行統計數量, 包括平均, 最小, 最大數量。

Rows examined: 掃描的行數量。

Database: 屬於哪個數據庫。

Users: 哪個用戶IP占到所有用戶執行的sql百分比。

Query abstract: 抽象後的sql語句。

Query sample: sql語句。

除了以上的輸出, 官方還提供了很多定制化參數, 是一款不可多得的好工具。

(3) pt-upgrade

這個工具用來檢查在新版本中運行的SQL是否與老版本一樣,返回相同的結果,最好的應用場景就是數據遷移的時候。

pt-upgrade h=host1 h=host2 slow.log

(4) pt-query-digest

可以從普通MySQL日誌,慢查詢日誌以及二進制日誌中分析查詢,甚至可以從SHOW PROCESSLIST和MySQL協議的tcpdump中進行分析,如果沒有指定文件,它從標準輸入流(STDIN)中讀取數據。

最簡單的用法如下:

pt-query-digest slow.logs

整個輸出分為三大部分:

1、整體概要(Overall)

技術分享

這個部分是一個大致的概要信息(類似loadrunner給出的概要信息),通過它可以對當前MySQL的查詢性能做一個初步的評估,比如各個指標的最大 值(max),平均值(min),95%分布值,中位數(median),標準偏差(stddev)。這些指標有查詢的執行時間(Exec time),鎖占用的時間(Lock time),MySQL執行器需要檢查的行數(Rows examine),最後返回給客戶端的行數(Rows sent),查詢的大小。

2、查詢的匯總信息(Profile)

這個部分對所有”重要”的查詢(通常是比較慢的查詢)做了個一覽表:

技術分享

每個查詢都有一個Query ID,這個ID通過Hash計算出來的。pt-query-digest是根據這個所謂的Fingerprint來group by的。舉例下面兩個查詢的Fingerprint是一樣的都是select * from table1 where column1 = ?,工具箱中也有一個與之相關的工具pt-fingerprint。

select * from table1 where column1 = 2
select * from table1 where column1 = 3
  • Rank整個分析中該“語句”的排名,一般也就是性能最常的。
  • Response time “語句”的響應時間以及整體占比情況。
  • Calls 該“語句”的執行次數。
  • R/Call 每次執行的平均響應時間。
  • V/M 響應時間的差異平均對比率。

在尾部有一行輸出,顯示了其他2個占比較低而不值得單獨顯示的查詢的統計數據。

3、詳細信息

這個部分會列出Profile表中每個查詢的詳細信息:

技術分享

包括Overall中有的信息、查詢響應時間的分布情況以及該查詢”入榜”的理由。

2.3BOX Anemometer

BOX Anemometer是 基於pt-query-digest將MySQL慢查詢可視化

技術分享

MySQL日誌文件與分析