1. 程式人生 > >myisam和innodb中count(*)的區別

myisam和innodb中count(*)的區別

INNODB在做SELECT的時候,要維護的東西比MYISAM引擎多很多:
1)資料塊,INNODB要快取,MYISAM只快取索引塊,  這中間還有換進換出的減少;
 
2)innodb定址要對映到塊,再到行,MYISAM記錄的直接是檔案的OFFSET,定位比INNODB要快

3)INNODB還需要維護MVCC一致;雖然你的場景沒有,但他還是需要去檢查和維護MVCC (Multi-Version Concurrency Control)多版本併發控制  

註釋:
InnoDB:通過為每一行記錄新增兩個額外的隱藏的值來實現MVCC,這兩個值一個記錄這行資料何時被建立,另外一個記錄這行資料何時過期(或者被刪除)。但是InnoDB並不儲存這些事件發生時的實際時間,相反它只儲存這些事件發生時的系統版本號。這是一個隨著事務的建立而不斷增長的數字。每個事務在事務開始時會記錄它自己的系統版本號。每個查詢必須去檢查每行資料的版本號與事務的版本號是否相同。讓我們來看看當隔離級別是REPEATABLEREAD時這種策略是如何應用到特定的操作的: SELECT InnoDB必須每行資料來保證它符合兩個條件: 1、InnoDB必須找到一個行的版本,它至少要和事務的版本一樣老(也即它的版本號不大於事務的版本號)。這保證了不管是事務開始之前,或者事務建立時,或者修改了這行資料的時候,這行資料是存在的。
2、這行資料的刪除版本必須是未定義的或者比事務版本要大。這可以保證在事務開始之前這行資料沒有被刪除

整體區別:
在不同的儲存引擎中,count()函式的執行是不同的。在MyISAM儲存引擎中,count()函式是直接讀取資料表儲存的行記錄數並返回,而在InnoDB儲存引擎中,count(*)函式是先從讀取表中的資料到記憶體緩衝區,然後掃描全表獲得行記錄數的。在使用count函式中加上where條件時,在兩個儲存引擎中的效果是一樣的,都會掃描全表計算某欄位有值項的次數。

場景分析:
1.myisam儲存表的總行數,因此count(*)並且無where子句,很快會返回表的總行數
2.myisam儲存表的總行數,利用count(column)並且無where子句,並且此column不為null,很快會返回表的總行數
3.myisam儲存表的總行數,利用count(column)並且無where子句,並且此column可以為null,mysql會對錶進行全表或全索引掃描來確定行數
4.innodb查詢count(*),count(column(not null)),count(column(may be null))並且無where子句,mysql會對錶進行全表或全索引掃描來確定行數
5.myisam和innodb查詢count(*),count(column(not null)),count(column(may be null))並且存在where子句,mysql會對錶進行索引掃描(如果列上有索引),速度也比較快

另外:由於innodb主鍵索引一般是聚簇索引,所以為了使資料量達到一定成都之後訪問count(*)不至於很慢,也會新增一個二級輔助索引

本文收集於網路