1. 程式人生 > >sql order by與索引之間的關係(where條件出現欄位才有效)

sql order by與索引之間的關係(where條件出現欄位才有效)

ORDER BY 通常會有兩種實現方法,一個是利用有序索引自動實現,也就是說利用有序索引的有序性就不再另做排序操作了。另一個是把結果選好之後再排序。 用有序索引這種,當然是最快的,不過有一些限制條件,來看下面的測試。 測試資料:student表有兩個欄位id ,sid ,id是主鍵。一共有20W條記錄,id從1到200000,sid也是從1到200000的資料。 第一種情況 : order by的欄位不在where條件也不在select中 select sid from zhuyuehua.student where sid < 50000 order by id;ec28f9fc-2678-3b99-8386-9ec7154165d6.jpg 第二種情況 : order by的欄位不在where條件但在select中。 select id,sid from zhuyuehua.student where sid < 50000 order by id;f43894ee-b4a1-358b-9709-95642e4e6dc1.jpg

第三種情況 : order by的欄位在where條件但不在select中。 select sid from zhuyuehua.student where sid < 50000 and id < 50000 order by id;19c51ab8-9a98-369c-b60e-da684bc22850.jpg 第四種情況 : order by的欄位在where條件但不在select中。倒序排列 select sid from zhuyuehua.student where sid < 50000 and id < 50000 order by id desc;1d3b0d87-7dc2-3152-b657-07212fb1dab0.jpg 測試結果: order by的欄位不在where條件不在select中     有排序操作 order by的欄位不在where條件但在select中     有排序操作 order by的欄位在where條件但不在select中     無排序操作 order by的欄位在where條件但不在select中(倒序)     無排序操作 結論: 當order by 欄位出現在where條件中時,才會利用索引而無需排序操作。其他情況,order by不會出現排序操作。 分析: 為什麼只有order by 欄位出現在where條件中時,才會利用該欄位的索引而避免排序。這要說到資料庫如何取到我們需要的資料了。 一條SQL實際上可以分為三步。 1.得到資料 2.處理資料 3.返回處理後的資料 比如上面的這條語句select sid from zhuyuehua.student where sid < 50000 and id < 50000 order by id desc 第一步:根據where條件和統計資訊生成執行計劃,得到資料。 第二步:將得到的資料排序。 當執行處理資料(order by)時,資料庫會先檢視第一步的執行計劃,看order by 的欄位是否在執行計劃中利用了索引。如果是,則可以利用索引順序而直接取得已經排好序的資料。如果不是,則排序操作。 第三步:返回排序後的資料。 另外: 上面的5萬的資料sort只用了25ms,也許大家覺得sort不怎麼佔用資源。可是,由於上面的表的資料是有序的,所以排序花費的時間較少。如果 是個比較無序的表,sort時間就會增加很多了。另外排序操作一般都是在記憶體裡進行的,對於資料庫來說是一種CPU的消耗,由於現在CPU的效能增強,對 於普通的幾十條或上百條記錄排序對系統的影響也不會很大。但是當你的記錄集增加到上百萬條以上時,你需要注意是否一定要這麼做了,大記錄集排序不僅增加了 CPU開銷,而且可能會由於記憶體不足發生硬碟排序的現象,當發生硬碟排序時效能會急劇下降。 注:ORACLE或者DB2都有一個空間來供SORT操作使用(上面所說的記憶體排序),如ORACLE中是使用者全域性區(UGA),裡面有SORT_AREA_SIZE等引數的設定。如果當排序的資料量大時,就會出現排序溢位(硬碟排序),這時的效能就會降低很多了。 總結:當order by 中的欄位出現在where條件中時,才會利用索引而不排序,更準確的說,order by 中的欄位在執行計劃中利用了索引時,不用排序操作。
這個結論不僅對order by有效,對其他需要排序的操作也有效。比如group by 、union 、distinct等。