1. 程式人生 > >數據庫中的聚集索引、非聚集索引、優化索引

數據庫中的聚集索引、非聚集索引、優化索引

而不是 能夠 方法 tro .html hash 項目 () 討論

原文:數據庫中的聚集索引、非聚集索引、優化索引

這篇文章我們來討論一下索引的問題吧,這篇文章不會介紹怎麽創建索引,但是會介紹怎麽優化索引。

什麽是索引?

索引是對記錄按照多個字段進行排序的一種方式。對表中的某個字段建立索引會創建另一種數據結構,其中保存著字段的值,每個值又指向與它相關的記錄。這種索引的數據結構是經過排序的,因而可以對其執行二分查找。

怎麽理解索引呢?我們經常用在windows系統下,查詢某些文件,系統都會建議我們建立文件的索引。比如,如果你要查詢一個文件名,系統要掃描所有文件進行傻瓜式地掃描,速度當然會很慢。當我們建立了索引後,經過相關的算法分析,會很快查詢出我們想要的文件名。

我們知道了索引的定義後,下面我們談談聚集索引、非聚集索引。

聚集索引、非聚集索引

聚集索引

聚集索引是數據表中按照某個列的順序來排序。即一個表中創建了聚集索引,則表的默認排序按照此列來排序。

一個表只能有一個聚集索引,因為表的默認排序只能有一個。

非聚集索引

非聚集索引具有獨立於數據行的結構。非聚集索引中的項目按索引鍵值的順序存儲,而表中的信息按另一種順序存儲(這可以由聚集索引規定)。對於非聚集索引,可以為在表非聚集索引中查找數據時常用的每個列創建一個非聚集索引。

查詢優化器

查詢優化器在執行查詢時通常會選擇最有效的方法。 但如果沒有索引,則查詢優化器必須掃描表。您的任務是設計並創建最適合您的環境的索引,以便查詢優化器可以從多個有效的索引中選擇。

優化索引

(這些都是網上找的,這裏做一些記錄)

(1)負向條件查詢不能使用索引

select * from order where status!=0 and stauts!=1

not in/not exists 都不是好習慣

可以優化為 in 查詢:

select * from order where status in(2,3)

(2)前導模糊查詢不能使用索引

select * from order where desc like ‘%XX‘

而非前導模糊查詢則可以:

select * from order where desc like ‘XX%‘

(3)數據區分度不大的字段不宜使用索引

select * from user where sex=1

原因:性別只有男,女,每次過濾掉的數據很少,不宜使用索引。

經驗上,能過濾 80% 數據時就可以使用索引。對於訂單狀態,如果狀態值很少,不宜使用索引,如果狀態值很多,能夠過濾大量數據,則應該建立索引。

(4)在屬性上進行計算不能命中索引

select * from order where YEAR(date) < = ‘2017‘

即使date上建立了索引,也會全表掃描,可優化為值計算:

select * from order where date < = CURDATE()

或者:

select * from order where date < = ‘2017-01-01‘

(5)如果業務大部分是單條查詢,使用Hash索引性能更好,例如用戶中心

select * from user where uid=?
select * from user where login_name=?

原因:

B-Tree索引的時間復雜度是O(log(n))

Hash索引的時間復雜度是O(1)

(6)允許為null的列,查詢有潛在大坑

單列索引不存null值,復合索引不存全為null的值,如果列允許為null,可能會得到“不符合預期”的結果集

select * from user where name != ‘shenjian‘

如果name允許為null,索引不存儲null值,結果集中不會包含這些記錄。

所以,請使用 not null 約束以及默認值。

(7)復合索引最左前綴,並不是值SQL語句的where順序要和復合索引一致

用戶中心建立了(login_name, passwd)的復合索引

select * from user where login_name=? and passwd=?
select * from user where passwd=? and login_name=?

都能夠命中索引

select * from user where login_name=?

也能命中索引,滿足復合索引最左前綴

select * from user where passwd=?

不能命中索引,不滿足復合索引最左前綴

(8)使用ENUM而不是字符串

ENUM保存的是TINYINT,別在枚舉中搞一些“中國”“北京”“技術部”這樣的字符串,字符串空間又大,效率又低。

(9)如果明確知道只有一條結果返回,limit 1能夠提高效率

select * from user where login_name=?

可以優化為:

select * from user where login_name=? limit 1

原因:

你知道只有一條結果,但數據庫並不知道,明確告訴它,讓它主動停止遊標移動

(10)把計算放到業務層而不是數據庫層,除了節省數據的CPU,還有意想不到的查詢緩存優化效果

select * from order where date < = CURDATE()

這不是一個好的SQL實踐,應該優化為:

$curDate = date(‘Y-m-d‘);
$res = mysql_query(‘select * from order where date < = $curDate‘);

原因:

釋放了數據庫的CPU

多次調用,傳入的SQL相同,才可以利用查詢緩存

(11)強制類型轉換會全表掃描

select * from user where phone=13800001234

你以為會命中phone索引麽?大錯特錯了,這個語句究竟要怎麽改?

末了,再加一條,不要使用select *(潛臺詞,文章的SQL都不合格 =_=),只返回需要的列,能夠大大的節省數據傳輸量,與數據庫的內存使用量喲。

可以關註本人的公眾號,多年經驗的原創文章共享給大家。

技術分享圖片

數據庫中的聚集索引、非聚集索引、優化索引