1. 程式人生 > >資料庫索引原理

資料庫索引原理

理解:索引會將建立所以的一列值全部存入所以,但不會儲存其他列的值,還會儲存指向表中的相應行的指標。指標是指一塊記憶體區域, 該記憶體區域記錄的是對硬碟上記錄的相應行的資料的引用。因此,索引中除了儲存列的值,還儲存著一個指向在行資料的索引。也就是說,索引中的Employee_Name這列的某個值(或者節點)可以描述為 (“Jesus”, 0x82829), 0x82829 就是包含 “Jesus”那行資料在硬碟上的地址。如果沒有這個引用,你就只能訪問到一個單獨的值(“Jesus”),而這樣沒有意義,因為你不能獲取這一行記錄的employee的其他值-例如地址(address)和年齡(age)

摺疊概述

建立索引的目的是加快對錶中記錄的查詢排序。

為表設定索引要付出代價的:一是增加了資料庫的儲存空間,二是在插入和修改資料時要花費較多的時間(因為索引也要隨之變動)

摺疊詳述

建立索引可以大大提高系統的效能。第一,通過建立唯一性索引,可以保證資料庫表中每一行資料的唯一性。第二,可以大大加快資料的檢索速度,這也是建立索引的最主要的原因。第三,可以加速表和表之間的連線,特別是在實現資料的參考完整性方面特別有意義。第四,在使用分組和排序子句進行資料檢索時,同樣可以顯著減少查詢中分組和排序的時間。第五,通過使用索引,可以在查詢的過程中,使用優化隱藏器,提高系統的效能。

也許會有人要問:增加索引有如此多的優點,為什麼不對錶中的每一個列建立一個索引呢?因為,增加索引也有許多不利的方面。第一,建立索引和維護索引要耗費時間,這種時間隨著資料量的增加而增加。第二,索引需要佔物理空間,除了資料表佔

資料空間之外,每一個索引還要佔一定的物理空間,如果要建立聚簇索引,那麼需要的空間就會更大。第三,當對錶中的資料進行增加、刪除和修改的時候,索引也要動態的維護,這樣就降低了資料的維護速度。

索引是建立在資料庫表中的某些列的上面。在建立索引的時候,應該考慮在哪些列上可以建立索引,在哪些列上不能建立索引。一般來說,應該在這些列上建立索引:

在經常需要搜尋的列上,可以加快搜索的速度;

在作為主鍵的列上,強制該列的唯一性和組織表中資料的排列結構;

在經常用在連線的列上,這些列主要是一些外來鍵,可以加快連線的速度;在經常需要根據範圍進行搜尋的列上建立索引,因為索引已經排序,其指定的範圍是連續的;

在經常需要排序的列上建立索引,因為索引已經排序,這樣查詢可以利用索引的排序,加快排序查詢時間;

在經常使用在WHERE子句中的列上面建立索引,加快條件的判斷速度。

同樣,對於有些列不應該建立索引。一般來說,不應該建立索引的的這些列具有下列特點:

第一,對於那些在查詢中很少使用或者參考的列不應該建立索引。這是因為,既然這些列很少使用到,因此有索引或者無索引,並不能提高查詢速度。相反,由於增加了索引,反而降低了系統的維護速度和增大了空間需求

第二,對於那些只有很少資料值的列也不應該增加索引。這是因為,由於這些列的取值很少,例如人事表的性別列,在查詢的結果中,結果集的資料行佔了表中資料行的很大比例,即需要在表中搜索的資料行的比例很大。增加索引,並不能明顯加快檢索速度。

第三,對於那些定義為text, imagebit資料型別的列不應該增加索引。這是因為,這些列的資料量要麼相當大,要麼取值很少,不利於使用索引。

第四,當修改效能遠遠大於檢索效能時,不應該建立索引。這是因為,修改效能和檢索效能是互相矛盾的。當增加索引時,會提高檢索效能,但是會降低修改效能。當減少索引時,會提高修改效能,降低檢索效能。因此,當修改操作遠遠多於檢索操作時,不應該建立索引。

把資料庫索引類比成什麼比較好呢?

一個非常好的類比是把資料庫索引看作是書的索引。如果你有一本關於狗的書,你想要找關於‘黃金獵犬’的那部分。當你可以通過在書背的索引找到哪幾頁有關於‘黃金獵犬’資訊的時候,你為什麼要翻完正本書 - 這相當於資料庫中的全表掃描。同樣的,就像一本書的索引包含頁碼一樣,資料庫的索引包含了指標,指向你在SQL中想要查詢的值所在的行。

使用資料庫索引會有什麼代價?

那麼,使用資料庫索引有什麼缺點呢?其一,索引會佔用空間 - 你的表越大,索引佔用的空間越大。其二,效能損失(主要值更新操作),當你在表中新增、刪除或者更新行資料的時候, 在索引中也會有相同的操作。記住:建立在某列(或多列)索引需要儲存該列最新的資料

基本原則是隻如果表中某列在查詢過程中使用的非常頻繁,那就在該列上建立索引