為什麼陣列查詢的效率優於連結串列
一個常見的程式設計問題: 遍歷同樣大小的陣列和連結串列, 哪個比較快? 如果按照大學教科書上的演算法分析方法,你會得出結論,這2者一樣快, 因為時間複雜度都是 O(n)。 但是在實踐中, 這2者卻有極大的差異。通過下面的分析你會發現, 其實陣列比連結串列要快很多。
首先介紹一個概念:memory hierarchy (儲存層次結構),電腦中存在多種不同的儲存器,如下表
- CPU 暫存器 – immediate access (0-1個CPU時鐘週期)
- CPU L1 快取– fast access (3個CPU時鐘週期)
- CPU L2 快取 – slightly slower access (10個CPU時鐘週期)
- 記憶體 (RAM)– slow access (100個CPU時鐘週期)
- 硬碟 (file system) – very slow (10,000,000個CPU時鐘週期)
各級別的儲存器速度差異非常大,CPU暫存器速度是記憶體速度的100倍! 這就是為什麼CPU產商發明了CPU快取。 而這個CPU快取,就是陣列和連結串列的區別的關鍵所在。
CPU快取會把一片連續的記憶體空間讀入, 因為陣列結構是連續的記憶體地址,所以陣列全部或者部分元素被連續存在CPU快取裡面, 平均讀取每個元素的時間只要3個CPU時鐘週期。而連結串列的節點是分散在堆空間裡面的,這時候CPU快取幫不上忙,只能是去讀取記憶體,平均讀取時間需要100個CPU時鐘週期。 這樣算下來,陣列訪問的速度比連結串列快33倍! (這裡只是介紹概念,具體的數字因CPU而異)
因此,程式中儘量使用連續的資料結構,這樣可以充分發揮CPU快取的威力。