(4)排序之希爾排序
轉載:http://www.cnblogs.com/jingmoxukong/p/4303279.html
要點
希爾(Shell)排序又稱為縮小增量排序,它是一種插入排序。它是直接插入排序算法的一種威力加強版。該方法因DL.Shell於1959年提出而得名。
希爾排序的基本思想是:
把記錄按步長 gap 分組,對每組記錄采用直接插入排序方法進行排序。 隨著步長逐漸減小,所分成的組包含的記錄越來越多,當步長的值減小到 1 時,整個數據合成為一組,構成一組有序記錄,則完成排序。
我們來通過演示圖,更深入的理解一下這個過程。
在上面這幅圖中:
初始時,有一個大小為 10 的無序序列。
在第一趟排序中
接下來,按照直接插入排序的方法對每個組進行排序。
在第二趟排序中,我們把上次的 gap 縮小一半,即 gap2 = gap1 / 2 = 2 (取整數)。這樣每相隔距離為 2 的元素組成一組,可以分為 2 組。
按照直接插入排序的方法對每個組進行排序。
在第三趟排序中,再次把 gap 縮小一半,即gap3 = gap2 / 2 = 1。 這樣相隔距離為 1 的元素組成一組,即只有一組。
按照直接插入排序的方法對每個組進行排序。此時,排序已經結束。
需要註意一下的是,圖中有兩個相等數值的元素 5 和 5
所以,希爾排序是不穩定的算法。
核心代碼
void shellSort(int *a,int n){ int gap=n/2; while(gap>=1){ //把距離為gap的元素編為一個組,掃描所有組 for(int i=gap;i<n;i++){ int j=0; int temp=a[i]; //對距離為gap的元素組進行排序 for(j=i-gap;j>=0&&temp<a[j];j=j-gap)//一定要註意!!! a[j+gap]=a[j]; a[j+gap]=temp; } gap/=2;//減少增量 } }
算法分析
希爾排序的算法性能
排序類別 |
排序方法 |
時間復雜度 |
空間復雜度 |
穩定性 |
復雜性 |
||
平均情況 |
最壞情況 |
最好情況 |
|||||
插入排序 |
希爾排序 |
O(Nlog2N) |
O(N1.5) |
|
O(1) |
不穩定 |
較復雜 |
時間復雜度
步長的選擇是希爾排序的重要部分。只要最終步長為1任何步長序列都可以工作。
算法最開始以一定的步長進行排序。然後會繼續以一定步長進行排序,最終算法以步長為1進行排序。當步長為1時,算法變為插入排序,這就保證了數據一定會被排序。 Donald Shell 最初建議步長選擇為N/2並且對步長取半直到步長達到1。雖然這樣取可以比O(N2)類的算法(插入排序)更好,但這樣仍然有減少平均時間和最差時間的余地。可能希爾排序最重要的地方在於當用較小步長排序後,以前用的較大步長仍然是有序的。比如,如果一個數列以步長5進行了排序然後再以步長3進行排序,那麽該數列不僅是以步長3有序,而且是以步長5有序。如果不是這樣,那麽算法在叠代過程中會打亂以前的順序,那就不會以如此短的時間完成排序了。
已知的最好步長序列是由Sedgewick提出的(1, 5, 19, 41, 109,...)
這項研究也表明“比較在希爾排序中是最主要的操作,而不是交換。”用這樣步長序列的希爾排序比插入排序和堆排序都要快,甚至在小數組中比快速排序還快,但是在涉及大量數據時希爾排序還是比快速排序慢。
算法穩定性
由上文的希爾排序算法演示圖即可知,希爾排序中相等數據可能會交換位置,所以希爾排序是不穩定的算法。
直接插入排序和希爾排序的比較
直接插入排序是穩定的;而希爾排序是不穩定的。
直接插入排序更適合於原始記錄基本有序的集合。
希爾排序的比較次數和移動次數都要比直接插入排序少,當N越大時,效果越明顯。
在希爾排序中,增量序列gap的取法必須滿足:最後一個步長必須是 1 。
直接插入排序也適用於鏈式存儲結構;希爾排序不適用於鏈式結構。
運行結果
排序前: 9 1 2 5 7 4 8 6 3 5 gap = 5: 4 1 2 3 5 9 8 6 5 7 gap = 2: 2 1 4 3 5 6 5 7 8 9 gap = 1: 1 2 3 4 5 5 6 7 8 9 排序後: 1 2 3 4 5 5 6 7 8 9
(4)排序之希爾排序