1. 程式人生 > >資料結構與演算法---排序演算法(Sort Algorithm)

資料結構與演算法---排序演算法(Sort Algorithm)

排序演算法的介紹

排序也稱排序演算法 (Sort Algorithm),排序是將一組資料,依指定的順序進行排列的過程。

排序的分類

1) 內部排序: 指將需要處理的所有資料都載入 到內部儲存器(記憶體)中進行排序。

2) 外部排序法:資料量過大,無法全部載入到內 存中,需要藉助外部儲存(檔案等)進行 排序。

 常見的排序演算法分類

 

演算法的時間複雜度

 度量一個程式(演算法)執行時間的兩種方法

1、事後統計的方法 這種方法可行, 但是有兩個問題:一是要想對設計的演算法的執行效能進行評測,需要實際執行該程式;

二是所得時間的統計量依賴於計算機的硬體、軟體等環境因素, 這種方式,要在同一臺計算機的相同狀態下執行,才能比較那個演算法速度更快。

2、事前估算的方法 通過分析某個演算法的時間複雜度來判斷哪個演算法更優.

時間頻度

時間頻度:一個演算法花費的時間與演算法中語句的執行次數成正比例,哪個演算法中語句執行次數多,它花費時間就多。一個演算法中的語句執行次數稱為語句頻度或時間頻度。記為T(n)。

 舉例說明-基本案例

比如計算1-100所有數字之和, 我們設計兩種演算法:

時間複雜度

 1、一般情況下,演算法中的基本操作語句的重複執行次數是問題規模n的某個函式,用T(n)表示,若有某個輔助函式f(n),使得當n趨近於無窮大時,T(n) / f(n) 的極限值為不等於零的常數,則稱f(n)是T(n)的同數量級函式。記作 T(n)=O( f(n) ),稱O( f(n) )  為演算法的漸進時間複雜度,簡稱時間複雜度。

 2、T(n) 不同,但時間複雜度可能相同。 如:T(n)=n²+7n+6 與 T(n)=3n²+2n+2 它們的T(n) 不同,但時間複雜度相同,都為O(n²)。

 3、計算時間複雜度的方法:

  1. 用常數1代替執行時間中的所有加法常數  T(n)=n²+7n+6 => T(n)=n²+7n+1
  2. 修改後的執行次數函式中,只保留最高階項  T(n)=n²+7n+1 => T(n) = n²
  3. 去除最高階項的係數 T(n) = n² => T(n) = n² => O(n²)

常見的時間複雜度

 

說明:

常見的演算法時間複雜度由小到大依次為:Ο(1)<Ο(log2n)<Ο(n)<Ο(nlog2n)<Ο(n2)<Ο(n3)< Ο(nk) <Ο(2n) ,隨著問題規模n的不斷增大,上述時間複雜度不斷增大,演算法的執行效率越低

從圖中可見,我們應該儘可能避免使用指數階的演算法

時間複雜度示例介紹

1)常數階O(1)

無論程式碼執行了多少行,只要是沒有迴圈等複雜結構,那這個程式碼的時間複雜度就都是O(1)

上述程式碼在執行的時候,它消耗的時候並不隨著某個變數的增長而增長,那麼無論這類程式碼有多長,即使有幾萬幾十萬行,都可以用O(1)來表示它的時間複雜度。

2)對數階O(log2n)

說明:在while迴圈裡面,每次都將 i 乘以 2,乘完之後,i 距離 n 就越來越近了。假設迴圈x次之後,i 就大於 2 了,此時這個迴圈就退出了,也就是說 2 的 x 次方等於 n,那麼 x = log2n也就是說當迴圈 log2n 次以後,這個程式碼就結束了。因此這個程式碼的時間複雜度為:O(log2n)  。 O(log2n) 的這個2 時間上是根據程式碼變化的,i = i * 3 ,則是 O(log3n) .

3)線性階O(n)

說明:這段程式碼,for迴圈裡面的程式碼會執行n遍,因此它消耗的時間是隨著n的變化而變化的,因此這類程式碼都可以用O(n)來表示它的時間複雜度

 4)線性對數階O(nlogN)

說明:線性對數階O(nlogN) 其實非常容易理解,將時間複雜度為O(logn)的程式碼迴圈N遍的話,那麼它的時間複雜度就是 n * O(logN),也就是了O(nlogN)

 5)平方階O(n²)

說明:平方階O(n²) 就更容易理解了,如果把 O(n) 的程式碼再巢狀迴圈一遍,它的時間複雜度就是 O(n²),這段程式碼其實就是嵌套了2層n迴圈,它的時間複雜度就是 O(n*n),即  O(n²) 如果將其中一層迴圈的n改成m,那它的時間複雜度就變成了 O(m*n)

6)立方階O(n³)、K次方階O(n^k)

說明:參考上面的O(n²) 去理解就好了,O(n³)相當於三層n迴圈,其它的類似

 平均時間複雜度和最壞時間複雜度

  1. 平均時間複雜度是指所有可能的輸入例項均以等概率出現的情況下,該演算法的執行時間。
  2. 最壞情況下的時間複雜度稱最壞時間複雜度。一般討論的時間複雜度均是最壞情況下的時間複雜度。 這樣做的原因是:最壞情況下的時間複雜度是演算法在任何輸入例項上執行時間的界限,這就保證了演算法的執行時間不會比最壞情況更長。
  3. 平均時間複雜度和最壞時間複雜度是否一致,和演算法有關(如圖:)。

 

演算法的空間複雜度簡介

  1. 類似於時間複雜度的討論,一個演算法的空間複雜度(Space Complexity)定義為該演算法所耗費的儲存空間,它也是問題規模n的函式。
  2. 空間複雜度(Space Complexity)是對一個演算法在執行過程中臨時佔用儲存空間大小的量度。有的演算法需要佔用的臨時工作單元數與解決問題的規模n有關,它隨著n的增大而增大,當n較大時,將佔用較多的儲存單元,例如快速排序和歸併排序演算法就屬於這種情況
  3. 在做演算法分析時,主要討論的是時間複雜度。從使用者使用體驗上看,更看重的程式執行的速度。一些快取產品(redis, memcache)和演算法(基數排序)本質就是用空間換時間.