演算法淺談——分治演算法與歸併、快速排序(附程式碼和動圖演示)

在之前的文章當中，我們通過海盜分金幣問題詳細講解了遞迴方法。

我們可以認為在遞迴的過程當中，我們通過函式自己呼叫自己，將大問題轉化成了小問題，因此簡化了編碼以及建模。今天這篇文章呢，就正式和大家聊一聊將大問題簡化成小問題的分治演算法的經典使用場景——排序。

排序演算法

排序演算法有很多，很多博文都有總結，號稱有十大經典的排序演算法。我們信手拈來就可以說上來很多，比如插入排序、選擇排序、桶排序、希爾排序、快速排序、歸併排序等等。老實講這麼多排序演算法，但我們實際工作中並不會用到那麼多，凡是高階語言都有自帶的排序工具，我們直接呼叫就好。為了應付面試以及提升自己演算法能力呢，用到的也就那麼幾種。今天我們來介紹一下利用分治思想實現的兩種經典排序演算法——歸併排序與快速排序。

歸併排序

我們先來講歸併排序，歸併排序的思路其實很簡單，說白了只有一句話：兩個有序陣列歸併的複雜度是\(O(n)\)。

我們舉個例子：

a = [1, 4, 6]
b = [2, 4, 5]
c = []

我們用i和j分別表示a和b兩個陣列的下標，c表示歸併之後的陣列，顯然一開始的時候i, j = 0, 0。我們不停地比較a和b陣列i和j位置大小關係，將小的那個數填入c。

填入一個數之後：

i = 1
j = 0
a = [1, 4, 6]
b = [2, 4, 5]
c = [1]

填入兩個數之後：

i = 1
j = 1
a = [1, 4, 6]
b = [2, 4, 5]
c = [1, 2]

我們重複以上步驟，直到a和b陣列當中所有的數都填入c陣列為止，我們可以很方便地寫出以上操作的程式碼：

def merge(a, b):
  i, j = 0, 0
  c = []
  while i < len(a) or j < len(b):
    # 判斷a陣列是否已經全部放入
    if i == len(a):
      c.append(b[j])
      j += 1
      continue
    elif j == len(b):
      c.append(a[i])
      i += 1
      continue
    # 判斷大小
    if a[i] <= b[j]:
      c.append(a[i])
      i += 1
    else:
      c.append(b[j])
      j += 1
  return c

從上面的程式碼我們也能看出來，這個過程雖然簡單，但是寫成程式碼非常麻煩，因為我們需要判斷陣列是否已經全部填入的情況。這裡有一個簡化程式碼的優化，就是在a和b兩個陣列當中插入一個”標兵“，這個標兵設定成正無窮大的數，這樣當a陣列當中其他元素都彈出之後。由於標兵大於b陣列當中除了標兵之外其他所有的數，就可以保證a陣列永遠不會越界，如此就可以簡化很多程式碼了（前提，a和b陣列當中不存在和標兵一樣大的數）。

我們來看程式碼：

def merge(a, b):
  i, j = 0, 0
  # 插入標兵
  a.append(MAXINT)
  b.append(MAXINT)
  c = []
  # 由於插入了標兵，所以長度判斷的時候需要-1
  while i < len(a)-1 or j < len(b)-1:
    if a[i] <= b[j]:
      c.append(a[i])
      i += 1
    else:
      c.append(b[j])
      j += 1
  return c

這裡應該都沒有問題，接下來的問題是我們怎麼利用歸併陣列的操作來排序呢？

其實很簡單，這也是歸併排序的精髓。

我們每次將一個數組一分為二，顯然，這個劃分出來的陣列不一定是有序的。但如果我們繼續切分呢？直到陣列當中只有一個元素的時候，是不是就天然有序了呢？

我們舉個例子：

          [4, 1, 3, 2]
           /        \
        [4, 1]    [3, 2]
        /    \    /    \
      [4]   [1]  [3]   [2]
        \    /     \   /
        [1, 4]     [2, 3]
           \        /
          [1, 2, 3, 4]

通過上面的這個過程我們可以發現，在歸併排序的時候，我們先一直往下遞迴切分陣列，直到所有的切片當中只有一個元素天然有序。接著一層一層地歸併回來，當所有元素歸併結束的時候，陣列就完成了排序。這也就是歸併排序的全部過程。

如果還不理解，還可以參考一下下面的動圖。

我們來試著用程式碼來實現。之前我曾經在面試的時候被要求在白板上寫過歸併排序，當時我用的C++覺得編碼還有一定的難度。現在，當我用習慣了Python之後，我感覺編碼難度降低了很多。因為Python支援許多陣列相關的高階操作，比如切片，變長等等。整個歸併排序的程式碼不超過20行，我們一起來看下程式碼：

def merge_sort(arr):
    n = len(arr)
    # 當長度小於等於1，說明天然有序
    if n <= 1:
        return arr
    mid = n // 2
    # 通過切片將陣列一分為二，遞迴排序左邊以及右邊部分
    L, R = merge_sort(arr[: mid]), merge_sort(arr[mid: ])
    n_l, n_r = len(L), len(R)

    # 陣列當中插入標兵
    L.append(sys.maxsize)
    R.append(sys.maxsize)
    new_arr = []
    i, j = 0, 0

    # 歸併已經排好序的L和R
    while i < n_l or j < n_r:
        if L[i] <= R[j]:
            new_arr.append(L[i])
            i += 1
        else:
            new_arr.append(R[j])
            j += 1
    return new_arr

你看，無論是思想還是程式碼實現，歸併排序並不難，就算一開始不熟悉，寫個兩遍也一定沒問題了。

理解了歸併排序之後，再來學快速排序就不難了，我們一起來看快速排序的演算法原理。

快速排序

快速排序同樣利用了分治的思想，我們每次做一個小的操作，讓陣列的一部分變得有序，之後我們通過遞迴，將這些有序的部分組合在一起，達到整體有序。

在歸併排序當中，我們劃分問題的方法是橫向切分，我們直接將陣列一分為二，針對這兩個部分分別排序。快排稍稍不同，它並不是針對陣列的橫向切分，而是從問題本身出發的”縱向“切分。在快速排序當中，我們解決的子問題不是對陣列的一部分排序，而是提升陣列的有序程度。怎麼提升呢？我們在陣列當中尋找一個數，作為標杆，我們利用這個標杆調整陣列當中元素的順序。將小於它的放到它的左側，大於它的放到它的右側。這麼一個操作結束之後，可以肯定的是，這個標杆所在的位置就是排序完成之後，它應該在的位置。

我們來看個例子：

a = [8, 4, 3, 9, 10, 2, 7]

我們選擇7作為標杆，一輪操作之後可以得到：

a = [2, 4, 3, 7, 9, 10, 8]

接著我們怎麼做呢？很簡單，我們只需要針對標杆前面以及標杆後面的部分重複上述操作即可。如果還不明白的同學可以看一下下面這張動圖：

如果用C++寫過快排的同學肯定對於快排的程式碼印象深刻，它是屬於典型的原理不難，但是寫起來很麻煩的演算法。因為快速排序需要用到兩個下標，寫的時候一不小心很容易寫出bug。同樣，由於Python當中動態陣列的支援非常好，我們可以避免使用下標來實現快排，這樣程式碼的可讀性以及編碼難度都要降低很多。

多說無益，我們來看程式碼：

def quick_sort(arr):
    n = len(arr)
    # 長度小於等於1說明天然有序
    if n <= 1:
        return arr
  
    # pop出最後一個元素作為標杆
    mark = arr.pop()
    # 用less和greater分別儲存比mark小或者大的數
    less, greater = [], []
    for x in arr:
        if x <= mark:
            less.append(x)
        else:
            greater.append(x)
    arr.append(mark)
    return quick_sort(less) + [mark] + quick_sort(greater)

整個程式碼出去註釋，不到15行，我想大家應該都非常容易理解。

最後，我們來分析一下這兩個演算法的複雜度，為什麼說這兩個演算法都是\(nlogn\)的演算法呢？（不考慮快速排序最差情況）這個證明非常簡單，我們放一張圖大家一看就明白了：

我們在遞迴的過程當中，我們只遍歷了一遍陣列，雖然我們每一層都會講陣列拆分。但是在遞迴樹上同一層的遞迴函式遍歷的總數加起來應該是等於陣列的總長也就是n的。

而且遞迴的層數是有限制的，因為我們每次都將陣列一分為二。而一個數組的最小長度是1，也就是說極端情況下我們一共能有\(\log_2^n\)層，每一層的複雜度總和是n，所以整體的複雜度是\(nlogn\)。

當然對於快速排序演算法來說，如果陣列是倒序的，我們預設取最後一個元素作為標杆的話，我們是無法切分陣列的，因為除它之外所有的元素都比它大。在這種情況下演算法的複雜度會退化到\(n^2\)。所以我們說快速排序演算法最差複雜度是\(O(n^2)\)。

到這裡，關於歸併排序與快速排序的演算法就講完了。這兩個演算法並不難，我想學過演算法和資料結構的同學應該都有印象，但是在實際面試當中，真正能把程式碼寫出來並且沒有明顯bug的實在是不多。我想，不論之前是否已經學會了，回顧一下都是很有必要的吧。

今天的文章就到這裡，希望大家有所收穫。如果喜歡本文，請順手點個關注吧。

演算法淺談——分治演算法與歸併、快速排序(附程式碼和動圖演示)

排序演算法

歸併排序

快速排序

演算法淺談——分治演算法與歸併、快速排序(附程式碼和動圖演示)

資料結構與演算法--排序（冒泡、選擇、歸併、快速排序、堆排序）

java--淺談線程（二、線程的方法和狀態）

十二種排序包你滿意（冒泡、插入、歸併、快速排序等包含希爾和計數排序）

Java常用的八種排序演算法與程式碼實現（二）：歸併排序法、快速排序法

淺談ICA演算法的概念、本質和流程

淺談資料結構與演算法

排序演算法的C++實現與效能分析（插入排序、歸併排序、快速排序、STOOGE排序、堆排序）

淺談資料結構與演算法分析學習及如何進行演算法分析

排序演算法——分治思想與歸併排序

JavaScript 資料結構與演算法之美 - 歸併排序、快速排序、希爾排序、堆排序

演算法淺談——遞迴演算法與海盜分金問題

演算法淺談——走迷宮問題與廣度優先搜尋

淺談Oracle12c 數據庫、用戶、CDB與PDB之間的關系

查詢演算法淺談演算法和資料結構: 七二叉查詢樹淺談演算法和資料結構: 十一雜湊表

排序演算法（直接插入、氣泡排序、選擇排序、快速排序、希爾排序、堆排序、歸併排序）

【python資料結構與演算法】幾種排序演算法：氣泡排序、快速排序

選擇排序、氣泡排序、合併排序、快速排序、歸併排序的演算法原理

淺談C#中的委託、事件與非同步

3. 排序通常有多種演算法，如氣泡排序、插入排序、選擇排序、希爾排序、歸併排序、快速排序，請選擇任意2種用java實現 [分值：20] 您的回答：(空) （簡答題需要人工評分）

演算法淺談——分治演算法與歸併、快速排序(附程式碼和動圖演示)

排序演算法

歸併排序

快速排序

相關推薦