七大排序演算法的個人總結（二）

阿新 • • 發佈：2018-12-20

歸併排序（Merge Sort）:

歸併排序是一個相當“穩定”的演算法對於其它排序演算法，比如希爾排序，快速排序和堆排序而言，這些演算法有所謂的最好與最壞情況。而歸併排序的時間複雜度是固定的，它是怎麼做到的？

兩個有序陣列的合併：

首先來看歸併排序要解決的第一個問題：兩個有序的陣列怎樣合成一個新的有序陣列：

比如陣列1｛ 3，5，7，8 ｝陣列2為｛ 1，4，9，10 ｝：

首先那肯定是建立一個長度為8的新陣列咯，然後就是分別從左到右比較兩個陣列中哪一個值比較小，然後複製進新的陣列中：比如我們這個例子：

｛ 3，5，7，8 ｝｛ 1

，4，9，10 ｝｛｝一開始新陣列是空的。

然後兩個指標分別指向第一個元素，進行比較，顯然，1比3小，所以把1複製進新陣列中：

｛ 3，5，7，8 ｝｛ 1，4，9，10 ｝｛ 1，｝

第二個陣列的指標後移，再進行比較，這次是3比較小：

｛ 3，5，7，8 ｝｛ 1，4，9，10 ｝｛ 1，3，｝

同理，我們一直比較到兩個陣列中有某一個先到末尾為止，在我們的例子中，第一個陣列先用完。｛ 3，5，7，8 ｝｛ 1，4，9，10 ｝｛ 1，3，4，5，7，8 ｝

最後把第二個陣列中的元素複製進新陣列即可。

｛ 1，3，4，5，7，8，9，10 ｝

由於前提是這個兩個陣列都是有序的，所以這整個過程是很快的，我們可以看出，對於一對長度為N的陣列，進行合併所需要的比較次數最多為2 * N -1（這裡多謝園友@icyjiang的提醒）。

這其實就是歸併排序的最主要想法和實現，歸併排序的做法是:

將一個數組一直對半分，問題的規模就減小了，再重複進行這個過程，直到元素的個數為一個時，一個元素就相當於是排好順序的。

接下來就是合併的過程了，合併的過程如同前面的描述。一開始合成兩個元素，然後合併4個，8個這樣進行。

所以可以看到，歸併排序是“分治”演算法的一個經典運用。

我們可以通過程式碼來看看歸併演算法的實現：

public static int[] sort(int[] array, int left, int right) {

    if (left == right) {

       return new int[] { array[left] };

    }

    int mid = (right + left) / 2;

    int[] l = sort(array, left, mid);

    int[] r = sort(array, mid + 1, right);

    return merge(l, r);

}

 

// 將兩個數組合併成一個

public static int[] merge(int[] l, int[] r) {

    int[] result = new int[l.length + r.length];

    int p = 0;

    int lp = 0;

    int rp = 0;

    while (lp < l.length && rp < r.length) {

       result[p++] = l[lp] < r[rp] ? l[lp++] : r[rp++];

    }

    while (lp < l.length) {

       result[p++] = l[lp++];

    }

    while (rp < r.length) {

       result[p++] = r[rp++];

    }

    return result;

}

程式碼量其實也並不多，主要的工作都在合併兩個陣列上。從程式碼上看，

if (left == right) {

    return new int[] { array[left] };

}

這個是遞迴的基準（base case），也就是結束的條件是當元素的個數只有一個時。

int mid = (right + left) / 2;

int[] l = sort(array, left, mid);

int[] r = sort(array, mid + 1, right);

這一部分顯然就是分（divide），將一個大問題分成小的問題。

最後也就是治（conquer）了，將兩個子問題的解合併可以得到較大問題的解。

所以可以說，歸併排序是說明遞迴和分治演算法的經典例子。

然後就又要回到比較原始的問題了，歸併排序它為什麼會快呢？

想回答這個問題可以先想一下之前說過的提高排序速度的兩個重要的途徑：一個是減少比較次數，一個是減少交換次數。

對於歸併排序而言，我們來從之前的例子應該可以看到，兩個陣列的合併過程是線性時間的，也就是說我們每一次比較都可以確定出一個元素的位置。這是一個重要的性質。

我們來看一個可以用一個例子來體會一下假如有這樣一個數組｛ 3，7，2，5，1，0，4，6 ｝，

冒泡和選擇排序的比較次數是25次。

直接插入排序用了15次。

而歸併排序的次數是相對穩定的，由我們上面提到的比較次數的計算方法，我們的例子要合併4對長度為1的，2對長度為2的，和1對長度為4的。

歸併排序的最多的比較次數為4 * 1 + 2 * 3 + 7 = 17次。（感謝@icyjiang的提醒）

再次說明一下，這個例子依然只是為了好理解，不能作為典型例子來看。

因為元素的隨機性，直接插入排序也可能是相當悲劇的。但我們應該從中看到的是歸併排序在比較次數上的優勢。

至於在種優勢是怎麼來的，我個人不成熟的總結一下，就是儘量的讓上一次操作的結果為下一次操作服務。

我們每一次合併出來的陣列，是不是就是為下一次合併做準備的。因為兩個要合併的陣列是有序的，我們才可能高效地進行合併。

快速排序（Quick Sort）：

這個演算法的霸氣程度從它的名字就可以看出來了。快速排序的應用也是非常廣的的，各種類庫都可以看到他的身影。這當然與它的“快”是有聯絡的，正所謂天下武功唯快不破。

快速排序的一個特點是，對陣列的一次遍歷，可以找到一個樞紐元（pivot）確定位置，還可以把這個陣列以這個樞紐元分成兩個部分，左邊的元素值都比樞紐元小，右邊的都比樞紐元大。我們遞迴地解決這兩個子陣列即可。

我們還是通過一個特殊的例子來看一下快速排序的原理：

我們假設有這樣一個數組｛ 4，7，3，2，8，1，5 ｝

對於快速排序來說，第一步就是找出一個樞紐元，而對於樞紐元的尋找是對整個演算法的時間效能影響很大的，因為搞不好快速排序會退化成選擇排序那樣。

對於這個不具有代表性的例子，我們選擇的是第一個元素做為樞紐元。

pivot 4

｛ 4，7，3，2，8，1，5 ｝

其中，紅色為左指標，藍色為右指標。一開始我們從右邊開始，找到第一個比pivot小的數。停止，然後將該值賦給左指標，同樣，左指標向右移動。

也就是說我們第一次得到的的結果是這樣的：

｛ 1，7，3，2，8，1，5 ｝

同樣的道理，我們在左邊找到一個比pivot大的值，賦值給右指標，同時右指標左移一步。

得到的結果應該是這樣的：

｛ 1，7，3，2，8，7，5 ｝

請注意，我們的這個移動過程的前提都是左指標不能超過右指標的前提下進行的。

這兩個過程交替進行，其實就是在對元素進行篩選。這一次得到的結果是：

｛ 1，2，3，2，8，7，5 ｝

黃色高亮表示兩個指標重疊了，這時候我們也就找到了樞紐元的位置了，將我們的樞紐元的值插入。

也就是說，我們接下來的工作就是以這個樞紐元為分割，對左右兩個陣列進行同樣的排序工作。

來看看具體的程式碼是怎麼實現的：

public static void sort(int[] array, int start, int end) {

    if (start >= end) {

       return;

    }

    int left = start;

    int right = end;

    int temp = array[left];

    while (left < right) {

       while (left < right && temp < array[right]) {

           right--;

       }

       if (left < right) {

           array[left] = array[right];

           left++;

       }

       while (left < right && temp > array[left]) {

           left++;

       }

       if (left < right) {

           array[right] = array[left];

           right--;

       }

    }

    array[left] = temp;

    sort(array, start, left - 1);

    sort(array, left + 1, end);

}

接下來還是同樣的問題，快速排序為什麼會快呢？如果沒有足夠的強大，那不是“浪得虛名”嗎？

首先還是看看前面的例子。

首先可以比較容易感受到的就是元素的移動效率高了。比如說例子中的1，一下子就移動到了前面去。

這也是我個人的一點感受，只是覺得可以這樣理解比較高效的排序演算法的特性：

高效的排序演算法對元素的移動效率都是比較高的。

它不像冒泡，直接插入那樣，每次可能都是步進一步，而是比較快速的移動到“感覺是正確”的位置。

想想，希爾排序不就是這麼做的嗎？後面的堆排序也是這個原理。

其次，快速排序也符合我們前面說的，“讓上一個操作的結果為下一次操作服務”。

很明顯，在樞紐元左邊的元素都比樞紐元要小，右邊的都比樞紐元大。顯然，資料的範圍小了，資料的移動的準確性就高了。

但是，快速排序的一個隱患就是樞紐元的選擇，我提供的程式碼中是選第一個元素做樞紐元，這是一種很冒險的做法。

比如我們對一個數組｛ 9，8，7，6，5 ｝想通過快速排序來變成從小到大的排序。如果還是選擇以第一個元素為樞紐元的話，快速排序就變成選擇排序了。

所以，在實際應用中如果資料都是是隨機資料，那麼選擇第一個做樞紐元並沒有什麼不妥。因為這個本來就是看“人品”的。

但是，如果是對於一些比較有規律的資料，我們的“人品”可能就不會太好的。所以常見的有兩種選擇策略：

一種是使用隨機數來做選擇。呵呵，聽天由命。

另一種是取陣列中的第一個，最後一個和中間一個，選擇數值介於最大和最小之間的。

這一種又叫做“三數中值分割法”。理論上，這兩種選擇策略還是可能很悲劇的。但概率要小太多了。

堆排序用文字太難看懂了，想畫一些圖來幫助理解，求各位大大推薦可以比較方便畫二叉樹的工具。

from: https://www.cnblogs.com/yjiyjige/p/3256700.html

七大排序演算法的個人總結（二）

歸併排序（Merge Sort）: 歸併排序是一個相當“穩定”的演算法對於其它排序演算法，比如希爾排序，快速排序和堆排序而言，這些演算法有所謂的最好與最壞情況。而歸併排序的時間複雜度是固定的，它是怎麼做到的？兩個有序陣列的合併：首先來看歸併排序要解決的第一個問題：兩

淺談排序演算法的效率（二）—（Java筆記）

首先：咱也借用一下網上的那張XXX的圖，咯！在下面：接下來，就是咱的驗證時間了（驗證什麼？當然是各種演算法的時間複雜度比較咯），沒什麼好說的了，直接上碼吧。程式碼實現： import java.util.Arrays; public class SortSum

yolo 目標檢測演算法個人總結（yolov1）

yolo 目標檢測演算法個人總結目前yolo目標檢測有兩個版本，分別為v1和v2。因工作需要用yolo演算法檢測人物，所以這段時間重點看了這兩篇論文，並實現了對應的tensorflow程式碼。這裡記錄下在論文閱讀過程中的一些細節資訊，留給自己，同時也希望各位能指出本人

資料結構與演算法學習總結（二）

1.什麼是複雜度分析？（1）資料結構和演算法解決是“如何讓計算機更快時間、更省空間的解決問題”。（2）因此需要從執行時間和佔用空間兩個維度來評估資料結構和演算法的效能。（3）分別用時間複雜度和空間複雜度兩個概念描述效能問題，二者統稱為複雜度。（4）複雜度描述的

七大排序演算法的個人總結（三）

堆排序（Heap）: 要講堆排序之前先要來複習一下完全二叉樹的知識。定義：對一棵具有n個結點的二叉樹按層序編號，如果編號為i(0 <= i <= n)的結點與同樣深度的滿二叉樹編號為i的結點在二叉樹中位置完全相同，則這棵二叉樹稱為完全二叉樹。如上面

七大排序演算法的個人總結（一）

氣泡排序（Bubble Sort）：很多人聽到排序第一個想到的應該就是氣泡排序了。也確實，氣泡排序的想法非常的簡單：大的東西沉底，汽泡上升。基於這種思想，我們可以獲得第一個版本的冒泡： public static void sort1(int[] array) { for

[演算法天天見]（二）進階排序

進階排序一、說明二、演算法歸併排序快速排序一、說明進階排序主要會展示歸併排序演算法和快速排序演算法。歸併排序演算法由於不是原地排序演算法所以它的空間複雜度不是O(1)，它的時間複雜度是O(nlogn

系統學習機器學習之總結（二）--機器學習演算法比較

轉自：https://blog.csdn.net/bryan__/article/details/52026214 其實這篇文章真正出處來自：csuldw 本文主要回顧下幾個常用演算法的適應場景及其優缺點！機器學習演算法太多了，分類、迴歸、聚類、推薦、影象識別領域等等，要想找到一個合適演算

機器學習演算法總結（二）調參技巧

偏差和方差在統計學習框架下，Error = Bias + Variance。Error指的模型的預測錯誤率，由兩部分組成，一部分是由於模型太簡單而帶來的估計不準確的部分（Bias），另一部分是由於模型太複雜而帶來的更大的變化空間和不確定性（Variance）。如果要降低模型的Bi

幾個內部排序演算法的總結（JAVA版）

插入排序 1、直接插入排序 public void insertSort(int[] a){ for(int i=0;i<a.length;i++){ int key=a[i]; int pos=i; while(pos>0&&a

7中排序演算法學習總結（圖解+程式程式碼）

我們通常所說的排序演算法往往指的是內部排序演算法，即資料記錄在記憶體中進行排序。排序演算法大體可分為兩種：　　　　一種是比較排序，時間複雜度O(nlogn) ~ O(n^2)，主要有：氣泡排序，選擇排序，插入排序，歸併排序，堆排序，快速排序等。　　　　另一種是非比較排

基於Deep Learning的跟蹤演算法總結（二）

本文主要談談TCNN（樹狀CNN）實現物體跟蹤演算法的大致流程和原理。論文：《Modeling and Propagating CNNs in a Tree Structure for Visual Tracking》，應該是投了CVPR2017。論文地

測試開發工程師面試總結（二）——演算法篇

演算法也屬於常見面試內容之一，但基本不會超過《劍指offer》的範圍，在此附上一篇簡書上整理的內容：第二版java解法常見的面試題包括以下幾類：字串操作，檔案輸入輸出流及統計，矩陣操作，單例模式等。 1.針對字串的操作：如字串反轉、

關於2015阿里移動推薦演算法大賽的總結（二）——推薦演算法

雖然開始走錯了路，但是也學到了東西，美團技術團隊的文件還是不錯的，喜歡的童鞋可以經常去瞅瞅，後面我會給連結的~~~~ —————————————————————————————————————————————————————————————— 具體流程基本流程如

影象拼接演算法總結（二）

2、特徵提取與匹配 OpenCV中關於SURF演算法的部分，常常涉及到的是SURF、SurfFeatureDetector、SurfDescriptorExtractor這三個類； features2d.hpp標頭檔案中，有：typedef SURF SurfFeature

機器視覺學習總結（二）—— LDA，PCA演算法與應用

//***************************** Face Recognize *********************************** void train(){ // load training data nTrainFaces = loadFace

遠程協助開發總結（二）

控制 amp 為什麽不能 username 開發 col dsc exce nec 遠程協助開發的過程中繼續總結針對開發總結一的問題，改正了一些地方 1.圖像和命令采用兩個套接字，為什麽不能采用一個套接字？遠程協助是快頻的通信，圖像需要不間斷的從受控端發送到控制端，發送接

.net Kafka.Client多個Consumer Group對Topic消費不能完全覆蓋研究總結（二）

eight 分享 stat .com ima topic consumer 閱讀 padding 依據Partition和Consumer的Rebalance策略，找到Kafka.Client Rebalance代碼塊，還原本地環境，跟蹤調試，發現自定義Consumer G

命令和符號總結（二）

命令2017-05-13隨記—————————————————————————————— 20.uname 顯示系統內核信息 -r 顯示內核版本 -m 32位，64位本文出自 “一個Linux小白-學習運維” 博客，謝絕轉載！命令和符號總結（二）

設計模式總結（二）

靈活性 mil 一個 blog 以及對象模式結構型設計模式 con 建模設計模式可分為三種：創建型設計模式。結構型設計模式和行為型設計模式。一、創建型設計模式在設計模式中，創建型設計模式處理對象創建過程的設計模式。它依據實際情況來決定詳細如何創建對象。創建型模

七大排序演算法的個人總結（二）

相關推薦