資料結構與演算法之美專欄學習筆記-排序(下）

阿新 • • 發佈：2018-11-11

分治思想

分治，顧明思意就是分而治之，將一個大問題分解成小的子問題來解決，小的子問題解決了，大問題也就解決了。

分治與遞迴的區別

分治演算法一般都用遞迴來實現的。分治是一種解決問題的處理思想，遞迴是一種程式設計技巧。

歸併排序

演算法原理

歸併的思想

先把陣列從中間分成前後兩部分，然後對前後兩部分分別進行排序，

再將排序好的兩部分合併到一起，這樣整個陣列就有序了。

這就是歸併排序的核心思想。如何用遞迴實現歸併排序呢？

寫遞迴程式碼的技巧就是分寫得出遞推公式，然後找到終止條件，最後將遞推公式翻譯成遞迴程式碼。

遞推公式

merge_sort(p…r) = merge(merge_sort(p…q), merge_sort(q+1…r))

終止條件

p >= r 不用再繼續分解

程式碼實現

public static void MergeSort(int[] data,int n){
    //傳入陣列、索引0和最後一位的索引
    Merge_c(data, 0, n - 1);
}
public static void Merge_c(int[] data,int p,int r){
    //遞迴終止條件：p與r相等或p大於r即細分到每個資料成員
    if (p >= r) return;
    //定義q為中間值
    int q = (p + r) / 2;
    //對q和中間值、中間值和r繼續細分 

    Merge_c(data,p,q);
    Merge_c(data,q+1,r);
    //直到細分到每個資料成員返回後，開始兩兩合併
    Merge(data,p,q,r);
}
public static void Merge(int[] data,int front,int mid,int back){
    //定義data陣列中第front到mid的陣列組成的陣列
    int[] frontArray = new int[mid + 1];
    for (int n = front; n < frontArray.Length; n++)
        frontArray[n]  
= data[n];
    //定義data陣列中第mid到back的陣列組成的陣列
    int[] backArray = new int[back - mid];
    for (int n = mid; n < backArray.Length; n++)
        backArray[n] = data[n];
    //定義臨時陣列，長度為陣列中第front到back間的資料的長度
    int[] temp = new int[back - front + 1];
    //定義三個臨時變數作為遊標，分別初始化為front和mid+1，以及臨時陣列中的最後一個數據的位置為0
    int i = front, j = mid+1, k = 0;
    //迴圈直到i超過了mid或者j超過了back
    while(i<=mid&&j<=back){
        //根據大小，將data的第i/j的資料存入temp陣列
        if (data[i] < data[j])
            temp[k++] = data[i++];
        else
            temp[k++] = data[j++];
    }
    //定義兩個臨時變數為記錄起始位置，初始化為合併的兩陣列中的前一個數組的頭尾索引
    int start = i, end = mid;
    //如果是後一個數組沒有遍歷完，就改為後一個數組的頭尾索引
    if (j <= back){
        start = j;
        end = back;
    }
    //將未遍完的陣列剩餘的資料存入temp陣列
    while (start <= end)
        temp[k++] = data[start++];
    //將完成排序的temp數組合併到對應的data陣列位置
    for (int l = 0; l < temp.Length; l++)
        data[front + l] = temp[l];
}

效能分析

演算法穩定性

歸併排序是一種穩定排序演算法。

時間複雜度

歸併排序的時間複雜度是O(nlogn)。

空間複雜度

歸併排序演算法不是原地排序演算法，空間複雜度是O(n)

因為歸併排序的合併函式，在合併兩個陣列為一個有序陣列時，需要藉助額外的儲存空間

快速排序

演算法原理

快排的思想

如果要排序陣列中下標從p到r之間的一組資料，我們選擇p到r之間的任意一個數據作為pivot（分割槽點）。

然後遍歷p到r之間的資料，將小於pivot的放到左邊，將大於pivot的放到右邊，將povit放到中間。

經過這一步之後，陣列p到r之間的資料就分成了3部分，前面p到q-1之間都是小於povit的，中間是povit，後面的q+1到r之間是大於povit的。

根據分治、遞迴的處理思想，我們可以用遞迴排序下標從p到q-1之間的資料和下標從q+1到r之間的資料，直到區間縮小為1，就說明所有的資料都有序了。

遞推公式

quick_sort(p…r) = quick_sort(p…q-1) + quick_sort(q+1, r)

終止條件

p >= r

程式碼實現

專欄寫的快排拆成三個方法讓人頭疼，我用C#改寫了群裡演算法大佬用c寫的快排，簡單明瞭。

public static void QuickSort(int[] data,int front,int back)
{
    //定義頭尾索引、分割槽點
    int i = front, j = back, mid = data[(front + back) / 2];
    //迴圈到i大於j
    while (i <= j)
    {
        //從頭索引i開始遍歷陣列，直到找到比分割槽點大的陣列成員
        while (data[i] < mid) i++;
        //從尾索引j開始遍歷陣列，直到找到比分割槽點小的陣列成員
        while (data[j] > mid) j--;
        //如果i、j都找到了，此時i仍然比j小，而且前者比後者大，就交換二者位置，使兩個陣列成員有序
        if (i <= j)
        {
            int temp = data[i];
            data[i] = data[j];
            data[j] = temp;
            //交換完成後，兩索引步進直到i比j大結束迴圈
            i++;j--;
        }
    }
    //迴圈結束後如果i仍然小於尾或者j仍然大於頭，根據前面的條件此時i肯定是大於j的
    //就以原頭為新頭，j為新尾，i為新頭，原尾為新尾，遞迴自身呼叫，遞迴到終點後陣列必定有序
    if (i < back) QuickSort(data,i, back);
    if (front < j) QuickSort(data,front, j);
}

效能分析

演算法穩定性

快速排序是不穩定的排序演算法。

時間複雜度

如果每次分割槽操作都能正好把陣列分成大小接近相等的兩個小區間，

那快排的時間複雜度遞推求解公式跟歸併的相同。快排的時間複雜度也是O(nlogn)。

如果陣列中的元素原來已經有序了，快排的時間複雜度就是O(n^2)。

前面兩種情況，一個是分割槽及其均衡，一個是分割槽極不均衡，

它們分別對應了快排的最好情況時間複雜度和最壞情況時間複雜度。

T(n)大部分情況下是O(nlogn)，只有在極端情況下才是退化到O(n^2)。

空間複雜度

快排是一種原地排序演算法，空間複雜度是O(1)

歸併排序與快速排序的區別

歸併排序

先遞迴呼叫，再進行合併，合併的時候進行資料的交換。所以它是自下而上的排序方式。

何為自下而上？就是先解決子問題，再解決父問題。
快速排序

先分割槽，在遞迴呼叫，分割槽的時候進行資料的交換。所以它是自上而下的排序方式。

何為自上而下？就是先解決父問題，再解決子問題。

思考

O(n)時間複雜度內求無序陣列中第K大元素

有10個訪問日誌檔案，每個日誌檔案大小約為300MB，每個檔案裡的日誌都是按照時間戳從小到大排序的。現在需要將這10個較小的日誌檔案合併為1個日誌檔案，合併之後的日誌仍然按照時間戳從小到大排列。如果處理上述任務的機器記憶體只有1GB，你有什麼好的解決思路能快速地將這10個日誌檔案合併

資料結構與演算法之美專欄學習筆記-排序(下）

分治思想分治思想分治，顧明思意就是分而治之，將一個大問題分解成小的子問題來解決，小的子問題解決了，大問題也就解決了。分治與遞迴的區別分治演算法一般都用遞迴來實現的。分治是一種解決問題的處理思想，遞迴是一種程式設計技巧。歸併排序演算法原理歸併的思想先把陣列從中間分

資料結構與演算法之美專欄學習筆記-排序(上）

排序方法氣泡排序、插入排序、選擇排序、快速排序、歸併排序、計數排序、基數排序、桶排序。複雜度歸類氣泡排序、插入排序、選擇排序 O(n^2) 快速排序、歸併排序 O(nlogn) 計數排序、基數排序、桶排序 O(n) 演算法的執行效率 1. 最

資料結構與演算法之美專欄學習筆記-排序優化

選擇合適的排序演算法回顧選擇排序演算法的原則 1）線性排序時間複雜度很低但使用場景特殊，如果要寫一個通用排序函式，不能選擇線性排序。 2）為了兼顧任意規模資料的排序，一般會首選時間複雜度為O(nlogn)的排序演算法來實現排序函式。 3）同為O(nlogn)的快排和歸併排序相比，

資料結構與演算法之美專欄學習筆記-線性排序

線性排序線性排序的概念線性排序演算法包括桶排序、計數排序、基數排序。線性排序演算法的時間複雜度為O(n)。線性排序的特點此3種排序演算法都不涉及元素之間的比較操作，是非基於比較的排序演算法。對排序資料的要求很苛刻，重點掌握此3種排序演算法的適用場景。桶排序演算法

資料結構與演算法之美專欄學習筆記-陣列

什麼是陣列陣列（Array）是一種線性表資料結構。它用一組連續的記憶體空間，來儲存一組具有相同型別的資料。線性表線性表就是資料排成像一條線一樣的結構。常見的線性表結構：陣列，連結串列、佇列、棧等。非線性表有：二叉樹、圖、堆等。連續的記憶體空間和相同型別的資料優點：兩限制使得

資料結構與演算法之美專欄學習筆記-複雜度分析

複雜度分析什麼是複雜度分析資料結構和演算法解決是“如何讓計算機更快時間、更省空間的解決問題”。因此需從執行時間和佔用空間兩個維度來評估資料結構和演算法的效能。分別用時間複雜度和空間複雜度兩個概念來描述效能問題，二者統稱為複雜度。複雜度描述的是演算法執行時間（或佔用空間）與資料規模的增長關係

資料結構與演算法之美專欄學習筆記-二分查詢(下)

四種常見的二分查詢變形問題查詢第一個值等於給定值的元素 //查詢第一個等於給定值的元素 public static int BSearch2(int[] a, int n, int value){ //定義陣列頭尾索引 int low = 0, high = n - 1;

資料結構與演算法之美專欄學習筆記-跳錶

跳錶的概念對連結串列建立n級索引，例如每兩個結點提取一個節點到上一層，稱之為索引層。圖中的down表示down指標，指向下一級結點跳錶的時間複雜度跳錶的高度跳錶的高度是log2n。跳錶的時間複雜度跳錶中查詢某個資料的時間複雜度是O(logn)。

資料結構與演算法之美專欄學習筆記-雜湊演算法

雜湊演算法的定義和原理將任意長度的二進位制串對映為固定長度的二進位制串。這個對映的規則就是雜湊演算法，而通過原始資料對映之後得到的二進位制串就是雜湊值。設計一個優秀的雜湊演算法需要滿足：從雜湊值不能反向推匯出原始資料（所以雜湊演算法也叫單向雜湊演算法）；對輸入資料非常敏感，哪怕原始

資料結構與演算法之美專欄學習筆記-二叉樹基礎(上）

樹節點的定義樹中的元素稱之為節點高度的定義節點的高度：節點到葉子節點的最長路徑樹的高度：跟節點的高度深度的定義根節點到這個節點所經歷的邊的個數層的定義節點的深度+1 二叉樹滿二叉樹除了葉子結點外每個節點都有左右兩個子節點完全二叉樹葉子結

資料結構與演算法之美專欄學習筆記-二叉樹基礎(下）

二叉查詢樹 Binary Search Tree 二叉查詢樹的定義二叉查詢樹又稱二叉搜尋樹。其要求在二叉樹中的任意一個節點，其左子樹中的每個節點的值，都要小於這個節點的值，而右子樹的節點的值都大於這個節點的值。二叉查詢樹的查詢操作二叉樹類、節點類以及查詢方法的程式碼實現

資料結構與演算法之美-堆和堆排序

堆和堆排序如何理解堆堆是一種特殊的樹，只要滿足以下兩點，這個樹就是一個堆。 ①完全二叉樹，完全二叉樹要求除了最後一層，其他層的節點個數都是滿的，最後一層的節點都靠左排列。 ②樹中每一個結點的值都必須大於等於（或小於等於）其子樹中每個節點的值。大於等於的情況稱為大頂堆，小於等於的情況稱為小頂堆。

《資料結構與演算法之美》專欄閱讀筆記5——散列表和雜湊函式

這應該是看完最呆（沒有想到的那種呆~）的一個小章節了，給作者鼓掌，講的好好。果然抽象能力才是王道文章目錄 1、散列表 1.1、小概念 1.2、雜湊函式 1

《資料結構與演算法之美》專欄閱讀筆記4——二分查詢

找呀找呀找朋友文章目錄 1、二分查詢 2、變形的二分查詢 2.1、查詢第一個、最後一個值等於給定值的元素 2.2、查詢第一個大於等於、最後一個小於等於給定值

《資料結構與演算法之美》專欄閱讀筆記3——排序演算法

上週排計劃，說花個一天的時間看完好了（藐視臉）~然後每天回家看一會，看了一個星期……做人，要多照鏡子好嘛文章目錄 1、簡單排序 1.1 如何分析排序演算法

《資料結構與演算法之美》專欄閱讀筆記2——線性表

換個方式來寫筆記，最近啃完了《Thinking in Java》，想要在看專欄的時候多做點擴充套件性的東西，比如把難撩的泛型加進來做實現，程式碼還是要寫起來才曉得怎麼寫更酷。總之最近看書的過程中、搜尋答案的過程中發出了很多“哇~超厲害！超酷！我也要這樣棒棒噠！”的嘆聲。新的開始，

《資料結構與演算法之美》專欄閱讀筆記1——複雜度分析

蹭可愛的男朋友買的極客時間的專欄【資料結構與演算法之美】，作者讓大家定個學習的flag。o(￣▽￣)o，好吧，最近喜歡做思維導圖（純粹因為好看！），所以flag就是每篇都要寫讀書筆記咯~ 文章目錄 1、如何抓住重點，系統

資料結構與演算法之美課程筆記一如何抓住重點，系統高效地學習資料結構與演算法？

什麼是資料結構？什麼是演算法？從廣義上講，資料結構就是指一組資料的儲存結構。演算法就是操作資料的一種方法。從狹義上講，是指某些著名的資料結構和演算法，比如佇列、棧、堆、二分查詢、動態規劃等。那資料結構和演算法有什麼關係呢？資料結構和演算法是相輔相成的。資料結構是為演算法服務的

《資料結構與演算法之美》專欄閱讀筆記2

換個方式來寫筆記，最近啃完了《Thinking in Java》，想要在看專欄的時候多做點擴充套件性的東西，比如把難撩的泛型加進來做實現，程式碼還是要寫起來才曉得怎麼寫更酷。總之最近看書的過程中、搜尋答案的過程中發出了很多“哇~超厲害！超酷！我也要這樣棒棒噠！

學習：資料結構與演算法之美(1-3)

第一課基礎知識就像是一座大樓的地基，它決定了我們的技術高度。而要想快速做出點事情，前提條件一定是基礎能力過硬，“內功”要到位。第二課為什麼要學習資料結構和演算法（摘自網友極客時間留言）直接好處是能夠寫出效能更優的程式碼，演算法是一種解決問題的思路和方

資料結構與演算法之美專欄學習筆記-排序(下）

分治思想

分治思想

分治與遞迴的區別

歸併排序

演算法原理

程式碼實現

效能分析

快速排序

演算法原理

程式碼實現

效能分析

歸併排序與快速排序的區別

思考

相關推薦