1. 程式人生 > >快速排序演算法及得到陣列中任意第K大的數

快速排序演算法及得到陣列中任意第K大的數

1 快速排序的圖解

假設我們現在對6 1 2 7 9 3 4 5 10 8這個10個數進行排序。首先在這個序列中隨便找一個數作為基準數(不要被這個名詞嚇到了,就是一個用來參照的數,待會你就知道它用來做啥的了)。為了方便,就讓第一個數6作為基準數吧。接下來,需要將這個序列中所有比基準數大的數放在6的右邊,比基準數小的數放在6的左邊,類似下面這種排列。
3 1 2 5 4 6 9 7 10 8
在初始狀態下,數字6在序列的第1位。我們的目標是將6挪到序列中間的某個位置,假設這個位置是k。現在就需要尋找這個k,並且以第k位為分界點,左邊的數都小於等於6,右邊的數都大於等於6。想一想,你有辦法可以做到這點嗎?

給你一個提示吧。請回憶一下氣泡排序,是如何通過“交換”,一步步讓每個數歸位的。此時你也可以通過“交換”的方法來達到目的。具體是如何一步步交換呢?怎樣交換才既方便又節省時間呢?先別急著往下看,拿出筆來,在紙上畫畫看。我高中時第一次學習氣泡排序演算法的時候,就覺得氣泡排序很浪費時間,每次都只能對相鄰的兩個數進行比較,這顯然太不合理了。於是我就想了一個辦法,後來才知道原來這就是“快速排序”,請允許我小小的自戀一下(o)。

方法其實很簡單: 分別從初始序列6 1 2 7 9 3 4 5 10 8兩端開始“探測”。先從右往左找一個小於6的數,再從左往右找一個大於6的數,然後交換他們。這裡可以用兩個變數i和j,分別指向序列最左邊和最右邊。我們為這兩個變數起個好聽的名字“哨兵i”和“哨兵j”。剛開始的時候讓哨兵i指向序列的最左邊(即i=1),指向數字6。讓哨兵j指向序列的最右邊(即j=10),指向數字8。
在這裡插入圖片描述


首先哨兵j開始出動。因為此處設定的基準數是最左邊的數,所以需要讓哨兵j先出動,這一點非常重要(請自己想一想為什麼)。哨兵j一步一步地向左挪動(即j–),直到找到一個小於6的數停下來。接下來哨兵i再一步一步向右挪動(即i++),直到找到一個數大於6的數停下來。最後哨兵j停在了數字5面前,哨兵i停在了數字7面前。
在這裡插入圖片描述
在這裡插入圖片描述
現在交換哨兵i和哨兵j所指向的元素的值。交換之後的序列如下。
6 1 2 5 9 3 4 7 10 8
在這裡插入圖片描述
在這裡插入圖片描述

到此,第一次交換結束。接下來開始哨兵j繼續向左挪動(再友情提醒,每次必須是哨兵j先出發)。他發現了4(比基準數6要小,滿足要求)之後停了下來。哨兵i也繼續向右挪動的,他發現了9(比基準數6要大,滿足要求)之後停了下來。此時再次進行交換,交換之後的序列如下。
6 1 2 5 4 3 9 7 10 8


第二次交換結束,“探測”繼續。哨兵j繼續向左挪動,他發現了3(比基準數6要小,滿足要求)之後又停了下來。哨兵i繼續向右移動,糟啦!此時哨兵i和哨兵j相遇了,哨兵i和哨兵j都走到3面前。說明此時“探測”結束。我們將基準數6和3進行交換。交換之後的序列如下。
3 1 2 5 4 6 9 7 10 8
在這裡插入圖片描述
在這裡插入圖片描述
在這裡插入圖片描述

到此第一輪“探測”真正結束。此時以基準數6為分界點,6左邊的數都小於等於6,6右邊的數都大於等於6。回顧一下剛才的過程,其實哨兵j的使命就是要找小於基準數的數,而哨兵i的使命就是要找大於基準數的數,直到i和j碰頭為止。
OK,解釋完畢。現在基準數6已經歸位,它正好處在序列的第6位。此時我們已經將原來的序列,以6為分界點拆分成了兩個序列,左邊的序列是“3 1 2 5 4”,右邊的序列是“9 7 10 8”。接下來還需要分別處理這兩個序列。因為6左邊和右邊的序列目前都還是很混亂的。不過不要緊,我們已經掌握了方法,接下來只要模擬剛才的方法分別處理6左邊和右邊的序列即可。現在先來處理6左邊的序列現吧。
左邊的序列是“3 1 2 5 4”。請將這個序列以3為基準數進行調整,使得3左邊的數都小於等於3,3右邊的數都大於等於3。好了開始動筆吧。
如果你模擬的沒有錯,調整完畢之後的序列的順序應該是。
2 1 3 5 4
OK,現在3已經歸位。接下來需要處理3左邊的序列“2 1”和右邊的序列“5 4”。對序列“2 1”以2為基準數進行調整,處理完畢之後的序列為“1 2”,到此2已經歸位。序列“1”只有一個數,也不需要進行任何處理。至此我們對序列“2 1”已全部處理完畢,得到序列是“1 2”。序列“5 4”的處理也仿照此方法,最後得到的序列如下。
1 2 3 4 5 6 9 7 10 8

對於序列“9 7 10 8”也模擬剛才的過程,直到不可拆分出新的子序列為止。最終將會得到這樣的序列,如下。
1 2 3 4 5 6 7 8 9 10

到此,排序完全結束。細心的同學可能已經發現,快速排序的每一輪處理其實就是將這一輪的基準數歸位,直到所有的數都歸位為止,排序就結束了。下面上個霸氣的圖來描述下整個演算法的處理過程。
在這裡插入圖片描述
快速排序之所比較快,因為相比氣泡排序,每次交換是跳躍式的。每次排序的時候設定一個基準點,將小於等於基準點的數全部放到基準點的左邊,將大於等於基準點的數全部放到基準點的右邊。這樣在每次交換的時候就不會像氣泡排序一樣每次只能在相鄰的數之間進行交換,交換的距離就大的多了。因此總的比較和交換次數就少了,速度自然就提高了。當然在最壞的情況下,仍可能是相鄰的兩個數進行了交換。因此快速排序的最差時間複雜度和氣泡排序是一樣的都是O(N2),它的平均時間複雜度為O(NlogN)。

2 實現快排的兩種partition函式

2.1 第一種(常規方法)

即上面描述的方法:

int Partition1(vector<int> &data,int left, int right) {
   if (data.size() <= 0 || left<0 || right >= data.size())
   	throw exception("Invalid Parameters");
   int i, j, t, temp;
   temp = data[left]; //temp中存的就是基準數,如果基準元素放在開頭右邊邊界指標先動,反之則反
   i = left;
   j = right;
   while (i != j) { //順序很重要,要先從右邊開始找,j尋找的是小於基準元素,最終需要選一個小於基準元素的值與基準元素交換
   	while (data[j] >= temp && i < j)
   		j--;
   	while (data[i] <= temp && i < j)//再找左邊的
   		i++;
   	if (i < j)//交換兩個數在陣列中的位置
   	{
   		t = data[i];
   		data[i] = data[j];
   		data[j] = t;
   	}
   }
   //最終將基準數歸位
   data[left] = data[i];
   data[i] = temp;
   return i;
}

2.2 第二種 (非常規,來自劍指offer)

//產生[start,end]的隨機數
int RandomInRange(int start, int end){
   int z = ((double)rand() / RAND_MAX)*(end - start) + start;
   return z;
}
void Swap(vector<int> &v, int a, int b){
   int tmp = v[a];
   v[a] = v[b];
   v[b] = tmp;
}
// 劍指offer書上的
int Partition2(vector<int> &data, int start, int end) {
   if (data.size() <= 0 || start<0 || end >= data.size())
   	throw exception("Invalid Parameters");
   int index = RandomInRange(start, end);  // 隨機取一個標準元素
   Swap(data, index, end);  // 交換元素
   int small = start - 1;
   for (int i = start; i<end; ++i) {
   	if (data[i]<data[end]) {
   		++small;
   		if (small != i)
   			Swap(data, i, small);
   	}
   }
   ++small;
   Swap(data, small, end);
   return small;
}

實現快速排序:

#include <iostream>
#include <stdlib.h>
#include <string>
#include <vector>
#include <stack>
#include <queue>
#include <exception>
void print_v(vector<int> v){
	for (int i = 0; i < v.size(); i++){
		cout << v[i] << endl;
	}
}
void quickSort(vector<int> &data, int left, int right){
	if (left == right)
		return;
	//int index = Partition1(data, left, right);
	int index = Partition2(data, left, right);
	if (index > left){
		quickSort(data, left, index - 1);
	}
	if (index < right){
		quickSort(data, index+1,right);
	}
}
int main(){
	vector<int> v = { 1, 2, 3, 2, 2, 2, 5, 4, 2 };
	quickSort(v, 0, v.size()-1);
	print_v(v);
	return 0;
	
}

3 得到陣列中任意第K大的數字

在O(n)時間內得到陣列中任意第K大的數字,可以藉助快速排序的思想,藉助partition函式。隨機選擇一個數字作為基準數,使用快速排序完成一輪排序後,如果基準數所在的index小於k,則第k大的數字在右半部分,如果大於k,則第k大的數字在左半部分。遞迴查詢即可。
注意:其實仔細觀察可以發現,該方法找出的其實是排序後位於第k位的元素。

int Find_k(vector<int> v, int k)
{

	int left = 0;
	int right = v.size()-1;
	int index = Partition2(v, left, right);

	while (index != k)
	{
		if (index>k)
		{
			right = index - 1;
			index = Partition1(v, left, right);
		}
		else
		{
			left = index + 1;
			index = Partition1(v, left, right);
		}

	}
	return v[k];
}
int main(){
	vector<int> v2 = { 1, 2, 3, 2, 4, 2, 5, 2, 3 };
	int k = 3;
	cout << Find_k(v2, k); //Find_k從第0大的數字開始計數
	return 0;
	
}

參考文章:

  1. O(n)演算法得到陣列中任意第k大的數字
  2. 劍指offer中Partition函式講解
  3. c++如何生成隨機數
  4. 快速排序(過程圖解)