1. 程式人生 > >尋找陣列中第k小的數:平均情況下時間複雜度為O(n)的快速選擇演算法

尋找陣列中第k小的數:平均情況下時間複雜度為O(n)的快速選擇演算法

又叫線性選擇演算法,這是一種平均情況下時間複雜度為O(n)的快速選擇演算法,用到的是快速排序中的第一步,將第一個數作為中樞,使大於它的所有數放到它右邊,小於它的所有數放到它左邊。之後比較該中樞的最後位置i與k的大小,若i比k小,說明第k小的元素在i的右半段,之後對i的右半段進行快速選擇;若i比k大,說明第k小的元素在i的左半段,之後對i的左半段進行快速選擇;若i正好等於k,則直接返回......。

下面是具體的演算法步驟:

1,選擇中樞:如下,為了提高快速選擇的效率,最好儘可能的選擇數值居中的數作為中樞。如1 7 2 8 4 3,則取頭尾以及中間位置,然後選擇(1, 2, 3)中的2

int median3(int nums[], int left, int right){
	int center = (left + right) / 2;
	if(nums[left] > nums[center])
		swap(nums[left], nums[center]);
	if(nums[left] > nums[right])
		swap(nums[left], nums[right]);
	if(nums[center] > nums[right])
		swap(nums[center], nums[right]);//此時nums[left] <= nums[center] <= nums[right]
	swap(nums[center], nums[right-1]);//交換中樞和a[right-1],此時上面三個值的居中的數在下標right-1處,然後返回中樞,由於a[right]必定比中樞大,故只需對區間[left, right-1]以中樞a[right-1]進行一次快速排序即可。
	return nums[right-1];
}

2,對區間[left, right-1]以中樞nums[right-1]進行一次快速排序,之後大於nums[right-1]的數全在它的右邊,小於nums[right-1]的數全在它的左邊
int pivot = nums[right-1], i = left, j = right-1;
while(i < j){
	while(nums[i] < pivot && i < j) ++i;
	nums[j] = nums[i];
	while(nums[j] >= pivot && i < j) --j;
	nums[i] = nums[j];
}
nums[i] = pivot;

3,比較i和k的大小:若求序列中的第k大的數,現在由步驟2已經知道一次選擇排序後的中樞下標為i,說明前面i個數比pivot大,後面right-i個數比pivot大。
如果k < i,說明第k大的數在前面i個數中;如果k > i,說明第k大的數在後面的right-i中;如果i==k,直接返回答案。對於前兩種情況只需要對pivot的左半段或者右半段中尋找即可,即:

if(k < i)
	QuickSelect(nums, k, 0, i-1);
else if(k > i)
	QuickSelect(nums, k, i+1, right);
else
	return nums[i];

完整程式碼如下:

#include <iostream>
using namespace std;
int median3(int nums[], int left, int right){
	int center = (left + right) / 2;
	if(nums[left] > nums[center])
		swap(nums[left], nums[center]);
	if(nums[left] > nums[right])
		swap(nums[left], nums[right]);
	if(nums[center] > nums[right])
		swap(nums[center], nums[right]);//此時nums[left] <= nums[center] <= nums[right]
	swap(nums[center], nums[right-1]);//交換中樞和a[right-1],此時上面三個值的居中的數在下標right-1處,然後返回中樞,由於a[right]必定比中樞大,故只需對區間[left, right-1]以中樞a[right-1]進行一次快速排序即可。
	return nums[right-1];
}

int QuickSelect(int nums[], int k, int left, int right){
	int pivot = median3(nums, left, right), i = left, j = right-1;
	while(i < j){
		while(nums[i] < pivot && i < j) ++i;
		nums[j] = nums[i];
		while(nums[j] >= pivot && i < j) --j;
		nums[i] = nums[j];
	}
	nums[i] = pivot;
	if(k < i)
		QuickSelect(nums, k, 0, i-1);
	else if(k > i)
		QuickSelect(nums, k, i+1, right);
	else
		return nums[i];
}

int main(){
	int k, nums[12] = {4, 5, 23, 12, 89, 20, 14, 23, 54, 66, 47, 23};
	while(cin >> k)
		cout << QuickSelect(nums, k-1, 0, 11) << endl;//第k大的數下標應為k-1
	return 0;
}
執行結果如下:



時間複雜度:每次儘可能的遍歷陣列的一半,故平均情況下的時間複雜度為O(n/2) + O(n/4) + O(n/8) + ... +O(1) = O(n)