1. 程式人生 > >常見排序演算法彙總與分析(下)(基數排序與計數排序)

常見排序演算法彙總與分析(下)(基數排序與計數排序)

本篇彙總的演算法將不再是基於比較的排序演算法,因此會突破這類演算法的時間複雜度下界O(nlog2n)。如果有朋友對前面的內容感興趣,可以先去看看常見排序演算法彙總與分析(中)(選擇排序與歸併排序)

我們先來總結基數排序演算法,該演算法在排序過程中不進行比較,而是通過“分配”和“收集”兩個過程來實現的。

基數排序

【基本思想】

首先設立r個佇列,對列編號分別為0~r-1,r為待排序列中元素的基數(例如10進位制數,則r=10),然後按照下面的規則對元素進行分配收集

1,先按最低有效位的值,把n個元素分配到上述的r個佇列中,然後從小到大將個佇列中的元素依次收集起來
2,再按次低有效位的值把剛收集起來的關鍵字分配到r個佇列中,重複收集工作
3,重複地進行上述分配和收集,直到最高有效位。(也就是說,如果位數為d,則需要重複進行d次,d由所有元素中最長的一個元素的位數計量)

為什麼這樣就可以完成排序呢?

以從小到大排序為例

首先當按照最低有效位完成分配和收集後,此時得到的序列,是根據元素最低有效位的值從小到大排列的。

當按照次低有效位進行第二次分配和收集後,得到的序列,是先根據元素的次低有效位的值從小到大排列,然後再根據最低有效位的值從小到大排列。

以此類推,當按照最高有效位進行最後一次分配和收集後,得到的序列,是先根據元素的最高有效位的值從小到大排列,再根據次高有效位排列,。。。,再根據次低有效位,再根據最低有效位。自然就完成了每個元素的從小到大排列。

【空間複雜度】O(n+r)

【時間複雜度】

平均情況:O(d(n+r))

因為每一趟分配的時間開銷是O(n),收集的開銷是O(r),因此執行d趟的時間開銷為O(d(n+r)),通常d,r為常數

最好情況:O(d(n+r))

最壞情況:O(d(n+r))

【穩定性】穩定

【優點】

穩定排序;時間複雜度可以突破基於關鍵字比較排序法的下界O(n)

【缺點】

需要額外的輔助空間

【演算法實現】
	/**
	 * 基數排序
	 * @param arr
	 */
	public static void radixSort(int[] arr) {
		//獲得待排序列元素中的最大位數
		int maxBit = getMaxBit(arr);
		//對每一位分別進行分配和收集
		for (int bit = 1; bit <= maxBit; bit++) {
			//分配
			List<List<Integer>> buf = distribute(arr, bit);
			//收集
			collect(arr, buf);
		}
	}
	private static void collect(int[] arr, List<List<Integer>> buf) {
		int i = 0;
		//收集,依次將每個佇列中的元素讀出
		for (List<Integer> temp : buf) {
			for (int ele : temp) {
				arr[i++] = ele;
			}
		}
	}
	private static int getMaxBit(int[] arr) {
		int maxBit = 0;
		int len = 0;
		for (int ele : arr) {
			//利用字串的length()方法獲得元素位數
			len = (ele + "").length();
			if (len > maxBit) {
				maxBit = len;
			}
		}
		return maxBit;
	}
	//分配
	private static List<List<Integer>> distribute(int[] arr, int bit) {
		List<List<Integer>> buf = new ArrayList<>();
		//構建r個佇列
		for (int i = 0; i < 10; i++) {
			buf.add(new ArrayList<>());
		}
		for (int ele : arr) {
			int value = getValueByBit(ele, bit);
			//根據每個元素指定位數上的值,將元素存放到對應的佇列上
			buf.get(value).add(ele);
		}
		return buf;
	}
	//得到指定位數上的值
	private static int getValueByBit(int ele, int bit) {
		//沒有該位,則返回0
		int value = 0;
		String temp = ele + "";
		if (temp.length() >= bit) {
			value = (int) (temp.charAt(temp.length() - bit) - '0');
		}
		return value;
	}

【本演算法解讀】

演算法針對的是十進位制數,所以r=10

演算法首先獲取到待排序列元素中的最大位數。然後按照基數排序的思想,對元素的每一位進行分配和收集。

分配distribute()方法:首先構建了r=10個佇列,對應編號即是0~9。根據給定的位數,得到待排序列中每個元素在該位上的值,若元素沒有該位,則返回0。根據每位上的值,將該元素放入相應的佇列。完成一次分配。

收集collect()方法:依次從r個佇列中讀出其中的元素值,並將其存入原始序列中,即完成了一次收集。

【舉個栗子】

對於待排序列413,10,8,28

首先獲取到待排序列的最大位數,即為3。

然後根據每一位的值進行分配和收集,分配過程如下圖:


由於是10進位制數,所以構造10個佇列,0~9。

首先從最低有效位開始,每個元素在該位上對應的值分別是3,0,8,8,根據該值,將對應元素放入對應的佇列。分配結束後,依次從每個佇列上讀取元素值存入原始序列。可以看到一次分配以後,元素已經按照最低有效位從小到大排列。繼續位數逐漸增大,直到最高有效位,重複上述操作即可完成排序。

計數排序

【基本思想】

計數排序是基於非比較排序,主要用於對於一定範圍內的整數進行排序。採用的是空間換時間的方法。

針對待排序列中的每一個元素x,得到序列中小於x的元素個數,有了這一資訊可以直接把x放到最終的輸出序列的正確位置上。 計數排序之所以能做到線性時間複雜度是因為使用了索引的思想。

計數排序對輸入的資料有附加的限制條件: 1、輸入的線性表的元素屬於有限偏序集S; 2、設輸入的線性表的長度為n,|S|=k(表示集合S中元素的總數目為k),則k=O(n)。 在這兩個條件下,計數排序的複雜性為O(n)。
對於下面我即將給出的演算法,它的限制條件是待排序列中的元素是有限個正整數(包括0,由於將元素值作為陣列下標),最大值用k=O(n)表示,元素個數用n表示。它利用元素的實際值來確定它們在輸出序列中的位置

【空間複雜度】O(n+k)

【時間複雜度】

平均情況:O(n+k)

最好情況:O(n+k)

最壞情況:O(n+k)

【穩定性】穩定

【優點】

穩定,在k值較小時突破了基於比較的排序演算法下界

【缺點】

存在前提條件,需要大量額外空間,k值較大時效率很低

【演算法實現】
	/**
	 * 計數排序
	 * @param arr
	 */
	public static void countSort(int[] arr) {
		int max = getMax(arr);
		int count[] = new int[max + 1];  //此時陣列中元素值均被初始化為0
		//在以元素值為
		for (int ele : arr) {
			count[ele]++;
		}
		int k = 0;
		for (int i = 0; i <= max; i++) {
			for (int j = 0; j < count[i]; j++) {
				arr[k++] = i;
			}
		}
	}
    //獲得待排元素中的最大值
	private static int getMax(int[] arr) {
		int max = 0;
		for (int ele : arr) {
			if (ele > max) {
				max = ele;
			}
		}
		return max;
	}

【本演算法解讀】

可以看到演算法首先獲得待排序列元素中的最大值,然後構建最大值+1的長度的計數陣列。遍歷待排序列的每個元素,並在以元素值為下標的陣列值中加1。然後遍歷計數陣列,若對應下標的位置上值大於0(等於幾就表示有幾個元素),則表示存在有元素且其值為下標的大小。將該元素新增到原始序列中。由於下標是從小到大的,所以對應得到的序列也是從小到大排列的。

【舉個栗子】

對於待排序列4,0,2,8,2

首先獲取最大值即為0,然後構建8+1長度的計數陣列。初始化時,計數陣列中的值均為0.如下圖所示:


將對應的元素值放在對應的下標裡,例如元素4,放在了下標為4的位置裡,計數陣列的值加1,表示其中有一個元素值為下標的元素。待排序列中有兩個2,所以下標為2的計數陣列值是2,表示其中有兩個元素值為下標的元素。

最後過遍歷計數陣列,如,遍歷到0下標位置,陣列值為1,表示有一個元素,元素值是下標0,新增到原始序列中。遍歷到2下標位置,陣列值為2,表示有兩個元素,元素值均為下標2,將兩個元素依次新增到原始序列中。以此類推,最終得到有序序列0,2,2,4,8。

那麼,到這裡我們這個常用排序演算法的彙總就順利完成了。本彙總分析了常用排序演算法中的,交換排序(氣泡排序,快速排序),插入排序(直接插入排序,希爾排序),選擇排序(直接選擇排序,堆排序),歸併排序,基數排序,計數排序。應該說是這個總結是暫時告一段落了,後面遇到一些好的演算法,還會繼續與大家分享。

為了方便大家,我已將本系列中用到的所有演算法原始碼(java實現)上傳至CSDN,需要的朋友可以點此下載

如有紕漏,敬請海涵。