1. 程式人生 > >PHP實現十大經典排序演算法

PHP實現十大經典排序演算法

演算法概述

01、演算法分類:

十種常見排序演算法可以分為兩大類:

非線性時間比較類排序:通過比較來決定元素間的相對次序,由於其時間複雜度不能突破O(nlogn),因此稱為非線性時間比較類排序。

線性時間非比較類排序:不通過比較來決定元素間的相對次序,它可以突破基於比較排序的時間下界,以線性時間執行,因此稱為線性時間非比較類排序。

02、演算法複雜度

03、相關概念

穩定:如果a原本在b前面,而a=b,排序之後a仍然在b的前面。

不穩定:如果a原本在b的前面,而a=b,排序之後 a 可能會出現在 b 的後面。

時間複雜度:對排序資料的總的操作次數。反映當n變化時,操作次數呈現什麼規律。

空間複雜度:是指演算法在計算機內執行時所需儲存空間的度量,它也是資料規模n的函式。

氣泡排序(Buttle Sort)

氣泡排序是一種簡單的排序演算法。它重複地走訪過要排序的數列,一次比較兩個元素,如果它們的順序錯誤就把它們交換過來。走訪數列的工作是重複地進行直到沒有再需要交換,也就是說該數列已經排序完成。這個演算法的名字由來是因為越小的元素會經由交換慢慢“浮”到數列的頂端。

(1)、演算法描述:

  • 比較相鄰的元素。如果第一個比第二個大,就交換它們兩個;

  • 對每一對相鄰元素作同樣的工作,從開始第一對到結尾的最後一對,這樣在最後的元素應該會是最大的數;

  • 針對所有的元素重複以上的步驟,除了最後一個;

  • 重複步驟1~3,直到排序完成。

(2)、演算法動圖:

(3)、程式碼實現:

/*
 * 氣泡排序
 * @param array $arr
 * @return array
 */
function bubbleSort($arr) {
    for($i = 0; $i < count($arr); $i++){
		for($j = 0; $j < count($arr)-1-$i; $j++){
			if($arr[$j] > $arr[$j+1]){
				$temp = $arr[$j+1];
				$arr[$j+1] = $arr[$j];
				$arr[$j] = $temp;
			}
		}
	}

	return $arr;
}

選擇排序(Selection Sort)

選擇排序(Selection-sort)是一種簡單直觀的排序演算法。它的工作原理:首先在未排序序列中找到最小(大)元素,存放到排序序列的起始位置,然後,再從剩餘未排序元素中繼續尋找最小(大)元素,然後放到已排序序列的末尾。以此類推,直到所有元素均排序完畢。

(1)、演算法描述:

n個記錄的直接選擇排序可經過n-1趟直接選擇排序得到有序結果。具體演算法描述如下:

  • 初始狀態:無序區為R[1..n],有序區為空;

  • 第i趟排序(i=1,2,3…n-1)開始時,當前有序區和無序區分別為R[1..i-1]和R(i..n)。該趟排序從當前無序區中-選出關鍵字最小的記錄 R[k],將它與無序區的第1個記錄R交換,使R[1..i]和R[i+1..n)分別變為記錄個數增加1個的新有序區和記錄個數減少1個的新無序區;

  • n-1趟結束,陣列有序化了。

(2)、演算法動圖:

(3)、程式碼實現:

/*
 * 選擇排序
 * @param array $arr
 * @return array
 */
function selectionSort($arr) {
	for($i = 0; $i < count($arr)-1; $i++){
		$minIndex = $i;
		for($j = $i + 1; $j < count($arr); $j++) {
			if ($arr[$j] < $arr[$minIndex]) {
				$minIndex = $j;
			}
		}
		$temp = $arr[$i];
		$arr[$i] = $arr[$minIndex];
		$arr[$minIndex] = $temp;
	}
	return $arr;
}

(4)、演算法分析:

表現最穩定的排序演算法之一,因為無論什麼資料進去都是O(n2)的時間複雜度,所以用到它的時候,資料規模越小越好。唯一的好處可能就是不佔用額外的記憶體空間了吧。理論上講,選擇排序可能也是平時排序一般人想到的最多的排序方法了吧。

插入排序(Insertion Sort)

插入排序(Insertion-Sort)的演算法描述是一種簡單直觀的排序演算法。它的工作原理是通過構建有序序列,對於未排序資料,在已排序序列中從後向前掃描,找到相應位置並插入。

(1)、演算法描述:

一般來說,插入排序都採用in-place在陣列上實現。具體演算法描述如下:

  • 從第一個元素開始,該元素可以認為已經被排序;

  • 取出下一個元素,在已經排序的元素序列中從後向前掃描;

  • 如果該元素(已排序)大於新元素,將該元素移到下一位置;

  • 重複步驟3,直到找到已排序的元素小於或者等於新元素的位置;

  • 將新元素插入到該位置後;

  • 重複步驟2~5。

(2)、演算法動圖:

(3)、程式碼實現:

/*
 * 插入排序
 * @param array $arr
 * @return array
 */
function insertionSort($arr) {
	for($i = 1; $i < count($arr); $i++){
		$preIndex = $i - 1;
		$current = $arr[$i];
		while($preIndex >= 0 && $arr[$preIndex] > $current){
			$arr[$preIndex + 1] = $arr[$preIndex];
			$preIndex--;
		}
		$arr[$preIndex + 1] = $current;
	}
	return $arr;
}

(4)、演算法分析:

插入排序在實現上,通常採用in-place排序(即只需用到O(1)的額外空間的排序),因而在從後向前掃描過程中,需要反覆把已排序元素逐步向後挪位,為最新元素提供插入空間。

希爾排序(Shell Sort)

1959年Shell發明,第一個突破O(n2)的排序演算法,是簡單插入排序的改進版。它與插入排序的不同之處在於,它會優先比較距離較遠的元素。希爾排序又叫縮小增量排序。

(1)、演算法描述:

先將整個待排序的記錄序列分割成為若干子序列分別進行直接插入排序,具體演算法描述:

  • 選擇一個增量序列t1,t2,…,tk,其中ti>tj,tk=1;

  • 按增量序列個數k,對序列進行k 趟排序;

  • 每趟排序,根據對應的增量ti,將待排序列分割成若干長度為m 的子序列,分別對各子表進行直接插入排序。僅增量因子為1 時,整個序列作為一個表來處理,表長度即為整個序列的長度。

(2)、演算法動圖:

(3)、程式碼實現:

/*
 * 希爾排序
 * @param array $arr
 * @return array
 */
function shellSort($arr){    
	$factor = 3;	//定義因子
	$gap = 1;		//最小值
	while ($gap < intval(count($arr) / $factor)){        
		$gap = $factor * $gap + 1; 
	}    
	
	while ($gap >= 1){  
		for ($i = $gap; $i < count($arr); $i++){ 
			for ($j = $i; $j >= $gap && $arr[$j] < $arr[$j-$gap];  $j -= $gap){               	
				$temp = $arr[$j];          
				$arr[$j] = $arr[$j-$gap]; 
				$arr[$j-$gap] = $temp;                
			}        
		}        
		$gap = intval($gap / $factor);    
	}    
	
	return $arr;
}

(4)、演算法分析:

希爾排序的核心在於間隔序列的設定。既可以提前設定好間隔序列,也可以動態的定義間隔序列。動態定義間隔序列的演算法是《演算法(第4版)》的合著者Robert Sedgewick提出的。

歸併排序(Merge Sort)

歸併排序是建立在歸併操作上的一種有效的排序演算法。該演算法是採用分治法(Divide and Conquer)的一個非常典型的應用。將已有序的子序列合併,得到完全有序的序列;即先使每個子序列有序,再使子序列段間有序。若將兩個有序表合併成一個有序表,稱為2-路歸併。

(1)、演算法描述:

  • 把長度為n的輸入序列分成兩個長度為n/2的子序列;

  • 對這兩個子序列分別採用歸併排序;

  • 將兩個排序好的子序列合併成一個最終的排序序列。

(2)、演算法動圖:

(3)、程式碼實現:

/*
 * 歸併排序
 * @param array $arr
 * @return array
 */
function mergeSort($arr) {
	if (count($arr) < 2) {
		return $arr;
	}
	$middle = floor(count($arr) / 2);
	$left = array_slice($arr,0, $middle);
	$right = array_slice($arr,$middle,count($arr)-$middle);
	return mergeArr(mergeSort($left), mergeSort($right));
}

function mergeArr($left, $right) {
	$res = [];
	while (count($left) > 0 && count($right) > 0) {
		if($left[0] <= $right[0]){
			array_push($res,array_shift($left));
		}else{
			array_push($res,array_shift($right));
		}
	}

	while(count($left)){
		array_push($res,array_shift($left));
	}
	while (count($right)){
		array_push($res,array_shift($right));
	}
	return $res;
}

(4)、演算法分析:

歸併排序是一種穩定的排序方法。和選擇排序一樣,歸併排序的效能不受輸入資料的影響,但表現比選擇排序好的多,因為始終都是O(nlogn)的時間複雜度。代價是需要額外的記憶體空間。

快速排序(Quick Sort)

快速排序的基本思想:通過一趟排序將待排記錄分隔成獨立的兩部分,其中一部分記錄的關鍵字均比另一部分的關鍵字小,則可分別對這兩部分記錄繼續進行排序,以達到整個序列有序。

(1)、演算法描述:

快速排序使用分治法來把一個串(list)分為兩個子串(sub-lists)。具體演算法描述如下:

  • 從數列中挑出一個元素,稱為 “基準”(pivot);

  • 重新排序數列,所有元素比基準值小的擺放在基準前面,所有元素比基準值大的擺在基準的後面(相同的數可以到任一邊)。在這個分割槽退出之後,該基準就處於數列的中間位置。這個稱為分割槽(partition)操作;

  • 遞迴地(recursive)把小於基準值元素的子數列和大於基準值元素的子數列排序。

(2)、演算法動圖:

(3)、程式碼實現:

/*
 * 快速排序
 * @param array $arr
 * @return array
 */
function quickSort($arr) {
    if(count($arr) <= 1) {
        return $arr;
    }
    $key = $arr[0];
    $rightArray = array();
    $leftArray = array();
    for($i = 1; $i < count($arr); $i++) {
        if($arr[$i] >= $key) {
            $rightArray[] = $arr[$i];
        } else {
            $leftArray[] = $arr[$i];
        }
    }
    $leftArray = quickSort($leftArray);
    $rightArray = quickSort($rightArray);
    return array_merge($leftArray, array($key), $rightArray);
}

//注意:該方式效率較低,但比較直觀

堆排序(Heap Sort)

堆排序(Heapsort)是指利用堆這種資料結構所設計的一種排序演算法。堆積是一個近似完全二叉樹的結構,並同時滿足堆積的性質:即子結點的鍵值或索引總是小於(或者大於)它的父節點。

(1)、演算法描述:

  • 將初始待排序關鍵字序列(R1,R2….Rn)構建成大頂堆,此堆為初始的無序區;

  • 將堆頂元素R[1]與最後一個元素R[n]交換,此時得到新的無序區(R1,R2,……Rn-1)和新的有序區(Rn),且滿足R[1,2…n-1]<=r[n];< span=""></=r[n];<>

  • 由於交換後新的堆頂R[1]可能違反堆的性質,因此需要對當前無序區(R1,R2,……Rn-1)調整為新堆,然後再次將R[1]與無序區最後一個元素交換,得到新的無序區(R1,R2….Rn-2)和新的有序區(Rn-1,Rn)。不斷重複此過程直到有序區的元素個數為n-1,則整個排序過程完成。

(2)、演算法動圖:

(3)、程式碼實現:

(等待補充...)

計數排序(Counting Sort)

計數排序不是基於比較的排序演算法,其核心在於將輸入的資料值轉化為鍵儲存在額外開闢的陣列空間中。 作為一種線性時間複雜度的排序,計數排序要求輸入的資料必須是有確定範圍的整數。

(1)、演算法描述:

  • 找出待排序的陣列中最大和最小的元素;

  • 統計陣列中每個值為i的元素出現的次數,存入陣列C的第i項;

  • 對所有的計數累加(從C中的第一個元素開始,每一項和前一項相加);

  • 反向填充目標陣列:將每個元素i放在新陣列的第C(i)項,每放一個元素就將C(i)減去1。

(2)、演算法動圖:

(3)、程式碼實現:

/*
 * 計數排序
 * @param array $arr
 * @return array
 */
function countingSort($arr){
	$length = count($arr);
	$maxValue = $arr[0];

	// 找出陣列中的最大值
	for ($i=1; $i < $length; $i++) {
	    if ($arr[$i] > $maxValue) {
	        $maxValue = $arr[$i];
	    }
	}

	/*
	 * 定長陣列, 鍵會自動排序, PHP陣列是hash表的實現,
	 * 如果這裡用普通的陣列, 鍵不會自動排序, 不存在的鍵也不會自動填充null
	 */
	$frequency = new SplFixedArray($maxValue + 1);

	/*
	 * 統計arr中, 值出現的頻次
	 */
	for ($i=0; $i < $length; $i++) {
	    if(empty($frequency[$arr[$i]]))
	        $frequency[$arr[$i]] = 0;
	    $frequency[$arr[$i]] += 1;
	}

	// 清空$arr
	$arr = [];
	// 遍歷frequency, 如果其元素有值, 那麼將鍵push到arr中
	for ($i=0; $i < count($frequency); $i++) {
	    if (!empty($frequency[$i])) {
	        for ($j=0; $j < $frequency[$i]; $j++) {
	            $arr[] = $i;
	        }
	    }
	}

	return $arr;	
}

(4)、演算法分析:

計數排序是一個穩定的排序演算法。當輸入的元素是 n 個 0到 k 之間的整數時,時間複雜度是O(n+k),空間複雜度也是O(n+k),其排序速度快於任何比較排序演算法。當k不是很大並且序列比較集中時,計數排序是一個很有效的排序演算法。

桶排序(Bucket Sort)

桶排序是計數排序的升級版。它利用了函式的對映關係,高效與否的關鍵就在於這個對映函式的確定。桶排序 (Bucket sort)的工作的原理:假設輸入資料服從均勻分佈,將資料分到有限數量的桶裡,每個桶再分別排序(有可能再使用別的排序演算法或是以遞迴方式繼續使用桶排序進行排)。

(1)、演算法描述:

  • 設定一個定量的陣列當作空桶;

  • 遍歷輸入資料,並且把資料一個一個放到對應的桶裡去;

  • 對每個不是空的桶進行排序;

  • 從不是空的桶裡把排好序的資料拼接起來。

(2)、演算法動圖:

(3)、程式碼實現:

/*
 * 桶排序
 * @param array $arr
 * @return array
 */
function bucketSort($arr){
	$res=[];
 	$len=count($arr);

 	//入桶
 	for($i=0,$max=$arr[$i];$i<$len;$i++){
 		if ($max<$arr[$i]) {
   			$max=$arr[$i];
  		}
  		$bucket[$arr[$i]]=[];
  		array_push($bucket[$arr[$i]],$arr[$i]);
	}

 	//出桶
 	for($i=0;$i<=$max;$i++){
 		if(!empty($bucket[$i])){
   			$l=count($bucket[$i]);
   			for ($j=0; $j <$l ; $j++) {
    			$result[]=$bucket[$i][$j];
   			}
  		}
 	}
 	return $result;
}

(4)、演算法分析:

桶排序最好情況下使用線性時間O(n),桶排序的時間複雜度,取決與對各個桶之間資料進行排序的時間複雜度,因為其它部分的時間複雜度都為O(n)。很顯然,桶劃分的越小,各個桶之間的資料越少,排序所用的時間也會越少。但相應的空間消耗就會增大。

基數排序(Radix Sort)

基數排序是按照低位先排序,然後收集;再按照高位排序,然後再收集;依次類推,直到最高位。有時候有些屬性是有優先順序順序的,先按低優先順序排序,再按高優先順序排序。最後的次序就是高優先順序高的在前,高優先順序相同的低優先順序高的在前。

(1)、演算法描述:

  • 取得陣列中的最大數,並取得位數;

  • arr為原始陣列,從最低位開始取每個位組成radix陣列;

  • 對radix進行計數排序(利用計數排序適用於小範圍數的特點);

(2)、演算法動圖:

(3)、程式碼實現:

/*
 * 基數排序
 * @param array $arr
 * @return array
 */
function radixSort($arr) {
    //先求出陣列中最大的位數
    $max = max($arr);
    $max_digit = get_digit($max);
  
    for ($i = 1; $i <= $max_digit; $i++) {
        counting_sort($arr, $i);
	}

	return $arr;
}

function counting_sort(&$arr, $digit_num = false) {
    if ($digit_num !== false) {
        for ($i = 0; $i < count($arr); $i++) {
            $arr_temp[$i] = get_specific_digit($arr[$i], $digit_num);
        } 
    } else {
        $arr_temp = $arr;
    }
  
    $max = max($arr);
    $time_arr = array(); //儲存元素出現次數的陣列
  
    //初始化出現次數陣列
    for ($i = 0; $i <= $max; $i++) {
        $time_arr[$i] = 0;
    }
  
    //統計每個元素出現次數
    for ($i = 0; $i < count($arr_temp); $i++) {
        $time_arr[$arr_temp[$i]]++;
    }
  
    //統計每個元素比其小或相等的元素出現次數
    for ($i = 0; $i < count($time_arr) - 1; $i++) {
        $time_arr[$i + 1] += $time_arr[$i];
    }
  
    //利用出現次數對陣列進行排序
    for($i = count($arr) - 1; $i >= 0; $i--) {
        $sorted_arr[$time_arr[$arr_temp[$i]] - 1] = $arr[$i];
        $time_arr[$arr_temp[$i]]--;
    }
  
    $arr = $sorted_arr;
    ksort($arr);    //忽略這次對key排序的效率損耗
}
  
/*
 * 計算某個數的位數
 */
function get_digit($number) {
    $i = 1;
    while ($number >= pow(10, $i)) {
    	$i++;
    }

    return $i;
}
  
/*
 * 獲取某個數字的從個位算起的第i位數
 */
function get_specific_digit($num, $i) {
    if ($num < pow(10, $i - 1)) {
        return 0;
    }
    return floor($num % pow(10, $i) / pow(10, $i - 1));
}

(4)、演算法分析:

基數排序基於分別排序,分別收集,所以是穩定的。但基數排序的效能比桶排序要略差,每一次關鍵字的桶分配都需要O(n)的時間複雜度,而且分配之後得到新的關鍵字序列又需要O(n)的時間複雜度。假如待排資料可以分為d個關鍵字,則基數排序的時間複雜度將是O(d*2n) ,當然d要遠遠小於n,因此基本上還是線性級別的。

基數排序的空間複雜度為O(n+k),其中k為桶的數量。一般來說n>>k,因此額外空間需要大概n個左右。