十大經典排序演算法總結——Java實現
轉自:https://blog.csdn.net/wangqyoho/article/details/52584640#t5
引
這段時間博主逐步替換為Java的實現 //博主留 2017.9.15 //2017.10.10完成氣泡排序的修改 //2017.10.11完成選擇排序、插入排序和希爾排序的修改 //2017.10.14完成歸併排序和快速排序修改 //2017.10.16完成堆排序、計數排序、桶排序和基數排序的修改 All done!!正文
排序演算法說明
(1)排序的定義:對一序列物件根據某個關鍵字進行排序;
輸入:n個數:a1,a2,a3,…,an
輸出:n個數的排列:a1’,a2’,a3’,…,an’,使得a1’<=a2’<=a3’<=…<=an’。
再講的形象點就是排排坐,調座位,高的站在後面,矮的站在前面咯。
(3)對於評述演算法優劣術語的說明
穩定:如果a原本在b前面,而a=b,排序之後a仍然在b的前面;
不穩定:如果a原本在b的前面,而a=b,排序之後a可能會出現在b的後面;
內排序:所有排序操作都在記憶體中完成;
外排序:由於資料太大,因此把資料放在磁碟中,而排序通過磁碟和記憶體的資料傳輸才能進行;
時間複雜度: 一個演算法執行所耗費的時間。
空間複雜度: 執行完一個程式所需記憶體的大小。
關於時間空間複雜度的更多瞭解請戳這裡,或是看書程傑大大編寫的《大話資料結構》還是很讚的,通俗易懂。
(4)排序演算法圖片總結:
排序對比:
圖片名詞解釋:
n: 資料規模
k:“桶”的個數
In-place: 佔用常數記憶體,不佔用額外記憶體
Out-place: 佔用額外記憶體
排序分類:
1.氣泡排序(Bubble Sort)
(1)演算法描述
氣泡排序是一種簡單的排序演算法。它重複地走訪過要排序的數列,一次比較兩個元素,如果它們的順序錯誤就把它們交換過來。走訪數列的工作是重複地進行直到沒有再需要交換,也就是說該數列已經排序完成。這個演算法的名字由來是因為越小的元素會經由交換慢慢“浮”到數列的頂端。
(2)演算法描述和實現
具體演算法描述如下:
- <1>.比較相鄰的元素。如果第一個比第二個大,就交換它們兩個;
- <2>.對每一對相鄰元素作同樣的工作,從開始第一對到結尾的最後一對,這樣在最後的元素應該會是最大的數;
- <3>.針對所有的元素重複以上的步驟,除了最後一個;
- <4>.重複步驟1~3,直到排序完成。
Java程式碼實現:
public static void bubbleSort(int[] array) {
long start = System.nanoTime();
int len = array.length;
for (int i = 0; i < len - 1; i++) {
for (int j = 0; j < len - i - 1; j++) {
if (array[j] > array[j + 1]) {
int tmp = array[j];
array[j] = array[j + 1];
array[j + 1] = tmp;
}
}
}
long end = System.nanoTime();
System.out.println((end - start)/1000.0 + "ms");
}
改進氣泡排序: 設定一標誌性變數pos,用於記錄每趟排序中最後一次進行交換的位置。由於pos位置之後的記錄均已交換到位,故在進行下一趟排序時只要掃描到pos位置即可。
改進後演算法如下:
public static void bubbleSort2(int[] array) {
long start = System.nanoTime();
int len = array.length;
int i = len - 1;
while (i > 0) {
int pos = 0;
for (int j = 0; j < i; j++) {
if (array[j] > array[j + 1]) {
pos = j;
int tmp = array[j];
array[j] = array[j + 1];
array[j + 1] = tmp;
}
}
i = pos;
}
long end = System.nanoTime();
System.out.println((end - start)/1000.0 + "ms");
}
氣泡排序動圖演示:
(3)演算法分析
時間複雜度:
- 最佳情況:T(n) = O(n)
當輸入的資料已經是正序時
- 最差情況:T(n) = O(n^2)
當輸入的資料是反序時
- 平均情況:T(n) = O(n^2)
- 就空間複雜度而言,可以看到在每次迴圈中,所需要的額外空間就是在進行數值交換時候的一個額外空間,所以空間複雜度為一個常量O(1)
2.選擇排序(Selection Sort)
表現最穩定的排序演算法之一(這個穩定不是指演算法層面上的穩定哈,相信聰明的你能明白我說的意思2333),因為無論什麼資料進去都是O(n²)的時間複雜度…..所以用到它的時候,資料規模越小越好。唯一的好處可能就是不佔用額外的記憶體空間了吧。理論上講,選擇排序可能也是平時排序一般人想到的最多的排序方法了吧。
(1)演算法簡介
選擇排序(Selection-sort)是一種簡單直觀的排序演算法。它的工作原理:首先在未排序序列中找到最小(大)元素,存放到排序序列的起始位置,然後,再從剩餘未排序元素中繼續尋找最小(大)元素,然後放到已排序序列的末尾。以此類推,直到所有元素均排序完畢。
(2)演算法描述和實現
n個記錄的直接選擇排序可經過n-1趟直接選擇排序得到有序結果。具體演算法描述如下:
- <1>.初始狀態:無序區為R[1..n],有序區為空;
- <2>.第i趟排序(i=1,2,3…n-1)開始時,當前有序區和無序區分別為R[1..i-1]和R(i..n)。該趟排序從當前無序區中-選出關鍵字最小的記錄 R[k],將它與無序區的第1個記錄R交換,使R[1..i]和R[i+1..n)分別變為記錄個數增加1個的新有序區和記錄個數減少1個的新無序區;
- <3>.n-1趟結束,陣列有序化了。
Java程式碼實現:
public static void selectSort(int[] array) {
long start = System.nanoTime();
int len = array.length;
int minIndex = 0;
for(int i = 0; i < len - 1 ; i++) {
minIndex = i;
for(int j = i + 1; j < len; j++) {
if(array[j] < array[minIndex]) {
minIndex = j;
}
}
int tmp = array[minIndex];
array[minIndex] = array[i];
array[i] = tmp;
}
long end = System.nanoTime();
System.out.println((end - start)/1000.0 + "ms");
}
選擇排序動圖演示:
(3)演算法分析
時間複雜度:- 最佳情況:T(n) = O(n^2)
- 最差情況:T(n) = O(n^2)
- 平均情況:T(n) = O(n^2)
3.插入排序(Insertion Sort)
插入排序的程式碼實現雖然沒有氣泡排序和選擇排序那麼簡單粗暴,但它的原理應該是最容易理解的了,因為只要打過撲克牌的人都應該能夠秒懂。
(1)演算法簡介
插入排序(Insertion-Sort)的演算法描述是一種簡單直觀的排序演算法。它的工作原理是通過構建有序序列,對於未排序資料,在已排序序列中從後向前掃描,找到相應位置並插入。插入排序在實現上,通常採用in-place排序(即只需用到O(1)的額外空間的排序),因而在從後向前掃描過程中,需要反覆把已排序元素逐步向後挪位,為最新元素提供插入空間。
(2)演算法描述和實現
一般來說,插入排序都採用in-place在陣列上實現。具體演算法描述如下:
- <1>.從第一個元素開始,該元素可以認為已經被排序;
- <2>.取出下一個元素,在已經排序的元素序列中從後向前掃描;
- <3>.如果該元素(已排序)大於新元素,將該元素移到下一位置;
- <4>.重複步驟3,直到找到已排序的元素小於或者等於新元素的位置;
- <5>.將新元素插入到該位置後;
- <6>.重複步驟2~5。
Java程式碼實現:
public static void insertSort(int[] array) {
long start = System.nanoTime();
int len = array.length;
for (int i = 1; i < len; i++) {
for (int j = i; j > 0 && array[j - 1] > array[j]; j--) {
int tmp = array[j - 1];
array[j - 1] = array[j];
array[j] = tmp;
}
}
long end = System.nanoTime();
System.out.println((end - start) / 1000.0 + "ms");
}
改進插入排序: 查詢插入位置時使用二分查詢的方式。相比與上面簡單插入排序,他針對每一批已排好序的序列,採用了二分查詢的方式提高定位效率。
public static void insertSort2(int[] array) {
long start = System.nanoTime();
int len = array.length;
for (int i = 1; i < len; i++) {
int current = array[i];
int st = 0;
int en = i - 1;
while (st <= en) {
int mid = (st + en) >> 1;
if (array[mid] < array[i]) {
st = mid + 1;
} else {
en = mid - 1;
}
}
for (int j = i - 1; j >= st; j--) {
array[j + 1] = array[j];
}
array[st] = current;
}
long end = System.nanoTime();
System.out.println((end - start) / 1000.0 + "ms");
}
插入排序動圖演示:
(3)演算法分析
- 最佳情況:輸入陣列按升序排列。T(n) = O(n)
- 最壞情況:輸入陣列按降序排列。T(n) = O(n^2)
- 平均情況:T(n) = O(n^2)
4.希爾排序(Shell Sort)
1959年Shell發明;
第一個突破O(n^2)的排序演算法;是簡單插入排序的改進版;它與插入排序的不同之處在於,它會優先比較距離較遠的元素。希爾排序又叫縮小增量排序
(1)演算法簡介
希爾排序的核心在於間隔序列的設定。既可以提前設定好間隔序列,也可以動態的定義間隔序列。動態定義間隔序列的演算法是《演算法(第4版》的合著者Robert Sedgewick提出的。
(2)演算法描述和實現
先將整個待排序的記錄序列分割成為若干子序列分別進行直接插入排序,具體演算法描述:
- <1>. 選擇一個增量序列t1,t2,…,tk,其中ti>tj,tk=1;
- <2>.按增量序列個數k,對序列進行k 趟排序;
- <3>.每趟排序,根據對應的增量ti,將待排序列分割成若干長度為m 的子序列,分別對各子表進行直接插入排序。僅增量因子為1 時,整個序列作為一個表來處理,表長度即為整個序列的長度。
Java程式碼實現:
public static void shellSort(int[] array) {
long start = System.nanoTime();
int len = array.length;
int gap = len/2;
//while(gap < len / 3) gap = 3 * gap + 1; //目前比較高效的gap
while(gap >= 1){
for(int i = gap; i < len; i++) {
for(int j = i; j - gap > 0 && array[j - gap] > array[j]; j -= gap) {
int tmp = array[j - gap];
array[j - gap] = array[j];
array[j] = tmp;
}
}
gap /= 2;
//gap /= 3;
}
long end = System.nanoTime();
System.out.println((end - start) / 1000.0 + "ms");
}
希爾排序圖示(圖片來源網路):
(3)演算法分析
- 最佳情況:T(n) = O(nlog2 n)
- 最壞情況:T(n) = O(nlog2 n)
- 平均情況:T(n) =O(nlog n)
5.歸併排序(Merge Sort)
和選擇排序一樣,歸併排序的效能不受輸入資料的影響,但表現比選擇排序好的多,因為始終都是O(n log n)的時間複雜度。代價是需要額外的記憶體空間。
(1)演算法簡介
歸併排序是建立在歸併操作上的一種有效的排序演算法。該演算法是採用分治法(Divide and Conquer)的一個非常典型的應用。歸併排序是一種穩定的排序方法。將已有序的子序列合併,得到完全有序的序列;即先使每個子序列有序,再使子序列段間有序。若將兩個有序表合併成一個有序表,稱為2-路歸併。
(2)演算法描述和實現
具體演算法描述如下:
- <1>.把長度為n的輸入序列分成兩個長度為n/2的子序列;
- <2>.對這兩個子序列分別採用歸併排序;
- <3>.將兩個排序好的子序列合併成一個最終的排序序列。
Java程式碼實現:
public static void mergeSort(int[] array, int start, int end) {
int len = end - start + 1;
if (len < 2) {
return;
}
int middle = end + (start - end) / 2; //防止溢位
mergeSort(array, start, middle);
mergeSort(array, middle + 1, end);
merge(array, start, end);
}
private static void merge(int[] array, int start, int end) {
int[] tmp = new int[end - start + 1];
int mid = (start + end) / 2;
int left = start;
int right = mid + 1;
int point = 0;
while (left <= mid && right <= end) {
if (array[left] < array[right]) {
tmp[point++] = array[left++];
} else {
tmp[point++] = array[right++];
}
}
while (left <= mid) {
tmp[point++] = array[left++];
}
while (right <= end) {
tmp[point++] = array[right++];
}
for (int i = 0; i < tmp.length; i++) {
array[i + start] = tmp[i];
}
}
歸併排序動圖演示:
(3)演算法分析
- 最佳情況:T(n) = O(n)
- 最差情況:T(n) = O(nlogn)
- 平均情況:T(n) = O(nlogn)
6.快速排序(Quick Sort)
快速排序的名字起的是簡單粗暴,因為一聽到這個名字你就知道它存在的意義,就是快,而且效率高! 它是處理大資料最快的排序演算法之一了。
(1)演算法簡介
快速排序的基本思想:通過一趟排序將待排記錄分隔成獨立的兩部分,其中一部分記錄的關鍵字均比另一部分的關鍵字小,則可分別對這兩部分記錄繼續進行排序,以達到整個序列有序。
(2)演算法描述和實現
快速排序使用分治法來把一個串(list)分為兩個子串(sub-lists)。具體演算法描述如下:
- <1>.從數列中挑出一個元素,稱為 “基準”(pivot);
- <2>.重新排序數列,所有元素比基準值小的擺放在基準前面,所有元素比基準值大的擺在基準的後面(相同的數可以到任一邊)。在這個分割槽退出之後,該基準就處於數列的中間位置。這個稱為分割槽(partition)操作;
- <3>.遞迴地(recursive)把小於基準值元素的子數列和大於基準值元素的子數列排序。
Java程式碼實現:
public static void quickSort(int[] array, int st, int en) {
int start = st;
int end = en;
if (start >= en)
return;
int index = partition(array, start, end);
quickSort(array, st, index - 1);
quickSort(array, index + 1, end);
}
private static int partition(int[] array, int st, int en) {
int reserve = array[st];
int start = st;
int end = en;
if (start >= end)
return start;
while (start < end) {
while (start < end && reserve <= array[end]) {
end--;
}
if (start < end) {
array[start++] = array[end];
}
while (start < end && array[start] <= reserve) {
start++;
}
if (start < end) {
array[end--] = array[start];
}
}
array[start] = reserve;
return start;
}
快速排序動圖演示:
快速排序演算法優化——三向切分快速排序
在上面的快速排序中,當有很多重複元素存在的時候,會大大的增加無謂的切分耗時:比如當前切分塊中若全部是相同的元素,則在當前塊中的遞迴切分就是無意義也沒有必要的。所以在三向切分中,用了lt和gt兩個“指標”來分隔小於當前“基準元素”和大於當前“基準元素”的值。
public static void quickSort3ways(int[] array, int low, int high) {
if (low >= high)
return;
int lt = low;
int i = low + 1;
int gt = high + 1;
while (i < gt) {
if (array[i] < array[lt]) {
swap(array, i++, lt++);
} else if (array[i] > array[lt]) {
swap(array, i, --gt);
} else {
i++;
}
}
quickSort3ways(array, low, lt);
quickSort3ways(array, gt, high);
}
上面這幅圖是三向切分的一個例子,為字母進行排序。每次迭代都不會包含和當前基準重複的元素。可以在下圖中看到,三向的效率還是有優勢的:
(3)演算法分析
遞迴演算法的時間複雜度公式:T[n] = aT[n/b] + f(n) ;最優情況下時間複雜度
快速排序最優的情況就是每一次取到的元素都剛好平分整個陣列(很顯然我上面的不是); 此時的時間複雜度公式則為:T[n] = 2T[n/2] + f(n);T[n/2]為平分後的子陣列的時間複雜度,f[n] 為平分這個陣列時所花的時間; 下面來推算下,在最優的情況下快速排序時間複雜度的計算(用迭代法): T[n] = 2T[n/2] + n ----------------第一次遞迴令:n = n/2 = 2 { 2 T[n/4] + (n/2) } + n ----------------第二次遞迴
= 2^2 T[ n/ (2^2) ] + 2n
令:n = n/(2^2) = 2^2 { 2 T[n/ (2^3) ] + n/(2^2)} + 2n ----------------第三次遞迴
= 2^3 T[ n/ (2^3) ] + 3n
......................................................................................
令:n = n/( 2^(m-1) ) = 2^m T[1] + mn ----------------第m次遞迴(m次後結束)