1. 程式人生 > >python進行桶排序與基數排序總結

python進行桶排序與基數排序總結

本文首先舉例闡述了兩種排序方法的操作步驟,然後列出了用python進行的實現過程,最後對桶式排序方法的優劣進行了簡單總結。

一、桶排序:

排序一個數組[5,3,6,1,2,7,5,10]

值都在1-10之間,建立10個桶:

[0 0 0 0 0 0 0 0 0 0] 桶

[1 2 3 4 5 6 7 8 9 10] 桶代表的值

遍歷陣列,第一個數字5,第五個桶加1

[0 0 0 0 1 0 0 0 0 0]

第二個數字3,第三個桶加1

[0 0 1 0 1 0 0 0 0 0]

遍歷後

[1 1 1 0 2 1 1 0 0 1]

輸出

[1 2 3 5 5 6 7 10]

程式碼:

def bucket_sort(lst):
    buckets = [0] * ((max(lst) - min(lst))+1)
    for i in range(len(lst)):
        buckets[lst[i]-min(lst)] += 1
    res=[]
    for i in range(len(buckets)):
        if buckets[i] != 0:
            res += [i+min(lst)]*buckets[i]
    return res

二、基數排序:

例如,對如下資料序列進行排序。

192,221,12,23

可以觀察到它的每個資料至多隻有3位,因此可以將每個資料拆分成3個關鍵字:百位(高位)、十位、個位(低位)。如果按照習慣思維,會先比較百位,百位大的資料大,百位相同的再比較十位,十位大的資料大;最後再比較個位。基數排序方法對任一子關鍵字排序時必須藉助於另一種排序方法,而且這種排序方法必須是穩定的。對於多關鍵字拆分出來的子關鍵字,它們一定位於0-9這個可列舉的範圍內,這個範圍不大,因此用桶式排序效率非常好。

程式碼:

from random import randint
def radix_sort(lis,d):
    for i in xrange(d):#d輪排序
        s = [[] for k in xrange(10)]#因為每一位數字都是0~9,故建立10個桶
        for j in lis:
            s[j/(10**i)%10].append(i)
        li = [a for b in s for a in b]
    return li

對陣列中的元素按照從低位到高位排序,對於[192,221,12,23]第一輪按照個位數字相同的放在一組,是s[1] =[221],s[2]=[192,12],s[3]=23,第二輪按照十位數字進行排序,s[1]=[12],s[2]=[221,23],s[9]=[192],第三輪按照百位數字進行排序,s[0]=[12,23],s[1]=[192],s[2]=[221]

總結:

桶排序與基數排序常作為桶式排序出現,基數排序進行了多輪的桶排序。桶式排序不再是一種基於比較的排序方法,它是一種比較巧妙的排序方式,但這種排序方式需要待排序的序列滿足以下兩個特徵:待排序列所有的值處於一個可列舉的範圍之類;待排序列所在的這個可列舉的範圍不應該太大,否則排序開銷太大。可以用於學生成績的排序,因為在若干學生中成績的範圍僅在100以內。

桶式排序的空間開銷較大,它需要兩個陣列,第1個buckets陣列用於記錄“落入”各桶中元素的個數,進而儲存各元素在有序序列中的位置,第2個數組用於快取待排資料。它只能排整形陣列。而且當k較大,而陣列長度n較小,即k>>n時,輔助陣列C[k+1]的空間消耗較大。