1. 程式人生 > >python函數語言程式設計(一)map/reduce、filter、sorted

python函數語言程式設計(一)map/reduce、filter、sorted

1. 變數可以指向函式

函式本身也可以賦值給變數,即:變數可以指向函式:

>>>f = abs

>>>f(-10)

10

2. 傳入函式

既然變數可以指向函式,函式的引數能接收變數,那麼一個函式就可以接收另一個函式作為引數,這種函式就稱之為高階函式。

一個最簡單的高階函式:

defadd(x, y, f):

    return f(x) + f(y)

當我們呼叫add(-5,6, abs)時,引數x,y和f分別接收-5,6和abs,根據函式定義,我們可以推導計算過程為:

x = -5

y = 6

f = abs

f(x) +f(y) ==> abs(-5) + abs(6) ==> 11

return11

用程式碼驗證一下:

>>>add(-5, 6, abs)

11

編寫高階函式,就是讓函式的引數能夠接收別的函式。

3. map

我們先看map。map()函式接收兩個引數,一個是函式,一個是Iterable,map將傳入的函式依次作用到序列的每個元素,並把結果作為新的Iterator返回。

有一個函式f(x)=x2,要把這個函式作用在一個list [1, 2, 3, 4, 5, 6, 7, 8, 9]上,就可以用map()實現如下:

>>>def f(x):

         return x * x

>>>r = map(f, [1, 2, 3, 4, 5, 6, 7, 8, 9])

>>>list(r)

[1, 4,9, 16, 25, 36, 49, 64, 81]

map()傳入的第一個引數是f,即函式物件本身。由於結果r是一個Iterator,Iterator是惰性序列,因此通過list()函式讓它把整個序列都計算出來並返回一個list。

map()作為高階函式,事實上它把運算規則抽象了,因此,我們不但可以計算簡單的f(x)=x2,還可以計算任意複雜的函式,比如,把這個list所有數字轉為字串:

>>>list(map(str, [1, 2, 3, 4, 5, 6, 7, 8, 9]))

['1','2', '3', '4', '5', '6', '7', '8', '9']

4. reduce

再看reduce的用法。reduce把一個函式作用在一個序列[x1, x2, x3, ...]上,這個函式必須接收兩個引數,reduce把結果繼續和序列的下一個元素做累積計算,其效果就是:

reduce(f,[x1, x2, x3, x4]) = f(f(f(x1, x2), x3), x4)

比方說對一個序列求和,就可以用reduce實現:

>>>from functools import reduce

>>>def add(x, y):

   .    returnx + y

>>>reduce(add, [1, 3, 5, 7, 9])

25

要把序列[1, 3, 5,7, 9]變換成整數13579:

>>>from functools import reduce

>>>def fn(x, y):

       return x * 10 + y

>>>reduce(fn, [1, 3, 5, 7, 9])

13579

5. map、reduce結合使用

可以寫出把str轉換為int的函式:

fromfunctools import reduce

defstr2int(s):

    def fn(x, y):

        return x * 10 + y

    def char2num(s):

        return {'0': 0, '1': 1, '2': 2, '3': 3,'4': 4, '5': 5, '6': 6, '7': 7, '8': 8, '9': 9}[s]

    return reduce(fn, map(char2num, s))

還可以用lambda函式進一步簡化成:

fromfunctools import reduce

defchar2num(s):

    return {'0': 0, '1': 1, '2': 2, '3': 3,'4': 4, '5': 5, '6': 6, '7': 7, '8': 8, '9': 9}[s]

defstr2int(s):

    return reduce(lambda x, y: x * 10 + y,map(char2num, s))

6. map/reduce用例

(1)利用map()函式,把使用者輸入的不規範的英文名字,變為首字母大寫,其他小寫的規範名字。輸入:['adam', 'LISA', 'barT'],輸出:['Adam', 'Lisa','Bart']:

defnormalize(name):

    return name.lower().capitalize()   #str.lower()將所有的字串變成小寫

                                                                   #str.capitalize()返回一個首字母大寫的字串。

L1 =['adam', 'LISA', 'barT']

L2 =list(map(normalize, L1))

print(L2)

(2)python提供的sum()函式可以接受一個list並求和,編寫一個prod()函式,可以接受一個list並利用reduce()求積:

fromfunctools import reduce

defprod(list):

       def mul(x,y):

              return x*y

       return reduce(mul,list)

print('3* 5 * 7 * 9 =', prod([3, 5, 7, 9]))

(3)利用map和reduce編寫一個str2float函式,把字串'123.456'轉換成浮點數123.456:

importmath

fromfunctools import reduce

defstr2float(s):

       index = s.index('.')        #str.index()得到字串索引位置,為3(0、1、2、3)

       n = len(s) - 1 - index           #計算小數位數

       s = s.replace('.', '')         #用空取代.,變成'123456'

       def chr2num(s):

              return{'0':0,'1':1,'2':2,'3':3,'4':4,'5':5,'6':6,'7':7,'8':8,'9':9}[s]        

       def cal(x,y):

              return x * 10 + y         

       return reduce(cal, map(chr2num,s))/math.pow(10, n)           

#先將字串寫list[1,2,3,4,5,6];再寫作整數123456;對整數除以10的n次方,n為小數位數

print('str2float(\'123.456\')=', str2float('123.456'))

print(type(str2float('123.456')))

7. filter

Python內建的filter()函式用於過濾序列。

和map()類似,filter()也接收一個函式和一個序列。和map()不同的是,filter()把傳入的函式依次作用於每個元素,然後根據返回值是True還是False決定保留還是丟棄該元素。

在一個list中,刪掉偶數,只保留奇數,可以這麼寫:

defis_odd(n):

    return n % 2 == 1

list(filter(is_odd,[1, 2, 4, 5, 6, 9, 10, 15]))

# 結果: [1, 5, 9, 15]

把一個序列中的空字串刪掉,可以這麼寫:

defnot_empty(s):

    return s and s.strip()    

    #str.strip()移除字串頭尾指定的字元(預設為空格),此處s字串若為空,false

list(filter(not_empty,['A', '', 'B', None, 'C', '  ']))

# 結果: ['A', 'B', 'C']

可見用filter()這個高階函式,關鍵在於正確實現一個“篩選”函式。

注意到filter()函式返回的是一個Iterator,也就是一個惰性序列,所以要強迫filter()完成計算結果,需要用list()函式獲得所有結果並返回list。

8. 用filter求素數

計算素數的一個方法是埃氏篩法,它的演算法理解起來非常簡單:

首先,列出從2開始的所有自然數,構造一個序列:

2, 3,4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, ...

取序列的第一個數2,它一定是素數,然後用2把序列的2的倍數篩掉:

3, 4,5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, ...

取新序列的第一個數3,它一定是素數,然後用3把序列的3的倍數篩掉:

5, 6,7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, ...

取新序列的第一個數5,然後用5把序列的5的倍數篩掉:

7, 8,9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, ...

不斷篩下去,就可以得到所有的素數。

用Python來實現這個演算法,可以先構造一個從3開始的奇數序列:

def_odd_iter():

    n = 1

    while True:

        n= n + 2

        yield n

注意這是一個生成器,並且是一個無限序列。

然後定義一個篩選函式:

def_not_divisible(n):

    return lambda x: x % n > 0

最後,定義一個生成器,不斷返回下一個素數:

defprimes():

    yield 2

    it = _odd_iter() # 初始序列

    while True:

        n = next(it) # 返回序列的第一個數

        yield n

        it = filter(_not_divisible(n), it) # 構造新序列

這個生成器先返回第一個素數2,然後,利用filter()不斷產生篩選後的新的序列。

由於primes()也是一個無限序列,所以呼叫時需要設定一個退出迴圈的條件:

# 列印1000以內的素數:

for nin primes():

    if n < 1000:

        print(n)

    else:

        break

9. filter用例

回數是指從左向右讀和從右向左讀都是一樣的數,例如12321,909。請利用filter()濾掉非回數:

defis_palindrome(n):

       return str(n)==str(n)[::-1] andlen(str(n))>1      

       #a[::1]將列表a倒序處理,如果a=[1,2,3],則a[::-1]=[3,2,1]

       #字串'xxx'也可以看成是一種list,每個元素就是一個字元。

output=filter(is_palindrome,range(1, 10000))

print(list(output))

10. sorted

Python內建的sorted()函式就可以對list進行排序:

>>>sorted([36, 5, -12, 9, -21])

[-21,-12, 5, 9, 36]

此外,sorted()函式也是一個高階函式,它還可以接收一個key函式來實現自定義的排序例如按絕對值大小排序:

>>>sorted([36, 5, -12, 9, -21], key=abs)

[5, 9,-12, -21, 36]

key指定的函式將作用於list的每一個元素上,並根據key函式返回的結果進行排序。

我們再看一個字串排序的例子:

>>>sorted(['bob', 'about', 'Zoo', 'Credit'])

['Credit','Zoo', 'about', 'bob']

預設情況下,對字串排序,是按照ASCII的大小比較的,由於'Z' < 'a',結果,大寫字母Z會排在小寫字母a的前面。

現在,我們提出排序應該忽略大小寫,按照字母序排序。要實現這個演算法,不必對現有程式碼大加改動,只要我們能用一個key函式把字串對映為忽略大小寫排序即可。忽略大小寫來比較兩個字串,實際上就是先把字串都變成大寫(或者都變成小寫),再比較。

這樣,我們給sorted傳入key函式,即可實現忽略大小寫的排序:

>>>sorted(['bob', 'about', 'Zoo', 'Credit'], key=str.lower)

['about','bob', 'Credit', 'Zoo']

要進行反向排序,不必改動key函式,可以傳入第三個引數reverse=True

>>>sorted(['bob', 'about', 'Zoo', 'Credit'], key=str.lower, reverse=True)

['Zoo','Credit', 'bob', 'about']

11. sorted用例

(1)假設我們用一組tuple表示學生名字和成績:

L =[('Bob', 75), ('Adam', 92), ('Bart', 66), ('Lisa', 88)]

用sorted()對上述列表分別按名字排序:

L =[('Bob', 75), ('Adam', 92), ('Bart', 66), ('Lisa', 88)]

defby_name(t):

    return t[:][0]

L2 =sorted(L, key=by_name)

print(L2)

(2)再按成績從高到低排序:

L =[('Bob', 75), ('Adam', 92), ('Bart', 66), ('Lisa', 88)]

defby_score(t):

    return t[:][1]

L2 =sorted(L, key=by_score, reverse=True)

print(L2)