1. 程式人生 > >使用快取方式優化遞迴函式與lru_cache

使用快取方式優化遞迴函式與lru_cache

一.遞迴函式的弊端

遞迴函式雖然編寫時用很少的程式碼完成了龐大的功能,但是它的弊端確實非常明顯的,那就是時間與空間的消耗。

用一個斐波那契數列來舉例


import time

#@lru_cache(20)
def fibonacci(n):
    if n < 2:
        return 1
    else:
        return fibonacci(n - 1) + fibonacci(n - 2)

t1 = time.time()
print(fibonacci(35))
t2 = time.time()
print(t2 - t1)  # 4.007285118103027
t1 = time.time() print(fibonacci(36)) t2 = time.time() print(t2 - t1) # 6.479698419570923

前面輸入的數較小,所以算的還算很快,但輸入到35、36來測試時已經要花上好幾秒來計算了,而且36比35計算時間多了兩秒多,可想而知資料再增大後消耗的時間增加的是越來越大的,因為這個遞迴函式的複雜性是O(2**n)

我們想一下這個函式遞迴的原理,流程,發現一個問題,計算fibonacci(35)的時候,是計算fibonacci(34)+fibonacci(33)的和,計算fibonacci(34)時,是計算的fibonacci(33)+fibonacci(32)的和,問題出現了,fibonacci(33)需要計算兩次,那不是重複了嘛,我們繼續遞歸向下拆分發現,幾乎所有的遞迴函式拆分為兩個函式的和時都會有重複計算,就想下面這個圖:

以fibonacci(5)舉例,這個圖裡面有一大部分的數字是重複的,也就是說執行了很多的重複的函式,這使我們產生了一個想法,既然重複執行了,那我讓它直接返回之前執行時的返回值不就行了,至於之前執行時的返回值,給他存起來不就好了嗎,這就用到了我們下面要說的快取思想

二.用快取優化遞迴函式

我們定義一個裝飾器來做函式的快取


import time

def cache_decorator(func):
    cache_dict = {}

    def decorator(arg):
        try:
            return cache_dict[arg]
        except
KeyError: return cache_dict.setdefault(arg, func(arg)) return decorator @cache_decorator def fibonacci(n): if n < 2: return 1 else: return fibonacci(n - 1) + fibonacci(n - 2) t1 = time.time() print(fibonacci(35)) t2 = time.time() print(t2 - t1) # 0 t1 = time.time() print(fibonacci(36)) t2 = time.time() print(t2 - t1) # 0

當使用了快取的方式後,發現計算所用的時間已經接近0,我們把數再改大一點


t1 = time.time()
print(fibonacci(300))
t2 = time.time()
print(t2 - t1)  # 0.001026153564453125
t1 = time.time()
print(fibonacci(301))
t2 = time.time()
print(t2 - t1)  # 0.0

這也太厲害了,當把數增大到300時,花費的時間才是0.001秒,而且t2的計算結果為0也證明了的確裝飾器中快取了資料,計算fibonacci(301)可直接從快取中拿fibonacci(300)和fibonacci(299),我們用圖來更清晰的解釋

圖中用虛線所指的結點都不需要重新計算了,只計算了不重複的數字,也就是意味著複雜度從O(2**n)降到了O(n)

這種快取的思想,給我們的優化帶來了巨大的收益

三.lru_cache裝飾器

上面的裝飾器是我們自己寫的,但它不適用與其他函式,比如有多個引數的函式,但是python標準庫為我們提供了一個非常方便的裝飾器來進行快取

它是functools模組中的lru_cache(maxsize,typed)

通過其名就能讓我們瞭解它,它是通過lru演算法來進行快取內容的淘汰,

maxsize引數設定快取記憶體佔用上限,其值應當設為2的冪,值為None時表示沒有上限

typed引數設定表示不同引數型別的呼叫是否分別快取,這個引數的意思是如果設定為True,那麼fibonacci(5)和fibonacci(5.0)將分別快取,不存為一個。

lru_cache的使用只需要將上面我們自定義的裝飾器替換為 lru_cache(None,False)即可。


參考《python高階程式設計(第2版)》