1. 程式人生 > >python 學習筆記【Generators】

python 學習筆記【Generators】

生成器(Generators)

首先我們要理解迭代器(iterators)。迭代器是一個讓程式設計師可以遍歷一個容器(特別是列表)的物件。然而,一個迭代器在遍歷並讀取一個容器的資料元素時,並不會執行一個迭代。換句話說這裡有三個部分:

  • 可迭代物件(Iterable)
  • 迭代器(Iterator)
  • 迭代(Iteration) 

上面這些部分互相聯絡。我們會先各個擊破來討論他們,然後再討論生成器(generators).

可迭代物件(Iterable)

Python中任意的物件,只要它定義了可以返回一個迭代器的__iter__方法,或者定義了可以支援下標索引的__getitem__

方法(這些雙下劃線方法會在其他章節中全面解釋),那麼它就是一個可迭代物件。簡單說,可迭代物件就是能提供迭代器的任意物件。

迭代器(Iterator)

任意物件,只要定義了next(Python2) 或者__next__方法,它就是一個迭代器。就這麼簡單。現在我們來理解迭代(iteration)

迭代(Iteration)

用簡單的話講,它就是從某個地方(比如一個列表)取出一個元素的過程。當我們使用一個迴圈來遍歷某個東西時,這個過程本身就叫迭代。現在既然我們有了這些術語的基本理解,那我們開始理解生成器吧。

生成器(Generators)

       生成器也是一種迭代器,但是你只能對其迭代一次。這是因為它們並沒有把所有的值存在記憶體中,而是在執行時生成值。你通過遍歷來使用它們,要麼用一個“for”迴圈,要麼將它們傳遞給任意可以進行迭代的函式和結構。大多數時候生成器是以函式來實現的。然而,它們並不返回一個值,而是yield

(暫且譯作“生出”)一個值。這裡有個生成器函式的簡單例子:

def generator_function():
    for i in range(10):
        yield i

for item in generator_function():
    print(item)

# Output: 0
# 1
# 2
# 3
# 4
# 5
# 6
# 7
# 8
# 9

這個案例並不是非常實用。生成器最佳應用場景是:你不想同一時間將所有計算出來的大量結果集分配到記憶體當中,特別是結果集裡還包含迴圈。

下面是一個計算斐波那契數列的生成器:

# generator version
def fibon(n):
    a = b = 1
    for i in range(n):
        yield a
        a, b = b, a + b

函式使用方法如下:

for x in fibon(1000000):
    print(x)

用這種方式,我們可以不用擔心它會使用大量資源。然而,之前如果我們這樣來實現的話:

def fibon(n):
    a = b = 1
    result = []
    for i in range(n):
        result.append(a)
        a, b = b, a + b
    return result

這也許會在計算很大的輸入引數時,用盡所有的資源。我們已經討論過生成器使用一次迭代,但我們並沒有測試過。在測試前你需要再知道一個Python內建函式:next()。它允許我們獲取一個序列的下一個元素。那我們來驗證下我們的理解:

def generator_function():
    for i in range(3):
        yield i

gen = generator_function()
print(next(gen))
# Output: 0
print(next(gen))
# Output: 1
print(next(gen))
# Output: 2
print(next(gen))
# Output: Traceback (most recent call last):
#            File "<stdin>", line 1, in <module>
#         StopIteration

我們可以看到,在yield掉所有的值後,next()觸發了一個StopIteration的異常。基本上這個異常告訴我們,所有的值都已經被yield完了。你也許會奇怪,為什麼我們在使用for迴圈時沒有這個異常呢?啊哈,答案很簡單。for迴圈會自動捕捉到這個異常並停止呼叫next()。你知不知道Python中一些內建資料型別也支援迭代哦?我們這就去看看:

my_string = "Yasoob"
next(my_string)
# Output: Traceback (most recent call last):
#      File "<stdin>", line 1, in <module>
#    TypeError: str object is not an iterator

       這個異常說那個str物件不是一個迭代器。對,就是這樣!它是一個可迭代物件,而不是一個迭代器。這意味著它支援迭代,但我們不能直接對其進行迭代操作。那我們怎樣才能對它實施迭代呢?是時候學習下另一個內建函式,iter。它將根據一個可迭代物件返回一個迭代器物件。這裡是我們如何使用它:

my_string = "Yasoob"
my_iter = iter(my_string)
next(my_iter)
# Output: 'Y'

根據網路課程梳理筆記