1. 程式人生 > >【python】迭代器與生成器到底是什麼?看完你就知道

【python】迭代器與生成器到底是什麼?看完你就知道

迭代器跟生成器,與上篇文章講的裝飾器一樣,都是屬於我的一個老大難問題。 通常就是遇到的時候就去搜一下,結果在一大坨各種介紹部落格中看了看,回頭又忘記了。 你是不是也是這樣呢? 俗話說:好記性不如爛筆頭,雖然現在基本不咋用筆寫字了,但是還是要好好整理下,起碼以後我就不用搜了。 如果現在給你一個列表`list_a = [1, 2, 3, 4]`,讓你去迭代它,相信大家都很熟悉,直接用for迴圈就完事兒, ``` list_a = [1, 2, 3, 4] for i in list_a: print(i) ``` 執行 ``` 1 2 3 4 [Finished in 0.1s] ``` 可以看到,for迴圈迭代了列表中的每一個元素,列印了出來。 那麼for迴圈背後都做了什麼事情呢? ### 一、 容器、可迭代物件、迭代器 聽起來陌生,但是你絕對熟悉的詞兒。 在python中,一切都是物件,物件的抽象是類,而物件的集合就是容器。 使用python中常見的容器有很多,比如:`列表list:[0, 1, 2]`,`集合set:([0, 1, 2])`,`字典dict:{0:0, 1:1, 2:2}`以及`元組tuple(0, 1, 2)`。 這些都是多個元素集中在一起的單元,區別的是內部資料結構的實現方法。 所有的容器都是可以迭代的,你可以用for迴圈去迭代上述的容器試試。 那把一個個元素找出來,用到的就是迭代器。用iter()可以建立一個迭代器。 迭代器提供一個``next()``方法,這個方法你每次呼叫的時候會給你返回下一個物件,或者``StopIteration``,也就是沒有物件可以給你了。 ``` list_a = [1, 2, 3, 4] it = iter(list_a) # 建立迭代器 print(next(it)) #呼叫next() print(next(it)) print(next(it)) print(next(it)) print(next(it)) ``` 執行結果,前4個print可以正常返回,第5個時候就出現`StopIteration`錯誤了,因為列表中4個元素已經返回完了。 ``` 1 2 3 4 Traceback (most recent call last): File "D:\練習\demo_iterator.py", line 9, in print(next(it)) StopIteration [Finished in 0.1s with exit code 1] ``` ### 二、生成器 什麼是生成器?簡單粗暴一點:生成器就是懶人版的迭代器。 在上述的建立迭代器操作中,我們顯然是做了一次性生成的操作,`list_a = [1, 2, 3, 4]`,這4個元素一次性生成好,以供`next()`呼叫。 但是生成出的這些元素都是會儲存到記憶體中去,這只是4個元素,如果有上千萬、上億元素呢? 我並不是第一時間要用到所有的元素,我只要在我呼叫`next()`的時候產生一個返回給我就好,那麼這樣一次性生成就會白白佔用了大量的記憶體。 生成器應運而生,當呼叫`next()`的時候,才會生成下一個變數。 生成器的寫法很簡單,用小括號,比如把一個列表生成式括起來:`(i for i in range(10000))`,這樣就初始化了一個生成器。 ``` print([i for i in range(10)]) print(i for i in range(10)) ``` 上面的時列表,下面的就是一個生成器了,區別就是``[]``和``()``。 執行結果: ``` [0, 1, 2, 3, 4, 5, 6, 7, 8, 9] at 0x033383A8> [Finished in 0.1s] ``` #### yield關鍵字 此外,函式也可以成為生成器,祕密就是``yield``關鍵字,比如: ``` def gen(): a = 0 while a < 100: yield a a += 1 test = gen() print(next(test)) print(next(test)) print(next(test)) print(next(test)) ``` 執行結果: ``` 0 1 2 3 [Finished in 0.1s] ``` ``yield``關鍵字,可以這樣理解:當函式執行到這一行的時候,程式會從這裡暫停,``yield``相當於``return``會返回, 當下次迭代時候,則會從``yield``的下一行程式碼開始執行。 所以,我呼叫了4次print,可以從0開始依次輸出。 從我工作中的使用場景出發的話,我在做一些自動化測試的時候,有些變數引數是不可以重複的,用迭代器來定義變數的生成規則,每次 呼叫都會產生一個新的,就不會重