1. 程式人生 > >Python教程·叠代、可叠代對象、叠代器與生成器詳解

Python教程·叠代、可叠代對象、叠代器與生成器詳解

file eba for ava integer list parameter for循環 簡潔

iteration(叠代)

叠代是Python最強大的功能之一,是訪問集合元素的一種方式。

只要是可叠代對象(Iterable),就可以通過for循環來遍歷,這種遍歷我們稱為叠代。

也就是說所有可作用於for循環的對象都是可叠代對象(Iterable)。

那麽,如何判斷一個對象是可叠代對象呢?方法是通過collections模塊的Iterable類型判斷:

>>> from collections import Iterable
>>> isinstance(123,Iterable)            # Integer 不可叠代
False
>>> isinstance(‘abc‘,Iterable)          # String 可叠代
True
>>> isinstance([1,2,3],Iterable)        # List 可叠代
True
>>> isinstance((‘a‘,‘b‘,‘c‘),Iterable)  # Tuple 可叠代
True
>>> isinstance({‘name‘:‘Arno‘,‘Job‘:‘Ops‘},Iterable)    # Dictionary 可叠代
True

dict 叠代說明

默認情況下,dict叠代的是key:

>>> d = {‘Name‘:‘Arno‘,‘Born‘:1993,‘Job‘:‘Ops‘}
>>> for k in d:
...     print(k)
... 
Name
Born
Job

如果要叠代value,可以用for value in d.values():

>>> for v in d.values():
...     print(v)
... 
Arno
1993
Ops

如果要同時叠代key和value,可以用for k, v in d.items():

>>> for k,v in d.items():
...     print(‘key:‘, k, ‘\t‘, ‘value:‘, v)
... 
key: Name    value: Arno
key: Born    value: 1993
key: Job     value: Ops

知識擴展

在Python中,List元素是有索引的,那麽如何實現類似Java那樣的下標循環?

方法一,通過len()方法取得列表長度,再結合range()方法實現索引下標循環:

>>> L = [‘a‘,‘b‘,‘c‘]
>>> for i in range(len(L)):
...     print(i, L[i])
... 
0 a
1 b
2 c

方法二,Python內置的enumerate函數可以把一個list變成 索引-元素 對,這樣就可以在for循環中同時叠代索引和元素本身:

>>> for i,v in enumerate(L):
...     print(i, v)
... 
0 a
1 b
2 c

iterator(叠代器)

叠代器是一個可以記住遍歷的位置的對象。

  • 叠代器對象從集合的第一個元素開始訪問,直到所有的元素被訪問完結束;
  • 叠代器只能往前不會後退;

叠代器有兩個基本的方法:

  • iter()
  • next()

可以通過 collections 模塊的 Iterator 類型判斷一個對象是否是叠代器:

>>> from collections import Iterator
>>> isinstance([1,2,3], Iterator)
False
>>> isinstance({‘Name‘:‘Arno‘,‘Born‘:1993,‘Job‘:‘Ops‘}, Iterator)
False
>>> isinstance(‘abc‘, Iterator)
False
>>> isinstance(iter([1,2,3]), Iterator)             # iter()創建叠代器對象
True
>>> isinstance((x for x in range(10)), Iterator)    # 生成器
True

可以看出,生成器(generator)都是叠代器(Iterator)對象,但String、List、Tuple、Dict雖然是可叠代對象(Iterable),卻不是叠代器(Iterator)。

當然,String、List、Tuple、Dict等可叠代對象都可用於創建叠代器:

>>> L = [1,2,3]
>>> it = iter(L)
>>> print(next(it))
1
>>> print(next(it))
2
>>> print(next(it))
3
>>> print(next(it))     # 沒有值可返回時,拋異常 StopIteration
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
StopIteration
>>> 

叠代器對象常使用for語句進行遍歷:

>>> L = [1,2,3]
>>> it = iter(L)
>>> for x in it:
...     print(x, end=" ")
... 
1 2 3 

也可以使用 next() 函數:

>>> import sys
>>> L = [1,2,3]
>>> it = iter(L)
>>> while True:
...     try:
...         print(next(it))
...     except StopIteration:
...         sys.exit()
... 
1
2
3

generator(生成器)

創建生成器的方法:

  • 使用了 yield 語句的函數
    Generator 是一個用於創建叠代器的簡單而強大的工具。 它們的寫法類似標準的函數,但當它們要返回數據時會使用 yield 語句。 每次對生成器調用 next() 時,它會從上次離開位置恢復執行(它會記住上次執行語句時的所有數據值)。
  • 使用生成器表達式,就是把一個 列表生成式 的[]改成()
    某些簡單的生成器可以寫成簡潔的表達式代碼,所用語法類似列表推導式,將外層為圓括號而非方括號。 這種表達式被設計用於生成器將立即被外層函數所使用的情況。 生成器表達式相比完整的生成器更緊湊但較不靈活,相比等效的列表推導式則更為節省內存。

yield 函數生成器

在 Python 中,使用了 yield 的函數被稱為生成器

跟普通函數不同的是,生成器是一個返回叠代器的函數,只能用於叠代操作,更簡單點理解生成器就是一個叠代器。

在調用生成器運行的過程中,每次遇到 yield 時函數會暫停並保存當前所有的運行信息,返回yield的值。並在下一次執行 next()方法時從當前位置繼續運行。

實例,使用 yield 實現斐波那契數列:

import sys

def fibonacci(n): # 生成器函數 - 斐波那契
    a, b, counter = 0, 1, 0
    while True:
        if (counter > n): 
            return
        yield a
        a, b = b, a + b
        counter += 1
f = fibonacci(10) # f 是一個叠代器,由生成器返回生成

while True:
    try:
        print (next(f), end=" ")
    except StopIteration:
        sys.exit()

列表生成式

列表生成式(List Comprehensions)也叫列表推導式,提供了一個更簡單的創建列表的方法。

常見的用法:

  • 是把某種操作應用於序列或可叠代對象的每個元素上,然後使用其結果來創建列表;
  • 或者通過滿足某些特定條件元素來創建子序列;

例如,創建一個平方列表,像這樣

>>> squares = []
>>> for x in range(10):
...     squares.append(x**2)
...
>>> squares
[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]

可以改為

>>> list(map(lambda x: x**2, range(10)))
[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]

等價於

# 列表推導式,更加簡潔易讀
>>> [x**2 for x in range(10)]
[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]

增加特定條件

>>> [x**2 for x in range(10) if x % 2 != 0]
[1, 9, 25, 49, 81]

創建為生成器

>>> (x**2 for x in range(10) if x % 2 != 0)
<generator object <genexpr> at 0x7f076f06e990>

知識擴展

lambda 表達式

lambda 表達式(有時稱為 lambda 構型)被用於創建匿名函數。

表達式 lambda parameters: expression 會產生一個函數對象 。 該未命名對象的行為類似於用以下方式定義的函數:

def <lambda>(parameters):
    return expression

註意:通過 lambda 表達式創建的函數不能包含語句或標註。

map() 高階函數

接收兩個參數,一個是函數,一個是可叠代對象(Iterable),map將傳入的函數依次作用到序列的每個元素,並把結果作為新的iterator(叠代器)返回。

總結

  • 叠代(iteration)是訪問集合元素的一種方式;
  • 叠代器(iterator)對象一定是可叠代對象,反之則不一定;
  • 可叠代對象(Iterable)不一定是叠代器;
    例如list、dict、str等集合數據類型是可叠代對象,但不是叠代器,但是它們可以通過iter()函數生成一個叠代器對象。
  • 生成器(generator)對象既是可叠代對象也是叠代器;

遍歷方式

  • 叠代器、生成器和可叠代對象都可以用for循環去叠代
  • 生成器和叠代器還可以被next()方函數調用並返回下一個值

Python教程·叠代、可叠代對象、叠代器與生成器詳解