Python教程·叠代、可叠代對象、叠代器與生成器詳解
叠代是Python最強大的功能之一,是訪問集合元素的一種方式。
只要是可叠代對象(Iterable),就可以通過for循環來遍歷,這種遍歷我們稱為叠代。
也就是說所有可作用於for循環的對象都是可叠代對象(Iterable)。
那麽,如何判斷一個對象是可叠代對象呢?方法是通過collections模塊的Iterable類型判斷:
>>> from collections import Iterable >>> isinstance(123,Iterable) # Integer 不可叠代 False >>> isinstance(‘abc‘,Iterable) # String 可叠代 True >>> isinstance([1,2,3],Iterable) # List 可叠代 True >>> isinstance((‘a‘,‘b‘,‘c‘),Iterable) # Tuple 可叠代 True >>> isinstance({‘name‘:‘Arno‘,‘Job‘:‘Ops‘},Iterable) # Dictionary 可叠代 True
dict 叠代說明
默認情況下,dict叠代的是key:
>>> d = {‘Name‘:‘Arno‘,‘Born‘:1993,‘Job‘:‘Ops‘}
>>> for k in d:
... print(k)
...
Name
Born
Job
如果要叠代value,可以用for value in d.values():
>>> for v in d.values():
... print(v)
...
Arno
1993
Ops
如果要同時叠代key和value,可以用for k, v in d.items():
>>> for k,v in d.items(): ... print(‘key:‘, k, ‘\t‘, ‘value:‘, v) ... key: Name value: Arno key: Born value: 1993 key: Job value: Ops
知識擴展
在Python中,List元素是有索引的,那麽如何實現類似Java那樣的下標循環?
方法一,通過len()方法取得列表長度,再結合range()方法實現索引下標循環:
>>> L = [‘a‘,‘b‘,‘c‘]
>>> for i in range(len(L)):
... print(i, L[i])
...
0 a
1 b
2 c
方法二,Python內置的enumerate函數可以把一個list變成 索引-元素 對,這樣就可以在for循環中同時叠代索引和元素本身:
>>> for i,v in enumerate(L): ... print(i, v) ... 0 a 1 b 2 c
iterator(叠代器)
叠代器是一個可以記住遍歷的位置的對象。
- 叠代器對象從集合的第一個元素開始訪問,直到所有的元素被訪問完結束;
- 叠代器只能往前不會後退;
叠代器有兩個基本的方法:
- iter()
- next()
可以通過 collections 模塊的 Iterator 類型判斷一個對象是否是叠代器:
>>> from collections import Iterator
>>> isinstance([1,2,3], Iterator)
False
>>> isinstance({‘Name‘:‘Arno‘,‘Born‘:1993,‘Job‘:‘Ops‘}, Iterator)
False
>>> isinstance(‘abc‘, Iterator)
False
>>> isinstance(iter([1,2,3]), Iterator) # iter()創建叠代器對象
True
>>> isinstance((x for x in range(10)), Iterator) # 生成器
True
可以看出,生成器(generator)都是叠代器(Iterator)對象,但String、List、Tuple、Dict雖然是可叠代對象(Iterable),卻不是叠代器(Iterator)。
當然,String、List、Tuple、Dict等可叠代對象都可用於創建叠代器:
>>> L = [1,2,3]
>>> it = iter(L)
>>> print(next(it))
1
>>> print(next(it))
2
>>> print(next(it))
3
>>> print(next(it)) # 沒有值可返回時,拋異常 StopIteration
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
StopIteration
>>>
叠代器對象常使用for語句進行遍歷:
>>> L = [1,2,3]
>>> it = iter(L)
>>> for x in it:
... print(x, end=" ")
...
1 2 3
也可以使用 next() 函數:
>>> import sys
>>> L = [1,2,3]
>>> it = iter(L)
>>> while True:
... try:
... print(next(it))
... except StopIteration:
... sys.exit()
...
1
2
3
generator(生成器)
創建生成器的方法:
- 使用了 yield 語句的函數
Generator 是一個用於創建叠代器的簡單而強大的工具。 它們的寫法類似標準的函數,但當它們要返回數據時會使用 yield 語句。 每次對生成器調用 next() 時,它會從上次離開位置恢復執行(它會記住上次執行語句時的所有數據值)。 - 使用生成器表達式,就是把一個 列表生成式 的[]改成()
某些簡單的生成器可以寫成簡潔的表達式代碼,所用語法類似列表推導式,將外層為圓括號而非方括號。 這種表達式被設計用於生成器將立即被外層函數所使用的情況。 生成器表達式相比完整的生成器更緊湊但較不靈活,相比等效的列表推導式則更為節省內存。
yield 函數生成器
在 Python 中,使用了 yield 的函數被稱為生成器
跟普通函數不同的是,生成器是一個返回叠代器的函數,只能用於叠代操作,更簡單點理解生成器就是一個叠代器。
在調用生成器運行的過程中,每次遇到 yield 時函數會暫停並保存當前所有的運行信息,返回yield的值。並在下一次執行 next()方法時從當前位置繼續運行。
實例,使用 yield 實現斐波那契數列:
import sys
def fibonacci(n): # 生成器函數 - 斐波那契
a, b, counter = 0, 1, 0
while True:
if (counter > n):
return
yield a
a, b = b, a + b
counter += 1
f = fibonacci(10) # f 是一個叠代器,由生成器返回生成
while True:
try:
print (next(f), end=" ")
except StopIteration:
sys.exit()
列表生成式
列表生成式(List Comprehensions)也叫列表推導式,提供了一個更簡單的創建列表的方法。
常見的用法:
- 是把某種操作應用於序列或可叠代對象的每個元素上,然後使用其結果來創建列表;
- 或者通過滿足某些特定條件元素來創建子序列;
例如,創建一個平方列表,像這樣
>>> squares = []
>>> for x in range(10):
... squares.append(x**2)
...
>>> squares
[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]
可以改為
>>> list(map(lambda x: x**2, range(10)))
[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]
等價於
# 列表推導式,更加簡潔易讀
>>> [x**2 for x in range(10)]
[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]
增加特定條件
>>> [x**2 for x in range(10) if x % 2 != 0]
[1, 9, 25, 49, 81]
創建為生成器
>>> (x**2 for x in range(10) if x % 2 != 0)
<generator object <genexpr> at 0x7f076f06e990>
知識擴展
lambda 表達式
lambda 表達式(有時稱為 lambda 構型)被用於創建匿名函數。
表達式 lambda parameters: expression 會產生一個函數對象 。 該未命名對象的行為類似於用以下方式定義的函數:
def <lambda>(parameters):
return expression
註意:通過 lambda 表達式創建的函數不能包含語句或標註。
map() 高階函數
接收兩個參數,一個是函數,一個是可叠代對象(Iterable),map將傳入的函數依次作用到序列的每個元素,並把結果作為新的iterator(叠代器)返回。
總結
- 叠代(iteration)是訪問集合元素的一種方式;
- 叠代器(iterator)對象一定是可叠代對象,反之則不一定;
- 可叠代對象(Iterable)不一定是叠代器;
例如list、dict、str等集合數據類型是可叠代對象,但不是叠代器,但是它們可以通過iter()函數生成一個叠代器對象。 - 生成器(generator)對象既是可叠代對象也是叠代器;
遍歷方式
- 叠代器、生成器和可叠代對象都可以用for循環去叠代
- 生成器和叠代器還可以被next()方函數調用並返回下一個值
Python教程·叠代、可叠代對象、叠代器與生成器詳解