1. 程式人生 > >python迭代器詳解

python迭代器詳解

迭代器

迭代是訪問集合元素的一種方式。迭代器是一個可以記住遍歷的位置的物件。迭代器物件從集合的第一個元素開始訪問,直到所有的元素被訪問完結束。迭代器只能往前不會後退。

1. 可迭代物件

我們已經知道可以對list、tuple、str等型別的資料使用for...in...的迴圈語法從其中依次拿到資料進行使用,我們把這樣的過程稱為遍歷,也叫迭代

但是,是否所有的資料型別都可以放到for...in...的語句中,然後讓for...in...每次從中取出一條資料供我們使用,即供我們迭代嗎?

>>> for i in 100:
...     print(i)
...
Traceback (most recent call last):
 File "<stdin>", line 1, in <module>
TypeError: 'int' object is not iterable
>>>
# int整型不是iterable,即int整型不是可以迭代的

# 我們自定義一個容器MyList用來存放資料,可以通過add方法向其中新增資料
>>> class MyList(object):
...     def __init__(self):
...             self.container = []
...     def add(self, item):
...             self.container.append(item)
...
>>> mylist = MyList()
>>> mylist.add(1)
>>> mylist.add(2)
>>> mylist.add(3)
>>> for num in mylist:
...     print(num)
...
Traceback (most recent call last):
 File "<stdin>", line 1, in <module>
TypeError: 'MyList' object is not iterable
>>>
# MyList容器的物件也是不能迭代的

我們自定義了一個容器型別MyList,在將一個存放了多個數據的MyList物件放到for...in...的語句中,發現for...in...並不能從中依次取出一條資料返回給我們,也就說我們隨便封裝了一個可以存放多條資料的型別卻並不能被迭代使用。

我們把可以通過for...in...這類語句迭代讀取一條資料供我們使用的物件稱之為可迭代物件(Iterable)**。

2. 如何判斷一個物件是否可以迭代

可以使用 isinstance() 判斷一個物件是否是 Iterable 物件:

In [50]: from collections import Iterable

In [51]: isinstance([], Iterable)
Out[51]: True

In [52]: isinstance({}, Iterable)
Out[52]: True

In [53]: isinstance('abc', Iterable)
Out[53]: True

In [54]: isinstance(mylist, Iterable)
Out[54]: False

In [55]: isinstance(100, Iterable)
Out[55]: False

3. 可迭代物件的本質

我們分析對可迭代物件進行迭代使用的過程,發現每迭代一次(即在for...in...中每迴圈一次)都會返回物件中的下一條資料,一直向後讀取資料直到迭代了所有資料後結束。那麼,在這個過程中就應該有一個“人”去記錄每次訪問到了第幾條資料,以便每次迭代都可以返回下一條資料。我們把這個能幫助我們進行資料迭代的“人”稱為迭代器(Iterator)

可迭代物件的本質就是可以向我們提供一個這樣的中間“人”即迭代器幫助我們對其進行迭代遍歷使用。

可迭代物件通過__iter__方法向我們提供一個迭代器,我們在迭代一個可迭代物件的時候,實際上就是先獲取該物件提供的一個迭代器,然後通過這個迭代器來依次獲取物件中的每一個數據.

那麼也就是說,一個具備了__iter__方法的物件,就是一個可迭代物件。

>>> class MyList(object):
...     def __init__(self):
...             self.container = []
...     def add(self, item):
...             self.container.append(item)
...     def __iter__(self):
...             """返回一個迭代器"""
...             # 我們暫時忽略如何構造一個迭代器物件
...             pass
...
>>> mylist = MyList()
>>> from collections import Iterable
>>> isinstance(mylist, Iterable)
True
>>>
# 這回測試發現添加了__iter__方法的mylist物件已經是一個可迭代物件了

4. iter()函式與next()函式

list、tuple等都是可迭代物件,我們可以通過iter()函式獲取這些可迭代物件的迭代器。然後我們可以對獲取到的迭代器不斷使用next()函式來獲取下一條資料。iter()函式實際上就是呼叫了可迭代物件的__iter__方法。

>>> li = [11, 22, 33, 44, 55]
>>> li_iter = iter(li)
>>> next(li_iter)
11
>>> next(li_iter)
22
>>> next(li_iter)
33
>>> next(li_iter)
44
>>> next(li_iter)
55
>>> next(li_iter)
Traceback (most recent call last):
 File "<stdin>", line 1, in <module>
StopIteration
>>>

注意,當我們已經迭代完最後一個數據之後,再次呼叫next()函式會丟擲StopIteration的異常,來告訴我們所有資料都已迭代完成,不用再執行next()函數了。**

5. 如何判斷一個物件是否是迭代器

可以使用 isinstance() 判斷一個物件是否是 Iterator 物件:

In [56]: from collections import Iterator

In [57]: isinstance([], Iterator)
Out[57]: False

In [58]: isinstance(iter([]), Iterator)
Out[58]: True

In [59]: isinstance(iter("abc"), Iterator)
Out[59]: True

6. 迭代器Iterator

通過上面的分析,我們已經知道,迭代器是用來幫助我們記錄每次迭代訪問到的位置,當我們對迭代器使用next()函式的時候,迭代器會向我們返回它所記錄位置的下一個位置的資料。實際上,在使用next()函式的時候,呼叫的就是迭代器物件的__next__方法(Python3中是物件的__next__方法,Python2中是物件的next()方法)。所以,我們要想構造一個迭代器,就要實現它的__next__方法。但這還不夠,python要求迭代器本身也是可迭代的,所以我們還要為迭代器實現__iter__方法,而__iter__方法要返回一個迭代器,迭代器自身正是一個迭代器,所以迭代器的__iter__方法返回自身即可。

一個實現了iter方法和next方法的物件,就是迭代器。

class MyList(object):
   """自定義的一個可迭代物件"""
   def __init__(self):
       self.items = []

   def add(self, val):
       self.items.append(val)

   def __iter__(self):
       myiterator = MyIterator(self)
       return myiterator

class MyIterator(object):
   """自定義的供上面可迭代物件使用的一個迭代器"""
   def __init__(self, mylist):
       self.mylist = mylist
       # current用來記錄當前訪問到的位置
       self.current = 0

   def __next__(self):
       if self.current < len(self.mylist.items):
           item = self.mylist.items[self.current]
           self.current += 1
           return item
       else:
           raise StopIteration

   def __iter__(self):
       return self
   
if __name__ == '__main__':
   mylist = MyList()
   mylist.add(1)
   mylist.add(2)
   mylist.add(3)
   mylist.add(4)
   mylist.add(5)
   for num in mylist:
       print(num)

7. for...in...迴圈的本質

for item in Iterable 迴圈的本質就是先通過iter()函式獲取可迭代物件Iterable的迭代器,然後對獲取到的迭代器不斷呼叫next()方法來獲取下一個值並將其賦值給item,當遇到StopIteration的異常後迴圈結束。

8. 迭代器的應用場景

我們發現迭代器最核心的功能就是可以通過next()函式的呼叫來返回下一個資料值。如果每次返回的資料值不是在一個已有的資料集合中讀取的,而是通過程式按照一定的規律計算生成的,那麼也就意味著可以不用再依賴一個已有的資料集合,也就是說不用再將所有要迭代的資料都一次性快取下來供後續依次讀取,這樣可以節省大量的儲存(記憶體)空間。

舉個例子,比如,數學中有個著名的斐波拉契數列(Fibonacci),數列中第一個數為0,第二個數為1,其後的每一個數都可由前兩個數相加得到:

0, 1, 1, 2, 3, 5, 8, 13, 21, 34, ...

現在我們想要通過for...in...迴圈來遍歷迭代斐波那契數列中的前n個數。那麼這個斐波那契數列我們就可以用迭代器來實現,每次迭代都通過數學計算來生成下一個數。

class FibIterator(object):
   """斐波那契數列迭代器"""
   def __init__(self, n):
       """
      :param n: int, 指明生成數列的前n個數
      """
       self.n = n
       # current用來儲存當前生成到數列中的第幾個數了
       self.current = 0
       # num1用來儲存前前一個數,初始值為數列中的第一個數0
       self.num1 = 0
       # num2用來儲存前一個數,初始值為數列中的第二個數1
       self.num2 = 1

   def __next__(self):
       """被next()函式呼叫來獲取下一個數"""
       if self.current < self.n:
           num = self.num1
           self.num1, self.num2 = self.num2, self.num1+self.num2
           self.current += 1
           return num
       else:
           raise StopIteration

   def __iter__(self):
       """迭代器的__iter__返回自身即可"""
       return self


if __name__ == '__main__':
   fib = FibIterator(10)
   for num in fib:
       print(num, end=" ")

9. 並不是只有for迴圈能接收可迭代物件

除了for迴圈能接收可迭代物件,list、tuple等也能接收。

li = list(FibIterator(15))
print(li)
tp = tuple(FibIterator(6))
print(tp)