一個簡單的計時器對比各種可迭代物件定義方式的速度區別

前情介紹: 如果對迭代器和生成器不瞭解,可以先看這兩篇

python隨用隨學20200221-生成器中的send(),throw()和close()方法
python中的迭代器和生成器

初始版本

import time

reps = 1000
repslist = range(reps)


def timer(func, *pargs, **kargs):
    start = time.clock()
    for i in repslist:
        ret = func(*pargs, **kargs)
    elapsed = time.clock() - start
    return (elapsed, ret)

這個是初始版本的計時器.

我們先來做個測試跑一遍

from timer import timer
import sys

reps = 100000
repslist = range(reps)

def forloop():
    res = []
    for x in repslist:
        res.append(abs(x))
    return res

def listComp():
    return [abs(x) for x in repslist]

def mapCall():
    return list(map(abs,repslist))

def genExpr():
    return list(abs(x) for x in repslist)

def genFunc():
    def gen():
        for x in repslist:
            yield abs(x)
    return list(gen())

print(sys.version)

for test in(forloop,listComp,mapCall,genExpr,genFunc):
    elapsed,result = timer(test)
    print('-'*33)
    print('%-9s:%.5f => [%s...%s]'%(test.__name__,elapsed,result[0],result[-1]))

得到的結果如下:

C:\Anaconda3\python.exe C:/Users/Brady/PycharmProjects/FAQ/literor.py
3.7.4 (default, Aug  9 2019, 18:34:13) [MSC v.1915 64 bit (AMD64)]
---------------------------------
forloop  :11.40492 => [0...99999]
---------------------------------
listComp :7.58494 => [0...99999]
---------------------------------
mapCall  :4.28971 => [0...99999]
---------------------------------
genExpr  :10.49181 => [0...99999]
---------------------------------
genFunc  :10.76498 => [0...99999]

從結果中可以看出來:

map比列表解析式快,而且兩者都比for迴圈要快得多.
生成器表示式和函式速度居中

如果我們採用自定義函式而非內建函式的話,得到的結果就更有意思了:

from timer import timer
import sys

reps = 100000
repslist = range(reps)

def forloop():
    res = []
    for x in repslist:
        res.append(x+10)
    return res

def listComp():
    return [x+10 for x in repslist]

def mapCall():
    return list(map(lambda x:x+10,repslist))

def genExpr():
    return list(x+10 for x in repslist)

def genFunc():
    def gen():
        for x in repslist:
            yield x+10
    return list(gen())

print(sys.version)

for test in(forloop,listComp,mapCall,genExpr,genFunc):
    elapsed,result = timer(test)
    print('-'*33)
    print('%-9s:%.5f => [%s...%s]'%(test.__name__,elapsed,result[0],result[-1]))

我們得到的結果如下:

3.7.4 (default, Aug  9 2019, 18:34:13) [MSC v.1915 64 bit (AMD64)]
---------------------------------
forloop  :26.69562 => [10...100009]
---------------------------------
listComp :16.46341 => [10...100009]
---------------------------------
mapCall  :19.51527 => [10...100009]
---------------------------------
genExpr  :10.53358 => [10...100009]
---------------------------------
genFunc  :10.85899 => [10...100009]

Process finished with exit code 0

說實話這個結果有點不好解釋了...貌似打臉了...

於是我又跑了一遍...得到的結果如下:

3.7.4 (default, Aug  9 2019, 18:34:13) [MSC v.1915 64 bit (AMD64)]
---------------------------------
forloop  :11.92378 => [10...100009]
---------------------------------
listComp :7.27866 => [10...100009]
---------------------------------
mapCall  :12.92113 => [10...100009]
---------------------------------
genExpr  :10.50988 => [10...100009]
---------------------------------
genFunc  :10.56482 => [10...100009]

Process finished with exit code 0

這個結果比較符合我們的預期...

在自定義函式下,map的速度比for迴圈要慢
列表解析式速度是最塊的.
生成器表示式的速度比列表解析式要慢,但是與生成器函式差不多.

進階版本

這個結果主要是由於python直譯器的實現造成的.

同時也說明一個問題... 我們的計時器不夠科學...

於是下面我們來優化一下我們的計時器.

考慮平臺的相容性,在類unix系統中,time.time可以提供更好的解析
由於隨機的系統載入可能引起的波動,我們在測試中取最短時間比取總執行時間要更可靠.

改版後的計時器

import time
import  sys

if sys.platform[:3]=='win':
    timefunc = time.clock
else:
    timfunc = time.time


def trace(*args):
    """
    used for debuging
    :param args:
    :return:
    """
    pass

def timer(func,*pargs,**kargs):
    _reps = kargs.pop('_reps',1000)
    trace(func,pargs,kargs,_reps)
    repslist = range(_reps)
    start = timefunc()
    for i in repslist:
        ret = func(*pargs,**kargs)
    elapsed = timefunc()-start
    return (elapsed,ret)


def best(func,*pargs,**kargs):
    _reps = kargs.pop('_reps',50)
    best=2**32
    for i in range(_reps):
        (time,ret)=timer(func,*pargs,_reps=1,**kargs)
        if time <best: best=time
    return (best,ret)

改版後的測試程式碼

from timer import timer
from timer import best
import sys

reps = 100000
repslist = range(reps)

def forloop():
    res = []
    for x in repslist:
        res.append(x+10)
    return res

def listComp():
    return [x+10 for x in repslist]

def mapCall():
    return list(map(lambda x:x+10,repslist))

def genExpr():
    return list(x+10 for x in repslist)

def genFunc():
    def gen():
        for x in repslist:
            yield x+10
    return list(gen())

print(sys.version)

for tester in (timer,best):
    print(f'<{tester.__name__}>')
    for test in(forloop,listComp,mapCall,genExpr,genFunc):
        elapsed,result = tester(test)
        print('-'*35)
        print('%-9s:%.5f => [%s...%s]'%(test.__name__,elapsed,result[0],result[-1]))

來看一下結果

3.7.4 (default, Aug  9 2019, 18:34:13) [MSC v.1915 64 bit (AMD64)]
<timer>
-----------------------------------
forloop  :11.18427 => [10...100009]
-----------------------------------
listComp :7.33068 => [10...100009]
-----------------------------------
mapCall  :13.33474 => [10...100009]
-----------------------------------
genExpr  :11.25375 => [10...100009]
-----------------------------------
genFunc  :11.03975 => [10...100009]
<best>
-----------------------------------
forloop  :0.00904 => [10...100009]
-----------------------------------
listComp :0.00525 => [10...100009]
-----------------------------------
mapCall  :0.01133 => [10...100009]
-----------------------------------
genExpr  :0.00845 => [10...100009]
-----------------------------------
genFunc  :0.00785 => [10...100009]

從執行的最快速度來看的話,完全符合我們上面的結論.

列表解析式的速度是最快的
map函式比正常的for迴圈要慢
生成器表示式比for迴圈要快,速度與生成器函式差不太多.

「結論:」

其實這篇文章寫來純粹是為了好玩的. 既然選擇了python...就別太糾結執行速度了,畢竟python只負責貌美如花...

python程式碼的優化,首先考慮的是可讀性和簡單性,其次實在閒的蛋疼了再去優化效能.

一個簡單的計時器對比各種可迭代物件定義方式的速度區別

一個簡單的計時器對比各種可迭代物件定義方式的速度區別前情介紹: 如果對迭代器和生成器不瞭解,可以先看這兩篇 python隨用隨學20200221-生成器中的send(),throw()和close()方法python中的迭代器和生成器初始版本 import timereps = 1000repslist

迭代器，可迭代物件，生成器區別

迭代物件：實現__iter__方法，返回迭代器。不需要顯示繼承Iterable，迭代器：實現_iter__方法，__next__方法，不需要顯示繼承Iterator from collections import Iterable,Iterator def generator():

python的迭代器，可迭代物件，生成器理解

上篇文章， python itertools 裡面實現的groupby方法。裡面用到了object, id, iter等很基礎的方法，看的有點暈。這裡重新整理一下迭代器，可迭代物件，生成器。複習一下，加深印象。 python語言很容易上手。比如for迴圈。 a = [1, 2,

Python生成器，迭代器,可迭代物件

在瞭解Python的資料結構時，容器(container)、可迭代物件(iterable)、迭代器(iterator)、生成器(generator)、列表/集合/字典推導式(list,set,dic

迭代器和可迭代物件

基於python3 迭代器 = 可迭代的物件可迭代的物件 != 迭代器講在前面：返回迭代器的物件，有：open(), map(), zip()和filte()函式，這幾個函式直接返回迭代器也就是可以直接在結果中呼叫next 如： f = open('xxx.txt')

搞清楚 Python 的迭代器、可迭代物件、生成器

很多夥伴對 Python 的迭代器、可迭代物件、生成器這幾個概念有點搞不清楚，我來說說我的理解，希望對需要的朋友有所幫助。 1 迭代器協議迭代器協議是核心，搞懂了這個，上面的幾個概念也就很好理解了。所謂迭代器協議，就是要求一個迭代器必須要實現如下兩個方法 iterator.__iter__(

python 基礎系列--可迭代物件、迭代器與生成器

迭代器是 Python 最強大的功能之一，可以想像如果有個幾十 GB 的大檔案，你需要編寫程式處理其中的文字資訊，如果一次性全部讀入記憶體，估計機器會直接罷工了，但是借住可迭代物件，可以一次從硬碟讀取一小塊內容到記憶體，處理完後寫回硬碟，不斷迭代，從而節省記憶體，加快處理速度。首先來解

迭代器、可迭代物件、生成器

迭代器與可迭代物件 1、定義：可迭代物件：大部分容器如 list，truples，str，sets是可迭代物件，但是他們不是迭代器。可迭代物件實現了__iter__方法，返回一個迭代器，或者使用iter(“可迭代物件”)返回一個迭代器。迭代器：迭代器提供了一

python中的可迭代物件和迭代器（iter函式和next函式）

iter函式：獲取可迭代物件身上的迭代器，會呼叫可迭代物件身上的iter的方法 next函式: 獲取迭代器中的下一個值，會呼叫迭代器物件身上的next的方法 from collections import Iterable from collections im

python之函式閉包、可迭代物件和迭代器

一、函式名的應用 # 1，函式名就是函式的記憶體地址，而函式名()則是執行這個函式。 def func(): return print(func) # 返回一個地址 # 2，函式名可以作為變數。 def func1():

迭代器生成器, 可迭代物件以及應用場景

可迭代物件: 實現了迭代器協議的物件就是可迭代物件(實現方式是,實現iter方法) 迭代器迭代器物件就是實現了iter() 和 next()方法的物件.其中iter()返回迭代器本身,而next()返回容器的下一個元素,在結尾處引發StopInteration異常.

python中的生成器、迭代器，可迭代物件

最近學習了python中的生成器、迭代器、可迭代物件的知識，現在回顧一下，鞏固理解先說一下列表生成式：執行結果如下：通過方括號加入裡面的表示式，從而生成一個列表，在這裡注意一下，列表生成時也可以加入函式：結果如下：計算了X的三次方

python迭代器和可迭代物件

迭代器定義：能夠使用for-in進行遍歷，並且能夠使用next依次獲取其中一個元素。說明：生成器就是一種特殊的迭代器判斷一個物件是不是迭代器 from collections import Iterator # lt

Python —— 容器、可迭代物件、迭代器、生成器

1、容器（container）容器是一種把多個元素組織在一起的資料結構，容器中的元素可以逐個的迭代獲取。可以用 in、not in等關鍵字判斷元素是否包含在容器內。 Python中，常見的容器物件：list，set，dict，tuple，str等 2、可迭代物件（Iterable）

【ES6】迭代器與可迭代物件

ES6 新的陣列方法、集合、for-of 迴圈、展開運算子（...）甚至非同步程式設計都依賴於迭代器（Iterator ）實現。本文會詳解 ES6 的迭代器與生成器，並進一步挖掘可迭代物件的內部原理與使用方法一、迭代器的原理在程式語言中處理陣列或集合時，使用迴圈語句必須要初始化一個變數記錄迭

Python：迭代器、可迭代物件、生成器

1、什麼叫迭代現在，我們已經獲得了一個新線索，有一個叫做“可迭代的”概念。首先，我們從報錯來分析，好像之所以1234不可以for迴圈，是因為它不可迭代。那麼如果“可迭代”，就應該可以被for迴圈了。這個我們知道呀，字串、列表、元組、字典、集合都可以被for迴圈，說明他們都是可迭代的

迭代器、生成器、可迭代物件

1.如果一個物件同時含有__iter__()方法和next()方法，那他就是一個迭代器 2.只含有__iter__()方法，並且該方法返回一個迭代器，那他就是一個可迭代物件 3.只有next方法，啥都不是。但是可以直接用next(obj)呼叫該物件。next(obj)方法的本質就是呼叫ob

python可迭代物件，迭代器和生成器

迭代是資料處理的基石，掃描記憶體中放不下的資料集時，我們要找到一種惰性獲取資料項的方式，即按需一次獲取一個數據項，這就是迭代器模式。所有的生成器都是迭代器，因為生成器實現了迭代器的介面，迭代器用於從集合中取出元素，生成器用於憑空生成元素。所有的序列都可以迭代：序列可以迭代的原因

python迭代，可迭代物件，生成器，迭代器--

python迭代給定一個list或tuple，我們可以通過for迴圈來遍歷這個list或tuple，這種遍歷我們稱為迭代（Iteration）可迭代物件： List：for a in List dict：（因為dict的儲存不是按照list的方式順序

Python可迭代物件，迭代器，生成器的區別

本篇文章簡單談談可迭代物件，迭代器和生成器之間的關係。三者簡要關係圖可迭代物件與迭代器剛開始我認為這兩者是等同的，但後來發現並不是這樣；下面直接丟擲結論： 1）可迭代物件包含迭代器。 2）如果一個物件擁有__iter__方法，其是可迭代物件；如果一個物件擁有ne

一個簡單的計時器對比各種可迭代物件定義方式的速度區別