7個提升Python程序性能的好習慣
原文作者:愛coding,會編程的核電工程師。
個人博客地址:zhihu.com/people/zhong-yun-75-63
掌握一些技巧,可盡量提高Python程序性能,也可以避免不必要的資源浪費。
1、使用局部變量
盡量使用局部變量代替全局變量:便於維護,提高性能並節省內存。
使用局部變量替換模塊名字空間中的變量,例如 ls = os.linesep。一方面可以提高程序性能,局部變量查找速度更快;另一方面可用簡短標識符替代冗長的模塊變量,提高可讀性。
2、減少函數調用次數
對象類型判斷時,采用isinstance()最優,采用對象類型身份(id())次之,采用對象值(type())比較最次。
#判斷變量num是否為整數類型 type(num) == type(0) #調用三次函數 type(num) is type(0) #身份比較 isinstance(num,(int)) #調用一次函數
不要在重復操作的內容作為參數放到循環條件中,避免重復運算。
#每次循環都需要重新執行len(a) while i < len(a): statement #len(a)僅執行一次 m = len(a) while i < m: statement
如需使用模塊X中的某個函數或對象Y,應直接使用from X import Y,而不是import X; X.Y。這樣在使用Y時,可以減少一次查詢(解釋器不必首先查找到X模塊,然後在X模塊的字典中查找Y)。
3、采用映射替代條件查找
映射(比如dict等)的搜索速度遠快於條件語句(如if等)。Python中也沒有select-case語句。
#if查找 if a == 1: b = 10 elif a == 2: b = 20 ... #dict查找,性能更優 d = {1:10,2:20,...} b = d[a]
4、直接叠代序列元素
對序列(str、list、tuple等),直接叠代序列元素,比叠代元素的索引速度要更快。
a = [1,2,3] #叠代元素 for item in a: print(item) #叠代索引 for i in range(len(a)): print(a[i])
5、采用生成器表達式替代列表解析
列表解析(list comprehension),會產生整個列表,對大量數據的叠代會產生負面效應。
而生成器表達式則不會,其不會真正創建列表,而是返回一個生成器,在需要時產生一個值(延遲計算),對內存更加友好。
#計算文件f的非空字符個數 #生成器表達式 l = sum([len(word) for line in f for word in line.split()]) #列表解析 l = sum(len(word) for line in f for word in line.split())
6、先編譯後調用
使用eval()、exec()函數執行代碼時,最好調用代碼對象(提前通過compile()函數編譯成字節碼),而不是直接調用str,可以避免多次執行重復編譯過程,提高程序性能。
正則表達式模式匹配也類似,也最好先將正則表達式模式編譯成regex對象(通過re.complie()函數),然後再執行比較和匹配。
7、模塊編程習慣
模塊中的最高級別Python語句(沒有縮進的代碼)會在模塊導入(import)時執行(不論其是否真的必要執行)。因此,應盡量將模塊所有的功能代碼放到函數中,包括主程序相關的功能代碼也可放到main()函數中,主程序本身調用main()函數。
可以在模塊的main()函數中書寫測試代碼。在主程序中,檢測name的值,如果為‘main‘(表示模塊是被直接執行),則調用main()函數,進行測試;如果為模塊名字(表示模塊是被調用),則不進行測試。
7個提升Python程序性能的好習慣