1. 程式人生 > >Python 2.7.x 和 3.x 版本區別小結

Python 2.7.x 和 3.x 版本區別小結

python

python現在很火,最近花了些時間去了解了一下,最初了解的是2.7.x版本,感覺,從書寫上是很不習慣,少了一雙大概號,取而代之的是縮進;然後跟kotlin和swift一樣省去了每行的分號,象我們這種分號強迫癥的人真心的不習慣;還有!True的條件改成not True、while後面可以跟else等等這些,真心不習慣啊!用2.7.x做了幾天的測試,基本慢慢算有個了解了,也試著爬了些行業網的數據,感覺這個比PHP寫爬蟲方便很多。然後昨晚就在家裏裝了個3.X的版本,很悲催的發現,原來寫的有很多的錯誤,萬般無奈的檢查之下,發現語句上是沒什麽問題,只是3.X版本不兼容部分的語句,例如最常用的print,raw_input都不一樣了,今天花了些時間查一查,並總結了一下它們的區別。



print函數

Python 2中的print語句被Python 3中的print()函數取代,這意味著在Python 3中必須用括號將需要輸出的對象括起來。在Python 3中想以Python2的形式不帶括號調用print函數時,會觸發SyntaxError。
Python 2

print ‘Python‘, python_version() 
print ‘Hello, World!‘
print(‘Hello, World!‘)
print "this line", ; print ‘more text on the same line‘


Python 2.7.6

Hello, World!

Hello, World!

this line more text on the same line



python3

print(‘Python‘, python_version()) 
print(‘Hello, World!‘) 
print("this line,", end="")  
print(‘ more text on the same line‘)

Python 3.4.1

Hello, World!

this line, more text on the same line


print ‘Hello, World!‘
File "<ipython-input-3-139a7c5835bd>", line 1


print ‘Hello, World!‘

^

SyntaxError: invalid syntax



註意:

在Python中,帶不帶括號輸出”Hello World”都很正常。但如果在圓括號中同時輸出多個對象時,就會創建一個元組,這是因為在Python 2中,print是一個語句,而不是函數調用。

通過input()解析用戶的輸入

幸運的是,Python 3改進了input()函數,這樣該函數就會總是將用戶的輸入存儲為str對象。在Python 2中,為了避免讀取非字符串類型會發生的一些危險行為,不得不使用raw_input()代替input()。

Python 2

>>> my_input = input(‘enter a number: ‘)

enter a number: 123

>>> type(my_input)

<type ‘int‘>

>>> my_input = raw_input(‘enter a number: ‘)

enter a number: 123

>>> type(my_input)

<type ‘str‘>


Python 3

>>> my_input = input(‘enter a number: ‘)

enter a number: 123

>>> type(my_input)

<class ‘str‘>

整數除法

由於人們常常會忽視Python 3在整數除法上的改動(寫錯了也不會觸發Syntax Error),所以在移植代碼或在Python 2中執行Python 3的代碼時,需要特別註意這個改動。

所以,我還是會在Python 3的腳本中嘗試用float(3)/2或 3/2.0代替3/2,以此來避免代碼在Python 2環境下可能導致的錯誤(或與之相反,在Python 2腳本中用from __future__ import division來使用Python 3的除法)。

Python 2

print ‘Python‘, python_version() 
print ‘3 / 2 =‘, 3 / 2
print ‘3 // 2 =‘, 3 // 2
print ‘3 / 2.0 =‘, 3 / 2.0
print ‘3 // 2.0 =‘, 3 // 2.0

Python 2.7.6
3 / 2 = 1
3 // 2 = 1
3 / 2.0 = 1.5
3 // 2.0 = 1.0

Python 3

print(‘Python‘, python_version()) 
print(‘3 / 2 =‘, 3 / 2)
print(‘3 // 2 =‘, 3 // 2)
print(‘3 / 2.0 =‘, 3 / 2.0)
print(‘3 // 2.0 =‘, 3 // 2.0)

Python 3.4.1
3 / 2 = 1.5
3 // 2 = 1
3 / 2.0 = 1.5
3 // 2.0 = 1.0


__future__模塊

Python 3.x引入了一些與Python 2不兼容的關鍵字和特性,在Python 2中,可以通過內置的__future__模塊導入這些新內容。如果你希望在Python 2環境下寫的代碼也可以在Python 3.x中運行,那麽建議使用__future__模塊。例如,如果希望在Python 2中擁有Python 3.x的整數除法行為,可以通過下面的語句導入相應的模塊。

from __future__ import division

下表列出了__future__中其他可導入的特性:

特性可選版本強制版本效果
nested_scopes2.1.0b12.2PEP 227:
Statically Nested Scopes
generators2.2.0a12.3PEP 255:
Simple Generators
division2.2.0a23.0PEP 238:
Changing the Division Operator
absolute_import2.5.0a13.0PEP 328:
Imports: Multi-Line and Absolute/Relative
with_statement2.5.0a12.6PEP 343:
The “with” Statement
print_function2.6.0a23.0PEP 3105:
Make print a function
unicode_literals2.6.0a23.0PEP 3112:
Bytes literals in Python 3000

示例:

from platform import python_version


Unicode

Python 2有基於ASCII的str()類型,其可通過單獨的unicode()函數轉成unicode類型,但沒有byte類型。而在Python 3中,終於有了Unicode(utf-8)字符串,以及兩個字節類:bytes和bytearrays。

Python 2

print type(unicode(‘this is like a python3 str type‘))
print type(b‘byte type does not exist‘)
print ‘they are really‘+b‘ the same‘
print type(bytearray(b‘bytearray oddly does exist though‘))

<type ‘unicode‘>

<type ‘str‘>

they are really the same

<type ‘bytearray‘>


Python 3

print(‘Python‘, python_version(), end="")

print(‘ has‘, type(b‘ bytes for storing data‘))

print(‘and Python‘, python_version(), end="")

print(‘ also has‘, type(bytearray(b‘bytearrays‘)))

print ‘note that we cannot add a string‘ + b‘bytes for data‘


Python 3.4.1 has <class ‘bytes‘>

and Python 3.4.1 also has <class ‘bytearray‘>

---------------------------------------------------------------------------TypeError Traceback (most recent call last)<ipython-input-13-d3e8942ccf81> in <module>()----> 1 ‘note that we cannot add a string‘ + b‘bytes for data‘ TypeError: Can‘t convert ‘bytes‘ object to str implicitly



比較無序類型

Python 3中另一個優秀的改動是,如果我們試圖比較無序類型,會觸發一個TypeError。

Python 2

print "[1, 2] > ‘foo‘ = ", [1, 2] > ‘foo‘
print "(1, 2) > ‘foo‘ = ", (1, 2) > ‘foo‘
print "[1, 2] > (1, 2) = ", [1, 2] > (1, 2)
[1, 2] > ‘foo‘ = False

(1, 2) > ‘foo‘ = True
[1, 2] > (1, 2) = False

Python 3

print("[1, 2] > ‘foo‘ = ", [1, 2] > ‘foo‘)
print("(1, 2) > ‘foo‘ = ", (1, 2) > ‘foo‘)
print("[1, 2] > (1, 2) = ", [1, 2] > (1, 2))
---------------------------------------------------------------------------

TypeError Traceback (most recent call last)
<ipython-input-16-a9031729f4a0> in <module>()
1 print(‘Python‘, python_version())
----> 2 print("[1, 2] > ‘foo‘ = ", [1, 2] > ‘foo‘)
3 print("(1, 2) > ‘foo‘ = ", (1, 2) > ‘foo‘)
4 print("[1, 2] > (1, 2) = ", [1, 2] > (1, 2))
TypeError: unorderable types: list() > str()


返回可叠代對象,而不是列表

在xrange一節中可以看到,某些函數和方法在Python中返回的是可叠代對象,而不像在Python 2中返回列表。

由於通常對這些對象只遍歷一次,所以這種方式會節省很多內存。然而,如果通過生成器來多次叠代這些對象,效率就不高了。

此時我們的確需要列表對象,可以通過list()函數簡單的將可叠代對象轉成列表。

Python 2

print range(3)
print type(range(3))

[0, 1, 2]
<type ‘list‘>

Python 3

print(range(3))
print(type(range(3)))
print(list(range(3)))

range(0, 3)
<class ‘range‘>
[0, 1, 2]

下面列出了Python 3中其他不再返回列表的常用函數和方法:

  • zip()

  • map()

  • filter()

  • 字典的.key()方法

  • 字典的.value()方法

  • 字典的.item()方法

xrange

在Python 2.x中,經常會用xrange()創建一個可叠代對象,通常出現在“for循環”或“列表/集合/字典推導式”中。這種行為與生成器非常相似(如”惰性求值“),但這裏的xrange-iterable無盡的,意味著可能在這個xrange上無限叠代。由於xrange的“惰性求知“特性,如果只需叠代一次(如for循環中),range()通常比xrange()快一些。不過不建議在多次叠代中使用range(),因為range()每次都會在內存中重新生成一個列表。在Python 3中,range()的實現方式與xrange()函數相同,所以就不存在專用的xrange()(在Python 3中使用xrange()會觸發NameError)。

import timeit
   
n = 10000
def test_range(n):
     return for i in range(n):
         pass
   
def test_xrange(n):
     for i in xrange(n):
         pass

Python 2

print ‘Python‘, python_version()
   
print ‘ntiming range()‘
%timeit test_range(n)
   
print ‘nntiming xrange()‘
%timeit test_xrange(n)

Python 2.7.6
timing range()
1000 loops, best of 3: 433 s per loop
timing xrange()
1000 loops, best of 3: 350 s per loop

Python 3

print(‘Python‘, python_version())
   
print(‘ntiming range()‘)
%timeit test_range(n)
Python 3.4.1

timing range()
1000 loops, best of 3: 520 s per loop

print(xrange(10))

---------------------------------------------------------------------------NameError Traceback (most recent call last)in ()----> 1 print(xrange(10)) NameError: name ‘xrange‘ is not defined


Python 3中的range對象中的__contains__方法


另一個值得一提的是,在Python 3.x中,range有了一個新的__contains__方法。__contains__方法可以有效的加快Python 3.x中整數和布爾型的“查找”速度。

x = 10000000
def val_in_range(x, val):
 return val in range(x)
   
def val_in_xrange(x, val):
 return val in xrange(x)
   
print(‘Python‘, python_version())
assert(val_in_range(x, x/2) == True)
assert(val_in_range(x, x//2) == True)
%timeit val_in_range(x, x/2)
%timeit val_in_range(x, x//2)

Python 3.4.1
1 loops, best of 3: 742 ms per loop
1000000 loops, best of 3: 1.19 s per loop

根據上面的timeit的結果,查找整數比查找浮點數要快大約6萬倍。但由於Python 2.x中的range或xrange沒有__contains__方法,所以在Python 2中的整數和浮點數的查找速度差別不大。

print ‘Python‘, python_version()
   
assert(val_in_xrange(x, x/2.0) == True)
assert(val_in_xrange(x, x/2) == True)
assert(val_in_range(x, x/2) == True)
assert(val_in_range(x, x//2) == True)
%timeit val_in_xrange(x, x/2.0)
%timeit val_in_xrange(x, x/2)
%timeit val_in_range(x, x/2.0)
%timeit val_in_range(x, x/2)

Python 2.7.7
1 loops, best of 3: 285 ms per loop
1 loops, best of 3: 179 ms per loop
1 loops, best of 3: 658 ms per loop
1 loops, best of 3: 556 ms per loop

下面的代碼證明了Python 2.x中沒有__contain__方法:

print(‘Python‘, python_version())
range.__contains__

print(‘Python‘, python_version())
range.__contains__

print(‘Python‘, python_version())
xrange.__contains__

Python 3.4.1
<slot wrapper ‘__contains__‘ of ‘range‘ objects


Python 2.7.7
---------------------------------------------------------------------------
AttributeError Traceback (most recent call last)<ipython-input-7-05327350dafb> in <module>()
1 print ‘Python‘, python_version()
----> 2 range.__contains__
AttributeError: ‘builtin_function_or_method‘ object has no attribute ‘__contains__‘


Python 2.7.7
---------------------------------------------------------------------------AttributeError Traceback (most recent call last)in ()
print ‘Python‘, python_version()
----> 2 xrange.__contains__
AttributeError: type object ‘xrange‘ has no attribute ‘__contains__‘


關於Python 2中xrange()與Python 3中range()之間的速度差異的一點說明:

有讀者指出了Python 3中的range()和Python 2中xrange()執行速度有差異。由於這兩者的實現方式相同,因此理論上執行速度應該也是相同的。這裏的速度差別僅僅是因為Python 3的總體速度就比Python 2慢。

def test_while():
 i = 0
 while i < 20000:
  i += 1
 return 
 
print(‘Python‘, python_version())
%timeit test_while()

Python 3.4.1

%timeit test_while()
100 loops, best of 3: 2.68 ms per loop

print ‘Python‘, python_version()
%timeit test_while()

Python 2.7.6
1000 loops, best of 3: 1.72 ms per loop



觸發異常

Python 2支持新舊兩種異常觸發語法,而Python 3只接受帶括號的的語法(不然會觸發SyntaxError):

Python 2

raise IOError,"file error"

---------------------------------------------------------------------------
IOError Traceback (most recent call last)
<ipython-input-8-25f049caebb0> in <module>()
----> 1 raise IOError, "file error"
IOError: file error

raise IOError("file error")

---------------------------------------------------------------------------
IOError Traceback (most recent call last)
<ipython-input-9-6f1c43f525b2> in <module>()
----> 1 raise IOError("file error")
IOError: file error

Python 3

raise IOError, "file error"


File "<ipython-input-10-25f049caebb0>", line 1
raise IOError, "file error"
^
SyntaxError: invalid syntax
The proper way to raise an exception in Python 3:


raise IOError("file error")


Python 3.4.1
---------------------------------------------------------------------------
OSError Traceback (most recent call last)
<ipython-input-11-c350544d15da> in <module>()
1 print(‘Python‘, python_version())
----> 2 raise IOError("file error")
OSError: file error



異常處理

Python 3中的異常處理也發生了一點變化。在Python 3中必須使用“as”關鍵字。

Python 2

try:
     let_us_cause_a_NameError
except NameError, err:
     print err, ‘--> our error message‘

name ‘let_us_cause_a_NameError‘ is not defined --> our error message


Python 3

try:
     let_us_cause_a_NameError
except NameError as err:
     print(err, ‘--> our error message‘)

name ‘let_us_cause_a_NameError‘ is not defined --> our error message



next()函數和.next()方法

由於會經常用到next()(.next())函數(方法),所以還要提到另一個語法改動(實現方面也做了改動):在Python 2.7.5中,函數形式和方法形式都可以使用,而在Python 3中,只能使用next()函數(試圖調用.next()方法會觸發AttributeError)。

Python 2

print ‘Python‘, python_version()
my_generator = (letter for letter in ‘abcdefg‘)
next(my_generator)
my_generator.next()

Python 2.7.6
‘b‘


Python 3

print(‘Python‘, python_version())
my_generator = (letter for letter in ‘abcdefg‘)
next(my_generator)
Python 3.4.1

‘a‘

my_generator.next()

---------------------------------------------------------------------------
AttributeError Traceback (most recent call last)
<ipython-input-14-125f388bb61b> in <module>()
----> 1 my_generator.next()
AttributeError: ‘generator‘ object has no attribute ‘next‘


For循環變量與全局命名空間泄漏

好消息是:在Python 3.x中,for循環中的變量不再會泄漏到全局命名空間中了!

這是Python 3.x中做的一個改動,在“What‘s New In Python 3.0”中有如下描述:

“列表推導不再支持[... for var in item1, item2, ...]這樣的語法,使用[... for var in (item1, item2, ...)]代替。還要註意列表推導有不同的語義:現在列表推導更接近list()構造器中的生成器表達式這樣的語法糖,特別要註意的是,循環控制變量不會再泄漏到循環周圍的空間中了。”

Python 2

print ‘Python‘, python_version()
i = 1
print ‘before: i =‘, i
print ‘comprehension: ‘, [i for i in range(5)] 
print ‘after: i =‘, i

Python 2.7.6
before: i = 1
comprehension: [0, 1, 2, 3, 4]
after: i = 4


Python 3

print(‘Python‘, python_version()) 
i = 1
print(‘before: i =‘, i)
print(‘comprehension:‘, [i for i in range(5)]) 
print(‘after: i =‘, i)


Python 3.4.1
before: i = 1
comprehension: [0, 1, 2, 3, 4]
after: i = 1





Python 2.7.x 和 3.x 版本區別小結