python3.x 和python2.x區別
一、 print 從語句變為函式
原: print 1, 2+3
改為: print ( 1, 2+3 )
二、range 與 xrange
原 : range( 0, 4 ) 結果 是 列表 [0,1,2,3 ]
改為:list( range(0,4) )
原 : xrange( 0, 4 ) 適用於 for 迴圈的變數控制
改為:range(0,4)
三、字串
原: 字串以 8-bit 字串
改為: 字串以 16-bit Unicode 字串儲存
四、try except 語句的變化
原: try:
......
except Exception, e :
......
改為
try:
......
except Exception as e :
......
五、開啟檔案
原: file( ..... )
或 open(.....)
改為:
只能用 open(.....)
六、從鍵盤錄入一個字串
原: raw_input( "提示資訊" )
改為: input( "提示資訊" )
七、bytes 資料型別
A bytes object is an immutable array. The items are 8-bit bytes, represented by integers in the range 0 <= x < 256.
bytes 可以看成是“位元組陣列”物件,每個元素是 8-bit 的位元組,取值範圍 0~255。
由於在 python 3.0中字串以 unicode 編碼儲存,當寫入二進位制檔案時,字串無法直接寫入(或讀取),必須以某種方式的編碼為位元組序列後,方可寫入。
(一)字串編碼(encode) 為 bytes
例: s = "張三abc12"
b = s.encode( 編碼方式)
# b 就是 bytes 型別的資料
# 常用的編碼方式為 : "uft-16" , "utf-8", "gbk", "gb2312", "ascii" , "latin1" 等
# 注 : 當字串不能編碼為指定的“編碼方式”時,會引發異常
(二) bytes 解碼(decode)為字串
s = "張三abc12"
b = s.encode( "gbk") # 字串 s 編碼為 gbk 格式的位元組序列
s1 = b.decode("gbk") # 將位元組序列 b以gbk格式 解碼為字串
# 說明,當位元組序列不能以指定的編碼格式解碼時會引發異常
(三)使用方法舉例
#coding=gbk
f = open("c:\\1234.txt", "wb")
s = "張三李四abcd1234"
# -------------------------------
# 在 python2.4 中我們可以這樣寫:
# f.write( s )
# 但在 python 3.0中會引發異常
# -------------------------------
b = s.encode("gbk")
f.write( b )
f.close()
input("?")
讀取該檔案的例子:
#coding=gbk
f = open("c:\\1234.txt", "rb")
f.seek(0,2) #定位至檔案尾
n = f.tell() #讀取檔案的位元組數
f.seek(0,0) #重新定位至檔案開始處
b = f.read( n )
# ------------------------------
# 在 python 2.4 中 b 是字串型別
# 要 python 3.0 中 b 是 bytes 型別
# 因此需要按指定的編碼方式確碼
# ------------------------------
s = b.decode("gbk")
print ( s )
# ------------------------------
# 在 python 2.4 中 可以寫作 print s 或 print ( s )
# 要 python 3.0 中 必須寫作 print ( s )
# ------------------------------
f.close()
input("?")
執行後應顯示:
張三李四abcd1234
(四) bytes序列,一但形成,其內容是不可變的
例:
s="ABCD"
b=s.encode("gbk")
print b[0] # 顯示 65
b[0] = 66
# 執行該句,出現異常: 'bytes' object does not support item assignment
八、 chr( K ) 與 ord( c )
python 2.4.2以前
chr( K ) 將編碼K 轉為字元,K的範圍是 0 ~ 255
ord( c ) 取單個字元的編碼, 返回值的範圍: 0 ~ 255
python 3.0
chr( K ) 將編碼K 轉為字元,K的範圍是 0 ~ 65535
ord( c ) 取單個字元的編碼, 返回值的範圍: 0 ~ 65535
九、 除法運算子
python 2.4.2以前
10/3 結果為 3
python 3.0
10 / 3 結果為 3.3333333333333335
10 // 3 結果為 3
十、位元組陣列物件 --- 新增
(一) 初始化
a = bytearray( 10 )
# a 是一個由十個位元組組成的陣列,其每個元素是一個位元組,型別借用 int
# 此時,每個元素初始值為 0
(二) 位元組陣列 是可變的
a = bytearray( 10 )
a[0] = 25
# 可以用賦值語句更改其元素,但所賦的值必須在 0 ~ 255 之間
(三) 位元組陣列的切片仍是位元組陣列
(四) 字串轉化為位元組陣列
#coding=gbk
s ="你好"
b = s.encode( "gbk") # 先將字串按某種“GBK”編碼方式轉化為 bytes
c = bytearray( b ) #再將 bytes 轉化為 位元組陣列
也可以寫作
c = bytearray( "你好", "gbk")
(五) 位元組陣列轉化為字串
c = bytearray( 4 )
c[0] = 65 ; c[1]=66; c[2]= 67; c[3]= 68
s = c.decode( "gbk" )
print ( s )
# 應顯示: ABCD
(六) 位元組陣列可用於寫入文字檔案
#coding=gbk
f = open("c:\\1234.txt", "wb")
s = "張三李四abcd1234"
# -------------------------------
# 在 python2.4 中我們可以這樣寫:
# f.write( s )
# 但在 python 3.0中會引發異常
# -------------------------------
b = s.encode("gbk")
f.write( b )
c=bytearray( "王五","gbk")
f.write( c )
f.close()
input("?")
十一、import thread
“import thread”問題,2.x中的模組thread在3.x中程式設計"_thread"(需要在前面加一個下劃線).否則會出現“ImportError: No module named thread