1. 程式人生 > >Python3和Python2的幾個區別

Python3和Python2的幾個區別

Unicode 是「字符集」 :字元的唯一標識

UTF-8 是「編碼規則」:字元的儲存方式

Python2中str是非unicode型別  [ ASCII ]

Python3中str為unicode型別

Python3中中bytes型別為非unicode型別,圖片、視訊、音訊等二進位制資料,都可以用 bytes 表示

Python2中bytes沒有實際的意義

unicode為一個字符集,不是一種編碼格式,unicode的具體編碼格式為utf-8、utf-16和utf-32 ,其中utf-8和utf-16為可變長的編碼格式,即字元最短儲存位元組為8位(utf-8)表示漢字時用三個位元組表示一個漢字,unicode用兩個位元組表示一個漢字。

Python2中的str是非unicode的字符集,那是哪種字符集?

ASCII 碼既可以說是字符集也可以說是編碼,Python2的編碼規則為ASCII