1. 程式人生 > >python中文編碼

python中文編碼

python2.x版本: python內部使用unicode 原始碼檔案預設是asci,但asci不存在中文編碼,解決:# -*- coding: utf-8 -*- 中文編碼有:gbk,gb2312,gb18030,utf-8

unicode類和str型別字串(gbk,gb2312,utf-8)的編碼:unicode由encode方法編碼為字串,字串由decode方法解析為unicode物件

s=u'中文'表示unicode物件 s='中文'表示預設編碼,如在utf-8檔案中,則為utf-8編碼

unicode字元轉換為str型別:u'中文'.encode("utf-8")或unicode('中文').encode("utf-8")

unicode經過encode為utf-8等,再經過decode為unicode

python3.x版本: 不支援u'中文'

str(表示中文)經過encode為bytes,再經過decode為str