1. 程式人生 > >字符串編碼與轉碼

字符串編碼與轉碼

-s border content utf-16 .cn 字符編碼 解碼 編碼解碼 同時

技術分享

需知:

1.在python2默認編碼是ASCII, python3裏默認是unicode

2.unicode 分為 utf-32(占4個字節),utf-16(占兩個字節),utf-8(占1-4個字節), so utf-16就是現在最常用的unicode版本, 不過在文件裏存的還是utf-8,因為utf8省空間

3.在py3中encode,在轉碼的同時還會把string 變成bytes類型,decode在解碼的同時還會把bytes變回string

python中,字符編碼默認為Unicode,因此,在進行字符編碼解碼時: str = ‘你好‘ #str是Unicode str_to_gbk = str.encode(‘gbk‘) #這裏解碼即可,即是Unicode解碼為gbk 此時str_to_gbk是GBK編碼,再進行編碼時 需要decode成Unicode,再encode成其他格式 例: gbk_to_utf8 = str_to_gbk.decode(‘gbk‘).encode(‘utf-8‘) #先轉化為Unicode,再轉化為utf-8

<wiz_tmp_tag id="wiz-table-range-border" contenteditable="false" style="display: none;">

字符串編碼與轉碼