1. 程式人生 > >四.python3 字符編碼

四.python3 字符編碼

mage 進制 中文 alt 1.0 編碼 log .py logs

計算機最底層能識別的

二進制數:0,1

為將二進制數轉變成人能看懂的文字

中國

發展出 ------>ASCII:只能存英文和拉丁字符。 一個字符占一個字節,八位

------>gb2312 :只能存6700多個中文, 1980

------>gbk1.0:存了2萬多字符, 1995

------>gb18030:存了2萬7千個中文, 2000

國際

----------------------------->unicode(相當於一個標準):utf-32(unicode的一個表現形式,編碼集): 一個任意字符占4個字節

------>unicode:utf-16: 一個字符占2個字節或2個以上(如果找不到字符對應的編碼就在utf-32中去找)

------>unicode-8: 一個英文用ASCII碼來存,一個中文占3個字節

中國標準用的是gbk

windows系統用的是gb18030

編碼和解碼

技術分享

四.python3 字符編碼