1. 程式人生 > >python實戰之編碼問題:中文!永遠的痛

python實戰之編碼問題:中文!永遠的痛

輸出 == 技術分享 都是 -s dsm font clas ng-

編碼的思維圖譜:

技術分享

技術分享

也就是說文件沒有編碼之說,事實上都是按二進制格式保存在硬盤中的。不過在寫入讀取時須使用相應的編碼進行處理,以便操作系統配合相關軟件/字體,繪制到屏幕中給人看。所以關鍵問題是得知道原先這些字串數據是使用什麽編碼來編譯的!可是在 Unicode之前都是使用類似對比表的形式來組織編碼的,無法從串數據流本身統一解出不同的文
字來。

unicode是編碼方式,萬國碼,詳細的實現方式:utf-8 utf-16
在邏輯上 unicode是沒有編碼格式的。

進行I/O輸出一定要做encode(‘utf-8‘)這樣類似的操作


只是unicode在python 是內部函數。
ust r i ng = uni code( st r eam , ‘ gbk‘ )這個的意思就是先轉換成unicode,再轉換成你想要的編碼

技術分享

python實戰之編碼問題:中文!永遠的痛