1. 程式人生 > >【 python | 架構設計 】文字檔案編解碼相關

【 python | 架構設計 】文字檔案編解碼相關

1、所有的字元與符號,均有其unicode碼

2、utf-8, utf-16.。。。均為unicode碼的儲存實現

3、沒有完全確定的方法可以判斷一個已經存在的文字檔案是採用哪種編碼方式落盤的

4、chardet是內建的探測資料的模組

5、在一般的web框架中,對資料的處理python都是使用預設的編解碼已經完成了。2.7使用ascii 3.5使用utf-8

6、編寫業務處理時,一般均以字串來作為操作物件,不會去操作unicode碼

綜合上面可以看出,對於可控的文字物件,我們在架構設計時,就應該將其規劃好,便於後續實現的可移植。