Python 註釋和中文亂碼
阿新 • • 發佈:2018-02-12
uft str class 計算機 運行 中文 不支持 encoding linux ,
Python 註釋分為三種:
1.單行註釋:#
2.多行註釋:前後3個單引號,或者三個雙引號;
如:‘‘‘ 多行註釋 ‘‘‘, """或者 多行註釋 ‘"""
3.特殊註釋:
如在linux 下面,在文件最前面加 #!/usr/bin/python ,代表 執行這個文件的時候,需要用這個程序來運行;
python2*版本不支持中文的問題,默認文件為ASCII碼,3.*已經支持,需要在文件前面加入:#encoding = utf-8 或者 #coding = utf-8 或者python的正規寫法 # _*_coding:uft-8_*_
產生亂碼的問題:
計算機存儲的時候,是以0,1來存儲,最小存儲單元為一個字節,最小存儲單位為一個比特(bit),一個字節有8個bit,在計算機存儲和讀取的時候,必須要有一套規範去標準化他們
比如:I am man;這些英文都要轉化為數字來存儲,並且還需要規定用幾個字節來存儲,這就形成了一套規範,現在主流的是unicode 編碼,utf-8,utf-16,utf-32,這些都是屬於unicode 編碼
只要字符轉數字不同,或者存儲的字節不同,有一個不同,就會產生亂碼,ASCII碼是不支持中文的,並且只能存儲255個字符
Python 註釋和中文亂碼