1. 程式人生 > >Python 設置系統默認編碼 轉

Python 設置系統默認編碼 轉

obj dea 就會 添加 輸入 article .com module default

解決UnicodeEncodeError: ‘ascii‘ codec can‘t encode characters in position 問題(轉)

本文轉載自:http://blog.csdn.net/intel80586/article/details/8566057

Python在安裝時,默認的編碼是ascii,當程序中出現非ascii編碼時,Python的處理常常會報這樣的錯UnicodeDecodeError: ‘ascii’ codec can’t decode byte 0x?? in position 1: ordinal not in range(128),python沒辦法處理非ascii編碼的,此時需要自己設置將python的默認編碼,一般設置為utf8的編碼格式。

查詢系統默認編碼可以在解釋器中輸入以下命令:

Python代碼
  1. >>>sys.getdefaultencoding()

設置默認編碼時使用:

Python代碼
  1. >>>sys.setdefaultencoding(’utf8’)

可能會報AttributeError: ‘module’ object has no attribute ‘setdefaultencoding’的錯誤,執行reload(sys),在執行以上命令就可以順利通過。

此時在執行sys.getdefaultencoding()就會發現編碼已經被設置為utf8的了,但是在解釋器裏修改的編碼只能保證當次有效,在重啟解釋器後,會發現,編碼又被重置為默認的ascii了,那麽有沒有辦法一次性修改程序或系統的默認編碼呢。

有2種方法設置python的默認編碼:

一個解決的方案在程序中加入以下代碼:

Python代碼
  1. import sys
  2. reload(sys)
  3. sys.setdefaultencoding(’utf8’)

另一個方案是在python的Lib\site-packages文件夾下新建一個sitecustomize.py,內容為:

Python代碼
  1. # encoding=utf8
  2. import sys
  3. reload(sys)
  4. sys.setdefaultencoding(’utf8’)

此時重啟python解釋器,執行sys.getdefaultencoding(),發現編碼已經被設置為utf8的了,多次重啟之後,效果相同,這是因為系統在python啟動的時候,自行調用該文件,設置系統的默認編碼,而不需要每次都手動的加上解決代碼,屬於一勞永逸的解決方法。

另外有一種解決方案是在程序中所有涉及到編碼的地方,強制編碼為utf8,即添加代碼encode(“utf8”),這種方法並不推薦使用,因為一旦少寫一個地方,將會導致大量的錯誤報告,我曾經遇到這種情況,錯誤日誌壓縮之後尚有70多K,全都是這一個問題,讓人有很崩潰的感覺。

另外:1. 當字符串裏有 \n、\t、\r時,json.loads()失效,異常,要去掉;
2. 在操作數據庫的時候用到 BasicDataSource 時,可以通過設置characterEncoding來解決中文亂碼的問題,
BasicDataSource connPool;connPool.addConnectionProperty("characterEncoding", "UTF-8");;

轉自:http://www.cnblogs.com/softidea/p/5198657.html

Python 設置系統默認編碼 轉