1. 程式人生 > >【python基礎知識】python輸出時出錯,UnicodeEncodeError: 'gbk' codec can't encode character '\ue4bf.....

【python基礎知識】python輸出時出錯,UnicodeEncodeError: 'gbk' codec can't encode character '\ue4bf.....

python的print()函式預設好像列印GBK編碼的格式,所以需要列印的字串需要改變編碼格式。

查詢到一個有用的辦法,看原文:

-----------------------------------------------------------------------------------------------

問題是這樣的,網頁的資料應該是'utf-8'編碼,這個可以在網頁的head上面看得到,然後你爬網頁的時候會把它轉化成Unicode,出問題的是在print()這兒,對於print()這個函式,他需要把內容轉化為'gbk'編碼才能顯示出來. 然後解決辦法是這樣,你在轉化後的Unicode編碼的string後面,加上 .encode('

GBK','ignore').decode('GBk') 也就是先用gbk編碼,忽略掉非法字元,然後再譯碼,是不是很有道理 應該是這樣的,因為我和你遇到同樣的問題,現在解決了

------------------------------------------------------------------------------------------------

也就是說在String的後面,加上

.encode('GBK','ignore').decode('GBk')

就可以正常列印了。