1. 程式人生 > >'gbk' codec can't decode byte 0xaa in position 4294: illegal multibyte sequence

'gbk' codec can't decode byte 0xaa in position 4294: illegal multibyte sequence

使用python的時候經常會遇到文字的編碼與解碼問題,其中很常見的一種解碼錯誤如題目所示,下面介紹該錯誤的解決方法,將‘gbk’換成‘utf-8’也適用。
(1)、首先在開啟文字的時候,設定其編碼格式,如:open(‘1.txt’,encoding=’gbk’);
(2)、若(1)不能解決,可能是文字中出現的一些特殊符號超出了gbk的編碼範圍,可以選擇編碼範圍更廣的‘gb18030’,如:open(‘1.txt’,encoding=’gb18030’);
(3)、若(2)仍不能解決,說明文中出現了連‘gb18030’也無法編碼的字元,可以使用‘ignore’屬性進行忽略,如:open(‘1.txt’,encoding=’gb18030’,errors=‘ignore’);
(4)、還有一種常見解決方法為open(‘1.txt’).read().decode(‘gb18030’,’ignore’)
---------------------
原文:https://blog.csdn.net/shijing_0214/article/details/51971734