1. 程式人生 > >UnicodeEncodeError: 'gbk' codec can't encode character '\ufffd' in position 89151: illegal multibyte

UnicodeEncodeError: 'gbk' codec can't encode character '\ufffd' in position 89151: illegal multibyte

  1. windows上面,編輯工具vscdoe,在學習嵩天老師的爬取京東商品介面時,出現的錯誤,需要將字元亂碼 ‘\ufffd’,使用空字元替換掉。中文亂碼問題請參考,並不是所有的都可以解決,有的不需要替換,只需要 r.encoding = r.apparent_encoding,就可以 ,有的是需要替換。
    python中文編碼問題解析
import requests
def jingdong(url):
    try:
        r= requests.get(url,timeout=10)
        print(r.status_code)
        r.raise_for_status()
        r.encoding = r.apparent_encoding
        str1 = r.text.replace('\ufffd','')
        return str1
        return r.text     
    except:
        return "error"
if __name__ =="__main__":
    url= "https://item.jd.com/31042415497.html"
    print(jingdong(url))

encode 編碼
decode 解碼
爬蟲要搞清楚 你爬的內容是什麼編碼,進而再去進行操作
推薦閱讀python encode decode 函式

  1. 如果不能解決 ,不報錯,但是還是亂碼,請看文章,
    vscode python 亂碼解決