1. 程式人生 > >Python HTTP庫requests中文頁面亂碼解決方案!

Python HTTP庫requests中文頁面亂碼解決方案!

獲得 使用 http text odin 抽取 from Coding blog

html編碼類型賦與獲取到文本

獲取html編碼類型:

1.使用apparent_encoding可以獲得真實編碼

1 >>> response.apparent_encoding 
2 GB2312

2.從html的meta中抽取

1 >>> requests.utils.get_encodings_from_content(response.text)
2 [gb2312]

前戲結束,只出一招即可(隨意選用):

1 # response.encoding = response.apparent_encoding
2 response.encoding = 
gb2312

Python HTTP庫requests中文頁面亂碼解決方案!