1. 程式人生 > >windows下python3安裝chardet外掛

windows下python3安裝chardet外掛

安裝chardet外掛過程很痛苦,歷經了不少周折,最後也是莫名其妙的在聯網的狀態(確切的說是翻牆聯網)下安裝成功了,對其原理任然不甚瞭解。

安裝過程如下:


2,下載後解壓,放在Python\Lib\site-packages下,如我的是"D:\Python33\Lib\site-packages\chardet2-2.0.3"

然後開啟命令列,輸入"python D:\Python33\Lib\site-packages\chardet2-2.0.3\setup.py install"若果不成功,檢視第三步

3,安裝setuptools,下載地址,此版本為3.4.1,若需要其他版本,可直接在google中搜索“名字+版本號”,然後點選快照即可下載,下載完成後,安裝完畢,再來重新安裝chardet

測試程式碼:

import urllib.request
import sys
reload(sys)
import chardet

req = urllib.request.urlopen(r"http://www.baidu.com")##這裡可以換成http://www.baidu.com,http://www.sohu.com
content = req.read()
typeEncode = sys.getfilesystemencoding()##系統預設編碼
infoencode = chardet.detect(content).get('encoding','utf-8')##通過第3方模組來自動提取網頁的編碼
html = content.decode(infoencode,'ignore').encode(typeEncode)##先轉換成unicode編碼,然後轉換系統編碼輸出
print (html)

p.s:但有個mbs的問題任然沒有解決,繼續改進。。。(報錯:UnicodeEncodeError: 'mbcs' codec can't encode characters in position 0--1: invalid character)