1. 程式人生 > >python之chardet驗證編碼格式

python之chardet驗證編碼格式

har 不同 int 協議 span 代理服務 編碼格式 ascii pri

在處理字符串時,常常會遇到不知道字符串是何種編碼,如果不知道字符串的編碼就不能將字符串轉換成需要的編碼

pip install chardet

舉例子

import chardet
import urllib.request     ---->安裝urllib3

# 可根據需要,選擇不同的數據
TestData = urllib.request.urlopen(http://www.baidu.com/).read(300)
print(chardet.detect(TestData))

# 運行結果:{‘encoding‘: ‘ascii‘, ‘confidence‘: 1.0, ‘language‘: ‘‘}

註:

rllib2是python自帶的模塊,不需要下載。

urllib 側重於 url 基本的請求構造,urllib2側重於 http 協議請求的處理,而 urllib3是服務於升級的http 1.1標準,且擁有高效 http連接池管理及 http 代理服務的功能庫

python之chardet驗證編碼格式