1. 程式人生 > >【python 爬蟲】python中url連結編碼處理方法

【python 爬蟲】python中url連結編碼處理方法

一、問題描述
有些網址,會把中文編碼成gb2312格式,例如百度知道,美容這一詞,網址上面會編碼成:

%C3%C0%C8%DD

那麼如何生成這種編碼呢?

二、解決方法
1、把要編碼的文字encode成所需格式
2、利用urllib 庫的quote方法編碼

# -*- coding:utf-8*-
import sys
reload(sys)
sys.setdefaultencoding('utf-8')


key=str("美容").decode('utf-8').encode('gb2312')
import urllib
m1=urllib.quote(key)
print
m1
D:\Python27\python.exe F:/PycharmProjects/url編碼.py
%C3%C0%C8%DD

Process finished with exit code 0