1. 程式人生 > >Python3 urllib.parse 常用函式示例

Python3 urllib.parse 常用函式示例

Python3 urllib.parse 常用函式示例

http://blog.51cto.com/walkerqt/1766670 

1、獲取url引數。

>>> from urllib import parse
>>> url = r'https://docs.python.org/3.5/search.html?q=parse&check_keywords=yes&area=default' >>> parseResult = parse.urlparse(url) >>> parseResult ParseResult(scheme='https', netloc='docs.python.org', path='/3.5/search.html', params='', query='q=parse&check_keywords=yes&area=default', fragment='') >>> param_dict = parse.parse_qs(parseResult.query) >>> param_dict {'q': ['parse'], 'check_keywords': ['yes'], 'area': ['default']} >>> q = param_dict['q'][0] >>> q 'parse' #注意:加號會被解碼,可能有時並不是我們想要的 >>> parse.parse_qs('proxy=183.222.102.178:8080&task=XXXXX|5-3+2') {'proxy': ['183.222.102.178:8080'], 'task': ['XXXXX|5-3 2']}
 

 

2、parse_qs/parse_qsl

>>> from urllib import parse
>>> parse.parse_qs('action=addblog&job=modify&tid=1766670') {'tid': ['1766670'], 'action': ['addblog'], 'job': ['modify']} #注意和第三個並不一樣 >>> parse.parse_qsl('action=addblog&job=modify&tid=1766670') [('action', 'addblog'), ('job', 'modify'), ('tid', '1766670')] >>> dict(parse.parse_qsl('action=addblog&job=modify&tid=1766670')) #注意和第一個並不一樣 {'tid': '1766670', 'action': 'addblog', 'job': 'modify'}
 

3、urlencode

>>> from urllib import parse
>>> query = { 'name': 'walker', 'age': 99, } >>> parse.urlencode(query) 'name=walker&age=99'
 

4、quote/quote_plus

>>> from urllib import parse
>>> parse.quote('a&b/c') #未編碼斜線 'a%26b/c' >>> parse.quote_plus('a&b/c') #編碼了斜線 'a%26b%2Fc'
 

5、unquote/unquote_plus

from urllib import parse
>>> parse.unquote('1+2') #不解碼加號 '1+2' >>> parse.unquote('1+2') #把加號解碼為空格 '1 2'
 

  如果你還想問為什麼沒有urldecode——再把示例1看五遍。^_^

6、域名編碼避免敏感詞遮蔽。

>>> ''.join('%' + ('%x'%ord(ch)).upper() for ch in 'github.com') '%67%69%74%68%75%62%2E%63%6F%6D'
 

 

相關閱讀:

1、urllib.parse — Parse URLs into components

2、Binary-to-text encoding (各種base編碼。base58、base64等)

3、Requests:為人類設計的HTTP庫

 

*** walker ***