1. 程式人生 > >python 從給定的URL中提取頂級域名(TLD)

python 從給定的URL中提取頂級域名(TLD)

安裝

PyPI的最新穩定版本:

1 pip install tld

或者GitHub的最新穩定版本:

1 pip install https://github.com/barseghyanartur/tld/archive/stable.tar.gz

或BitBucket的最新穩定版本:

1 點選安裝https://bitbucket.org/barseghyanartur/tld/get/stable.tar.gz

用法示例

從給定的URL 獲取TLD名稱作為字串

1 from tld import get_tld
2 
3 get_tld("http://www.google.co.uk")
4 # 'co.uk'
5 6 get_tld("http://www.google.idontexist", fail_silently=True) 7 # None

獲取TLD作為物件

 1 from tld import get_tld
 2 
 3 res = get_tld("http://some.subdomain.google.co.uk", as_object=True)
 4 
 5 res
 6 # 'co.uk'
 7 
 8 res.subdomain
 9 # 'some.subdomain'
10 
11 res.domain
12 # 'google'
13 
14 res.tld
15
# 'co.uk' 16 17 res.fld 18 # 'google.co.uk' 19 20 res.parsed_url 21 # SplitResult( 22 # scheme='http', 23 # netloc='some.subdomain.google.co.uk', 24 # path='', 25 # query='', 26 # fragment='' 27 # )

獲取TLD名稱,忽略丟失的協議

1 from tld import get_tld, get_fld
2 
3 get_tld("www.google.co.uk
", fix_protocol=True) 4 # 'co.uk' 5 6 get_fld("www.google.co.uk", fix_protocol=True) 7 # 'google.co.uk'

將TLD部件作為元組返回

1 from tld import parse_tld
2 
3 parse_tld('http://www.google.com')
4 # 'com', 'google', 'www'

從給定的URL 獲取第一級域名作為字串

1 from tld import get_fld
2 
3 get_fld("http://www.google.co.uk")
4 # 'google.co.uk'
5 
6 get_fld("http://www.google.idontexist", fail_silently=True)
7 # None




good good study ,day day up !!!