urlparse模塊(python模塊)
一、urlparse模塊簡介
二、urljoin函數使用
urljoin主要是拼接URL,它以base作為其基地址,然後與url中的相對地址相結合組成一個絕對URL地址。函數urljoin在通過為URL基地址附加新的文件名的方式來處理同一位置處的若幹文件的時候格外有用。需要註意的是,如果基地址並非以字符/結尾的話,那麽URL基地址最右邊部分就會被這個相對路徑所替換。如果希望在該路徑中保留末端目錄,應確保URL基地址以字符/結尾。
輸入代碼: import urlparse #urljoin函數是合並域名和相對路徑的 urljoin = urlparse.urljoin(‘http://www.sina.cn/cc‘,‘file/down.php‘) print urljoin urljoin1 = urlparse.urljoin(‘http://www.sina.cn/cc/‘,‘file/down.php‘) print urljoin1 |
代碼運行結果: C:\Python27\python.exe C:/Users/Lee/Desktop/d/PycharmProjects/untitled/test.py http://www.sina.cn/file/down.php http://www.sina.cn/cc/file/down.php |
三、urlparse函數和urlsplit函數使用
主要是分析urlstring,返回一個包含5個字符串項目的元組:協議、位置、路徑、查詢、片段。allow_fragments為False時,該元組的組後一個項目總是空,不管urlstring有沒有片段,省略項目的也是空。urlsplit()和urlparse()差不多
輸入代碼: import urlparse |
代碼運行結果: C:\Python27\python.exe C:/Users/Lee/Desktop/d/PycharmProjects/untitled/test.py SplitResult(scheme=‘http‘, netloc=‘www.baidu.com‘, path=‘/good/index.php‘, query=‘id=18‘, fragment=‘‘) http www.baidu.com /good/index.php id=18 |
urlparse模塊(python模塊)