1. 程式人生 > >python爬取12306及各引數的使用。完整程式碼

python爬取12306及各引數的使用。完整程式碼

import requests
from retrying import retry
reuquests和retrying的下載及安裝可以通過命令列pip install 口令實現

# 呼叫重連裝飾器固定格式,最大重試3次
@retry(stop_max_attempt_number=3)
def get12306():
print("123")
# 此時的123,程式碼報錯列印3次,成功爬取只打印1次
url = "https://www.12306.cn/mormhweb/"
# 最多響應3秒,verify=false是ssl證書錯誤新增的引數
response = requests.get(url,timeout=3)
print(response.content.decode())
# content為二進位制位元組型別,使用decode函式解碼
if __name__ == '__main__':
try:
get12306()
except:
# 捕獲異常,3次連結錯誤報1次此程式碼
print("finish")

網路爬蟲(又被稱為網頁蜘蛛,網路機器人)就是 模擬客戶端(主要指瀏覽器)傳送網路請求,接收請求響應,按照一定的規則,自動地抓取網際網路資訊的程式。 原則上,只要是客戶端(主要指瀏覽器)能做的事情,爬蟲都能夠做。爬蟲的主要用途:網路資訊的採集,12306搶票,網路上的投票,相較之前的人工採集資料節省了大量的人力與物力。