1. 程式人生 > >Python爬蟲教程-09-error 模塊

Python爬蟲教程-09-error 模塊

read tps exception url exceptio from 失敗 mark err

Python爬蟲教程-09-error模塊

今天的主角是error,爬取的時候,很容易出現錯,所以我們要在代碼裏做一些,常見錯誤的處,關於urllib.error

URLError

  • URLError 產生的原因:
    • 1.無網絡連接
    • 2.服務器連接失敗
    • 3.找不到指定的服務器
    • 4.URLError是OSError的子類
    • 案例v9文件:https://xpwi.github.io/py/py%E7%88%AC%E8%99%AB/py09error.py
# 案例v9
# URLError的使用

from urllib import  request,error

if __name__ == ‘__main__‘:

    url = "http://www.baiiiiiiiiiiidu.com/"

    try:

        req = request.Request(url)

        rsp = request.urlopen(req)

        html = rsp.read().decode()
        print(html)

    except error.URLError as e:
        print("URLError:{0}".format(e.reason))
        print("URLError:{0}".format(e))

    except Exception as e:
        print(e)

技術分享圖片

HTTPError

  • 1.是URLError的一個子類

URLError和HTTPError的區別:

  • HTTPError是對應的HTTP請求的返回碼錯誤,如果返回錯誤碼是400以上的,則引發HTTPError
  • URLError對應的一般是網絡出現問題,包括url問題

    - 本筆記不允許任何個人和組織轉載

Python爬蟲教程-09-error 模塊