Python爬蟲——解決urlretrieve下載不完整問題且避免用時過長

阿新 • • 發佈：2018-12-15

在這篇部落格中：http://blog.csdn.net/Innovation_Z/article/details/51106601 ，作者利用遞迴方法解決了urlretrieve下載檔案不完整的方法，其程式碼如下：

def auto_down(url,filename):
    try:
        urllib.urlretrieve(url,filename)
    except urllib.ContentTooShortError:
        print 'Network conditions is not good.Reloading.'
        auto_down(url,filename)

但是經筆者測試，下載檔案出現urllib.ContentTooShortError且重新下載檔案會存在用時過長的問題，而且往往會嘗試好幾次，甚至十幾次，偶爾會陷入死迴圈，這種情況是非常不理想的。為此，筆者利用socket模組，使得每次重新下載的時間變短，且避免陷入死迴圈，從而提高執行效率。
　　以下為程式碼：

import socket
import urllib.request
#設定超時時間為30s
socket.setdefaulttimeout(30)
#解決下載不完全問題且避免陷入死迴圈
try:
    urllib.request.urlretrieve(url,image_name)
except socket.timeout:
    count = 1
    while count <= 5:
        try:
            urllib.request.urlretrieve(url,image_name)                                                
            break
        except socket.timeout:
            err_info = 'Reloading for %d time'%count if count == 1 else 'Reloading for %d times'%count
            print(err_info)
            count += 1
    if count > 5:
        print("downloading picture fialed!")

本次分享到此結束，如有不足之處，還請批評指正！歡迎大家交流~~

注意：本人現已開通兩個微信公眾號：因為Python（微訊號為：python_math）以及輕鬆學會Python爬蟲（微訊號為：easy_web_scrape），歡迎大家關注哦~~
作者：劍與星辰
來源：CSDN
原文：https://blog.csdn.net/jclian91/article/details/77513289
版權宣告：本文為博主原創文章，轉載請附上博文連結！

Python爬蟲——解決urlretrieve下載不完整問題且避免用時過長

Python爬蟲——解決urlretrieve下載不完整問題且避免用時過長

python爬蟲-解決網頁中取不到的資訊-”真假網頁“

在idea中maven專案 jar包下載不完整解決辦法（持續更新）

Python爬蟲讀書筆記——下載快取（5）

【轉】QT 串列埠QSerialPort + 解決接收資料不完整問題

Python爬蟲——利用PhantomJS下載動態載入圖片

python爬蟲解決403禁止訪問錯誤

QT 串列埠QSerialPort + 解決接收資料不完整問題

python爬蟲之音樂下載

Python爬蟲學習（二）---- 完整的爬蟲體系

Python中解決Gensim找不到模組的問題

nginx+tomcat檔案下載不完整

python爬蟲解決趕集網掃碼獲取手機號

利用python爬蟲關鍵詞批量下載高清大圖

從零開始的Python爬蟲速成指南，本文受眾：沒寫過爬蟲的萌新

Windows 8/8.1 進入歡迎&登入介面前黑屏且等待時間過長&登入假死解決方法

[轉]解決ssh登錄後閑置時間過長而斷開連接

Spring Cloud: 使用kill命令優雅關閉微服務, 解決退出時Eureka取消註冊操作耗時過長的坑

解決登陸經常提示：你登入時間過長，請重新返回登入頁面進行登入

Python，自己修改的爬去淘寶網頁的程式碼解決Python爬蟲爬取淘寶商品資訊也不報錯，也不輸出資訊

Python爬蟲——解決urlretrieve下載不完整問題且避免用時過長

相關推薦