Python 分塊多執行緒下載器

阿新 • • 發佈：2019-02-05

BlocksDownload

將通過 HTTP 協議傳輸的檔案進行分塊，並用多執行緒下載，充分利用本地頻寬。

說明

Python 2.7, no third-party library
每個執行緒對應一個 http 連線
max_block_size 越大記憶體佔用越大，影響資料能否儘早寫入磁碟而不是停留在記憶體裡。單個下載塊太大會出 MemoryError
經過測試：壓縮檔案，視訊檔案，音訊檔案沒問題，但有些網站的安裝包無法開啟，什麼”缺少端對端驗證”
目前網上大多電影都是通過 p2p 方式分享的，所以這個程式可能並沒有太大的作用
優先根據指定的 threading 數量設定執行緒數目，不指定的話將會根據 max_block_size 大小計算合適的執行緒個數。

利用 Event 事件實現程序同步。
請謹慎使用test，因為會在下載會破壞性覆蓋同名檔案。

下載陰陽師apk提速效果還是很明顯的。

downloader:

def __init__(self, url, download_to, max_block_size=1024*1024*5, thread_num=0):
* url:待下載檔案連結
* download_to：存放下載檔案的路徑
* max_block_size：可能出現的最大的下載塊大小, 單位 Byte
* thread_num: 制定下載執行緒個數，預設會根據 max_block_size 自動計算
> thread_num 的自定義會導致根據 max_block_size 計算失效

適用於：

通過 http 協議傳輸的大型檔案(>200MB)
伺服器端未對單個主機的連結個數進行限制或者限制已知。

Update Note:

2017-04-07
實現了分塊多執行緒下載的功能，但要構建一個健壯的下載器，還有很多細節需要考慮，需要更多包裝。
比如：(1)提供 FTP 協議的相容，(2)更人性化的使用方法包裝

# coding:utf-8

#-----Python 3 Compatible
from __future__ import absolute_import
from __future__ import division
from 
 __future__ import print_function
from __future__ import unicode_literals
#---------------------------------
import urllib
import urllib2
import threading
import time
import datetime

class downloader:
    def __init__(self, url, download_to, max_block_size=1024*1024*5, thread_num=0):
        self.url = url
        self.name = download_to
        req = urllib2.Request(self.url)
        response = urllib2.urlopen(req)
        file_size = response.headers.getheader('Content-Length')
        self.total = int(file_size)
        # 根據要求或者塊大小計算執行緒個數
        if thread_num:
            self.thread_num = thread_num
        else:
            self.thread_num = (self.total+max_block_size-1)//max_block_size
        print(self.thread_num)
        self.event_list = [threading.Event() for _ in range(self.thread_num)]
        self.event_list[0].set()
        print('File size is %d KB'%(self.total/1024))

    # 劃分每個下載塊的範圍
    def get_range(self):
        ranges=[]
        offset = int(self.total/self.thread_num)
        for i in range(self.thread_num):
            if i == self.thread_num-1:
                ranges.append((i*offset,''))
            else:
                ranges.append((i*offset,(i+1)*offset))
        return ranges

    def download(self,start,end, event_num):
        post_data = {'Range':'Bytes=%s-%s' % (start,end),'Accept-Encoding':'*'}
        # headers = urllib.urlencode(post_data)
        req = urllib2.Request(self.url, headers=post_data)
        res = urllib2.urlopen(req)
        # res = requests.get(self.url,headers=headers)
        print('%s:%s chunk starts to download'%(start,end))
        self.event_list[event_num].wait()
        self.fd.seek(start)
        self.fd.write(res.read())
        print("Number[%d] block was written"%event_num)
        if event_num<len(self.event_list)-1:
            self.event_list[event_num+1].set()

    def run(self):
        self.fd =  open(self.name,'ab')
        thread_list = []
        n = 0
        for ran in self.get_range():
            start,end = ran
            print('thread %d Range:%s ~ %s Bytes'%(n, start, end))
            thread = threading.Thread(target=self.download, args=(start,end,n))
            thread.start()
            thread_list.append(thread)
            n += 1
        map(lambda thd:thd.join(), thread_list)
        print('download %s load success'%(self.name))
        self.fd.close()

Python 分塊多執行緒下載器

BlocksDownload 將通過 HTTP 協議傳輸的檔案進行分塊，並用多執行緒下載，充分利用本地頻寬。說明 Python 2.7, no third-party library 每個執行緒對應一個 http 連線 max_block_s

libcurl實現多執行緒下載器

libcurl官網(http://curl.haxx.se/)是一個很強大網路功能的庫，支援當前DICT, FILE, FTP, FTPS, Gopher, HTTP, HTTPS, IMAP, IMAPS, LDAP, LDAPS,

Java編寫的一個多執行緒下載器

這裡只是演示這個下載器如何使用以及介面 1.可以百度TIM:找到下載介面，複製下載地址： 2.貼上到下載器介面如下圖:(注意儲存地址一定是存在的) 3.點選開始下載:(如果想要暫停或者繼續可以先選中下載行，點選暫停或者繼續)

如何用python實現一個多執行緒定時器

因為自已要寫一個和時間有關的方法，每過幾秒鐘之後要執行一個函式，但在主執行緒裡寫一個死迴圈來作定時器總是覺得不好。正好今天學習了一下python的多執行緒，可以拿來練手。寫了下邊的python定時器類，

Java多執行緒下載器FileDownloader（支援斷點續傳、代理等功能）

前言在我的任務清單中，很早就有了一個檔案下載器，但一直忙著沒空去寫。最近剛好放假，便抽了些時間完成了下文中的這個下載器。介紹同樣的，還是先上效果圖吧。 Jar包地址位於 FileDownloader 目前實現的主要功能有：多執行緒下載斷點續傳自定義頭部等即將完成的包括：新增代理功

風火程式設計--python多執行緒下載檔案

多執行緒下載檔案出現異常的執行緒會自動重新下載, 所有的進度會在同一位置輪換顯示 import os import datetime from urllib import request url_list = ["url1","url2","url3"

Python多執行緒下載表情包-黃勇-專題視訊課程

Python多執行緒下載表情包—469人已學習課程介紹本課程從基本的爬蟲開始講起。到如何使用多執行緒的方式爬表情包。課程內容豐富，容易上手，乾貨多多。課程收益學會Python爬

Python爬蟲之多執行緒，多程序

前言我們之前寫的爬蟲都是單個執行緒的？這怎麼夠？一旦一個地方卡到不動了，那不就永遠等待下去了？為此我們可以使用多執行緒或者多程序來處理。首先宣告一點！多執行緒和多程序是不一樣的！一個是 thread 庫，一個是 multiprocessing 庫。而多執行緒 thread 在 Pytho

Android核心技術-day05-05-安卓下的多執行緒下載(帶ProgressBar)有bug版

package com.gaozewen.multidownloader; import android.os.Bundle; import android.support.v7.app.AppCompatActivity; import android.view.View; impor

Android核心技術-day05-04-JavaSE多執行緒下載

package com.gaozewen.lib; import java.io.BufferedReader; import java.io.File; import java.io.FileInputStream; import java.io.InputStream; import ja

Python 學習系列 -- 多執行緒

轉載自：https://www.cnblogs.com/yeayee/p/4952022.html 多執行緒和多程序是什麼自行google補腦，廖雪峰官網也有，但是不夠簡潔，有點暈，所以就整個簡單的範例。　　對於python 多執行緒的理解，我花了很長時間，搜尋的大部份文章都不夠

使用Python自定義多執行緒,得到所有返回結果組成list

import threading import time """重新定義帶返回值的執行緒類""" class MyThread(threading.Thread): def __init__(self, func, args=()): super(MyThread,

使用select實現多執行緒定時器

#include <iostream> #include <stdio.h> #include <stdlib.h> #include <string.h> #include <sys/time.h> #in

帶斷點續傳的多執行緒下載

多執行緒下載原理：伺服器CPU分配給每條執行緒的時間片相同，伺服器頻寬平均分配給每條執行緒，所以客戶端開啟的執行緒越多，就能搶佔到更多的伺服器資源，所以使用多執行緒下載的話，速度會更快。 JavaSE實現帶斷點續傳的多執行緒下載步驟： 1、傳送http請求至下載地址，獲取要下載

Android原生下載（下篇）多檔案下載+多執行緒下載

零、前言 1.上篇實現了單執行緒的單檔案下載，本篇將講述多個檔案的多執行緒下載，在此之前希望你先弄懂上篇 2.本篇將用到上篇之外的技術：多執行緒、執行緒池(簡)、RecyclerView、資料庫多執行緒訪問下的注意點、volatile AtomicLong(簡) 最終靜態的效果

Python佇列與多執行緒及檔案鎖

佇列實現生產-多執行緒消費先看程式碼 # -*- coding: utf-8 -*- import queue import threading mu = threading.Lock() class Producer(threading.Thread): def __init__(

python中的多執行緒threading之儲存程序結果Queue

程式碼實現功能，將資料列表中的資料傳入，使用四個執行緒處理，將結果儲存在Queue中，執行緒執行完後，從Queue中獲取儲存的結果 import threading from queue import Queue def job(l, q): for i in range

python中的多執行緒threading之新增執行緒：Thread()

百度百科：多執行緒多執行緒（英語：multithreading），是指從軟體或者硬體上實現多個執行緒併發執行的技術。具有多執行緒能力的計算機因有硬體支援而能夠在同一時間執行多於一個執行緒，進而提升整體處理效能。具有這種能力的系統包括對稱多處理機、多核心處理器以及晶片級多處理（Chi

android多執行緒下載-HttpURLConnection

android多執行緒下載-HttpURLConnection private static String PATH = "http://192.168.37.2:8080/http/02.jpg"; public static void main(String[] args)

Python實戰之多執行緒程式設計thread模組

分享一下我老師大神的人工智慧教程！零基礎，通俗易懂！http://blog.csdn.net/jiangjunshow 也歡迎大家轉載本篇文章。分享知識，造福人民，實現我們中華民族偉大復興！

Python 分塊多執行緒下載器

BlocksDownload

說明

downloader:

適用於：

Update Note:

相關推薦