python技巧——使用Pool實現多程序並行

阿新 • • 發佈：2018-12-04

簡介

可以使用 Pool來實現多程序並行。

Pool 模組來自於 multiprocessing 模組。

multiprocessing 模組是跨平臺版本的多程序模組，像執行緒一樣管理程序，與 threading 很相似，對多核CPU的利用率會比 threading 好的多。
Pool 類可以提供指定數量的程序供使用者呼叫，當有新的請求提交到Pool中時，如果池還沒有滿，就會建立一個新的程序來執行請求。如果池滿，請求就會告知先等待，直到池中有程序結束，才會建立新的程序來執行這些請求。

函式

apply()

函式原型：apply(func[, args=()[, kwds={}]])

該函式用於傳遞不定引數，同python中的apply函式一致，主程序會被阻塞直到函式執行結束（不建議使用，並且3.x以後不在出現）。

apply_async()

函式原型：apply_async(func[, args=()[, kwds={}[, callback=None]]])

與apply用法一致，但它是非阻塞的且支援結果返回後進行回撥。

map()

函式原型：map(func, iterable[, chunksize=None])

Pool類中的map方法，與內建的map函式用法行為基本一致，它會使程序阻塞直到結果返回。

map_async()

函式原型：map_async(func, iterable[, chunksize[, callback]])

與map用法一致，但是它是非阻塞的。其有關事項見apply_async。

阻塞與非阻塞的講解見下面備註。

close()

關閉程序池（pool），使其不在接受新的任務。

terminal()

結束工作程序，不在處理未處理的任務。

join()

主程序阻塞等待子程序的退出， join方法要在close或terminate之後使用。

示例

比如我想同時讓伺服器執行多條 hive 命令，可程式設計如下：

from multiprocessing import Pool
import subprocess

# 定義所有並行語句都回呼叫的函式
def run_sh 
(sh):
    '''
    執行一行shell命令
    '''
    (statusLoad, outputLoad) = subprocess.getstatusoutput(sh)    
    return (statusLoad, outputLoad)

# 將需要執行的多條語句放入到一個list中
sh_list = []
sh_list.append('hive -e "select * from A" > A_result')
sh_list.append('hive -e "select * from B" > B_result')
sh_list.append('hive -e "select * from C" > C_result')

# 開始並行
pool = Pool(len(sh_list))
pool.map(run_sh, sh_list) # 表示將 sh_list 每個元素作為引數遞給 run_sh
pool.close() # 將程序池關閉，不再接受新的程序
pool.join() # 主程序阻塞，只有池中所有程序都完畢了才會通過

# 開始處理結果檔案，此時三個 *_result 檔案肯定是存在並且已經寫入完畢的

備註

1、阻塞與非阻塞的區別

map() 會使程序阻塞，即通過 map() 開啟的多程序都結束之後，這個函式才會有返回結果，否則主程序會一直等待，不會往下進行。

map_async() 為非阻塞，即通過 map_async() 開啟多程序之後，立刻會返回結果，主程序會繼續往下執行。

注意：

如果後面呼叫了 join() 函式，則不管之前用的是 map 還是 map_async，主程序都會等待，直到程序池中所有程序執行完畢，才會繼續往下執行。

2、`starmap` 函式

Pool 類中，python 3.X 還引入了 starmap 函式，與 map 的區別在於， starmap 支援將多個引數放入到佇列中，不同引數按照順序以元組形式存放，舉例如下：

from multiprocessing import Pool
def func(a, b):
    print(a + b)

if __name__=="__main__":
    args = [(1,2),(3,4),(5,6)]
    pool = Pool(3)
    pool.starmap(func, args)

輸出

3
7
11

記憶體共享問題

多程序並行有一個特點：多個程序之間並不能共享記憶體。

比如一個人寫出了以下程式碼，期望可以對同一個數進行累加：

from multiprocessing import Pool
def func(dic, c):
    dic['count'] += c

if __name__=="__main__":
    d = dict() 
    d['count'] = 0
    args = [(d, 1), (d, 2), (d, 3)]
    pool = Pool(3)
    pool.starmap(func, args)   
    pool.close()
    pool.join()
    print(f'dic={d}')

但是輸出為：

dic={'count': 0}

不是我們想要的結果。

這是因為，多執行緒和多程序最大的不同在於，多程序中，同一個變數，各自有一份拷貝存在於每個程序中，互不影響，而多執行緒中，所有變數都由所有執行緒共享，所以，任何一個變數都可以被任何一個執行緒修改。

解決辦法

可以使用 multiprocessing.Manager 來建立物件，這樣的物件可以被共享，如：

from multiprocessing import Pool, Manager
def func(dic, c):
    dic['count'] += c

if __name__=="__main__":
    d = Manager().dict()  #生成一個字典，可以在多個程序中傳遞和共享。
    d['count'] = 0
    args = [(d, 1), (d, 2), (d, 3)]
    pool = Pool(3)
    pool.starmap(func, args)   
    pool.close()
    pool.join()
    print(f'dic={d}')

輸出是我們所期望的：

dic={'count': 6}

Manager() 內部有加鎖機制，不允許兩個程序同時修改一份資料，因為程序的資料是獨立的，因此資料是安全的。

另外，如果只要求並行，不要求必須是多程序，可以使用多執行緒來實現共享資料。 參照python技巧——使用threadpool實現多執行緒並行。

python技巧——使用Pool實現多程序並行

簡介可以使用 Pool來實現多程序並行。 Pool 模組來自於 multiprocessing 模組。 multiprocessing 模組是跨平臺版本的多程序模組，像執行緒一樣管理程序，與 threading 很相似，對多核CPU的利用率會比 threading

python語法——使用Pool實現多程序並行

簡介 Pool 模組來自於 multiprocessing 模組。 multiprocessing 模組是跨平臺版本的多程序模組，像執行緒一樣管理程序，與 threading 很相似，對多核CPU的利用率會比 threading 好的多。 Pool 類可以提供指定數

PHP實現多程序並行執行指令碼

由於php的程序是不支援多執行緒的，有些場景為了方便以及提高效能，可以用php實現多程序以彌補這個不足： #!/usr/bin/env php < ?php $cmds=array(

PHP使用QPM實現多程序並行任務處理程式

考慮用PHP實現以下場景：有一個抓站的URL列表儲存在佇列裡，後臺程式讀取這個佇列，然後轉交給子程序去抓取HTML存放到檔案裡。為了提高效率，允許多工並行執行，但為了避免機器負載過高，限制了最大的並行任務數(為了測試方便，我們把這個數設為3)，當佇列中取到

Python 多程序並行程式設計實踐: multiprocessing 模組

Python 多程序並行程式設計實踐: multiprocessing 模組 2017/04/17 · 實踐專案 · multiprocessing, 多程序, 並行本文作者：伯樂線上 - iPytLab&n

程序與執行緒（2）- python實現多程序

python 實現多程序參考連結： https://morvanzhou.github.io/tutorials/python-basic/multiprocessing/ python中實現多程序的模組：multiprocessing 注意：在windows系統下

Python Pool類多程序 apply_async 非同步變成了阻塞解決方法

出錯程式碼: if __name__ == '__main__': ip_arr=get_ip_list() pool=Pool(processes=4) for temp in ip_arr: res = pool.apply_as

多執行緒與多程序及Python實現【Python實現多程序】

上一篇部落格介紹了多執行緒與多程序的理論部分，這篇部落格將參考部落格以及各種教程完成Python多程序實現部分。 multiprocessing模組 Process 類 multiprocessing.Process(group=None, target=N

python之通過thread來實現多程序

程式碼如下： import threading, time class Test1(threading.Thread): def __init__(self, name): super().__init__(name=name) def run(self): print('tes

Python學習筆記：多程序

multiprocessing --程序庫 Linux上可以用fwork，但是windowns不支援fwork,所以才需要用 multiprocessing垮平臺來使用多程序父程序：當前執行的程序叫父程序子程序：當前執行的程序中建立的程序叫子程序引入程序模組 for

Python：socket實現ftp程序

handler 拋出異常失敗 all accept ESS net isp spa 剛開始學習socket編程，還不是特熟練，碼了好長時間，中間遇到許多問題，記錄一下用socketserver寫ftp server端： 1 #!/usr/bin/env python

Python學習【第21篇】：程序池以及回撥函式 python併發程式設計之多程序2-------------資料共享及程序池和回撥函式

python併發程式設計之多程序2-------------資料共享及程序池和回撥函式一、資料共享 1.程序間的通訊應該儘量避免共享資料的方式 2.程序

Python學習【第20篇】：互斥鎖以及程序之間的三種通訊方式（IPC）以及生產者個消費者模型 python併發程式設計之多程序1-----------互斥鎖與程序間的通訊

python併發程式設計之多程序1-----------互斥鎖與程序間的通訊一、互斥鎖程序之間資料隔離，但是共享一套檔案系統，因而可以通過檔案來實現程序直接的通訊，

python3實現多程序併發任務

在python開發中，有時候會有這樣的需求，比如說我後很多個任務，需要並行執行，也就是說有一個任務佇列，大家都知道，在python中的多執行緒，它其實從嚴格意義上來講，並不是真正的多執行緒。所以用多執行緒我們還不如使用多程序。使用多程序的有什麼好處了，它可以實現分散式多機並行。多個客戶端共享一個

Linux 實現多程序拷貝檔案

//copy.c #include <stdio.h> #include <unistd.h> #include <fcntl.h> #include<stdlib.h> #include<sys/stat.h> #include<e

python&Keras實現多GPU或指定GPU的使用

1. keras新版本中加入多GPU並行使用的函式下面程式段即可實現一個或多個GPU加速：注意：使用多GPU加速時，Keras版本必須是Keras2.0.9以上版本 from keras.utils.training_utils import multi_gpu_model &n

Python爬蟲學習_多程序爬取58同城

思路：有多個頻道（類別），每個頻道下有多個商品連結，每個商品都有詳情頁。先將頻道連結中的多個商品連結爬下來放入資料庫中，再從資料庫中取出來每一個商品詳情頁連結，進行詳情頁中的資訊爬取首先是channel_extact.py,爬取不同頻道的連結 from bs4 impo

51.[Python]使用multiprocessing進行多程序程式設計

基本知識本文先介紹使用Python進行多程序程式設計需要了解的基礎知識，然後以multiprocessing包為例說明如何進行多程序程式設計，本文的原始碼放在我的github專案上，歡迎訪問。針對IO密集型任務，如果想採用多執行緒方式處理，歡迎閱讀

PHP 如何實現多程序 and mysql查詢效率

首先我來說說這個我的需求吧。需求：有極少的使用者來訪問我的網頁，但是一旦有使用者訪問，就會查詢資料庫，資料庫是極大的。如果直接查詢的話，那麼耗時很長，為了節約時間，有很多工作需要做，其中一個就是多程序（多執行緒）。比如，一個程序查詢一個table，這樣可以提高效率。然後

python併發程式設計之多程序、多執行緒、非同步和協程

一、多執行緒　　多執行緒就是允許一個程序記憶體在多個控制權，以便讓多個函式同時處於啟用狀態，從而讓多個函式的操作同時執行。即使是單CPU的計算機，也可以通過不停地在不同執行緒的指令間切換，從而造成多執行緒同時執行的效果。　　多執行緒相當於一個併發(concunrr

python技巧——使用Pool實現多程序並行

簡介

函式

apply()

apply_async()

map()

map_async()

close()

terminal()

join()

示例

備註

1、阻塞與非阻塞的區別

2、starmap 函式

記憶體共享問題

解決辦法

相關推薦

2、`starmap` 函式