1. 程式人生 > >python3學習筆記:多程序分散式小例子

python3學習筆記:多程序分散式小例子

最近一直跟著廖大在學Python,關於分散式程序的小例子挺有趣的,這裡做個記錄。

分散式程序

Python的multiprocessing模組不但支援多程序,其中managers子模組還支援把多程序分佈到多臺機器上。一個服務程序可以作為排程者,將任務分佈到其他多個程序中,依靠網路通訊。由於managers模組封裝很好,不必瞭解網路通訊的細節,就可以很容易地編寫分散式多程序程式。
master服務端原理:通過managers模組把Queue通過網路暴露出去,其他機器的程序就可以訪問Queue了
服務程序負責啟動Queue,把Queue註冊到網路上,然後往Queue裡面寫入任務,程式碼如下:

#task_master.py
#coding=utf-8

#多程序分散式例子
#伺服器端

from multiprocessing.managers import BaseManager
from multiprocessing import freeze_support  #server啟動報錯,提示需要引用此包
import random,time,queue

#傳送任務的佇列
task_queue = queue.Queue()
#接收結果的佇列
result_queue = queue.Queue()

#從BaseManager繼承的QueueManager
class QueueManager
(BaseManager):
pass #win7 64 貌似不支援callable下呼叫匿名函式lambda,這裡封裝一下 def return_task_queue(): global task_queue return task_queue def return_result_queue(): global result_queue return result_queue def test(): #把兩個Queue註冊到網路上,callable引數關聯了Queue物件 #QueueManager.register('get_task_queue',callable=lambda:task_queue)
#QueueManager.register('get_result_queue',callable=lambda:result_queue) QueueManager.register('get_task_queue',callable=return_task_queue) QueueManager.register('get_result_queue',callable=return_result_queue) #繫結埠5000,設定驗證碼‘abc’ manager = QueueManager(address=('127.0.0.1',5000),authkey=b'abc')#這裡必須加上本地預設ip地址127.0.0.1 #啟動Queue manager.start() #server = manager.get_server() #server.serve_forever() print('start server master') #獲得通過網路訪問的Queue物件 task = manager.get_task_queue() result = manager.get_result_queue() #放幾個任務進去 for i in range(10): n = random.randint(0,10000) print('put task %d...' % n) task.put(n) #從result佇列讀取結果 print('try get results...') for i in range(10): r = result.get(timeout=10) print('result:%s' % r) #關閉 manager.shutdown() print('master exit') if __name__ == '__main__': freeze_support() test()

執行截圖如下:
這裡寫圖片描述
在分散式多程序環境下,新增任務到Queue不可以直接對原始的task_queue進行操作,那樣就繞過了QueueManager的封裝,必須通過manager.get_task_queue()獲得的Queue介面新增。

任務程序,程式碼如下:

#task_worker.py
#coding=utf-8

#多程序分散式例子
#非服務端:worker

import time,sys,queue
from multiprocessing.managers import BaseManager

#建立類似的QueueManager
class QueueManager(BaseManager):
    pass

#由於這個QueueManager只從網路上獲取Queue,所以註冊時只提供名字即可
QueueManager.register('get_task_queue')
QueueManager.register('get_result_queue')

#連線到伺服器,也就是執行task_master.py的機器
server_addr = '127.0.0.1'
print('connect to server %s...'% server_addr)
#埠和驗證碼注意要保持完全一致
m = QueueManager(address=(server_addr,5000),authkey=b'abc')
#從網路連線
m.connect()
#獲取Queue的物件
task = m.get_task_queue()
result = m.get_result_queue()
#從task佇列獲取任務,並把結果寫入result佇列
for i in range(10):
    try:
        n = task.get(timeout=1)
        print('run task %d * %d...'% (n,n))
        r = '%d * %d = %d' % (n,n,n*n)
        time.sleep(1)
        result.put(r)
    except queue.Empty:
        print('task queue is empty')
#處理結果
print('worker exit')

執行截圖如下:
這裡寫圖片描述