python大佬養成計劃----分散式程序
阿新 • • 發佈:2018-12-11
分散式程序
在Thread和Process中,應當優選Process,因為Process更穩定,而且,Process可以分佈到多臺機器上,而Thread最多隻能分佈到同一臺機器的多個CPU上。
Python的 multiprocessing 模組不但支援多程序, 其中 managers 子模組還支援把多程序分佈到多臺機器上。一個服務程序可以作為排程者,將任務分佈到其他多個程序中,依靠網路通訊。由於managers模組封裝很好,不必瞭解網路通訊的細節,就可以很容易地編寫分散式多程序程式。
通過managers模組把Queue通過網路暴露出去,就可以讓其他機器的程序訪問Queue了。先看服務程序,服務程序負責啟動Queue,把Queue註冊到網路上,然後往Queue裡面寫入任務。
BaseManager: 提供了不同機器程序之間共享資料的一種方法;
(重要的點: ip:port)
# task_master.py import random from multiprocessing import freeze_support from queue import Queue from multiprocessing.managers import BaseManager # 1. 建立需要的佇列 # task_queue:傳送任務的佇列 # coding=utf-8 import random,time from queue import Queue from multiprocessing.managers import BaseManager from multiprocessing import freeze_support task_queue = Queue() # 傳送任務的佇列: result_queue = Queue() # 接收結果的佇列: class QueueManager(BaseManager): # 從BaseManager繼承的QueueManager: pass # windows下執行 def return_task_queue(): global task_queue return task_queue # 返回傳送任務佇列 def return_result_queue (): global result_queue return result_queue # 返回接收結果佇列 def test(): # 把兩個Queue都註冊到網路上, callable引數關聯了Queue物件,它們用來進行程序間通訊,交換物件 #QueueManager.register('get_task_queue', callable=lambda: task_queue) #QueueManager.register('get_result_queue', callable=lambda: result_queue) QueueManager.register('get_task_queue', callable=return_task_queue) QueueManager.register('get_result_queue', callable=return_result_queue) # 繫結埠4000, 設定驗證碼'sheenstar': #manager = QueueManager(address=('', 4000), authkey=b'sheenstar') # windows需要寫ip地址 manager = QueueManager(address=('192.168.1.160', 4000), authkey=b'sheenstar') manager.start() # 啟動Queue: # 獲得通過網路訪問的Queue物件: task = manager.get_task_queue() result = manager.get_result_queue() for i in range(13): # 放幾個任務進去: n = random.randint(0, 10000) print('Put task %d...' % n) task.put(n) # 從result佇列讀取結果: print('Try get results...') for i in range(13): r = result.get(timeout=10) print('Result: %s' % r) # 關閉: manager.shutdown() print('master exit.') if __name__=='__main__': freeze_support() print('start!') test()
執行程式,會等待執行結果10s,如果沒有worker端獲取任務,返回結果,程式將報錯。
當我們在一臺機器上寫多程序程式時,建立的 Queue 可以直接拿來用,但是,在分散式多程序環境下,新增任務到Queue不可以直接對原始的 task_queue 進行操作,那樣就繞過了QueueManager 的封裝,必須通過manager.get_task_queue()獲得的 Queue 介面新增。
# coding=utf-8 import time, sys from queue import Queue from multiprocessing.managers import BaseManager # 建立類似的QueueManager: class QueueManager(BaseManager): pass # 由於這個QueueManager只從網路上獲取Queue,所以註冊時只提供名字: QueueManager.register('get_task_queue') QueueManager.register('get_result_queue') # 連線到伺服器,也就是執行task_master.py的機器: server_addr = '192.168.1.160' print('Connect to server %s...' % server_addr) # 埠和驗證碼注意保持與task_master.py設定的完全一致: m = QueueManager(address=(server_addr, 4000), authkey=b'sheenstar') # 從網路連線: try: m.connect() except: print('請先啟動task_master.py!') #sys.exit("sorry, goodbye!"); # 獲取Queue的物件: task = m.get_task_queue() result = m.get_result_queue() # 從task佇列取任務,並把結果寫入result佇列: for i in range(13): try: n = task.get() print('run task %d * %d...' % (n, n)) r = '%d * %d = %d' % (n, n, n*n) time.sleep(1) result.put(r) except ConnectionResetError as e: print("任務執行結束,自動斷開連線") # 處理結束: print('worker exit.')
使用命令列執行程式,結果更直觀