1. 程式人生 > >Gearman(分散式任務分發框架)作用、工作原理、安裝、PHP拓展

Gearman(分散式任務分發框架)作用、工作原理、安裝、PHP拓展

前言:

工作中我們有時候會遇到比如需要同時釋出資料到多個個伺服器上,或者同時處理多個任務。可以使用PHP的curl_multi的方式併發處理請求,但是由於網路和資料以及各個伺服器等等的一些情況導致這種併發處理的響應時間很慢,因為在併發請求的過程中還包括記錄日誌,處理資料等邏輯,等待處理結果並返回,所以也不能友好的滿足後臺操作的體驗。

現在有另外一種方案,利Gearman來實現併發的需求。通過Client將請求傳送到Gearman的Jobs,在每個Work中來再來進行curl_multi和資料處理和日誌等一些操作,同時用supervisor 來監控Gearman以及Works的程序,這樣可以實現一個並行的多程序和負載均衡的方案。

 

Gearman作用:

非同步處理:圖片處理,訂單處理,批量郵件/通知之類的

要求高CPU或記憶體的處理:大容量的資料處理,MapReduce運算,日誌聚集,視訊編碼

分散式和並行的處理

定時處理:增量更新,資料複製

限制速率的FIFO處理

分散式的系統監控任務

 

Gearman工作原理:


使用Gearman的應用通常有三部分組成:一個Client、一個Worker、一個 任務伺服器。 Client的作用是提出一個 Job 任務 交給 Job Server 任務伺服器。Job Server 會去尋找一個 合適的 Worker 來完成這項任務。Worker 執行由 Client 傳送過來的 Job,並且將結果通過 Job Server 返回給 Client。Gearman 提供了 Client 和 Worker 的 API,利用這些API 應用可以同 Gearman Job Server來進行
通訊
。Gearman 內部 Client 和 Worker 之間的通訊都是通過 TCP 連線來進行的。




通常,多語言多系統之間的整合是個大問題,一般來說,人們多半會採用WebService的方式來處理此類整合問題,但不管採用何種風格的WebService,如RPC風格,或者REST風格,其本身都有一定的複雜性。相比之下,Gearman也能實現類似的作用,而且更簡單易用。


一個Gearman請求的處理過程涉及三個角色:Client -> Job -> Worker。


Client:請求的發起者,可以是C,PHP,Perl,MySQL UDF等等。
Job:請求的排程者,用來負責協調把Client發出的請求轉發給合適的Work。
Worker:請求的處理者,可以是C,PHP,Perl等等。


因為Client,Worker並不限制用一樣的語言,所以有利於多語言多系統之間的整合。


甚至我們通過增加更多的Worker,可以很方便的實現應用程式的分散式負載均衡架構。


3 Gearman下載

    1)官網
     http://gearman.org/


    2)官網下載
     https://launchpad.net/gearmand
    
    3)官網使用嚮導
     http://gearman.org/getting-started/
        
    3)本次安裝用到的所有軟體下載地址(安裝環境為CentOS-6.5)    
     http://download.csdn.net/detail/clevercode/8698699
    

4 Gearman安裝


4.1 安裝linux必備常用庫


    Linux中必備常用支援庫的安裝: http://blog.csdn.net/clevercode/article/details/45438401


4.2 安裝gearmand依賴的庫

    # yum install -y boost-devel gperf libevent-devel libuuid-devel
    

4.3 安裝gearmand服務

    1)解壓
    # cd /usr/local/src/gearman
    # tar xzf gearmand-1.1.12.tar.gz
    
    2)配置
    # cd gearmand-1.1.12
    # ./configure
    
    3)編譯
    # make
    
    4)安裝
    # make install
    

    5)安裝成功圖,輸入

    # gearman




5 安裝php擴充套件

    1)安裝phpize
    # yum install -y php-devel


    2)解壓
    # cd /usr/local/src/gearman
    # tar xzf gearman-1.1.2.tgz 
    
    3)配置
    # cd gearman-1.1.2
    # phpize
    # ./configure
    
    4)編譯
    # make
    
    5)安裝
    # make install   
    
    6)安裝成功

    出現“Installing shared extensions:     /usr/lib64/PHP/modules/”表示安裝成功,/usr/lib64/php/modules/是gearman.so擴充套件的目錄。如圖


    
    7)配置(加入擴充套件)
    # vi /usr/local/php5/etc/php.ini
    extension="gearman.so"
    
    8)查配置是否成功
    # vi test.php
    <?php
    print gearman_version() . "\n";
    ?>
    
    執行php test.php後,出現1.1.12表示安裝成功
    # php test.php
    1.1.12 


6 Gearman啟動停止



    1) 建立日誌/data0/logs/gearmand.log
    # touch /data0/logs/gearmand.log
    
    2)啟動
    # /usr/local/sbin/gearmand -d -u root -L 192.168.142.130 --log-file=/data0/logs/gearmand.log
      
    3)引數詳解
    -b,--backlog= 儲備的監聽連線數量
    -d, --daemon 後臺執行
    -f, --file-descriptors= 檔案描述符的數量
    -h, --help 幫助
    -j, --job-retries= 在ob server移除不可用job之前執行的次數,防止不斷執行導致其他可用worker崩潰。預設沒有限制
    -l, -log-file= 日誌檔案存放位置(預設記錄最簡單日誌)
    -L, --listen= 監聽的IP,預設全部接受
    -p, --port= 指定監聽埠
    -P, --pid-file= 指定程序ID寫入位置
    -r, --protocol= 載入協議模組
    -q, --queue-type= 指定持久化佇列
    -t, --threads= 使用的I/9執行緒數量。預設為0
    -u, --user= 啟動後,切換到指定使用者
    -v, --verbose 增加一級詳細程度
    -V, --version 顯示版本資訊
         
    4)查是否執行
    # ps axu | grep gearmand
    
    5)檢視監聽埠
    # netstat -anp | grep 4730
    
    6)停止,直接kill掉程序。
      
   

7 Gearman使用



7.1 建立Worker

   建立worker.php,建立一個傳送郵件的Worker端。程式碼如下
[php]  view plain  copy
  1. <?php  
  2.   
  3. $workernew GearmanWorker();  
  4. $worker->addServer('192.168.142.130''4730');  
  5. $worker->addFunction("sendMail""my_sendmail_function");  
  6. while ($worker->work());  
  7.   
  8. function my_sendmail_function($job){  
  9.       
  10.     // 接收資料  
  11.     $tmp = $job->workload();  
  12.     $receiveArr = unserialize($tmp);  
  13.       
  14.     $from = $receiveArr['from'];  
  15.     $to = $receiveArr['to'];  
  16.     $subject = $receiveArr['subject'];  
  17.     $content = $receiveArr['content'];  
  18.       
  19.     //傳送郵件  
  20.     //....  
  21.       
  22.     return $subject.' sendmail OK';  
  23. }  
  24.   
  25. ?>  



7.2 啟動Worker端

  如果處理的資料量大,可以執行以下指令碼多次,即啟動多個Worker端。

   # nohup php worker.php > tmp.txt &


7.3 建立Client(阻塞模式,需要等待返回結果才結束)

   建立一個client.php。do()方法是阻塞模式,必須等待worker端返回結果,程式才能停止。(如圖返回:hello Gearman sendmail OK)
   
[php]  view plain  copy
  1. <?php  
  2.   
  3. $clientnew GearmanClient();  
  4. $client->addServer('192.168.142.130''4730');  
  5.   
  6. $job = array();  
  7. $job['from'] = 'Code';  
  8. $job['to'] = 'Gearman';  
  9. $job['subject'] = 'hello Gearman';  
  10. $job['content'] = 'hello Gearman:this is from GearmanClient';  
  11. $job = serialize($job);  
  12.   
  13. //等到worker端返回結果,才會結束。  
  14. $ret = $client->do("sendMail"$job);  
  15.   
  16. echo $ret."\r\n";  
  17.   
  18. ?>  



7.4 建立Client(非阻塞,不用等結果)

   建立一個client2.php。doBackground()不用等待worker端返回結果,程式就結束了。
   
[php]  view plain  copy
  1. <?php  
  2.   
  3. $clientnew GearmanClient();  
  4. $client->addServer('192.168.142.130''4730');  
  5.   
  6. $job = array();  
  7. $job['from'] = 'Code';  
  8. $job['to'] = 'Gearman';  
  9. $job['subject'] = 'hello Gearman';  
  10. $job['content'] = 'hello Gearman:this is from GearmanClient';  
  11. $job = serialize($job);  
  12.   
  13. //不等待返回結果,就會結束  
  14. $ret = $client->doBackground("sendMail"$job);  
  15. echo $ret."\r\n";  
  16.   
  17. ?>  



8 Gearman管理

  輸入以下命令,檢視4730埠情況。
  #  (echo "status" ; sleep 2 ) | telnet 192.168.142.130 4730

 

  1)欄位說明:"已知註冊的任務"  "正在執行的任務"  "佇列中的任務"  "可用的 Worker".
  2)sendMail        0       0       1,註冊的任務名為 sendMail,0 個正常在執行,佇列為空,有一個可用的 Worker.