1. 程式人生 > >Elastic-Job定時入門

Elastic-Job定時入門

主要功能

定時任務: 基於成熟的定時任務作業框架Quartz cron表示式執行定時任務。

作業註冊中心: 基於Zookeeper和其客戶端Curator實現的全域性作業註冊控制中心。用於註冊,控制和協調分散式作業執行。

作業分片: 將一個任務分片成為多個小任務項在多伺服器上同時執行。

彈性擴容縮容: 執行中的作業伺服器崩潰,或新增加n臺作業伺服器,作業框架將在下次作業執行前重新分片,不影響當前作業執行。

支援多種作業執行模式: 支援OneOff,Perpetual和SequencePerpetual三種作業模式。

失效轉移: 執行中的作業伺服器崩潰不會導致重新分片,只會在下次作業啟動時分片。啟用失效轉移功能可以在本次作業執行過程中,監測其他作業伺服器空閒,抓取未完成的孤兒分片項執行。

執行時狀態收集: 監控作業執行時狀態,統計最近一段時間處理的資料成功和失敗數量,記錄作業上次執行開始時間,結束時間和下次執行時間。

作業停止,恢復和禁用:用於操作作業啟停,並可以禁止某作業執行(上線時常用)。

被錯過執行的作業重觸發:自動記錄錯過執行的作業,並在上次作業完成後自動觸發。可參考Quartz的misfire。

多執行緒快速處理資料:使用多執行緒處理抓取到的資料,提升吞吐量。

冪等性:重複作業任務項判定,不重複執行已執行的作業任務項。由於開啟冪等性需要監聽作業執行狀態,對瞬時反覆執行的作業對效能有較大影響。

容錯處理:作業伺服器與Zookeeper伺服器通訊失敗則立即停止作業執行,防止作業註冊中心將失效的分片分項配給其他作業伺服器,而當前作業伺服器仍在執行任務,導致重複執行。

Spring支援:支援spring容器,自定義名稱空間,支援佔位符。

運維平臺:提供運維介面,可以管理作業和註冊中心。

目錄結構說明

elastic-job-core

elastic-job核心模組,只通過Quartz和Curator就可執行分散式作業。

elastic-job-spring

elastic-job對spring支援的模組,包括名稱空間,依賴注入,佔位符等。

elastic-job-console

elastic-job web控制檯,可將編譯之後的war放入tomcat等servlet容器中使用。

elastic-job-example

使用例子。

elastic-job-test

測試elastic-job使用的公用類,使用方無需關注。

引入maven依賴

elastic-job已經發布到中央倉庫,可以在pom.xml檔案中直接引入maven座標。

    <!-- 引入elastic-job核心模組 -->
    <dependency>
        <groupId>com.dangdang</groupId>
        <artifactId>elastic-job-core</artifactId>
        <version>1.0.1</version>
    </dependency>
    <!-- 使用springframework自定義名稱空間時引入 -->
    <dependency>
        <groupId>com.dangdang</groupId>
        <artifactId>elastic-job-spring</artifactId>
        <version>1.0.1</version>
    </dependency>

程式碼開發

提供3種作業型別,分別是OneOff, Perpetual和SequencePerpetual。需要繼承相應的抽象類。

方法引數shardingContext包含作業配置,分片和執行時資訊。可通過getShardingTotalCount(),getShardingItems()等方法分別獲取分片總數,執行在本作業伺服器的分片序列號集合等。

OneOff型別作業

OneOff作業型別比較簡單,需要繼承AbstractOneOffElasticJob,該類只提供了一個方法用於覆蓋,此方法將被定時執行。用於執行普通的定時任務,與Quartz原生介面相似,只是增加了彈性擴縮容和分片等功能。

public class MyElasticJob extends AbstractOneOffElasticJob {

@Override
protected void process(JobExecutionMultipleShardingContext context) {
    // do something by sharding items
}

}

Perpetual型別作業

Perpetual作業型別略為複雜,需要繼承AbstractPerpetualElasticJob並可以指定返回值泛型,該類提供兩個方法可覆蓋,分別用於抓取和處理資料。可以獲取資料處理成功失敗次數等輔助監控資訊。需要注意fetchData方法的返回值只有為null或長度為空時,作業才會停止執行,否則作業會一直執行下去。這點是參照TbSchedule的設計。Perpetual作業型別更適用於流式不間歇的資料處理。

作業執行時會將fetchData的資料傳遞給processData處理,其中processData得到的資料是通過多執行緒(執行緒池大小可配)拆分的。建議processData處理資料後,更新其狀態,避免fetchData再次抓取到,從而使得作業永遠不會停止。processData的返回值用於表示資料是否處理成功,丟擲異常或者返回false將會在統計資訊中歸入失敗次數,返回true則歸入成功次數。

public class MyElasticJob extends AbstractPerpetualElasticJob {

@Override
protected List<Foo> fetchData(JobExecutionMultipleShardingContext context) {
    List<Foo> result = // get data from database by sharding items
    return result;
}

@Override
protected boolean processData(JobExecutionMultipleShardingContext context, Foo data) {
    // process data
    return true;
}

}

SequencePerpetual型別作業

SequencePerpetual作業型別和Perpetual作業型別極為相似,所不同的是Perpetual作業型別可以將獲取到的資料多執行緒處理,但不會保證多執行緒處理資料的順序。如:從2個分片共獲取到100條資料,第1個分片40條,第2個分片60條,配置為兩個執行緒處理,則第1個執行緒處理前50條資料,第2個執行緒處理後50條資料,無視分片項;SequencePerpetual型別作業則根據當前伺服器所分配的分片項數量進行多執行緒處理,每個分片項使用同一執行緒處理,防止了同一分片的資料被多執行緒處理,從而導致的順序問題。如:從2個分片共獲取到100條資料,第1個分片40條,第2個分片60條,則系統自動分配兩個執行緒處理,第1個執行緒處理第1個分片的40條資料,第2個執行緒處理第2個分片的60條資料。由於Perpetual作業可以使用多餘分片項的任意執行緒數處理,所以效能調優的可能會優於SequencePerpetual作業。

public class MyElasticJob extends AbstractSequencePerpetualElasticJob {

@Override
protected List<Foo> fetchData(JobExecutionSingleShardingContext context) {
    List<Foo> result = // get data from database by sharding items
    return result;
}

@Override
protected boolean processData(JobExecutionSingleShardingContext context, Foo data) {
    // process data
    return true;
}

}

作業配置

與Spring容器配合使用作業,可以將作業Bean配置為Spring Bean, 可在作業中通過依賴注入使用Spring容器管理的資料來源等物件。可用placeholder佔位符從屬性檔案中取值。

Spring名稱空間配置

<?xml version="1.0" encoding="UTF-8"?>
<beans xmlns="http://www.springframework.org/schema/beans"
    xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
    xmlns:reg="http://www.dangdang.com/schema/ddframe/reg" 
    xmlns:job="http://www.dangdang.com/schema/ddframe/job" 
    xsi:schemaLocation="http://www.springframework.org/schema/beans
                        http://www.springframework.org/schema/beans/spring-beans.xsd
                        http://www.dangdang.com/schema/ddframe/reg
                        http://www.dangdang.com/schema/ddframe/reg/reg.xsd
                        http://www.dangdang.com/schema/ddframe/job
                        http://www.dangdang.com/schema/ddframe/job/job.xsd
                        ">
    <!--配置作業註冊中心 -->
    <reg:zookeeper id="regCenter" serverLists=" yourhost:2181" namespace="dd-job" baseSleepTimeMilliseconds="1000" maxSleepTimeMilliseconds="3000" maxRetries="3" />
    <!-- 配置作業A-->
    <job:bean id="oneOffElasticJob" class="xxx.MyOneOffElasticJob" regCenter="regCenter" cron="0/10 * * * * ?"   shardingTotalCount="3" shardingItemParameters="0=A,1=B,2=C" />
    <!-- 配置作業B-->
    <job:bean id="perpetualElasticJob" class="xxx.MyPerpetualElasticJob" regCenter="regCenter" cron="0/10 * * * * ?" shardingTotalCount="3" shardingItemParameters="0=A,1=B,2=C" processCountIntervalSeconds="10" concurrentDataProcessThreadCount="10" />
</beans>

基於Spring但不使用名稱空間

<!-- 配置作業註冊中心 -->
    <bean id="regCenter" class="com.dangdang.ddframe.reg.zookeeper.ZookeeperRegistryCenter" init-method="init">
        <constructor-arg>
            <bean class="com.dangdang.ddframe.reg.zookeeper.ZookeeperConfiguration">
                <property name="serverLists" value="${xxx}" />
                <property name="namespace" value="${xxx}" />
                <property name="baseSleepTimeMilliseconds" value="${xxx}" />
                <property name="maxSleepTimeMilliseconds" value="${xxx}" />
                <property name="maxRetries" value="${xxx}" />
            </bean>
        </constructor-arg>
    </bean>    <!-- 配置作業-->
    <bean id="xxxJob" class="com.dangdang.ddframe.job.spring.schedule.SpringJobController" init-method="init">
        <constructor-arg ref="regCenter" />
        <constructor-arg>
            <bean class="com.dangdang.ddframe.job.api.JobConfiguration">
                <constructor-arg name="jobName" value="xxxJob" />
                <constructor-arg name="jobClass" value="xxxDemoJob" />
                <constructor-arg name="shardingTotalCount" value="10" />
                <constructor-arg name="cron" value="0/10 * * * * ?" />
                <property name="shardingItemParameters" value="${xxx}" />
            </bean>
        </constructor-arg>
    </bean>

不使用Spring配置

如果不使用Spring框架,可以用如下方式啟動作業。

import com.dangdang.ddframe.job.api.JobConfiguration;
import com.dangdang.ddframe.job.schedule.JobController;
import com.dangdang.ddframe.reg.base.CoordinatorRegistryCenter;
import com.dangdang.ddframe.reg.zookeeper.ZookeeperConfiguration;
import com.dangdang.ddframe.reg.zookeeper.ZookeeperRegistryCenter;
import com.dangdang.example.elasticjob.core.job.OneOffElasticDemoJob;
import com.dangdang.example.elasticjob.core.job.PerpetualElasticDemoJob;
import com.dangdang.example.elasticjob.core.job.SequencePerpetualElasticDemoJob;

public class JobDemo {

    // 定義Zookeeper註冊中心配置物件
    private ZookeeperConfiguration zkConfig = new ZookeeperConfiguration("localhost:2181", "elastic-job-example", 1000, 3000, 3);

    // 定義Zookeeper註冊中心
    private CoordinatorRegistryCenter regCenter = new ZookeeperRegistryCenter(zkConfig);

    // 定義作業1配置物件
    private JobConfiguration jobConfig1 = new JobConfiguration("oneOffElasticDemoJob", OneOffElasticDemoJob.class, 10, "0/5 * * * * ?");

    // 定義作業2配置物件
    private JobConfiguration jobConfig2 = new JobConfiguration("perpetualElasticDemoJob", PerpetualElasticDemoJob.class, 10, "0/5 * * * * ?");

    // 定義作業3配置物件
    private JobConfiguration jobConfig3 = new JobConfiguration("sequencePerpetualElasticDemoJob", SequencePerpetualElasticDemoJob.class, 10, "0/5 * * * * ?");

    public static void main(final String[] args) {
        new JobDemo().init();
    }

    private void init() {
        // 連線註冊中心
        regCenter.init();
        // 啟動作業1
        new JobController(regCenter, jobConfig1).init();
        // 啟動作業2
        new JobController(regCenter, jobConfig2).init();
        // 啟動作業3
        new JobController(regCenter, jobConfig3).init();
    }
}

使用限制

作業一旦啟動成功後不能修改作業名稱,如果修改名稱則視為新的作業。

同一臺作業伺服器只能執行一個相同的作業例項,因為作業執行時是按照IP註冊和管理的。

作業根據/etc/hosts檔案獲取IP地址,如果獲取的IP地址是127.0.0.1而非真實IP地址,應正確配置此檔案。

一旦有伺服器波動,或者修改分片項,將會觸發重新分片;觸發重新分片將會導致執行中的Perpetual以及SequencePerpetual作業再執行完本次作業後不再繼續執行,等待分片結束後再恢復正常。

開啟monitorExecution才能實現分散式作業冪等性(即不會在多個作業伺服器運行同一個分片)的功能,但monitorExecution對短時間內執行的作業(如每5秒一觸發)效能影響較大,建議關閉並自行實現冪等性。

elastic-job沒有自動刪除作業伺服器的功能,因為無法區分是伺服器崩潰還是正常下線。所以如果要下線伺服器,需要手工刪除zookeeper中相關的伺服器節點。由於直接刪除伺服器節點風險較大,暫時不考慮在運維平臺增加此功能

實現原理

彈性分散式實現

第一臺伺服器上線觸發主伺服器選舉。主伺服器一旦下線,則重新觸發選舉,選舉過程中阻塞,只有主伺服器選舉完成,才會執行其他任務。

某作業伺服器上線時會自動將伺服器資訊註冊到註冊中心,下線時會自動更新伺服器狀態。

主節點選舉,伺服器上下線,分片總數變更均更新重新分片標記。

定時任務觸發時,如需重新分片,則通過主伺服器分片,分片過程中阻塞,分片結束後才可執行任務。如分片過程中主伺服器下線,則先選舉主伺服器,再分片。

通過4可知,為了維持作業執行時的穩定性,執行過程中只會標記分片狀態,不會重新分片。分片僅可能發生在下次任務觸發前。

每次分片都會按伺服器IP排序,保證分片結果不會產生較大波動。

實現失效轉移功能,在某臺伺服器執行完畢後主動抓取未分配的分片,並且在某臺伺服器下線後主動尋找可用的伺服器執行任務。