1. 程式人生 > >DataWorks2.0的“業務流程”與1.0的“工作流”的對比

DataWorks2.0的“業務流程”與1.0的“工作流”的對比

類型 任務 完成 結果 包括 由於 商家 模塊 3.3

DatwWorks終於升級2.0了,心情萬分激動之余,又有一絲擔憂。因為,沒法再創建新的舊版工作流了。。。
新版拋棄了“工作流”這個概念,引入了“業務流程”和“解決方案”兩個新的概念。於是,作為團隊Leader,我花了很大的精力去鉆研這兩個概念到底該如何應用在我的實際業務中。

1.目的
能盡快應用DataWorks2.0的諸多給力新功能;
盡快解決掉由於無法新建舊版工作流引起的不便;

2.舊版工作流劃分
任務節點一般分為以下幾類:

源數據同步節點
單業務基礎數據層統計節點
跨業務基礎數據層統計節點
結果數據層統計節點
結果數據同步節點
2.1 劃分維度
舊版本的工作流,主要包含以下幾個維度:

2.1.1 源數據庫
數據源是在哪個數據庫中

包括:源數據同步節點
2.1.2 產品線
源數據屬於哪個產品線
包括:源數據同步節點 + 單業務基礎數據層統計節點
2.1.3 目標系統
結果數據是給哪個系統提供的(後臺系統、BI、DataV、……)
包括:結果數據層統計節點 + 結果數據同步節點
2.1.4 業務模塊
結果數據屬於哪個業務模塊(訂單+投訴、訂單+保險、商家+訂單、……)
包括:跨業務基礎數據層統計節點 + 結果數據層統計節點 + 結果數據同步節點
2.1.5 運行周期
每日、每周、每月運行
包括:所有節點
2.1.6 輸入/統計/輸出
包含的節點的類型,是屬於“源數據遷入”、“統計任務”還是“結果數據遷出”
包括:所有節點
2.2 其他劃分原則
盡量減少每個工作流所依賴的上遊工作流的個數;
能用一句話給整個工作流起個名字;
每個工作流內的節點數量不超過30個;

  1. 舊版工作流與新版業務流程的區別
    3.1 運行周期
    舊版工作流:
    整個工作流(包含多個內部節點),對應一個運行周期
    新版業務流程:
    每個節點,對應一個運行周期
    3.2 依賴關系
    舊版工作流:

工作流依賴工作流;
內部節點依賴內部節點;
新版業務流程:

業務流程之間,無依賴關系;
節點依賴節點,可以跨業務流程依賴,可以不同運行周期的任務間依賴。
3.3 節點的分類
舊版工作流:
無分類,只能通過內部節點的命名來區分
新版業務流程:
可以自動按節點類型分類(SQL節點、數據同步節點、機器學習節點、……)
3.4 工作流(業務流程)的分類
舊版工作流:
無分類,只能通過工作流的命名來區分

新版業務流程:
可以通過“解決方案”功能來分類(類似於給每個業務流程打標簽),“業務流程”與“解決方案”是“多對多”的關系。
3.5 提交範圍
舊版工作流:
整個工作流(包含多個內部節點)一起提交
新版業務流程:
單個任務節點提交。也支持業務流程中多個節點批量提交的方式。
3.6 重命名
舊版工作流:

工作流不支持重命名;
內部節點不支持重命名;
新版業務流程:

業務流程支持重命名;
節點支持重命名;
3.7 添加文件夾的位置
舊版工作流:
多級文件夾→工作流→內部節點
新版業務流程:
業務流程→數據集成/數據開發→多級文件夾→節點

  1. 業務流程劃分原則
    最後,關於我的業務流程的劃分原則,總結如下:

業務流程是完成一個最小業務的;
業務流程的數量可以稍微多一點兒,可以通過解決方案去查找;
每個業務流程裏的節點最好不要太多,每個業務流程裏能直觀展示的就只有那麽多;
希望大家也能早日用上DataWorks2.0的諸多給力功能!不用繼續在舊版工作流中縫縫補補。

DataWorks2.0的“業務流程”與1.0的“工作流”的對比