1. 程式人生 > >大資料平臺任務排程與監控系統

大資料平臺任務排程與監控系統

背景

大資料平臺技術框架支援的開發語言多種多樣,開發人員的背景差異也很大,這就產生出很多不同型別的程式(任務)執行在大資料平臺之上,如:MapReduce、Hive、Pig、Spark、Java、Shell、Python等。

這些任務需要不同的執行環境,並且除了定時執行,各種型別之間的任務存在依賴關係,一張簡單的任務依賴圖如下:

任務排程依賴圖

任務排程依賴圖

目前各業務的資料任務基本都是靠Crontab定時排程,各個任務之間的依賴僅靠簡單的序列來實現。

這樣做的問題:

  • 很容易造成前面的任務未結束或者失敗,後面的任務也執行起來,最終跑出錯誤的分析結果;
  • 任務不能併發執行,增加任務執行的整體時間視窗;
  • 任務管理和維護很不方便,不好統計任務的執行時間及執行日誌;
  • 缺乏及時有效的告警;

SkyNet排程監控系統,正是為了解決以上問題。

系統架構

大資料任務排程

大資料任務排程

名詞解釋

SkyNet 任務排程監控系統的名稱。
Job/任務 一個程式執行單元,比如,一個MapReduce程式、一個Shell指令碼等。
業務日期 每個程式執行所處理的資料日期。
JobInstance/任務例項 一次任務執行例項,因為一個任務在同一業務日期可能會執行多次。
資源 任務執行的節點(主機)
DataHub 資料交換機,用於異構資料來源時間的資料交換。

系統模組

  • JobManager:SkyNet的Master,提供RPC服務,接收並處理JobClient/Web提交的所有操作;與元資料通訊,維護Job元資料;負責任務的統一配置維護、觸發、排程、監控
  • JobMonitor: 監控正在執行的Job狀態、監控任務池、監控等待執行的Job;
  • JobWorker:SkyNet的Slave,從任務池中獲取Job、負責啟動並收集Job的執行狀態,維護至元資料庫;
  • JobClient/Web:SkyNet客戶端類,前端介面提供給使用者,用作任務的配置、管理、監控等;
  • 任務元資料:目前使用Mysql,儲存Job的配置、依賴關係、執行歷史、資源配置、告警配置等;

系統特性

  • 分散式架構:容量和負載能力(JobWorker)可線性擴充,並可以跨外網部署(只需能訪問元資料庫即可);
  • 高可用性:擁有主備Master,一旦主Master異常,備Master會接替主Master提供服務(後期實現);
  • 高容錯性:Master重新啟動後,會將之前未完成的任務重新排程執行;
  • 完善易用的Web使用者介面:用於使用者配置、提交、查詢、監控任務及任務的依賴關係;
  • 支援任意型別的任務:除了Hadoop生態圈的MapReduce、Hive、Pig等,還支援其他任何語言開發的任務,如Java、Shell、Python、Perl、Spark等;
  • 完整的日誌記錄:收集並記錄任務執行過程中產生的標準輸出和標準錯誤,提供Http訪問,使用者可通過訪問任務對應的日誌Url來方便的訪問任務執行日誌;
  • 任務之間的靈活依賴:可將任意一個任務作為自己的父任務進行依賴觸發;
  • 靈活多樣的告警規則:除了失敗告警,也支援任務超時未完成、任務超時未開始等告警規則;

頁面展示

DashBoard:顯示平臺任務總體概況,資源總體概況

大資料任務排程

大資料任務排程

任務查詢和維護:

大資料任務排程

大資料任務排程

新增任務:

大資料任務排程

大資料任務排程

檢視任務依賴關係及執行狀態:

大資料任務排程

大資料任務排程

檢視任務執行狀態及執行日誌:

大資料任務排程

大資料任務排程

相關推薦

資料平臺任務排程監控系統

背景 大資料平臺技術框架支援的開發語言多種多樣,開發人員的背景差異也很大,這就產生出很多不同型別的程式(任務)執行在大資料平臺之上,如:MapReduce、Hive、Pig、Spark、Java、Shell、Python等。 這些任務需要不同的執行環境,並且除了定時執

Kafka 叢集在馬蜂窩資料平臺的優化應用擴充套件

馬蜂窩技術原創文章,更多幹貨請訂閱公眾號:mfwtech   Kafka 是當下熱門的訊息佇列中介軟體,它可以實時地處理海量資料,具備高吞吐、低延時等特性及可靠的訊息非同步傳遞機制,可以很好地解決不同系統間資料的交流和傳遞問題。 Kafka 在馬蜂窩也有非常廣泛的應用,為很多核心的業務提供支撐。

餓了麼資料平臺排程系統演進實踐

背景 隨著餓了麼在大資料應用的不斷深入,需要解決任務數量增長快 ,任務多樣化,任務關係複雜,任務執行效率低,任務失敗不可控等問題。 目前現狀 每天完成大資料任務計算54000+ 節點叢集85臺

深入資料平臺心臟:餓了麼排程系統全解

隨著餓了麼在大資料應用的不斷深入,需要解決任務數量增長快、任務多樣化、任務關係複雜、任務執行效率低及任務失敗不可控等問題。 餓了麼大資料平臺現狀:每天完成大資料任務計算 54000+;節點叢集 85 臺。 開源解決方案 Ooize Ooize 基於工作流排程引擎,是雅虎的開源專

架構師實踐日 11.9 南京站報名 | 技術牛帶你剖析資料平臺內部演進中的挑戰實踐

從網際網路時代到物聯網時代,資料成為了企業的核心資產,挖掘資料價值成為了企業資料探索、技術應用的重中之重,甚至將影響到企業未來的發展和商業模式。但大資料體量大、多樣性、價值密度低、速度快等特徵,也給大資料的應用研發工作帶來了不少挑戰。  如何應對大資料

Hadoop資料平臺架構實踐

一、什麼是Apache Hadoop? 1.1 定義和特性 可靠的、可擴充套件的、分散式計算開源軟體。 Apache Hadoop軟體庫是一個框架,允許使用簡單的程式設計模型,在計算機叢集分散式地處理大型資料集。 它可以從單個伺服器擴充套件到數千臺機器,每個機

Ambari配置郵件警告--監控資料平臺

1 開啟管理介面2 建立Alert3 編輯內容-- Name:自定義-- Group:Ambari提供了一些預設的警告方案,也可以自定義。每個Group包含的報警資訊都可以自己配置。-- Severity:傳送報警的級別。包含:OK,WARNING,CRITICAL,UNKN

宜信資料:如何快速搭建監控報警系統

作者:宜信大資料創新中心LAIN團隊 在系統的開發及運維中,監控報警始終是非常重要的環節。監控報警系統能夠幫助開發運維人員及時理解系統的狀況,便於出現問題時及時定位,同時可以根據整個監控指標的趨勢圖規劃後續的開發運維計劃。本文希望通過介紹宜信大資料創新中心的監控報警系統,給大家快速搭建一套監控報警

資料平臺架構技術選型場景運用

導讀:本文將大資料的工作角色分為三種類型,包括業務相關、資料科學相關和資料工程。大資料平臺偏向於工程方面,大資料平臺一般包括資料來源、資料採集、資料儲存、資料分析等方面。 講師從資料來源、資料來源結構、資料變化程度和資料規模等4個維度對資料來源進行分類,資料來源分類維度的

資料實時案例--實時日誌監控告警系統

本次介紹使用Flume+kafka+storm+mysql的實時日誌監控告警系統,程式碼部分比較多,會放在一個下載的連線裡面,可以免費下載。 需求 在軟體開發中國,上線執行時經常會出現一些報錯,但是我們如果不能進行有效的實時監控,及時的處理,經常會帶來巨大損失

資料平臺建設方案(專案需求技術方案)

一、專案背景   “十三五”期間,隨著我國現代資訊科技的蓬勃發展,資訊化建設模式發生根本性轉變,一場以雲端計算、大資料、物聯網、移動應用等技術為核心的“新 IT”浪潮風起雲湧,資訊化應用進入一個“新常態”。***(某政府部門)為積極應對“網際網路+”和大資料時代的機遇和挑戰,適應全

資料平臺作業排程系統詳解-實踐篇

上一篇文章,討論了作業排程系統的分類,流派,架構實現方案和各種方案的優缺點以及適用場景,最後還簡單總結了理想中,一個完備的工作流作業排程系統,應該具備哪些功能特性。但是,紙上得來終覺淺,絕知此事要躬行。實踐才是硬道理。我司剛巧在開發工作流作業排程系統這塊有一些實踐經驗,所以這

資料平臺運維------CMCDH的升級

CM與CDH的升級過程有點類似與安裝過程,這裡我們也是採用離線安裝模式,各軟體版本資訊為:作業系統:CentOS6.8CDH版本:5.7.1:CDH-5.7.1-1.cdh5.7.1.p0.11-el5.parcel.sha                CDH-5.7.1-

資料平臺運維-----Kerberos環境下Hive及Impala監控指令碼的開發

一、工程目錄二、原理解析    Hive和Impala是兩個最常用的大資料查詢工具,他們的主要區別是Hive適合對實時性要求不太高的業務,對資源的要求較低;而Impala的由於採用了全新的架構,處理速度非常的快,但同樣的也對資源消耗比較大,適合實時性要求高的業務。    在我

恆豐銀行基於資料平臺構建資料倉庫的研究實踐

恆豐銀行原傳統資料倉庫是建立在IOE(IBM、ORACLE、EMC)傳統架構體系上,已接入資料來源系統有30多個,配套建立監管資料集市、資料分析集市,風險資料集市三個主要資料集市,負責十幾個管理應用和監管系統的資料需求,下游建有銀行管理類系統如綜合經營分析系統(管理駕駛艙)、

資料要學習哪些技術呢?資料技術的分類選擇路線

大資料的處理過程可以分為大資料採集、儲存、結構化處理、隱私保護、挖掘、結果展示(釋出)等,各種領域的大資料應用一般都會涉及到這些基本過程,但不同應用可能會有所側重。對於網際網路大資料而言,由於其具有獨特完整的大資料特點,除了共性技術外,採集技術、結構化處理技術、隱私保護也非常突出。 有很

資料人工智慧發展趨勢前景

上週,南京大學開設了國內第一家人工智慧學院,機器學習大牛周志華領銜院長,可謂實至名歸。最近幾年,以大資料和人工智慧為代表的前沿資訊科技,備受各界關注,相關領域的風投和創新、創業高燒不退,學術界大牛們紛紛下海,大資料深度學習研究和應用也在逐步落地,就連國務院的支援政策也是一個接一個。還有Face

採用資料的商業動機驅動 ------ 學習筆記

概念: 架構:架構是針對某種特定目標系統的具有體系性的、普遍性的問題而提供的通用的解決方案 業務架構是基於業務導向和驅動的架構來理解、分析、設計、構建、整合、擴充套件、執行和管理資訊系統,比如業務架構體系認為一個資訊系統必須由組織機構、業務流程、業務資訊、業務功能、和業務語義等層次構成。為實

資料脫敏介紹(資料平臺 )

資料脫敏(Data Masking),又稱資料漂白、資料去隱私化或資料變形。百度百科對資料脫敏的定義為:指對某些敏感資訊通過脫敏規則進行資料的變形,實現敏感隱私資料 的可靠保護。這樣,就可以在開發、測試和其它非生產環境以及外包環境中安全地使用脫敏後的真實資料集。 可以看到資料脫敏具有幾個關鍵點:

資料來源/資料平臺

【彙總】資料來源/大資料平臺 一、網路趨勢分析   站長工具:5118 | chinaz   指數工具:艾瑞指數 | 百度指數 | 微指數 | 搜狗指數