1. 程式人生 > >【阿里巴巴大資料實踐筆記】第13章:計算管理

【阿里巴巴大資料實踐筆記】第13章:計算管理

計算平臺追求目標:目前內部 MaxCompute 叢集上有 200 多萬個任務,每天儲存資源、計算資源消耗都很大。 如何降低計算資源的消耗,提高任務執行的效能,提升任務產出的時間

1.系統優化

(1)HBO (History-Based Optimiz町, 基於歷史的優化器)

(2)CBO (Cost-Based Optimizer , 基於代價的優化器)

收集到的表、分割槽、索引等統計資訊來計算每種執行方式的代價( Cost ),進而選擇其中代價最少的執行方式。

但對錶和列上統計資訊的收集也是有代價的,收集統計資訊會消耗大量資源。MaxCompute 採用各種抽樣統計演算法,通過較少的資源獲得大量的統計資訊,最大化提高統計資訊利用率。  

 

2.任務優化