1. 程式人生 > >揭祕阿里雲EB級大資料計算引擎MaxCompute

揭祕阿里雲EB級大資料計算引擎MaxCompute

日前,全球權威諮詢與服務機構Forrester釋出了《The Forrester WaveTM: Cloud Data Warehouse, Q4 2018》報告。這是Forrester Wave首次釋出關於雲數倉解決方案(Cloud Data Warehouse,簡稱CDW)的測評。報告對雲數倉的當前產品功能、產品路線和發展策略、市場表現等幾個方面進行全面的評估,在產品能力排行榜中,阿里雲力壓微軟排行第7。

abb4093bf2dfa67c76529a81eb1be6ff5918dd88

Forrester測評報告對CDW核心功能的評估主要從解決方案的多樣性、資料整合、效能和彈性擴充套件、安全性等方面進行,Forrester給出的評價是:阿里雲(MaxCompute+DataWorks+ADB)在廣泛的基礎設施之上提供了一個可靠的資料分析平臺,能夠滿足客戶實時和EB規模的資料處理需求。此前媒體已經報道了DataWorks的相關細節,今天我們就來聊聊MaxCompute。

EB級資料處理能力

首先來看一組資料。

2018年雙11,MaxCompute單日資料處理超過600PB,平穩支撐電商混布單元線上流量洪峰12萬筆/s交易,穩定承載45%導購流量,為雙11交易峰值提供了有力保障和平滑支撐。

根據官方介紹,MaxCompute是一種快速、完全託管的資料倉庫解決方案,通俗地理解就是大型分散式資料計算,所以大規模計算是最基礎的能力。MaxCompute已經是阿里巴巴的主力計算平臺,支援了整個阿里巴巴集團內部99%的大資料儲存和95%的計算,資料規模已達到EB級,上文提到的雙11場景就很好地體現了規模這能力。

 

 

cd9b821027b5658039e93652cbe0596512d78d08

當然,它和傳統 Hadoop 相比還有其它的優勢。MaxCompute 向用戶提供了完善的資料匯入方案以及多種經典的分散式計算模型,能夠更快速的解決使用者海量資料計算問題,有效降低企業成本,並保障資料安全。

整體來說有如下特點:

 ●  MaxCompute在計算引擎、分散式儲存上做了優化,在Sort Benchmark中MaxCompute消耗的時間和成本都是最低,保證了最優價效比。

 ●  伺服器資源、叢集規模都是動態的彈性拓展,無需使用者關心。

 ●  支援SQL、MR、迭代計算、記憶體計算、圖計算等計算模型。

a182a3970ecde72096aa37b9f634d9a582ecdf4d

經歷大規模應用實踐

據瞭解,目前MaxCompute正在為全球企業提供大資料計算能力。阿里巴巴通用計算平臺負責人關濤曾表示,“在公共雲上,MaxCompute每年以250%的使用者量和計算量在增長,並在全球十幾個國家和地區部署服務,為當地企業提供計算力。”

例如,城市大腦的底層就在使用MaxCompute做儲存和大資料計算,支援了杭州、澳門、吉隆坡等城市進行智慧化升級。這其中,由MaxCompute、PAI、流計算服務組成的計算平臺發揮了巨大的價值。

1

不僅如此,MaxCompute在各大行業已經有廣泛應用:

天氣預測有著廣泛的需求群體,每天幾億次的天氣查詢需求和近幾十億次的廣告請求, MaxCompute則很好地應對了這一挑戰。MaxCompute幫助墨跡天氣實現了對每天上億使用者的天氣查詢需求的快速響應和幾十億次廣告請求的精準投放。 網際網路保險行業,MaxCompute幫助眾安實現精準的使用者畫像分析,助力企業為數億使用者提供數十億的保單服務,提升企業效率的同時,為億萬使用者送去健康與安全。

總而言之,只要有海量資料處理需求的場景,MaxCompute都能通過阿里云為使用者提供快速、穩定的計算能力。

結語

從Forrester的本次研究報告可以看出,大資料技術已經進入CDW階段,在廣泛的基礎設施之上提供一個可靠的資料分析平臺,滿足客戶實時和大規模資料計算成為核心需求。

MaxCompute作為大資料計算平臺,不只是單一引擎,更是面向企業的完整服務。在過去10年中,MaxCompute穩定支撐阿里集團所有資料業務的同時,早已將強大的資料能力普惠給廣泛的雲上企業。基於MaxCompute構建穩定、安全、可擴充套件及與應用系統高效互動的資料中臺,已成為眾多行業下客戶數字轉型的首選方案。

作者: 隱林
原文連結
本文為雲棲社群原創內容,未經允許不得轉載。