1. 程式人生 > >大資料的重要性,技術和商業的碰撞,談阿里雲與天貓雙11這十年

大資料的重要性,技術和商業的碰撞,談阿里雲與天貓雙11這十年

摘要: 2009年,發生了兩件看似不起眼的事。 初春剛過,阿里雲在北京一棟沒有暖氣的寫字樓寫下了飛天第一行程式碼。 同年11月11日,淘寶商城啟動了一個叫做雙11的促銷活動。 誰也沒想到,多年以後他們會是現在這模樣。

2009年,發生了兩件看似不起眼的事。

初春剛過,阿里雲在北京一棟沒有暖氣的寫字樓寫下了飛天第一行程式碼。

同年11月11日,淘寶商城啟動了一個叫做雙11的促銷活動。

誰也沒想到,多年以後他們會是現在這模樣。

前傳

2007年淘寶的交易額突破了400億,技術團隊卻喜憂參半:現有集中式架構已經捉襟見肘,該如何應對?

隨即啟動的分散式改造獲得巨大成功,淘寶所有的業務都做了模組化。

儘管這次技術升級在現在看來存在諸多侷限性:更多的是為了應對不斷增多的圖片快取,在CDN端對海量的圖片快取做了一些限流操作。但就是這次改造成就了歷史上第一個雙11,2009年雙11當天的流量達到了一個高峰,在舊的架構體系下,這幾乎是一項不可能完成的任務。

一年後,飛天的第一個版本上線,僅有幾十臺機器的叢集開始服務第一個內部客戶——阿里金融。

這些探索讓所有人看到了一個趨勢:用分散式的方法將傳統、昂貴的小型機硬體和軟體,替換成通用的X86的伺服器叢集,虛擬化等技術可以讓計算能夠按量、隨時被啟動。

流量狂奔:脈衝計算

從計算機誕生到90年代,計算資源都是作為“可計劃性”的資源來使用。無論是探索月球,還是研究基因的奧祕,計算資源本身是可規劃的。然而,網際網路時代的到來,一個爆發性事件,就有可能挑戰整個計算資源,不確定性如影隨形。

毫無疑問,雙11就是這樣一個典型場景。

2011雙11的流量洪峰給技術團隊留下了午夜驚魂般難忘的回憶:系統性技術問題,使大量商家可能出現超賣。

事後,這群國內網際網路行業最優秀的技術人開始意識到這已經不僅僅是一場商業促銷活動,更是一次技術大考。

次年,天貓與阿里雲、萬網宣佈聯合推出聚石塔平臺,率先以雲端計算為“塔基”,為天貓、淘寶平臺上的電商及電商服務商提供IT基礎設施。

基於阿里雲的ECS雲伺服器、RDS雲資料庫、SLB負載均衡網路,商家訂單源源不斷的推送到商家平臺上,保障了資料的穩定和延續。這是雲端計算首次參與雙11,並且實現了191億的交易總額。

飛天的高速成長也給了所有人信心:5年的時間,飛天平臺叢集規模從1500臺到3000臺,2013年8月,單叢集超越5000臺,同時支援多叢集跨機房計算……

接下來幾年,雲端計算逐漸成為這場狂歡節中的基石,到2014年,聚石塔上96%的交易使用了阿里雲。

2015年開始,雙11構建了全球最大的混合雲,將公共雲和專有云無縫連線。

而這些成果最終成為了全社會的能力:無論是春節在12306搶票,還是在世界盃期間的狂歡,抑或是微博上的明星八卦,脈衝計算的能力在今天已經變成了常態。

資料平臺,計算創造價值

2013年前後,“船票論”在網際網路圈極為流行。“船票”成為了人們對於一家公司有沒有未來的判斷依據。至於如何拿到這張船票,彼時都非常模糊。

然而,移動端帶來的海量資料卻是真實存在的,移動端帶來的新需求,也推動了阿里雲大資料平臺的發展。

鮮為人知的是,2004年,為了從大資料中分析當前狀況,並預測未來的趨勢,阿里就擁有了第一個大資料倉庫,到2008年,淘寶的業務量與資料量已達到2004年的數千倍,為了讓資料成為生產資料,從底層重構大資料技術就顯得尤為重要。

2010年春,大資料引擎MaxCompute的前身SQL Engine第一版上線,執行在當時30臺機器的飛天叢集上。

2011年,飛天團隊開始探索支撐集團內部數倉業務,在1500臺機器上並行運行雲梯2的生產作業,並取得了不輸於Hadoop的效能和穩定性成績。

飛天5K專案之後,MaxCompute隨之進入5000臺機器和跨機房排程時代,並且可以在377秒完成100TB的排序。

通過MaxCompute引擎助力,從2014年雙11開始,千人千面成為常態。現在,這一產品已經成為阿里巴巴的主力計算平臺:

l阿里巴巴集團99%的資料儲存以及95%的計算能力使用MaxCompute;

l每天有超過500萬個作業在平臺上執行;

l2017年雙11,MaxCompute單日資料處理超過320PB。

幾年過去,“船票論”煙消雲散,然而大資料平臺帶來的價值已顯山露水,通過大資料與人工智慧演算法的結合,MaxCompute已成為ET大腦最重要的組成部分,ET城市大腦自動指揮城市路口訊號燈,並且成功應用於馬來西亞的交通治理;ET工業大腦推動工廠取得更好的良品率,致力於幫助製造企業提升1%的良品率。

從數字化阿里到數字化城市,MaxCompute可以承載EB級的資料儲存能力,成為全球首個100TB規模Bigbench測試通過的大資料計算平臺;在公共雲上覆蓋國內外的十幾個國家和地區,專有云上部署超過100+套。

史上最大規模的人機協同

2017年的雙11被認為是人類歷史上最大規模的人機協同“超級工程”:技術運維、商品推薦、客服、支付、物流等各個環節都引入機器智慧。

資料、計算力、演算法是人工智慧的三大核心要素。飛天在通用計算服務的基礎上,開始探索麵向人工智慧的異構計算。

2017年9月12日,阿里雲宣佈推出全新一代異構計算加速平臺,在行業內第一次覆蓋了包括AMD、NVIDIA的GPU和Intel、XILINX的FPGA在內的所有6款主流異構例項,提供最高可達75TFLOPS的算力。

全新的基礎設施讓全球最大規模的人機協同成為了可能。雙11大量AI和視訊轉碼業務部署在ECS的GPU叢集之上,包括視訊雲的視訊智慧處理、阿里小蜜、拍立淘和新零售的智慧供應鏈管理等AI業務都通過阿里雲異構計算GPU昊天平臺進行加速。

l  ●  阿里巴巴資料中心機器人“天巡”每天在機房巡邏,能接替運維人員以往30%的重複性工作。

l  ●  AI排程官“達靈”將資料中心資源分配率拉昇到90%以上。

l  ●  人工智慧助手‘阿里小蜜’在雙11當天承擔95%的客服諮詢。

l  ●  菜鳥智慧貨倉機器人單日可發貨超過100萬件。

l  ●  AI設計師“鹿班”,在雙11期間設計了4.1億張商品海報。

l  ●  阿里機器智慧推薦系統雙11當天為使用者生成超過567億個專屬“貨架”,像智慧導購員一樣,給消費者“億人億面”的個性化推薦。

半年後的武漢雲棲大會上,阿里雲首次和合作夥伴一起展出了AI智慧點單裝置,在沒有任喚醒詞的情況下,客戶以每秒5個字的速度,向一臺機器點單,並頻繁更換語句,這臺機器對每次對話均作出了精準應答。

現在,這些基礎設施以及商業化的產物正服務於各行各業。

飛天2.0支撐2018全社會的雙11

如果說最初的技術變革是為了解決平臺的流量峰值問題,那麼現在新的篇章已經開啟,新技術正在引領商業變革。

今年雙11期間,阿里雲上新增呼叫的彈性計算能力累計超過1000萬核,相當於10座大型資料中心,創造了“脈衝計算”的新紀錄。不僅如此,飛天2.0的新能力全面支撐雙11:

●  阿里雲自研神龍彈性裸金屬伺服器在核心繫統中發揮巨大作用。其基於完全自研的新一代軟硬融合的X-Dragon虛擬化架構,兼具物理機和虛擬機器優勢,解決了高峰值流量下的效能瓶頸。

●  業界首個百萬級IOPS的ESSD雲盤提供了數十PB的儲存規模,應對了史上最大的高併發IO挑戰。

●  貓晚網路直播創下頻寬峰值記錄,阿里雲視訊雲高可靠直播方案完美保障了優酷2500萬用戶的體驗。

●  CDN為中國1/3以上的網際網路流量提供加速,視訊雲在海外為Lazada提供直播服務。

●  國內首次大規模IPv6商業應用實踐,雲、網、端以及應用全面支援IPv6。

●  實時計算Blink處理峰值達到每秒17.18億條,相當於120萬本新華字典的資料量。

●  MaxCompute支撐線上流量洪峰12萬筆/秒交易,承載45%導購流量。

●  雲盾為雲上客戶提供上千萬次風險識別服務,並將DDoS高防技術輸出到全球,保障全球業務。

……

在這些技術底座之上,整個系統應對流量洪峰更加從容,當天交易額達到創紀錄的2135億。

當然,IoT的登場則為雙11創造了更大的想象空間。

在消費側,IoT技術服務新零售的同時,正在催生新的追蹤經濟。消費者可以檢視進口商品完整的商品溯源實時資訊,確保天貓進口商品安全可溯,遠洋運輸也實時可見。

在製造側,助力天貓品牌服裝廠商數字化接單、下單和備貨,個性化生產、柔性化製造,交期準確率近乎100%;對農業生產、運輸、銷售進行全鏈路升級。

從線上到線下,從生產製造到物流配送,從國內到海外,阿里雲的技術能力延伸到各行各業。而這只是這些新技術應用的冰山一角,雲與AI、IoT的有機融合未來還會產生什麼化學反應?我們拭目以待。

結語

從27個品牌參加成交額不過數千萬元開始,到現在的千億級體量,雙11已經成為一個未來商業實踐的範本,也是新技術的最大試驗場,這些新技術逐漸變成全社會的基礎能力,撬動一場全球的社會大協作。

對大資料的概念都是模糊不清的,大資料是什麼,能做什麼,學的時候,該按照什麼線路去學習,學完往哪方面發展,想深入瞭解

想學習的同學歡迎加入大資料學習qq群:792133408,有大量乾貨(零基礎以及進階的經典實戰)分享給大家

並且有清華大學畢業的資深大資料講師給大家免費授課,給大家分享目前國內最完整的大資料高階實戰實用學習流程體系 。