1. 程式人生 > >本地 vs. 雲:大數據廝殺的最終幸存者會是誰?— InfoQ專訪阿裏雲智能通用計算平臺負責人關濤

本地 vs. 雲:大數據廝殺的最終幸存者會是誰?— InfoQ專訪阿裏雲智能通用計算平臺負責人關濤

直接 先來 遷移 堅持 能力 十種 什麽 數據服務 過程

技術分享圖片
一家企業什麽時候會決定上雲?過去,這個問題的答案可能是當企業發現需要購買新的硬件進行新一輪資本投入時,往往傾向於考慮另一種替代方案,比如雲,這可能更多還是從成本方面考慮;或者,當企業出現某種彈性計算需求時,雲平臺是非常好的實現 IT 資源“削峰”的方案。

不同於現有技術邊界的“替換”,如今,這個問題的答案可以再加上一條:技術邊界的“擴張”。當企業需要某種能力,比如 AI 或者大數據,但自身技術實力達不到或者企業核心競爭力不在技術本身,此時就可能會考慮上雲,甚至這已經成為不少企業選擇雲平臺的重要原因。通過選擇雲平臺,企業實現了自己技術邊界的擴張,從而為業務邊界擴張提供技術上的保障。

過去幾年,雲平臺大數據服務越來越成熟,單就這一項,主流雲廠商可提供的服務列表就達到數十種,本地大數據服務的聲音似乎越來越弱,這在 Cloudera 與 Hortonworks 合並之後尤為明顯。有分析人士指出,Hadoop 與 Spark/Flink 等流技術的融合已經在雲平臺發生,這讓 Cloudera 和 Hortonworks 的基礎產品出現落後。巧合的是,Spark 商業化公司 DataBricks 選擇了一條不同於 Cloudera 與 Hortonworks 的軟件發行之道,DataBricks 一直堅持走雲上訂閱方式,從而在商業上更加領先。據此,本地大數據服務是否進入消失倒計時?雲平臺大數據服務最終到底會趨向多雲、混合雲還是單一公有雲?集群規模增大,上雲成本將難以承受是誤區還是事實?

InfoQ 將就上述問題展開系列探討,追蹤采訪數位行業內雲計算和大數據相關方向技術專家,從他們的觀點中獲取答案。本期采訪嘉賓——阿裏雲智能通用計算平臺負責人關濤。

雲平臺 vs 本地大數據服務
在對比雲平臺和本地大數據服務之前,我們先來探討一個基本問題:不同量級、不同技術能力的企業是否都適合上雲,這也是企業上雲之前必須想明白的問題。我們經常聽到一句話:未來的雲計算會成為像水電煤一樣的基礎設施,暫且不論這句話是否完全正確,中國目前的上雲進程的確在加快,如果要成為必備基礎設施,勢必需要匹配所有量級、所有技術能力的企業。

對於互聯網初創型企業,其特點是業務模式和規模高度不確定,數據量小,計算場景不確定,資金有限且沒有自己的數據技術力量。關濤表示,對這類型企業而言,雲大數據服務可以幫助降低大數據使用門檻,讓企業將有限的人力和物力都放在業務層面,快速搭建並為不確定的未來發展預留彈性能力。這種類型的客戶的需求關鍵字是:靈活和全面。

對於中大型互聯網企業,其通常擁有自己的集群和數據,業務相對穩定且有 SLA 要求,甚至具備非常成熟的數據團隊,這部分企業的技術能力或許足夠滿足業務需求,上雲所能帶來的好處就是降低甚至免除運維,保障 SLA 並提升安全能力,同時在性能、彈性等方面提供更低成本的服務。 需求關鍵字:穩定和成本。

對於傳統客戶,這部分企業往往更加謹慎,且原有數據中心較為龐大,整體遷移需要考慮的因素非常多,通常需要一整套解決方案,這部分企業往往也最在意雲計算的成本、穩定性和安全性等問題。需求關鍵字:解決方案。

成本

雲計算本身是一個需要重投資的領域,雖然有不少公司加入,但排名靠前的依舊集中於幾家資本和技術力量比較雄厚的公司。相對於本地大數據服務,雲平臺大數據服務的性能、穩定性、成本和安全性一直是討論的焦點。關濤表示,雲廠商在數據中心選址基建(例如需要綜合考慮電力成本和容量因素)、硬件建設、帶寬網絡建設(例如需要獨立雙鏈路網絡保證)、存儲、CDN 分發、安全加固等方面都投入了巨大精力,資本投入在百億甚至千億級別,中小企業自建服務的資本和技術投入顯然無法達到這一程度。

對於中小企業而言,上雲是個相對輕松的話題,首先數據資產量小尚可輕松挪動,且可享受雲廠商帶來的技術優勢;其次,業務體量相對較小,整體使用成本較低。但是,不少人認為“當集群規模達到一定程度,雲平臺的成本會變得非常高”。對此,關濤認為,雖然雲計算是個按需付費的資源,但小型數據中心的硬件啟動成本並不低,如果企業自行搭建,還需要考慮其中的人力成本,這部分隱性成本經常被忽略。

從軟件層面來看,主流雲廠商在技術層面的投入非常大,這不僅僅是技術研發層面的資金支持,阿裏雲平臺所提供的服務大都在內部業務經過長時間試運行,達到穩定以後才開放給用戶,這是普通公司很難達到的,尤其是中小企業的基礎設施上雲很難投入到這個級別,集中力量打造業務層面的差異性優勢才是這類型企業的立足關鍵,而不是糾結於底層的基礎設施。

當然,如果企業具備一定線下集群,上雲確實需要一定工作量和遷移成本,這包括網絡打通、數據、作業、應用遷移等。線下規模越大,工作量就越大,這是目前阻礙企業上雲的重要挑戰。關濤表示,這部分工作其實是階段性的,隨著雲技術的發展,企業可以直接或間接享受技術紅利。此外,雲廠商提供了不少遷移技術,比如多種類型的數據運輸與搬遷工具,基於專線的數據上傳和混合雲技術等。

安全

安全是企業對雲計算最早也是最大的顧慮,上雲肯定無法完全規避安全風險,但如果和自建機房相比,雲平臺相當於多了一重保險。如果企業自建機房,部署某個版本的 Linux 系統,也不見得將補丁打全,同樣存在安全風險。關濤表示,阿裏雲在安全方向(包括內核漏洞修補、DDos 防護、主動漏洞掃描、權限管理、隱私保護等)上有非常大的投入,安全性比自建要好的多。

雲廠商 vs 雲上自建大數據服務
對於一些互聯網企業而言,並不糾結是否上雲,而是在考慮選擇雲廠商提供的大數據服務還是選擇基於雲平臺自建,這些企業往往具備一定技術能力並擁有原始業務積累。關濤認為,從業界來看,美國大多數互聯網企業已經放棄自建數據中心而大規模應用雲技術,例如 NetFlix 已經將所有業務遷移至公有雲;專註專有雲和 IaaS 的 Cloudera 和 Hortonworks 已經合並過冬。

從發展趨勢來看,這是一個雲服務逐步成熟與客戶認知逐步發展的過程,就好比每一項新技術都經過了長期市場論證一樣。關濤認為,客戶認知應該會從最開始的懷疑(安全性、穩定性等)到逐步嘗試,到上雲,再到大規模依賴;從數據中心和主機托管,到依賴 IaaS,再到大規模應用無服務計算、PaaS 和 SaaS;從專有雲部署到混合雲,再到公有雲。

其次,隨著大數據與 AI 技術的發展成熟,雲廠商在該領域的競爭優勢已經逐步從“能做”變成“又快又好”。雲計算廠商的規模優勢能夠建立更高的競爭門檻,這是很多企業自建所達不到的。

混合雲和多雲皆是過程,單一雲平臺可能是主流
當企業確定選擇雲廠商提供的大數據服務時,又會出現新的問題:如何從這麽多種雲平臺大數據服務中選擇最符合自己業務發展需求的?是選擇混合雲、多雲還是單一公有雲平臺?

去年,一向對混合雲不感興趣的 AWS 推出了不少混合雲服務,這讓不少企業開始推測雲計算的未來將是混合雲或者多雲。對此,關濤更傾向於多雲和混合雲皆是中間過程,最終的大方向應該是單一公有雲的觀點。他補充道,無論是混合雲還是多雲都存在跨雲管理的問題,用戶需要適配一套或者多套雲系統,並將系統間數據和業務打通協調,比本地或者單一雲平臺更加復雜。

現階段,依照用戶需求不同,本地部署、混合雲(作為中間形態)與雲平臺部署三種情況都可能出現。但是,長期來看,隨著雲平臺的逐漸成熟和用戶認可,從成本和效率角度出發,單一雲平臺或許會是主流。

關於公有雲平臺,企業主要顧慮的問題就是單一供應商綁定。一旦綁定,數據和業務遷移困難,後續發展可能缺乏選擇;一旦雲平臺出現故障,是否有異構容災能力,是否會對業務造成不可逆的影響等。

關濤認為,如今的雲服務分層解耦越來越清晰,各基礎服務接口未來會更加標準,例如容器化和 K8S 等,這些標準化服務會大幅降低用戶被單一雲平臺綁定的顧慮。此外,主流雲廠商已經在提供一定程度的異構容災能力,例如阿裏雲的 3AZ 方案,可以保證跨數據中心的可靠性,技術上能夠滿足異構容災需求;如果用戶追求極致容災能力,有可能選擇混合雲或者多家雲廠商,這需要在多雲平臺之上,再做一層數據管理和業務同步邏輯,會給架構帶來很大的技術和成本壓力。當然,這還最終取決於用戶的需求,只是目前這種選擇應該比較少,例如,在金融數據庫領域,企業很少同時選擇兩種數據庫方案。

結語

從長線來看,關濤認為,用戶自建本地大數據服務會逐漸消亡。就國外雲計算的發展進程來看,很多大企業選擇上雲看重的可能並不是 IaaS 層面的能力,而是大數據和 AI 等偏上層的能力,這些現象足以說明用戶不僅會用 IaaS 的能力,並且可能會被上層能力吸引。

據此,阿裏雲大數據服務接下來將集中對如下幾方面進行改進:一是作為大數據引擎,隨著數據爆發式增長和計算的無處不在,性能、成本、擴展性和穩定性仍然是技術重點;二是非文本類數據的處理能力,包括識別、處理音、視、圖等新數據格式,例如短視頻推薦場景;三是非關系型數據處理,例如圖計算、Graph Embedding;四是 AI for BigData,比如在海量數據的前提下,基於 AI 的智能數據管理、智能建模與數據優化等。

各位網友,你如何看待雲平臺和本地大數據服務之間的關系呢?你所在的企業又是如何選擇的呢?

本文轉載於InfoQ,原文鏈接 https://www.infoq.cn/article/i8BVDSC9WAcOT*yuqxJH

了解阿裏巴巴大數據計算服務訪問 https://www.aliyun.com/product/odps

本地 vs. 雲:大數據廝殺的最終幸存者會是誰?— InfoQ專訪阿裏雲智能通用計算平臺負責人關濤