1. 程式人生 > >AWS以客戶為中心的進化,推動傳統企業上雲和機器學習

AWS以客戶為中心的進化,推動傳統企業上雲和機器學習

語言 初創企業 推導 創業 任務 面向 vmw alt 一件事

技術分享圖片
進入到2018年,已經是最早從2006年AWS開始的雲計算第12個年頭,如果你以為全球市場開始顯現疲態,那就大錯特錯了。2018年6月18日,市場調查公司Synergy Research Group公布了全球2018年第一季度公共雲基礎設施市場調查,令人意外的是,通常為淡季的第一季度卻出現了強勁增長。Synergy Research Group說,這是近9個季度以來增長勢頭最高的一個季度,比2017年同期增長了32%!而過去9個季度平均每季度也只增長10-20%。

在以服務器、存儲、網絡、安全和基礎設施軟件為主的公共雲基礎設施市場中,2018年第一季度ODM占據了25%的市場份額,即大型公共雲服務商自行設計並委托外包生產的硬件。Synergy Research Group就此評價,這意味著超大規模公共雲服務商正在不斷擴大基礎設施。而Synergy Research Group的預測是未來五年的IaaS、PaaS、SaaS和公共雲負載將不斷增長,這將帶來數據中心基礎設施的“水漲船高”。

作為全球最大的公共雲服務商,AWS在2018年也進入了新的發展階段。最新2018年第一季度的亞馬遜財報指出,AWS作為軟件業務已經成熟。從面向小型初創企業的隨用隨付費服務發展成為面向企業客戶的多年合同模式,在2018年第一季度財報中還有至少124億美元的未來收入,即沒被計入收入的已簽署合同總價值,這說明了AWS與企業客戶的多年合同關系。而這正是AWS不斷發展的邏輯的結果:以客戶為中心的進化。

持續以客戶為中心進化

技術分享圖片

眾所周知,AWS的設計思想就是以客戶為中心。最著名的例子,莫過於在一項產品或服務還沒有開發之前,先寫好新聞稿。

2018年6月29日,在AWS技術峰會2018上海站期間,亞馬遜AWS首席雲計算企業顧問張俠再次強調了這一做法:AWS在開發任何一個產品項目之前,第一件事是先把新聞發布稿寫好,第二把關於新聞發布稿的問答做好,第三再寫好用戶手冊;這些都做到之後,領導團隊再去評估立項申請;如果認可就立項,給予相應資源和資金,然後就開始項目。

張俠再次重申:“這是AWS以客戶為中心的一套方法,我們不是簡單的看競爭對手在做什麽、說了什麽,也不了解他們的策略。我們會專註於客戶的需求、市場的需求,幫助客戶成功。甚至,連我們自己的財務指標都不是重要的,我們就是把自己做好。”

實際上,到了2018年,AWS以客戶為中心的做法也有了進化。在AWS CTO Werner Vogels的最新博客文章中,介紹了這一最新進展。大家都知道,AWS在近年來陸續推出了多種數據庫,在AWS技術峰會2018上海站期間也強調,截止目前AWS在全球已經幫助超過78000套不同類型的數據庫通過AWS DMS數據庫遷移工具遷移至雲上,Amazon Aurora是AWS歷史上增長最快的服務。作為經典的關系型數據庫管理服務,Airbnb就采用了Aurora構建高性能、高可擴展的應用,Aurora也幫助Airbnb全面管理和運行其MySQL工作負載。

但在另一方面,通過AWS長期的運營,也發現沒有一種數據庫可以通吃所有應用。開發者們正在使用多種面向特定應用場景的數據庫,來構建高度分布式應用。這其實也是開發者的通常作法,即把一個復雜應用切分成若幹小部分,再用最好的工具解決每一個小部分的問題,而最好的工具往往是根據每個場景而量身定制。

這就是今天AWS提供六大數據庫服務的原因。這六大數據庫服務包括:關系型數據庫服務Amazon Aurora和Amazon RDS、Key-Value型Amazon DynamoDB、Document型Amazon DynamoDB、Graph型Amazon Neptune、In-memory內存型Amazon ElastiCache for Redis & Memcached、Search搜索型Amazon Elasticsearch Service。

以DynamoDB為例,當初之所以開發這個數據庫服務,是因為在支撐Amazon.com快速擴展的時候,已經突破了傳統商業數據庫的極限,而經過仔細分析後卻發現原來70%的運營需求是Key-value型數據的查詢,且只需要返回含有主Key值的一行數據即可。於是AWS工程師們意識到,這樣大規模的特定需求,需要一種不同類型的數據庫,這就是非關系型數據為DynamoDB的源起。

DynamoDB以及其它AWS數據庫服務的出現,都是為了滿足針對不同應用場景的數據庫服務需求,而數據庫也需要為了特定目標而構建,從而幫助開發者實現高性能、可擴展的應用。這些的背後,說明AWS在持續把雲上用戶的需求進行同類歸並,達到一定規模後即從技術角度反向推導和設計新的產品與服務。

傳統企業持續上AWS

技術分享圖片

正如今年第一季度財報所揭示的那樣,現在AWS的用戶群正從小型創業公司轉向大型多年期企業客戶。

在AWS技術峰會2018上海站活動上,西門子(中國)有限公司執行副總裁 Markus Mildner介紹了西門子與AWS的全球合作夥伴關系。在西門子推出的基於雲的開放式物聯網操作系統MindSphere中,應用了超過40項AWS服務,MindSphere也運行在AWS之上。

Werner Vogels在AWS技術峰會2018上海站上強調,“現在,沒有什麽應用不能被遷移到雲上。”AWS已經提供了六大類數據庫雲服務,其中就有針對企業級應用的數據庫。Johnson&Johnson就采用了Amazon RDS、DynamoDB和Amazon Redshift數據倉庫來最小化收集和提供數據的時間和精力,以便從數據中快速發展洞察。AWS的數據庫服務正幫助Johnson&Johnson管理醫師的工作流程、優化供應鏈以及開發新的藥品。金融機構Captial One也在使用Amazon RDS存儲交易數據,使用Amazon Redshift存儲網站日誌以便分析時的數據整合,使用DynamoDB存儲用戶數據以便用戶可以從Captial One的APP應用上快速獲得自己的信息。

在中國,一家以算法驅動創新的藥物科技公司晶泰科技,與AWS從2015年下半年開始合作至今,在AWS上運行計算密集型任務。

晶泰科技的技術中包含有大量的量子物理、人工智能算法,是一個典型的計算密集型產品和服務,晶泰科技大量使用了亞馬遜AWS的競價實例spot instance。晶泰科技基於最前沿的計算物理、量子化學、分子動力學、人工智能與雲計算等技術,為藥企提供快速、精確的智能化藥物研發科技,通過藥物模擬來顯著提高藥物發現與發展關鍵環節的效率與成功率,降低研發成本,晶泰科技目前已與多家世界頂級藥企與科研機構建立深度合作。

實際上藥品研發有著相當長的周期,可達10-20年,而臨床前的研發就可達約七八年。晶泰科技從藥物晶體預測角度切入藥品研發,藥物晶型是藥物研發從化合物確定到臨床實驗的中間環節,傳統上要經過漫長的實驗試錯,企業在這個環節需要一個可以進行後續藥品篩選的預測工具,以提高整體研發效率。所謂藥物晶型預測,就是對同一種藥物分子的不同晶體結構以及其穩定性、安全性等進行計算預測,並以此為基礎,分析藥物分子非常關鍵的、影響後續是否能夠研發成功的物理、化學、生物和藥物等重要的特征。根據晶泰科技的預測,藥企再用更具有針對性的實驗進行驗證,縮短研發周期。2018年5月,晶泰科技與輝瑞制藥達成戰略研發合作,建立小分子藥物模擬算法平臺,提高算法的精確度和適用廣泛度,驅動小分子藥物的創新。

晶泰科技CEO馬健在AWS技術峰會2018上海站活動上表示,“亞馬遜的競價實例是最開始非常吸引我們的一點。在保證效率的同時,也最大化降低了成本。”馬健認為AWS的競價實例很適合高性能計算任務,而AWS整體對晶泰科技來說有三方面優勢:首先是龐大、穩定和海量的計算資源;其次是吞吐數據的處理能力,因為晶泰科技的計算過程也會涉及到海量數據的吞吐和分析;第三是安全性能,因為晶泰科技大部分的客戶對象是海外大型藥企,對於數據安全的要求非常高,而AWS的安全性在整個工業界受到廣泛認可。

除了晶泰科技的高性能計算任務外,AWS還服務於全球以及中國多家大型企業以及政府機構。AWS與也VMware、SAP、IBM等合作,提供企業級應用和解決方案,以滿足企業客戶的需求。

持續改進機器學習服務

技術分享圖片

AWS在機器學習和人工智能方向除了推出自己的技術與算法外,也以客戶為中心優化和簡化了開發者使用機器學習進行開發和管理的難度。

2018年4月,AWS宣布數以萬計的客戶正在使用AWS機器學習服務,活躍用戶數量比去年增長250%以上,這主要得益於AWS re:Invent 2017以來Amazon SageMaker被廣泛采用。SageMaker是AWS re:Invent 2017上推出的全托管機器學習服務,開發者只需關心數據、機器學習框架和算法即可,其它參數調優等工作都 SageMaker自動完成。

早在2016 AWS re: Invent上就集中發布了AWS的AI產品線,包括文本到語音轉換服務Amazon Polly、基於深度學習的圖像和人臉識別服務Amazon Rekognition以及可編寫自然人機交互的Amazon Lex。2017 AWS re: Invent上進一步發布了Amazon Rekognition Video實時及批量視頻分析服務、Amazon Transcribe 自動語音識別文字記錄服務、Amazon Translate 自動多語種文字翻譯服務、Amazon Comprehend全托管自然語言處理理解服務、Alexa for Business等人工智能和機器學習服務。

特別是2017 AWS re: Invent上推出的首個深度學習攝像頭DeepLens,這是AWS繼Echo智能音箱後進入又一個新的智能硬件品類。除了預置優化的MXNet框架、支持AWS Greengrass物聯網邊緣計算核心功能外,還可與多種AWS雲服務結合起來,極大降低了人工智能和機器學習應用的開發門檻。

實際上,AWS推出的所有機器學習服務與產品,都是以客戶為中心進行持續改進和優化。英語流利說是一款流行的英語口語學習應用,旗艦APP“英語流利說”的註冊用戶數已逾7000萬人,付費用戶超百萬。在機器學習方面,英語流利說聯合創始人兼首席技術官胡哲人介紹,流利說的機器學習團隊主要集中在TensorFlow上,但不論是否采用TensorFlow算法,更為重要和本質的是數據和計算能力。而使用數據,這就涉及到權限管理。AWS有一個很有特色的IAM(Identity & Access Management,身份認證與訪問控制服務),是一個很好用的權限系統。之前,流程說采用自己的離線計算集群時,把數據從雲平臺上抓到自己機房時,就需要自己做復雜的權限管理;但現在改用AWS後,只需要把數據傳到雲,AWS自然有一套貫穿VPC、EC2、S3整個計算體系的IAM系統,流利說的機器學習團隊就可以更加集中精力於算法和應用開發本身。

英語流利說的體驗再次說明,AWS的優勢是整個AWS技術體系的綜合優勢。例如AWS Glue是完整的數據目錄和ETL服務,讓企業和開發者可以輕松的在AWS各類存儲服務之間調用數據,在AWS的存儲和數據庫服務與AWS的分析和機器學習服務之間建立無縫連接。Werner Vogels在AWS技術峰會2018上海站活動上強調,AWS Glue讓各類企業都可以在數據分析的幫助下獲得成功。

AWS目前可以提供125種雲服務,超過4200種功能特性,以及2300多種第三方產品。AWS公有雲服務覆蓋全球18個區域,開設了55個可用區,包含100多個節點。在中國,AWS已經有由光環新網運營的AWS中國(北京)區域,以及2017年12月上線的由西雲數據運營的AWS中國(寧夏)區域。在過去一年中,AWS北京和寧夏區域推出了超過16種主要服務,包含150多項服務及功能更新。

時間雖然到了2018年,AWS已經進入了第12個年頭,但顯然AWS仍然以客戶為中心不斷進化以滿足提升用戶體驗、降低用戶成本、更具強創新能力的需求。從以客戶為中心的角度來說,AWS的進化永無止境。(文/寧川)

附:8月9日舉行的AWS技術峰會(北京)開始註冊

註冊鏈接:

https://awssummit.cn?tc=Smx21V7H4J

AWS以客戶為中心的進化,推動傳統企業上雲和機器學習