AI賦能資料中心 加速資料中心智慧化
自從2016年AlphaGo打敗李世石之後,人工智慧的能力開始逐漸被世人瞭解,人工智慧開始真正落地。Gartner的資料顯示,到2020年,人工智慧預計將減少180萬個就業機會。好訊息是,它也將創造230萬個就業崗位。如今,AI相關專利申請量飆升,AI晶片需求也不斷增加,微軟已決定採購華為新開發的AI晶片應用於中國的資料中心。

然而,人工智慧技術的發展與落地應用還遠未成熟。對人工智慧硬體而言,算力是技術實現的保障,這需要大量強有力的資料中心提供基礎支援。但傳統資料中心存在諸多痛點,亟需借力人工智慧,開展資料中心的革命。
實際上,人工智慧的發展少不了資料中心的支撐,與此同時,智慧化是未來能源基礎設施發展的必由之路,在此過程中,人工智慧也將助推資料中心朝智慧化方向發展。
資料中心與AI如何擦出火花?
資料中心成千上萬臺伺服器為人工智慧所需的計算能力提供了物理基礎,人工智慧也將給資料中心帶來了新的革命,其帶來的積極影響主要有三個方面。
一是便於資料中心管理和控制。未來的資料發展必將走向軟體定義,但隨著資料中心呈現複雜化,人工處理的精力和能力都有限。如果通過人工智慧利用其學習能力,對以往管理資料進行智慧分析,就可得到可觀準確的決策。
二是降低資料中心能耗。資料中心是能耗大戶,鉅額的電能費用已經成為資料中心高速發展的瓶頸,很多網際網路巨頭的自建資料中心開始想盡一切辦法去降低能耗。人工智慧技術就可以充分計算PUE值,再根據PUE值反推哪些因素對其影響最大,再去優化這些部分,從而達到降低能耗的目的,提升資料中心執行效率。
例如,谷歌使用DeepMind提供的AI技術,在機房的能耗上獲得了大幅的削減,相應減少PUE值。具體而言,通過建立機器學習的模型,對機房的PUE指標趨勢進行預測,從而指導製冷裝置的配置優化,減少了閒置的用於製冷的電力消耗。這項技術能夠為谷歌減少15%的資料中心整體耗電量,節省下來的成本相當可觀。
三是資料中心的資料加工。資料中心擁有海量資料,原有的計算方式效率太低。藉助AI技術的智慧化運維,就可以對這些資料進行深度分析,將資料進行過濾、整理、組建各種模擬模型,這些加工後的資料可能會產生巨大的價值。如果是資料中心的執行資料,則可以通過智慧運算,獲得提升資料中心運維水平機會;如果是資料中心的儲存資料,則可以通過只能運算獲得行業市場狀況,進行人員特徵的分析等。
資料中心運維日趨智慧化
人工智慧為資料中心提供了全新的機遇:未來可以建設智慧化的資料中心,用來替代簡單重複勞動,在大量資料中提取規律性資訊,大量方案中優選最佳方案,複合資料環境下選擇最優模式。
具體到智慧運維領域,目前依靠已有的日誌進行模式識別,可以實現實時監控,潛在故障告警,實時故障定位,重點區域問題監控,還可實現解決方案智慧化推薦;在節能降耗方面,可實現整個基礎設施的智慧化管理,提高可靠性,降低IT能耗,減少製冷消耗,從而節省電力。
然而,人工智慧亦對資料中心帶來了不小的挑戰。據信通院研究資料顯示,在供電方面,AI使得資料中心功率密度從5kW提升到21kW及以上,給供配電基礎設施帶來挑戰;在製冷方面,AI帶來的高功率帶來高散熱,風冷向液冷轉變;在邊緣計算方面,AI使得網路限制資料需要端側處理,要建設好邊緣資料中心。
智慧微模組3.0將成智慧化里程碑
目前,行業內已有不少智慧化資料中心解決方案問世。以華為公司為例,2018年6月CEBIT2018期間,華為釋出了一款名為“智慧微模組3.0”的智慧化解決方案,主要圍繞i³(iPower,iCooling,iManager)特性,加入AI優化執行演算法,實現資料中心基礎設施整體功能的智慧化融合,使得資料中心的高效智慧如虎添翼。
智慧微模組3.0將通過智慧化AI演算法主動判斷執行狀態,實現供電鏈路毫秒級故障檢測,秒級故障定位,毫秒級故障隔離,分鐘級故障恢復功能;突破行業困擾已久的冷媒洩漏檢測難題;提升資料中心全生命週期空間、電力、製冷及人力資源的高效利用。
其中,iPower可實現供電全鏈路可視及告警精確定位,並擁有基於AI技術的電池管理系統,配合毫秒級故障隔離,以保障供電的可靠性。iCooling,基於AI的自優化演算法,同等工況下溫控系統節電可達8%;溫控系統精確製冷,消除熱點隱患,提升資料中心執行的穩定性。同時,AI演算法支援空調冷媒容量的自檢測,提高可靠性。iManager是智慧微模組3.0的大腦,讓機房運維變得更加簡單、高效:底層裝置藉助先進的IoT技術,擺脫傳統串列埠通訊速度慢的問題,同時裝置高度自學習、自適應,為整個系統智慧化打造堅實的基礎;系統平臺通過雲化改造,構建DCIM+管理資源池,全球資料中心運營經驗共享,邁出資料中心智慧化、自優化的重要一步。對於出租型資料中心,華為DCIM+通過對租戶資源使用情況進行動態分析,識別不同型別使用者的需求,輔助資料中心的規劃建設與擴容。智慧識別高價值客戶型別,牽引優勢資源向高價值使用者轉移,優化資源配置,提升出租收益。
資料中心基礎設施發展經歷了散件化組合,產品化整合,智慧化融合三個發展階段。現在,華為將AI技術運用到資料中心基礎設施管理中,能夠大幅提升資料中心的可靠性、能源效率以及運維效率,最終幫助客戶降低全生命週期TCO,增加收入。