雲時代來襲,IT運維面臨哪些新的挑戰?
在雲端計算時代,IT系統建設越來越成為企業發展至關重要的一環。業務系統,以及支撐業務系統執行的基礎設施通常是企業關注的首要目標,然而,保障業務健康執行的背後“功臣”——運維繫統同樣至關重要。
每一次IT系統的轉型,運維繫統和業務保障都是最艱難的部分。在當前企業IT系統向雲架構轉型的時刻,運維繫統再一次面臨著新的挑戰。所以在資料中心運維的時候,運維人員應該注意哪些問題?
雲端計算時代,資料中心運維應該注意以下幾點:
1. 關注智慧自動化運維的趨勢與難點
智慧自動化運維是雲資料中心時代尤為重要的趨勢。公有云讓基礎設施資源更集中,企業放棄自建資料中心轉而使用公有云,基礎設施資源因此集中到了第三方服務商的手中。
這一定程度上使得企業運維輕量化,更注重上層應用的運維,後端較重的基礎設施運維轉嫁集中到了第三方公有云服務商的身上。基礎設施運維的集中化,大體量化為自動化運維提供了良好的生存空間,企業前端的輕量的運維甚至也可以通過大資料以智慧視覺化的方式呈現出來。
2. 避免人為失誤與網路威脅
前不久,中國某大型雲廠商因運維人員操作失誤啟動了一個BUG,導致一些客戶訪問官網控制檯和使用MQ、NAS等多項產品功能出現問題,造成了較大影響。實際上,除了自然災害等原因,資料中心運維出現的一些安全問題極有可能是人為導致的。
出了要避免人為上的失誤,來自網路的威脅也不可小覷。資料中心資源的集中化讓我們逐漸感受到,資料中心故障的大型化趨勢越來越明顯,從網路安全的角度來說一個漏洞被利用,就可能會造成較大的資料丟失甚至裝置停機事故。
3. 多平臺融合的導致故障點監測困難
有業界人士稱,相對於傳統IT架構,雲資料中心運維的管理物件主要分為五大類,分別是:
機房環境基礎設施部分,包含風火水電等;各種裝置,包括儲存、伺服器、網路裝置、安全裝置等硬體資源;系統與資料,包括作業系統、資料庫、中介軟體、應用程式等軟體資源及業務資料;管理工具,包括了基礎設施監控軟體、監控軟體、工作流管理平臺、報表平臺、簡訊平臺等從中可以看出,一項雲資料中心向外界提供服務是多方服務融合的結果。因此,當面臨一個故障時,如何在諸多服務中準確追溯到故障點,是運維人員需要關注的另一個問題。
雲運維作為雲端計算必不可少的組成部分,會越來越展示出其重要性,成為雲端計算的核心競爭力之一。下一步將加大人工智慧在雲運維的投入與實踐,讓資料中心機器人融入更多的運維業務場景,替代傳統的手工操作,提供高度自動化和智慧化的“無人值守”式雲資料中心運維解決方案。