1. 程式人生 > >智能運維解決方案:TOC -IT技術運行中心

智能運維解決方案:TOC -IT技術運行中心

經驗 維數 分析 數據共享 未處理 壓縮 趨勢 團隊 生命

TOC--IT技術運行中心(Technoical Operation Center )是網利友聯在多年運維經驗基礎上,全新打造的一套綜合智能運維解決方案。

運維現狀

運維行業經過幾十年的發展,基本上每個用戶的信息中心都已經建立了一套完整的運維體系,這其中不乏最重要幾個部分:人、物、數。業務在變,運維目標也在時刻發生著變化。如今的運維體系現狀是有團隊、有工具、有數據。但是面向智能運維生態的發展趨勢,面對大數據分析計算場景,缺少的是數據匯聚、數據融合、告警關聯分析、數據統一展現等。總結起來就是整個運維環境中缺少最具有價值的“連接者”角色。而TOC在整個的智能運維生態中扮演的就是數據連接者的角色。

TOC.png

面對工具多樣性,告警源多樣性,數據多樣性,團隊協同工作的場景,TOC方案提供了邊融合、邊叠代的解決方案。通過“松耦合”的方式持續融合專業的運維工具、數據、流程、持續優化運維數據共享、團隊協同、資源優化的一體化運維效果。

運維大數據融合分析

工欲善其事,必先利其器。數據是一切智能運維的根基。要想智能運維方案落地,必須有強大的數據做支撐。而TOC通過豐富的數據接口,負責將Zabbix、Nagios 、Tivoli等主流開源和商業監控平臺的告警數據整合,快速接入到TOC技術運行平臺。通過智能算法壓縮告警數據 ,全程統一采集,統一存儲,統一展現,從而能夠杜絕數據孤島,提高運維尤其是異常處理的效率。並且可以通過全局的數據統計評價各告警源的規範性,各類服務響應的SLA水平,發現運維服務瓶頸,優化服務資源匹配。

同時,配合專業的基礎IT數據監控采集工具BSM,TOC+BSM的數據采集加匯聚組合,絕對是智能運維的一把利器。

告警全生命周期管理與事件工單流程

TOC一站式解決所有的監控告警問題:

TOC對接各大主流監控工具可在一個平臺中接收所有監控系統的告警,讓運維人員集中處理IT事件,避免多平臺切換,通過智能算法將告警壓縮合並,為運維人員提供分析、甄選之後的最重要的告警。

TOC 作為匯聚多個告警源的集中告警服務臺,與ITSM 工單流程統一對接,不僅避免各告警工具分別與ITSM 對接,而且能夠從更高維度實現告警響應能力的統籌管理,能夠從更高維度支持多個關聯告警的合並開單,提升服務管理效率。

TOC 平臺支持和流程工單系統進行對接,實現手動派單和自動派單的自動化流程,同時支持多維度的工單統計信息,為IT運維持續優化提供依據。

服務臺已確認告警統計.png

工單處理情況.png

靈活的排班和告警分配策略

TOC提供靈活的告警分派策略,可以將不同級別的告警分配給不同的運維人員。 運維團隊可通過排班機制建立起 7 x 24 小時的應急響應機制。 在合適的時間,把告警推送給最合適的人員,隨時查看已處理和未處理的告警情況。通過告警排行分析,可以了解哪些應用、 哪些告警是頻發的,作出針對性的解決方案。

創建靈活的排班規則,把您的運維團隊更有效地管理起來。一線二線運維團隊分工協作。可以了解大到團隊、小到個人的工作效率、解決能力。 通過對告警壓縮的分析,可以發現產生告警風暴的原因,優化告警規則,提高處理效率。

智能運維解決方案:TOC -IT技術運行中心