優雲蔣君偉:自動化運維成本仍然很高">優雲蔣君偉:自動化運維成本仍然很高

分類:IT技術 時間:2017-09-26

9月10日-11日,上海光大國際會展中心隆重舉辦了“2017上海站CNUTCon全球運維技術大會”。本次大會的主題是“智能時代的新運維”,各個公司為觀眾帶來了他們關於該主題的思考,並分享了他們的實踐經歷。InfoQ有幸邀請了杭州優雲軟件有限公司的產品副總裁蔣君偉老師接受我們的采訪。談到對自動化運維未來的展望,蔣老師表示自動化運維必然是大勢所趨,但是因為相關技術債務的存在,自動化運維的成本還很高。那優雲自己的技術與產品是如何去做高效運維的呢?本次采訪帶你了解一二。

InfoQ:與其它同類產品相比,優雲有哪些優勢?

蔣君偉:要介紹優雲的產品優勢,我想可以簡單說明一下優雲是如何來的。優雲來自廣通,廣通公司成立於2003年,14年以來一直專註於運維領域,廣通的產品也隨著運維行業的趨勢發展,從最初的監控、CMDB、ITIL到APM,行業的客戶也深入到政府、金融、運營商領域,我們對用戶運維痛點與上一代運維產品的瓶頸,有深刻認識。

所以,2016年,廣通成立全資子公司,推出了新一代運維產品線優雲,與同類產品相比,我們有以下優勢:

1. 平臺化:打通運維場景,避免運維信息孤島與運維工具碎片化的情況 

2. 自動化:結合自動化操作編排,實現故障自愈與運維自助式服務 

3. 社交化:通過ChatOps App,由運維機器人輔助運維人員,隨時隨地完成運維工作 

4. 大數據:內置運維數據分析算法,有效解決數據中心容量規劃難題 

5. 分布式:支持水平擴展,可隨資源規模增長而增加管理能力

InfoQ:優雲產品采用了哪些核心技術?

蔣君偉:優雲產品的核心技術包括:

1、 安全、穩定、低負載、易擴展的采集代理平臺

采集代理是運維體系中非常重要的落地工具,由於企業用戶的環境非常復雜,所以采集代理在技術設計需要非常註意:

  • 優雲Agent主要使用python與Java技術平臺實現,所以在服務器的兼容性上有很大保障;
  • 為兼容被防火墻與網閘隔離的網絡,Agent總是單向對Server發起連接,拉取作業或上報結果,這種方式也可以讓Agent集群形成一個網狀級聯,兼容多級網絡;
  • 同時Agent會主動降低進程的優先級,以降低CPU消耗,控制內存與磁盤使用,將對部署服務器的影響降到最低;
  • Agent使用強引擎弱腳本的設計思路,內置了ssh/wmi/snmp/ipmi等交互協議,允許用戶快速使用shell/python/groovy等腳本快速擴展Agent能力。

2、 可視化埋點技術

優雲UEM產品可以實現用戶Web端與移動端的用戶操作體驗監控,不像傳統的用戶體驗監控產品,我們不需要預先埋點,我們可以幫助產品經理生成用戶的操作熱區,並直接在產品界面上操作,決定要關註哪些用戶的操作行為。這個埋點依賴兩個部份完成:

用戶交互數據的全量抓取技術:通過在應用端部署前端agent js, agent會監聽頁面中的相關操作,比如點擊事件,超鏈接等,將相關數據(比如來源、去向)全部記錄下來,並每隔1分鐘進行上報,由服務端存儲分析。

用戶界面元素標記技術:可以直接在被監控應用端進行框選,設置頁面元素標記,這些元素會和全量采集的數據進行匹配(比如通過匹配css選擇器、文本等)。通過這種可視化標記的方式就可以直接關註用戶需要的數據,無須開發者手動對頁面元素進行埋點。

3、全鏈路監控技術

優雲UEM與APM,已經將用戶端的操作與服務端對此操作的執行過程結合在一起,通過UEM的用戶端請求染色,可以跟蹤每一個請求操作到服務端,針對服務端的常用RPC協議,如http/dubbo/rmi等,也可以通過嵌入式agent進行染色與跟蹤。因此,一筆操作所經過的每一個計算節點與數據存儲節點的調用堆棧,我們都可以捕捉到,並能呈現分析其中的瓶頸節點與代碼。

4、 圖像質量分析算法

優雲VideoMon產品使用的圖像與視頻質量分析算法,可以快速完成攝象頭成像質量的分析,其中診斷的準確性與快速是技術關鍵。使用信號波動檢查、像素灰度值分析、非灰色像素集中區域分析、圖像弱邊緣數分析等算法,來實現視頻信號丟失檢測、偏色檢測、清晰度異常檢查等功能。

InfoQ:談談對全棧雙態運維解決方案的具體理解?

蔣君偉:這裏有兩個關鍵詞:

1. 全棧

全棧體現了解決方案的覆蓋面是完整的,運維的對象,可以從基礎架構到業務應用;從物理資源到雲資源;從用戶端到服務端的全鏈路運維。

2. 雙態

雙態則有兩層含義。從技術層上來說,雙態要求產品能同時進行傳統IOE架構的運維,以及x86架構的雲資源運維;從管理上來說,應能支撐ITIL與DevOps這兩種運維體系。

我認為全棧雙態運維解決方案,應該能滿足這兩個關鍵詞。

InfoQ:優雲產品解決方案已經應用到了哪些行業和哪些客戶中?具體效果如何?

蔣君偉:自16年7月發布我們的產品後,很多用戶都非常踴躍,到目前我們也實施了不少典型案例:

1、 某金融雙態方案,實現雲資源交付的服務自助化

金融目前是最典型的雙態運維場景了,一方面金融核心系統要保持非常穩定,是穩態,另一方面移動支付渠道又要求應用的叠代與響應非常敏捷,是敏態。

通過優雲的Monitor,我們實現了傳統業務與互聯網業務的全棧監控;並且通過ITSM實現流程自助服務,業務部門提交的資源申請工單,在審批通過時,借助CMDB與Automation,實現業務部門的資源交付、應用部署自助化。

2、 某部委業務大數據分析監控方案

此客戶全國擁有數萬的站點需要上報業務數據,這些數據的處理要求非常高的時效性與準確性。由於站點的規模變大、數據種類增加以及數據監控粒度的增加,舊的業務支撐保障系統已無法滿足對業務數據的實時監控需求。

優雲Store運維數據平臺具有大數據分析能力,能實現這些上報的業務數據實時流數據處理,結合CMDB中的站點基本信息,實現監控指標的多個管理維度分析,並通過Show大屏可視化呈現全國的數據質量。

3、 某海外平安城市運維項目

平安城市中存在大量的IT設備與海量的物聯網設備需要運維管理,其運維團隊對於整個城市的攝象頭故障總是頭痛不已,一直處於被動運維的狀態。

優雲VideoMon能快速完成上萬路的攝象頭圖像質量分析監控,大量減少運維團隊的巡檢成本。對存在故障的結點,優雲Alert通過告警熱圖功能,從地域、類型、業務等多個維度,為用戶呈現故障分布情況,快速幫助用戶找到問題根源,縮短故障修復時間。

InfoQ:談談對自動化運維的展望。

蔣君偉:自動化運維必然是大勢所趨,並且會越來越快地改變我們的運維工作,目前我們所處的時代是一個舊與新的過渡時代,就像集裝箱發明後的航運業一樣。

在集裝箱剛開始被發明出來的階段,大家從心理到技術上都沒有作好準備,包括貨主、公路、鐵路、港口、吊車到輪船,都沒有為集裝箱做好配套。但由於幾個關鍵事件,集裝箱的標準化,以及隨之配套的操作、運輸手段,很快就改變了全世界。

我們現在也是,雖然容器及服務、函數及服務技術已經出現,但我們還有太多的歷史債務需要償還,所以現在的標準化與自動化的收益還不明顯, 自動化運維的成本還很高

但隨著歷史債務的解決,新的應用研發、運維手段,都會圍繞著這些新技術配套起來,到時候自動化運維就非常容易實施與獲得巨大收益。

最後,我們運維人員也會像碼頭工人一樣,需要改變我們的技術工作內容與深度,否則就會被下崗。

嘉賓介紹

蔣君偉,優雲產品副總裁,IT運維領域的十年老兵,先後研發了網絡管理、系統管理、CMDB、ITSM等產品,並成功建設了國內多個全國性的網絡管理與運維管理項目。現從事優雲新一代數據中心運維產品研發工作,主要負責產品線規劃、核心技術研發、研發團隊建設與運維咨詢等工作。


Tags: 廣通 自動化 產品 通運 成本 優勢

文章來源:


ads
ads

相關文章
ads

相關文章

ad