1. 程式人生 > >大資料時代與精準運維

大資料時代與精準運維

本文根據高效運維專家群友文章整理併發布。

歡迎關注“高效運維”公眾號,以搶先賞閱誠意滿滿的各種原創文章。

作者簡介

李鵬

北京中煙資訊科技有限公司,中國資訊科技服務標準技術委員會專家,IT運維實驗室行業專家,ISO20000國際認證管理師,《IT運維之道》作者,從事IT安全及運維管理工作近二十年。

近年致力於提升中國本土企業IT治理水平,堅持倡導運用國際先進的IT服務管理理念,結合企業實際開展IT系統的安全及運維管理。

精準運維

引言

隨著科技的進步,我們正步入一個新的時代,新常態下,由重視數量到更注重質量,以創新做為推動力,網際網路+、工業4.0、中國製造2025、以及大資料、雲端計算科技迸發出全新活力。

以人為本的智慧時代就要到來:智慧連線、智慧服務、智慧製造,“連線一切,充分感知”

是這個時代的特徵。

因此,利用這個時代的特定服務,企業家們精準掌舵,站在風口上的人,註定將是大時代的弄潮人。

一、什麼是大資料

大資料,就是隨著資訊化技術的發展,特別是網際網路技術的發展,積累下的大量的資訊資料資產,這些資產具有四個特點:

第一,資料體量巨大。從TB級別,躍升到PB級別

第二,資料型別繁多。前文提到的網路日誌、視訊、圖片、地理位置資訊等等

第三,處理速度快,1秒定律,可從各種型別的資料中快速獲得高價值的資訊,這一點是和傳統的資料探勘技術有著本質的不同

第四,只要合理利用資料並對其進行準確的分析,我們將會獲得高價值回報

業界將這四個特點歸納為4個“V”, 亦即:

  • Volume(資料體量大)
  • Variety(資料型別繁多)
  • Velocity(處理速度快)
  • Value(價值密度低)

大資料分析最早來源於運維人的日誌分析,但之後人們發現這些資料蘊涵著非常大的價值,並逐步發展到對各種業務資料的分析,

當前,大資料的處理分析正逐漸成為新一代資訊科技融合應用的結點,大資料成為資訊產業持續高速增長的新引擎,對它的有效利用亦將成為提高企業核心競爭力的關鍵因素。

另一方面,大資料時代科學研究的方法也將發生重大改變

在大資料時代,可通過實時監測、跟蹤研究物件在網際網路上產生的海量行為資料, 進行挖掘分析,揭示出其中蘊藏的規律、提出研究結論和對策。

二、精準運維及其與大資料的關係

什麼是運維?

所謂運維,既可理解為資訊系統的執行維護,又可理解為IT業務的運營及維護工作,兩種理解都正確,只是適用的企業型別不一樣:

前者是傳統的理解,主要適用於一些大型傳統企業和IT業界傳統作業部分

後者的理解更活躍在一批IT服務的創新企業裡,他們更需要企業的經營與使用者的需求同步

什麼是精準運維?

精準運維

精準運維是一種IT服務方法,它是要讓IT運維服務圍繞被服務物件的業務來展開,進行同步心跳式的服務,而不是僅圍繞資訊系統本身(軟硬體)來服務,這在書籍《IT運維之道》有闡述。

作為執行維護,精準運維是通過一系列方法掌握服務物件的資訊系統特徵以及該資訊系統所服務的企業業務特徵,找準目標,把握企業執行脈搏,從而精準地規劃服務,同步應變,實現服務與業務的匹配。

作為運營維護,精準運維就是從業者以客戶為導向,讓業務與使用者的要求心跳同步,並確保支撐業務的資訊系統,隨需應變。

兩種理解作為精準運維沒有本質的差異,就是第一人稱還是第三人稱而已。

精準運維本質是要保持使用者的需求與業務心跳同步,以人為本,要達到的效果與四個因素有關,即人、軟體、硬體與環境,具體關聯如下圖所示:

精準運維

  • 應用軟體是指對業務的邏輯程式設計
  • 支撐軟體包括作業系統、中介軟體、開發工具、資料庫等
  • 硬體包括:客戶端裝置、伺服器、網路設施
  • 環境包括機房設施等
  • 人員主要指開發和運營維護的企業員工。

從圖上我們可以看到,前面的因素對後面的因素提出要求,而後面對前面產生影響。

使用者或客戶對系統的要求是通過對業務的要求來實現的,而使用者對業務的要求又是動態的,還各有特色,如果後臺準備不足,就可能導致滿意度下降,甚至流失客戶。

這個特性在網際網路行業尤為突出:網際網路企業更重視使用者體驗,資訊系統本身的易用性差或穩定性低往往直接影響使用者體驗,進而對企業的使用者群體規模產生致命的影響。

值得一提的是,網際網路企業一般客戶與使用者是一致的,傳統企業則不一定。

因此網際網路企業對大資料的應用,是要建立在充分感知被服務物件的業務情況,並能預測業務情況的基礎上的。

要掌握使用者的對業務的動態要求,甚至預測和引導使用者的行為,就需要大資料來幫忙,找出關聯性,發現趨勢並引領趨勢,即大資料可以輔助實現精準運維,使其更加精、更加準。

三、為什麼企業需要精準運維

在以人為本的時代,雖然客戶是上帝,但“上帝”除了儘量滿足還需要合理引導。我們說決定客戶滿意度的因素一般有三:

  1. 是客戶或使用者的慾望和要求,
  2. 是競爭對手的情況與態勢,
  3. 是自身的水平與實力。

1和2均為外部因素,只有3是內部因素。

根據實踐經驗我們發現:滿足、引導和控制外部並提升內部是提高滿意度的最佳之法。

當然。內外密切相關,提升內部必須是圍繞外部的,而只有對外部的情況準確掌握,才能做到對外部的滿足、引導與控制。

所以,目前一切的智慧活動都是基於“明白”這個概念出發的,明白客戶(使用者),明白對手,這樣才能做到貼心服務。

這是一個以人為本的社會,如何明白人們的心思,那就是所謂的“察言觀色”。

怎樣察言觀色呢?

道理很簡單,因為人們在家庭和社會活動中留下許多痕跡,這些痕跡資料,就是企業來判斷客戶或者使用者行為的依據,這些大資料加上合適的分析,能幫助我們隨需應變。

現在網際網路、移動網際網路、物聯網正在逐步成熟,一些巨型的傳統企業或IT服務企業,如:騰訊、阿里、百度、京東、google、amazon、中國電網、銀行等,具備了這樣的分析條件。

正如我在《IT運維之道》中提到的:大部分IT系統在設計和開發階段,受開發週期、執行效率和成本等因素的影響,都不可能做到無限柔性;要做到隨需應變,就需要運維工作來幫忙。當然,這對運維工作本身也提出了較高的要求:

首先,運維不僅僅是執行維護而是運營維護, 需要全面、準確把握業務需求;

其次,運維工作需要精準,將業務需求和資訊系統效能、功能等進行匹配度分析,為系統升級改造、優化完善提供依據和解決方案;

再次,要對運營過程中的大資料從業務角度進行精準分析,從而找到新的業務增長點或改進方向。

精準運維有助於我們的企業服務精準化、個性化、甚至引領潮流化,使企業強者恆強。

當前,網際網路企業正處於爭奪“入口”戰的白熱化階段:

是網際網路正在顛覆傳統資訊獲取、生活消費以及商務方式的入口渠道

是面臨眾多網際網路企業搶奪的現實,而且網際網路企業扁平化程度越來越高

如何成為第一、穩住第一,都是CEO思考的課題。

質量、速度、成本是網際網路企業產品的主要考量。

網際網路企業的產品從策劃、設計、研發、上線、運營都要考慮這三個問題。這裡的質量是廣義的質量,包含了使用者的熱度。

所以作為運營維護人一開始就要參加到整個週期中,並把控全域性,才能真正與使用者的需求心跳同步,精準運維。

經典案例分析:

精準運維

2015年微信發紅包,除夕搖一搖總次數110億次,峰值1400萬次/秒,8.1億次每分鐘,微信紅包收發達10.1億次!

驚人數字再次讓人們好奇,2015年微信紅包方式與去年使用者與使用者之間互發紅包相比,搖紅包的方式對業務量來說是一個極大的爆發,光是除夕10:30送出的一波紅包就達到了1.2億個,已經是2014年除夕夜峰值的4800倍之巨 (2014年峰值每分鐘被拆開紅包數量僅2.5W個) !

大量使用者在同一時間搖紅包,瞬間產生每秒千萬級的請求,這個量級的請求如果不加以疏導處理直接到達後臺,必定會導致後端服務過載甚至崩潰。

微信後臺運維團隊主要通過三大應對策略應對:有損服務,柔性可用,大系統小做

我們在驚歎騰訊再次創造奇蹟的同時,仔細想想,哪些可損、哪些可柔、哪些可小做?

微信搖紅包是個業務,實現這個業務的是它的資訊系統,就是說配什麼樣的員工、用什麼樣的硬體、怎樣的應用更合理,需要什麼樣的環境,這些決策都需要基於預測使用者的群體意識,決定保哪部分業務,對應的資源怎麼調整,都與大資料有關。

四、企業怎樣做好精準運維

1. 傳統企業

傳統企業運維的關注重點是在安全、許可權管理等方面,以及舊IT資產利用率,如何利用好現有的IT資產是他們目前迫切需要解決的問題。

傳統企業的內網,使用大量的小型機(IBM Power小型機、HP小型機、Sun小型機等)、高階網路和儲存裝置(Cisco、EMC、日立等),使用大量的商業資料庫、ERP和中介軟體技術(IBM DB2、Oracle、SAP等)。

企業的核心業務運行於這些裝置和軟體之上,業務年限長、歷史遺留問題多,資料安全、業務連續性等是這些企業的生命線。

在運維方面,傳統企業往往通過購買廠商和整合商(即第三方)的服務來保證其IT業務的穩定性。

那麼,傳統企業如何做好精準運維呢?主要有三個關鍵點,具體如下:

企業高層要有戰略高度,能夠意識到業務的發展與資訊系統的執行休慼相關,並重視精準運維在促進業務發展中的重要作用;

引入一個專業的運維團隊(這個團隊往往是第三方專業運維服務商),能夠協助本企業蒐集業務需求以及與資訊系統密切相關的人、軟體、硬體、環境等資訊,並進行資訊系統與業務的匹配度分析,進而提出對資訊系統的優化建議;

企業根據上述優化建議進行綜合評估,從成本效益角度選擇部分或全部予以實施,並由專業運維團隊來跟蹤實施效果。

2.網際網路企業

對於網際網路企業的運維,如何快速有效地部署、如何保證可利用率、如何處理大併發訪問等是他們的頭等要事。

現代的網際網路企業,大量使用PC伺服器、普通硬碟盤陣和叢集、先進的SSD技術、大量使用Linux、MySQL等開源軟體。業務模式單一,軟體技術、硬體裝置更替迅速。

效能優化、部署靈活、提升IT硬體利用率是他們的工作重點,業務領先的網際網路企業背後都有一個強大的IT運維技術團隊,而這個運維技術團隊往往是網際網路企業內部的一個資訊部門或運維部門。

對於網際網路企業來說,要做好精準運維,主要關注以下幾個方面:

企業高層要把握大生態環境,要時刻關注使用者體驗和發展趨勢,並將其作為業務發展的一個重要任務來抓。

企業內部的專業技術團隊要開展大資料分析,要掌握使用者對業務的動態要求,並預測和引導使用者的行為,通過大資料來輔助開展精確預測。同時,將預測結果轉化為對資訊系統的需求,包括人員、軟體、硬體、環境需求等,從而提出效能提升和服務創新的優化建議。

根據內部專業技術團隊的優化建議,進行系統性能的優化或新服務產品的設計,以精確匹配使用者需求。

展望未來,“連線一切”將是一個時尚的詞句,物物相連,人人相連,人物相連。

精準運維

在這個巨大且複雜的網路中,以大資料、雲端計算為基礎的智慧感知世界,就在未來十年誕生,讓我們張開雙臂,擁抱未來,以大資料為基礎,精準感知、精準運維。

未來,我們是主人。

據說,你離運維高手之間,只差一個“置頂”的距離?!

“置頂”高效運維公眾號,搶鮮賞閱各類好文章。

怎麼“置頂”?看下圖:

filehelper_1464331777008_46

文/高效運維公眾號