1. 程式人生 > >IT Operations(IT 運營),運維的更價值化認識

IT Operations(IT 運營),運維的更價值化認識

一直想努力向別人(甚至包括從事運維的人)解釋清楚什麼是運維,發現很難!

6月20號,在InfoQ高效運維群裡面,對運維創業做了一次激烈的討論,很自然地,過程中不可避免的談到運維苦逼和運維無法產品化的問題,這是一些運維需要說服自己,證明自己價值的問題。對於本人來說,運維的價值不容置疑,只要我們運維人能自我認識突破,更體系化的站在業務角度看待運維價值問題,那我們就不是一個苦逼的成本部門。此時我自然的想到了【IT運營】,它帶來的視界會更加開闊,能夠幫助更好的重新認識運維。

一、運維是什麼

運維從IT軟體工程的階段論來說,一般分為使用者需求階段、軟體開發實現、軟體測試和軟體維護幾個階段。因此很多人就把運維粗暴地解讀為執行+維護

。不過慶幸的是,運維人自己已經認為我們不是簡單的維護角色了。維護的角色是一種職能化的表述,意味著你是郵件工程師、伺服器工程師、網路工程師等等。

其實運維對應的英語單詞是Operations,而不是Maintenance。Operations有“操作、運營”的意思,一般會和IT一起出現,稱之為IT Operations(IT運營),也就是我們現在說的運維,Maintenance只是一個維護的定位,早已退化。

二、什麼是IT運營(運維)

顯然從階段論的角度來看運維,無法概括運維的全貌,所以自己一直和別人說運維就是IT運營,那什麼是IT運營?以下是我做了一個產品通路的分解,然後分解出一條技術運營的主線。

當用戶的需求被識別出來之後,這個時候必然會產生兩種需求:一類是使用者需求的功能性描述,一類是使用者產品的技術實現描述

。接下來從不同的需求出發,此時會產生產品運營和技術運營的要求。技術運營一定是基於技術產品和業務產品中的技術部分,包括基礎平臺產品(網路、機房、伺服器、DNS)、應用產品(application、協議)。為了確保它們能夠滿足業務的目標,運維需要提供多種保障措施,比如說構建自動化平臺(配置管理、排程平臺、IT產品管理平臺)和技術產品資料運營平臺(監控、應用效能管理、能力管理等等)。以上的分解思路,可以解釋運維是否需要構建大資料平臺,且和產品大資料平臺的差異點與邊界。

IT運營和產品運營很多落腳點是類似的,也是一種持續改進和閉環的策略,講產品的生命週期管理和優化,產品說,我是為了提供給使用者更好的服務或者價值;技術運營(即運維)說,我也是為了提供給使用者更好的服務或者價值。真的如此麼?那我們在看看什麼是使用者的價值。

對於使用者來說,一種更低成本更高質量的服務才是他們需要的,因此把使用者價值分成多個維度的描述,有產品功能和特性需求側的,有使用者體驗側的,有成本方面的(如上圖)。由此也可以看出很多的使用者價值訴求都會轉換成對軟體產品技術的需求,這類技術需求實現之後,需要運營手段來保證和持續改進。

在業務網際網路化的今天,使用者獲得同質服務的觸點變得越來越多,如何讓自家的業務脫穎而出,一方面考驗產品運營能力,另外一個方面更是在考驗技術運營的能力。在小米推出米聊後不久,騰訊就迅速推出微信,這是騰訊後臺技術架構對業務的敏捷支援;在有相同功能的兩個網際網路產品選擇下,你一定會選擇那個訪問快(速度),並且可用性高,易用性好的產品,特別是速度。在過去的工作中,可以列舉很多IT運營能力不足而影響業務發展的例子。

Gartner早期還有一個關於IT價值的模型描述,會有稍稍不同,列出供參考:

在這個模型圖裡面,關於IT產生的價值指標也非常明確,完全的導向了業務價值,比如說經濟性、質量、敏捷性、客戶滿意度和商業貢獻度等等。

  • 經濟性。包含了投入成本、產出效率和生產率。

  • 質量。包含了可用性、相應時間,交易速度等等。

  • 敏捷性。IT對於業務變化的適應性和調整的速率,一個好的IT業務架構應該能夠適應業務的變化,從而快速對市場相應決策。

  • 客戶滿意度。可以各個渠道收集客戶的意見,比如說appstore,產品論壇,客服,CRM渠道等等。

  • 商業貢獻度。提供更多的商業價值,比如說更大的市場份額,更多的使用者獲取,更高的市場佔有率。

說這麼多,是想改變大家對運維的一個錯誤認識----運維是成本部門,而非收益部門。在一個分散式的x86的複雜架構環境中,如果沒有運維部門的統一規劃和管理,等於一個樂隊少了指揮,其技術建設、管理和運營肯定會陷入混亂,最終影響的是使用我們產品的使用者。

三、什麼是IT運營管理

IT運營管理,IT Operations Management(ITOM),其中最經典的描述是還來自於Gartner的經典解釋。Gartner從一個更全域性、更巨集觀的視野來分析了ITOM的組成及其趨勢。Gartner每年會發布多個領域的hype cycle的報告,hype clye是一種分析方法,把一個領域涉及的技術從誕生、發展、成熟等多個過程在一張圖中描述出來,並且預估它未來會爆發的時間表。從圖中的組成部分,可以看到IT運營的全貌,會涉及到ITOM的多個方面,2013年的報告內容如下(來自於Chuck Henry的一篇PPT分享)。



橫座標不解釋了,大家可以自己查查英語單詞,加深一下印象,另外不同的形狀標示著未來爆發的時間週期。比如說ITIL處於幻滅期,它的再次爆發至少要5到10年。

從這個PPT頁面中,你可以看到很多個方向,比如說DevOps、ITIL、APM、IT能力管理、配置管理、CMDB等等,你能說它們和你運維無關麼?其實做過網際網路運維的人都或多或少的知道上面圖形中術語的意思,因為很多都和我們日常的工作相關,有些是在執行ITIL的過程中接觸到的,比如說IT service catalog、CMDB;有些是在DevOps實踐中接觸到的,比如Application Release Automation,當然全域性的DevOps會包含更多哈;有些是我們在做資料分析的時候接觸到的,比如說Service-Level Reporting tool,Capacity Planning and Management。

這麼多方向如要落地實施,一定是運維部門主導建設的,或許大家已經這麼幹了,此時你難道還說運維就是一個苦逼打雜的,運維沒有價值的?ITOM可以幫我們更全面的去看待運維。不過切忌照搬哈。

四、IT運營的目標衡量

IT運營物件是技術產品,它的特性決定了IT運營的要求和策略的不同,歸納總結有如下:

1、功能性

軟體提供的功能是否滿足了使用者需要?這個地方還有很多個維度可以衡量裡面有是否提供了正確的功能(適合性)、適合使用者需求的功能(正確性)、安全的功能(安全性)等等。

2、可靠性

軟體的執行是否可靠的?可以通過可用性指標來衡量,可用性的指標在上一篇文章結合故障有談到過如何計算。典型的兩個很衡量維度就是容錯性和可恢復性。前者將對故障的容錯處理能力(要麼不出故障),後者對出現故障之後的恢復能力(出故障後,要麼快速恢復)。

3、易用性

易用性是一種產品化的能力,可以體現在產品是否能夠被使用者快速理解的,能夠易於使用的,且操作友好的。不要讓使用者拿到一個產品之後,自己捉摸該如何操作,對於某個核心功能來說,操作的深度很深。操作友好就體現著相同的產品功能下,設計的不同,給使用者帶來的操作複雜度是完全不同的。同是紅包功能,微信紅包、QQ紅包、支付寶紅包給使用者帶來的易用性完全不同。

4、效率

體現在面向使用者的產品交付速度和內部IT支撐服務的響應速度。前者效率體現者使用者等待新功能/新特性需要付出的時間成本;後者體現在內部IT支援需要付出的時間成本,在業務量出現增長的情況下,我們需要多少時間能夠把支撐的資源提供到位。效率維度基本上都是DevOps自動化解決方案的範疇。

5、可維護性

可監控性。對於一個複雜架構,是否具備可監控的能力,它是一種能夠幫助你快速發現故障,快速定位故障直至恢復故障的能力。

可變更性。架構的變更能力非常重要,如果一個架構引入變更就需要對使用者服務產生中斷或者影響的話,說明這個架構是有不足的或者變更方案設計是不足的。

容錯性。是一種容錯的能力,特別是一些非期望錯誤的容錯能力,這個在前期的設計準則中需要考慮到一些不可靠性的設定,比如說網路不可靠、硬體不可靠等等。同時對於一些未知的錯誤,提供自動的降級服務或者容錯服務能力。

如何實現可監控性?個人覺得首先要有一個監控平臺,其次監控平臺需要有采集一切資料的能力,且能自動分析資料的關聯,最後才是通過資料實現端到端的監控能力。

可變更性和容錯性,是在架構設計和實現的階段,就要考慮後續對運維友好,設計和實現一個彈性可擴充套件服務架構對運維來說非常重要,資料解耦和服務解耦是優先要考慮的原則。舉個例子,對於一個使用者註冊的功能來說,可以有URI和域名兩種實現方案來區分服務,顯然前者的區分對運維不友好,當因為容量的問題,要實現註冊核心業務分離的時候,需要在七層代理服務上按照URI進行服務轉發,而採用域名的解決方案,則簡單許多,DNS指向修改即可。

6、可移植性

是IT產品的可遷移性,一則就涉及到IT技術產品的選型問題,當你選擇的IT技術產品開源和公共化程度越高,遷移的成本就越低。公有云服務很多都是基於開源協議的實現,就是一個典型的例子,確保使用者的技術產品能夠無縫切入到公有云;

其次要考慮雲端的服務遷移能力,包含了公有云之間的遷移能力(顯然目前不具備)和私有IT環境向雲端服務遷移的能力。


有了這些特性維度,基本上就有了IT運營的資料體系,做好IT運營,就是不斷去挖掘技術產品所產生的日誌和資料,去衡量IT技術產品的現狀以及未來的運營優化的方向。不過要注意的是在可維護性裡面不僅僅是度量這麼簡單,還有自動化平臺建設來滿足可變更性的要求,它的直接衡量指標就是之前提到的變更延時。

很多時候,我們會擔心運維做久了,特別是運維被瑣事和故障所牽繞的情況下,會忘了我們還能做什麼,更是忘了我們其實是從IT運營而來,從IT運營的角度看運維,特別是和ITOM結合起來去看運維,帶來的感覺又完全不同:

第一、平時運維的工作層面到底還有多少提煉和認識不夠的地方(以ITOM為對標)?同樣是做應用效能管理APM,程式碼級效能管理是不是唯一的方法,結合網際網路還有哪些實踐,他們之間的互補又在哪兒?能力管理的必要性是在哪兒?如何建設能力管理系統,從能力管理的三個層次來看,他們的成本和收益是什麼樣的?我把這些概括為運維的內在思考

第二、不斷去思考運維帶來的業務價值。從之前的討論中都可以看到運維的最終價值點,它們都有一個業務價值的通用描述,我們是否有結合自己的業務仔細思考過,提煉過?我把這些又概括為運維的外在思考

當我們把其內在和外在都思考清楚了,其實也就是把運維的某方面思考清楚了,此時我們結合行業的特點去做運維,提煉最佳實踐,是不是意味著運維更有價值了?

注:這篇文章還可以談談IT運營的方法和策略,但是限於篇幅,不作深入展開!

相關推薦

IT Operations(IT 運營價值認識

一直想努力向別人(甚至包括從事運維的人)解釋清楚什麼是運維,發現很難!6月20號,在InfoQ高效運維群裡面,對運維創業做了一次激烈的討論,很自然地,過程中不可避免的談到運維苦逼和運維無法產品化的問題,這是一些運維需要說服自己,證明自己價值的問題。對於本人來說,運維的價值不容置疑,只要我們運維人能自我認識突破

一目了然“之IT可視不再說難!

it運維 運維可視化 服務流程管理 運維軟件 勤智數碼 前言可視化,就是把復雜抽象的數據信息,以合適的視覺元素及視角去呈現,方便大家理解、記憶、傳遞!這裏,我們來聊聊IT運維可視化。 關於IT運維可視化,我認為是將整個運維過程的關鍵環節或重要環節,比如運維看不見但又必須管的”數據黑匣子“,

IT技術開發資源站---小公舉網站導航測試版

IT技術運維開發資源站網站導航:dh.gaopengju.cn網站導航:dh.gaopengju.cn網站導航:dh.gaopengju.cnIT技術,運維,開發資源站---小公舉網站導航測試版

數據中心服務器保養秘笈人工必備

好友 設備 電池 並發 兩個 操作 處理 協調 實際應用 服務器目前的應用越來越高,相關的一些服務器硬件知識相信很多人都了解的非常透徹了。那麽,對於服務器的養護大家又知道多少呢?在此,3A網絡小錢今天將自己了解的一些東西展示給大家,一是希望給大家作一個基礎的參考,二是企盼能

容器技術部署快高效的發展就來自睿雲智合(Wise2C

容器技術部署運維更快高效的發展就來自睿雲智合(wise2c) 隨著Docker的日趨成熟,容器技術在全球範圍內的應用越來越廣泛,國內的企業IT對於容器技術也從過去的試用調研轉向現在的真正落地。睿雲智合(Wise2C)將密切追蹤這一領域的技術發展趨勢,憑借業界領先的產品以及豐富的落地經驗為國內企業提供專業

可視由繁

itil it服務通道 it服務 運維可視化 互聯網的迅猛發展使信息系統建設加快、規模變大,不同的信息系統中設備類型和數量增多,網絡結構日益復雜,導致系統故障無法精確定位、系統狀態難以實時掌握等問題時有發生,這些都給運維人員帶來了很大的工作壓力。可視化技術的應用,改變了傳統的人工運維,讓運維由

java精品高級架構課RocketMQ中間件Mysql分布式集群服務架構架構視頻教程

大型 mys 互聯網公司 課程 enter 20px hcl 理解 bin 14套java精品高級架構課,緩存架構,深入Jvm虛擬機,全文檢索Elasticsearch,Dubbo分布式Restful 服務,並發原理編程,SpringBoot,SpringCloud,Ro

Linux學習筆記(二十九日常

日常運維一、查看系統負載w/uptime 查看系統負載 load average後指系統在一分鐘,五分鐘,十五分鐘內的運行狀態,平均有多少服務在運行負載值大於邏輯cpu數就說明超負荷了,數值小於cpu數是理想狀態 cat /proc/cpuinfo 查看cpu核數processor 後的數字就是cpu數量減一

Linux學習筆記(三十日常

free一、iostat、freeiostat -x 磁盤使用rrqm/s: 每秒進行 merge 的讀操作數目。即 delta(rmerge)/swrqm/s: 每秒進行 merge 的寫操作數目。即 delta(wmerge)/sr/s: 每秒完成

Linux學習筆記(三十一日常

ifconfig一、linux網絡相關、 ifconfig ifconfig //查看網卡ip(yum install net-tools) ifup ens33/ifdown ens33 //開啟網卡,關閉網卡,只有一個網卡時,一旦關閉了網卡就會斷開遠程鏈接,只能去服務器主機重新打

讓您的可預期(二 - ECS系統事件支持歷史事件查詢

控制臺摘要: 主動運維又填新功能,全部事件頁登場,您可以查看您的實例以及磁盤所發生的歷史系統事件,有助於您對資源有個更全面清晰的掌控。背景數月前,我們推出了新的功能:讓您的運維更可預期(一) - ECS系統事件支持用戶自助重啟和預約操作 。有了這個功能,當您的雲服務器所在的物理機硬件可能存在安全風險需要遷移的

第19章自動化之系統安裝

imp hat 如果 發型 disco mini 設備 umount main 更多內容請點擊:Linux學習從入門到打死也不放棄,完全筆記整理(持續更新,求收藏,求點贊~~~~) http://blog.51cto.com/13683480/2095439第19章,運維自

Linux學習總結(七十三自動化之saltstack

配置文件 創建 運維工具 shell腳本 就是 數據庫 同步 service 方便 1 認識自動化運維 傳統運維效率低,大多工作人為完成傳統運維工作繁瑣,容易出錯傳統運維每日重復做相同的事情傳統運維沒有標準化流程傳統運維的腳本繁多,不能方便管理自動化運維就是要解決上面所有問

IT人永遠不老老程序員價值何在?

邊際 不一定 技能 貴的 足夠 國內 其它 需要 以及 IT人永遠不老?做夢,怎麽可能。無論你現在是多麽風華正茂,青春洋溢,終有成熟、老去的那天。 但是,人的身體可以變老,人的精神面貌、心態卻真的可以“歸來仍是少年”,只要你心不老,保持著對生活、對世界的好奇心和進取心,眼光

Kubernetes實戰 高可用叢集搭建配置與應用

1-1 K8S導學 1-2 搭建K8S叢集步驟和要點介紹 1-3 搭建三節點Ubuntu環境 1-4 安裝容器引擎 1-5 下載Kubeadm、node元件和命令列工具 1-6 向叢集中加入worker節點 1-7 安裝dashboard和heapste

奇碩:使用網易雲服務成本降低50%

2018年上半年,我國電子商務發展仍保持較高增速,前5個月網上零售額總額達到32691億元,首次在1-5月份突破3萬億。當下零售業的快速增長不僅拉動了專注泛零售資料分析的科技公司發展,同時也為第三方資料分析公司帶來急需快速擴充IT資源的挑戰。 以上海奇碩網路科技(下簡稱奇碩)為例,作為零售企業一

釋出國內首個無伺服器容器服務效率從未如此高效

近年來,隨著越來越多的企業基於微服務架構構建自身核心業務平臺後,微服務已獲得越來越多技術人員的肯定,同時,微服務也承載著企業數字化轉型的重任。但微服務架構的落地給企業的運維團隊帶來了不少的挑戰,原有的運維方式和工具已無法滿足微服務架構的需求。例如: 微服務架構下的應用管理難微服務架構相比之前煙囪式的

發布國內首個無服務器容器服務效率從未如此高效

物理機 交互 煙囪 智能 uber motion 物理 一次 流程 近年來,隨著越來越多的企業基於微服務架構構建自身核心業務平臺後,微服務已獲得越來越多技術人員的肯定,同時,微服務也承載著企業數字化轉型的重任。但微服務架構的落地給企業的運維團隊帶來了不少的挑戰,原有的運維方

陣列(隨機生成一陣列陣列的概念和題目設計(利用二陣列 :任意給定分數去計算科目和人均平均分

1 //陣列間的關係arr[]中的數字為幾,[]內就有幾個數 2 //{ }內的數是從0開始,如需要列印應從0開數 3 如{2,6,9,8,7}列印arr[4]就是7 4 #include <stdio.h> 5 #include <stdlib.h> 6 int

IT人永遠不老老程式設計師價值何在?

IT人永遠不老?做夢,怎麼可能。無論你現在是多麼風華正茂,青春洋溢,終有成熟、老去的那天。 但是,人的身體可以變老,人的精神面貌、心態卻真的可以“歸來仍是少年”,只要你心不老,保持著對生活、對世界的好奇心和進取心,眼光和狀態就會不同。 首先,你要對資本的殘酷性有