1. 程式人生 > >IT運維人員必看!超全資訊化建設之運維資料

IT運維人員必看!超全資訊化建設之運維資料

隨著IT建設的不斷深入和完善,計算機硬軟體系統的執行維護已經成為了各行各業各單位領導和資訊服務部門普遍關注和不堪重負的問題,據統計,IT運維服務佔到IT部門工作量的80%左右。IT運維普遍存在以下現象: 

1IT運維工作忙而不受重視。 

IT運維服務人員工作的一個普遍現象是“很忙碌,坐不下”,每個IT運維服務人員都很忙碌,到處在各個業務部門間解決和處理問題,就像“救火員”。雖然如此忙碌,但業務人員還是經常抱怨“找不到人”、“解決問題太慢”等等。IT運維服務人員的工作始終得不到業務部門的認可,而且工作量也難以量化。運維或資訊部門作為單位的業務支撐部門,在資訊系統的戰略規劃專案立項等工作中話語權較弱,更談不上決策權,往往是專案建設完成之後才介入系統的管理和維護,等到發現問題為時已晚。 


2IT系統複雜,維護難度高,風險壓力大。 

隨著組織資訊化的不斷投入,組織的硬體設施、軟體系統不斷增加,軟硬體裝置的增加在一定程度上增加IT運維的複雜性,包括各類開發系統、各類應用架構、不同品牌廠商裝置等等,需要不斷增加人力投入,IT運維成本居高不下。對業務連續性要求較高的單位,系統一旦宕機損失是巨大的,運維部門壓力可想而知。有的單位由於缺乏系統的資產管理,運維部門很難準確瞭解公司到底有多少IT資產,公司是否需要購置新機也缺少資料支撐。在年底審計時全團隊奮戰多日才能完成單位的IT資產清查工作,然而來年又會因為裝置報廢,或員工離職而發生很多變化,還是無法做到實時掌握準確資料。 

3技術人員難培養,流動性大。 


大多數時候,運維人員都在進行著簡單重複的工作,且很難得到終端使用者的肯定,他們私下用“碌碌無為”、“窮忙族”來形容自己,人心渙散,自我認可度低,團隊人員流動率較大。 情況往往是某人好不容易成為熟練工了,卻因為看不到職業前景或感覺不受重視而提出辭職。這些中堅力量的離職,會造成客戶滿意度和運維質量相當長一段時間內出現波動。 

4服務商難管理,技術水平參差不齊,服務不及時,有問題不能及時解決。 

IT運維服務外包存在一定風險,關鍵在於對於IT運維服務外包供應商的管理不到位,具體體現在招標環節疏於審查、過程監督環節疏於監管、以及事後評價環節疏於考核。通過在招標環節加強對供應商資質、能力水平、案例等考察可以有效包括准入關;通過在服務過程中加強監督可及時發現供應商服務提供能力的異常;通過事後評價可以建立供應商的退出機制,保證供應商提供優秀的服務。 


IT運維服務問題分析 

從以上現象可以看出,IT運維服務的所有問題的根源都不是技術問題,而是管理問題,包括流程管理的問題、評價管理的問題、應急管理的問題等等。主要包括: 

1IT運維服務管理方式缺乏創新。 

IT 運維服務管理方式包括自營管理和外包管理,隨著IT系統複雜程度的增加,對於IT運維能力的要求也越來越高,自營服務的成本已遠遠大於外包服務的成本,在某些非關鍵的領域,應該引入IT運維服務外包這一創新管理模式以降低服務成本,同時將組織自身的IT運維人員解放出來,做更有價值和意義的工作。 

2IT運維服務管理不規範。 

IT運維服務人員很忙碌卻得不到業務部門認可的根本原因是雙方缺少IT運維服務溝通的基本語言,也就是IT運維服務管理規範不明確,導致業務部門對於IT運維服務部門提供哪些服務不清晰、提供服務的流程不清晰、對於服務的評價指標不清晰,同時也導致IT運維服務人員工作職責不清晰、人員間工作交接不順暢、服務過程缺少監督等。 

3工作分工設計不合理,忽視梯隊建設。 

人員管理問題,根源在於運維工作分配不合理,業績無法考核。若將運維人員分成一、二、三線支援,不同運維人員各司其職,能使有限的運維力量得到合理利用,整體工作效率將明顯提升;同時也方便對各自的工作業績進行評估。再據此制定相應獎懲措施,或針對不同崗位提供不同服務技能培訓,亦能提高員工工作積極性。同時,加強運維團隊內部知識系統的建設,有利於沉澱內部知識積累,快速培訓新員工,減少核心員工離職帶來的衝擊。 

4IT運維服務供應商管理不到位。 

IT運維服務外包存在一定風險,關鍵在於對於IT運維服務外包供應商的管理不到位,具體體現在招標環節疏於審查、過程監督環節疏於監管、以及事後評價環節疏於考核。通過在招標環節加強對供應商資質、能力水平、案例等考察可以有效的對供應商的資格進行把關;通過在服務過程中加強監督可及時發現供應商服務提供能力的異常;通過事後評價可以建立供應商的退出機制,保證供應商提供優秀的服務。 

科學的IT運維服務管理之道 

IT運維服務包括自有運維、外包運維、自有與外包相結合的方式。下面將對兩種不同模式下的管理進行闡述。 

基於最佳實踐的IT運維管理 

1 ITIL概述 

IT運維管理作為IT服務管理的主要範疇,目前國際上的研究和論證比較成熟,主要成果包括ISO20000系列的國際標準以及ITIL最佳實踐方法論,兩者從理論基礎上是一致的,區別在於標準和標準的實踐。下面以ITIL為例介紹IT運維管理的最佳實踐。 

ITIL 是基於流程的方法論。IT部門可用其檢查是否用一種可控的和訓練有素的方法為終端使用者交付所需的IT服務。ITIL合併了一套最佳的實踐慣例,可適用於幾乎所有IT組織, 無論其規模大小, 或採取何種技術。ITIL被用來建立和交付服務管理流程;這些管理任務可被某些服務及系統管理工具所簡化。 

ITIL對IT服務管理實踐中涉及的許多重要問題進行了系統的分析, 包括全面的檢查清單(checklist)、任務、程式、責任等與任何IT服務組織密切相關的問題。這些概念的定義也涵蓋了大多數IT服務組織的主要行為。IT服務組織可以藉助ITIL的指導建立和拓展自己的IT服務流程。 

ITIL V3的核心設施是基於服務生命週期的, 服務生命週期框架下圖所示, 服務戰略是生命週期運轉的軸心;服務設計、服務轉換和服務運營是實施階段;服務改進則在於對服務的定位,基於戰略目標對有關的程序和專案的優化改進。 

2 ITIL五大模組 

ITIL V3包含的各模組內容如下: 

(1)服務戰略(Service Strategy) 

服務戰略為組織在設計、開發和實施服務管理從組織能力和戰略資產兩個戰略角度來提供指導。該部分內容提出了服務管理實踐過程中整個服務生命週期的策略、指南和過程。服務戰略是服務設計、服務轉換、服務運營和服務改進的基礎,它的主題包括了市場開發、、內部和外部的服務提供、服務資產、服務目錄,以及整個服務生命週期過程中戰略的實施。 

(2)服務設計(Service Design) 

服務設計描述了對服務及服務管理過程設計和開發的知道,它包括將戰略目標轉變成服務投資組合和服務資產的原則和方法,服務設計的範圍不僅限於新的服務,它還包括為保持和增加客戶價值而實行服務生命週期過程中必要的變更和改進,服務的連續性,服務水平的滿足,以及對標準,規則的遵從性。它指導組織如何開發設計服務管理的能力。 

(3)服務轉換(Service Transition) 

服務轉換為如何將新的或變更的服務轉換到運營過程中有關能力的開發和改進的指導,服務戰略需求通過服務設計進行編碼,而服務轉換則是探討如何將這種編碼有效匯入到服務運營的體系中,與此同時,還應控制失敗的風險和服務的中斷。 

(4)服務運營(Service Operation) 

服務運營包含了在服務運營方面的實踐,它對如何達到服務支援和交付的效果與效率,確保客戶與服務供應商的價值提供了指導,並最終通過服務運營實現戰略目標。 

(5)持續服務改進(Continual Service Improvement) 

服務改進為創造和保持客戶價值而用更優化的服務設計、轉換和運營提供指導。它結合了質量管理、變更管理和能力改進方面的原則、實踐和方法。組織要學會在服務質量、運營效率和業務連續性方面的不斷提高和改進意識。此外,它還為改進所取得的成就與服務戰略、服務設計和服務轉換之間如何建立關聯提供指導,為基於戴明環(PDCA)形成計劃性變更的閉環反饋系統的建立提供思路。 

3 ITIL關鍵流程 

在IT運維服務體系中,ITIL是一套基於流程的方法和規則。在組織資訊化建設中,ITIL可以指導資訊化部門向用戶提供更為高效可靠的服務。下面對這些關鍵流程進行簡要的介紹。 

(1)服務檯 

服務檯是使用者與IT部門進行溝通的唯一平臺。服務檯為使用者提供了服務聯絡點,利用這個聯絡點促進組織業務流程與服務管理基礎架構的整合。服務檯的主要設計目標是加強使用者與IT服務部門之間溝通,為組織的資訊化建設服務。 

(2)事件與故障管理 

事件與故障管理的主要功能包括對事件與故障進行記錄,分類,並安排專家管理故障處理的全過程。事件與故障管理的目標是在避免影響客戶和使用者業務的前提下讓IT系統能夠迅速恢復到安全級別。 

(3)問題管理 

問題管理流程是指通過事件發生的原因進行分析,制定問題的解決方案以及預防措施,降低因問題和事件而產生的消極影響。與故障管理單純強調故障的處理速度不同,問題管理模組的核心功能是找到事件發生的深層次原因,並相應的提出合理的解決方案防止問題的再次發生。 

(4)配置管理 

配置管理模組負責識別和確認系統配置項、記錄和報告配置項狀態和變更請求、檢驗配置項的正確性和完整性等活動。設定配置管理的主要目的在於為組織提供IT基礎架構的邏輯模型,對變更管理和釋出管理提供有效的支援。 

(5)變更管理 

變更管理是在最短的時間內完成系統架構,並在服務的任一方面發生變更時對其進行控制的服務管理流程。該模組的設計目標是確保在變更實施過程中使用標準的方法體系並提高變更的效率,並降低由業務變更導致的業務中斷對組織產生的影響。 

(6)釋出管理 

釋出管理流程負責對經過測試後匯入實際應用的新增或修改的配置項進行分發和宣傳。釋出管理之前進行的是軟體的控制和分發,該過程由變更管理流程進行管理。 

(7)服務級別的管理 

該項管理的目的在於為簽訂服務級別的協議而進行一系列活動所組成的服務管理流程,其中主要的活動包括協議的計劃、草擬、以及簽訂服務級別等方面。有效的服務級別管理可以保證IT服務質量在不提高成本的前提下能夠穩步提高。 

(8)IT服務財務管理 

IT服務財務管理模組主要是指IT服務過程中所需的成本進行預算和核算,根據預算情況向客戶收取相應的費用。所涉及的費用主要包括投資預算、服務成本的核算以及服務計費三部分。合理的財務管理以及計費方法可以通過量化服務成本降低開銷,避免風險的發生並引導客戶的合理行為。財務管理流程產生的預算和核算資訊可以為IT服務提供有效的輔助決策資訊。 

(9)IT服務持續性管理 

IT服務持續性管理指當系統發生故障時有可靠的技術、財務和管理資源保證組織的IT服務能夠正常執行。保持IT服務持續性的關鍵在於當故障發生時,系統仍可以提供預定級別的服務,從而確保系統的業務可以穩定持續的執行。 

(10)能力管理 

能力管理既考慮運營成本也考慮業務需求,對服務能力進行合理配置從而達到IT資源發揮最大效能的目的。該流程包括服務能力管理、業務能力管理和資源能力管理等方面。 

(11)可用性管理 

可用性管理流程通過分析使用者和業務方的可用性需求並以此為依據來優化和設計IT基礎架構的可用性,有效的可用性管理可以在控制成本的前提下提高系統的可用性。有效的可用性管理可以通過定位業務以及對使用者的可用性需求進行分析,從而使IT服務的設計能夠滿足使用者的需求,並且可以避免IT服務運作中可用性級別過高的情況發生,這一設計思想對於降低IT服務的運作成本具有重要意義。 


風險可控的IT運維服務外包 

IT外包是指組織為了實現自己的目標, 通過合同或協議的方式將部分或全部的資訊科技職能交由外部的服務提供商提供的一種管理模式。IT外包一般還伴隨著組織的IT 資產、人員、租賃資產交由IT 服務商管理。 

選擇IT外包有以下好處:專業公司提供的外包服務,比組織自身服務部門的工作更為高效、專業;利用第三方的資源和技術優勢,降低組織管理與執行成本;組織自身則集中精力發展其核心業務,增強核心競爭力;以組織業務特點定製的解決方案,完全人性化的整合及服務;單一的聯絡點,全面支援客戶眾多品牌的軟硬體產品,避免多廠商IT裝置條件下的協調成本等。 

1 IT運維服務外包的基本階段 

對於外包的客戶方組織而言,要成功實施 IT 外包服務,主要經過以下幾個階段: 

組織的內部分析和評估(準備階段) 

在這一階段,組織的高層管理者主要工作是確定外包的需求並制定實施的策略。要從外包中獲得效益,組織的最高決策層必須採取主動的態度,因為只有最高決策層才具有外包成功所必需的視角和推動變革的力量。 

選擇合適的外包商(選擇階段) 

在選擇外包商時,要先將自己要求的底線與外包商所能提供的服務進行比較。通過識別潛在的外包商,向外包商釋出資訊並邀請競標,接收和分析外包商的標書,審閱外包商的證明檔案,驗證他們在提供外包服務上的經驗與能力,甄選最終外包商並進行合同談判。 

完成內部服務向外包服務的過渡(過渡階段) 

該階段涉及到人事過渡、資源移交、工作場所變更、系統切換等過程。 

外包的實施和管理階段(整合階段) 

這一階段對外包關係進行管理,並就任何外包關係的維護與變化進行協商或者談判,加以實施。客戶在這一階段要保持對外包業務效能的隨時監測和評估,並及時與外包商交換意見,保證外包工作的順利進行。 

2 IT運維服務外包風險管理 

IT外包風險是由許多不確定因素造成的。其中可能涉及配合外包服務提供商的需求進行一些額外工作,包括協調成本、簽約金和監督外包商進展的支出,這些可能導致實際成本遠高於預期成本。另外,還有一些合同風險——在與外包服務提供商訂立合同時,如果條款說明不明確或者漏掉重要條款,都可能會讓組織遭受極大的損失。 

由於外包必然會涉及風險,因而在外包決策前必須對風險進行管理,進行風險評估,要辨別、分析風險並按照優先次序對其進行排序,考慮如何才能消除或減小風險,同時還要考慮在外包協議生效期間產生的管理費用。 

IT外包風險管理是指根據資訊資源對於組織的價值,對風險進行預測、識別、評估、分析,識別、評價組織的資訊資源的威脅和脆弱性,並在此基礎上有效地處置風險,從而使風險達到可接受的水平。主要包括以下幾個步驟: 

風險識別:識別和評估潛在的風險領域 
風險分析:分析外包關係可能會產生的風險 
風險排序:對風險的優先順序進行排序 
風險控制:考慮採用什麼樣的方法對它們進行管理與控制。 

3 IT運維服務外包合同管理 

外包合同管理是外包服務管理的一個重要組成部分。由於外包專案經常涉及到的交易金額龐大,而且外包服務對於組織的高效運營非常關鍵,因此需要專業的法律檔案支撐。合同應該靈活而又能夠解決交易中真正問題,使客戶和外包商雙方均受到保護,能對價值的創造和風險的管理起到支援作用。 

外包服務合同包括服務水平協議(SLA - Service Level Agreement)。外包合同一般為 5 年、10年。合同條款是外包服務中最重要的環節,合同條款制定的詳細程度和明確性直接影響合同的履行。合同條款涵蓋的內容非常全面,包括:合同的適用範圍和預期客戶資源需求、合同條件、基準及衡量辦法、有效期、終止原因、智慧財產權、合同轉讓、關鍵專案實施人員及補救辦法、未來價格靈活性、未來服務的靈活性、付款方式和時間、風險管理以及其它法律規定的合同必備條款。好的外包合同條款對合同中的工作有清楚的界定,能夠在雙方出現分歧時成為解決爭端的依據。 

4 IT運維服務外包關係管理 

在IT 服務外包中,合同是要求雙方履行承諾的主要約束力。然而僅靠合同並不能保證外包的成功。由於外包合同在多數情況下是不完善的,合同是逐步實施並且不斷變化的,所以在合同中不可能對外包服務需求的所有環節都做出具體的規定,如果客戶在外包職能範圍內出現新的需求,而且需求在合同中沒有做出具體規定,就無法靠合同解決。 

在這種關係下,客戶方需要與外包商建立起相互協作和相互理解的關係,這樣外包商才會對變化與額外的需求做出善意反應。因此,外包商和客戶之間的穩固關係顯然是長期業務外包關係成功的關鍵,也是解決外包中分歧的有效方法。 

要正確維繫與外包商之間的關係,需要進行關係管理。外包關係管理是指一整套能夠使外包關係運營的人事、流程、工具和系統。外包關係管理是組織確保實現合同價值的最重要的工作。 

實踐經驗顯示,成功實施外包關係管理的組織通常非常關注以下幾個關鍵成功因素: 

雙方協商的、可測量和可檢驗的客觀績效標準 

成功的外包關係焦點在結果而不在手段。需要制定客觀的績效度量標準,能夠保證結果的可度量性。只有通過與績效的客觀標準相比較,顧客才知道他們正在接受的服務正是期望獲得的服務,外包商才知道他們正在滿足顧客期望的需求。 

正式的關係管理結構 

正式的、多層次的關係管理結構可以將客戶和外包商連在一起。外包關係要求用它自己的管理結構去替代以前內部的管理系統,這種新型結構通常採用聯合管理團隊的形式。管理團隊或大型合同的多個管理團隊負責日常的、戰術和戰略方面的關係管理。每個團隊的職責、議程、會議頻度以及與其他團隊的關係都有明確的界定。這種關係管理結構建立起識別、解決問題的重要機制,能夠實現問題的及時上報、處理和解決。 

基於績效的定價標準 

基於績效的定價可以確保不斷地激勵外包商去達到或超越設定的績效標準。當績效超過標準時,就給予獎勵;當績效低於標準時,就給予處罰。對處於外包關係中的雙方的員工來說,這些激勵也可轉化為績效標準。把所有的基於績效的風險和收益轉換成個人的績效標準時有利於雙方關注焦點的適當調整。 

關於商業目標和關係管理的內部培訓及交流 

負責為顧客管理外包關係的員工應接受專門的職業培訓,包括全面理解合同的商業目標,雙方認可的具體的績效標準,以及他們個人的角色、職責、權力和報告結構。此外,終端使用者也應該接受適當的培訓,以理解商業的總體目標、問題的識別和解決方式、溝通的渠道等。培訓和交流也可以減少客戶可能存在的不滿或抵制情緒。 

知識和技能持續不斷的交流 

兩個組織之間持續不斷的、自由的知識和技能的交流是成功的外包管理的標誌。每方都有他們自己的特長,當這些特長被共享時,它不僅對雙方關係的成功有所貢獻,而且對己方的成功也有所貢獻。培訓計劃、崗位經驗、與專家交流、技術和工序都是有助於實現交流的具體方式。 

最佳實踐介紹 

完整的IT運維服務框架包括管理諮詢、外包服務以及工具服務,以IT運維諮詢服務為先導進行頂層設計,規範組織內部IT運維和IT外包業務;以IT運維外包為過程環節,實現IT運維的專業化和高效化;以IT運維服務工具為支撐,實現流程的固化和實時監測,提高IT運維服務的效率。總體框架圖如下: 

針對IT運維服務管理,國內外的大量實踐已經為我們提供了優秀的經驗。 

藉助第三方諮詢力量可有效實現IT運維服務管理最佳實踐落地 

很多客戶都希望加強自身內部的IT運維服務管理或者加強對IT外部服務的管控,但是苦於沒有經驗,在實際建設過程中出現設計不完善、不能落地的現象。實踐證明,通過引入第三方諮詢服務可以有效解決此問題。第三方諮詢服務依靠大量的服務實踐和成熟的實施方法論,可以幫助客戶在最短時間內實現適合客戶自身特點的IT運維服務管理體系的設計,並能輔導客戶實現管理體系與日常管理的有效融合,幫助客戶最大程度上發揮最佳實踐的功效。 

IT運維服務外包可實現IT運維成本與質量的平衡 

在IT運維服務過程中,很困擾客戶的一個問題就是業務對於IT運維服務質量的要求與IT運維服務能力和服務成本間的矛盾。伴隨著組織IT系統複雜程度的不斷增加,為保證IT運維服務質量,IT運維服務成本激增,如何來解決? 
通過引入IT運維服務外包,將部分或全部IT運維服務交付給專業的第三方IT運維服務提供商,可有效解決IT運維成本與運維質量的矛盾。
選擇IT外包有以下好處:專業公司提供的外包服務,比組織自身服務部門的工作更為高效、專業;利用第三方的資源和技術優勢,降低組織管理與執行成本;組織自身則集中精力發展其核心業務,增強核心競爭力。 

應用自動化巡檢工具能夠降低運維工作強度,提高巡檢效率 

資訊系統的運維工作,涉及對網路、業務應用、桌面、安全、告警、運維服務模組等上百個指標的檢查,對於這些指標的檢查如果通過人工巡檢的方式進行,巡檢效率低,並且可能出現漏檢、重檢的情況。 

自動巡檢時,巡檢中心按照巡檢表要求定時啟動巡檢;巡檢指令由介面卡接收並執行,並將檢查結果反饋到巡檢中心;巡檢中心實時展現當前巡檢過程執行情況,發現異常情況即以工單、告警等方式及時通知給應急維護人員;針對每次巡檢過程,能夠自動產生巡檢結果報告。對於所有歷史巡檢結果報告,支援按照多種查詢條件進行快速檢索。自動巡檢系統還能夠根據設定,定期自動產生統計分析和趨勢分析報告,支援高層領導決策。 

相對於人工巡檢,自動巡檢系統由中心和介面卡分工協作實現自動巡