1. 程式人生 > >“不是不需要運維工程師,是人人皆是運維”|對話阿裏雲MVP蔣爍渺(上)

“不是不需要運維工程師,是人人皆是運維”|對話阿裏雲MVP蔣爍渺(上)

ogl google搜索 href 大學 雲計算服務 依賴 生存 ceo 雲計算

摘要: 與湖畔大學首期學員、阿裏雲MVP、駐雲創始人蔣爍渺面對面

【三位阿裏雲MVP(駐雲CEO、首席架構師、大數據總監)《MVP時間》首次同臺授課,“湖畔第一大腦” 蔣爍渺領頭線上精講,內容涉及企業IT架構、混合雲存儲、大數據方案等實戰內容,從技術實戰到解決方案,難題痛點一次解透。聽課鏈接直戳:
第一節:雲時代企業IT智能診斷實踐與探索
第二節:企業IT架構雲化轉型挑戰與應對
第三節:混合雲場景下存儲實踐精講
第四節:雲管理服務技術要點和實踐精講
第五節:混合雲大數據實踐精講】

阿裏雲MVP、駐雲科技CEO蔣爍渺4月11日做客《MVP時間》,為大家分析在雲時代對於企業IT智能診斷的實踐與探索。本篇為上期,下期文檔直戳

1、 雲時代的大背景

屈指算來,雲計算已經進入了第二個十年。隨著下一代技術如數字業務、物聯網和人工智能的實現,雲計算已然是業務和IT的關鍵組成部分。雲技術正在從一個市場顛覆者演變為傳統和下一代IT中的主力軍。

技術分享圖片

需要強調的一點是,我們認為,真正意義上的雲計算就是公有雲。為什麽呢?

我們先從5G說起。展望未來,5G時代很快到來。大家都在展望伴隨5G時代的物聯網、邊緣計算、人工智能、AR/VR的大變革。而更為實際的,5G時代會發生的事情,是固定網絡逐步退出市場,正如之前固定電話慢慢從市場中推出那樣。每個人的手機電腦都會以無線網絡的方式接入到互聯網中。那個時候企業局域網就會消失,局域網消失以後,可能企業內網就消失了,或者說內網就是今天我們在雲上看到的VPC、虛擬專有雲或者虛擬私有網絡,到那個時刻,沒有局域網,又何來專有雲呢?

隨著5G的進入,雲計算的發展還是會非常長久的進行下去,直到大部分IT都轉入到雲計算時代,而那個時候可能會有新的東西出現。
換個角度,今天對於整個世界改變最大的力量是互聯網。未來每一個企業都是互聯網企業,雲就是互聯網基礎設施。所以說掌握雲計算的技術是非常重要的,未來不懂雲計算就沒有辦法在這個市場上生存,如果你是一個IT工程師的話。

2、 雲時代IT從業者的挑戰

雲時代的到來對於IT從業者來說帶來了極大的變革和挑戰。
雲計算大數據技術叠代更新,IT從業者需要掌握的技能更廣,還需跟上工作節奏。
傳統的我們經常會把工程師分成開發人員或者運維工程師、測試工程師,開發工程師又包括前端工程師,後端工程師等。而現在這樣的職業分工也產生了變化的趨勢。

記得前幾天有一篇文章說阿裏雲是不是會殺死運維,大家也知道有個耳熟能詳的詞語叫DevOps。這也說明了一個問題:雲計算廠商把IT基礎設施運營起來了,帶來了一個重大的變化:企業內部並不需要單純的運維工程師了。為什麽呢?一是因為DevOps的發展,二是因為雲計算帶來的極大便利使得很多運維工作被大大簡化。

舉例來說,絕大多數尚未建立完備開發體系的公司,它的開發工程師就可以通過RAM授權的子賬號,甚至主賬號進入雲的控制臺修改關鍵雲資源配置,比如對象存儲Bucket的修改。

因此,由於雲的分布式的變化,每一個工程師都可以通過API或者控制臺,快速的改變雲的現狀,包括配置信息的變更。這使得傳統的運維工作離散化了。某種程度上說,不是不需要運維工程師,而是人人皆運維。

在這樣的大背景下,傳統的運維工程師又何去何從呢?他們的職業發展也面臨著巨大的變化。
傳統意義上的運維工程師的主要工作,我們經常開玩笑說是搬箱子,插網線和裝系統三大件。

而今天面對雲,這三件事情都不用做了,因為你使用ECS鏡像服務器就裝好了,甚至你都不需要自己安裝MySQL,直接使用RDS就夠了。
因此傳統意義上運維工程師本身知識結構面臨著更新,從傳統意義上運維工程師要變成企業內部的雲管理員或者成為企業內部雲架構師,應該往這個方向去轉變。大家也可以到百度百科上看到雲管理員這個新職業的描述。

技術分享圖片

3、 雲時代企業IT管理的挑戰

為應對市場變化的快速響應,企業業務的復雜與變動並存,還需保障IT系統的穩定可靠。

1)除了故障,還有什麽更值得我們考慮?

企業將基礎設施甚至中間件使用了雲計算廠商提供的服務之後,如果雲服務出現了故障,我們可以根據SLA的條款,向雲廠商索賠。
因而在雲上,我們最需要擔心的不是雲服務的故障,或者說在雲上除了故障其實我們還有更多問題需要考慮。

舉兩個例子:

前段時間寶馬發生了數據泄漏,原因是它的開發工程師對AWS上存儲Bucket沒有進行任何安全限制,導致數據可以被任何人讀取,甚至包括Google搜索引擎。

系統本身並沒有出現故障,但是發現某些應用連接數或者是進程內存占有快速上升,存儲量快速上升,很可能是因為開發工程師的BUG,導致你要為雲計算廠商一個月多付好多錢,浪費了帶寬或者浪費了存儲。

為什麽這些問題不能提早發現呢?有以下幾個原因:

這些雲資源的管理本身非常繁瑣,往往因為工程師出差或者管理不善等原因,導致域名證書或者主機本身忘了續費,從而引起了業務的中斷。

工程師並不具備財務權,傳統職責在故障的發現和處理,而上述這些問題的管理並沒有得到足夠的重視。

因此,重要的問題不是故障,當你到故障那一刻的時候,那個問題已經不小了。

2)復雜、大量數據的挑戰

現今我們處在一個復雜的世界中。這個世界的數據不僅僅包含雲上的數據,還有你自己物理機房或者說外部的數據,甚至還有IOT,數字化的POS機等持續不斷產生的數據。

對一個企業來說,所面對的數據並不一定只是IT數據,大趨勢是所有數據最終都可能被匯聚到雲上。

3)信息孤立和不對稱性帶來的挑戰

傳統IT環境中通常會有一個IT部門負責技術保障,維護管理整個企業內部所有系統,但是隨著雲的時代到來,任何一個有開發能力或者有系統需求的業務團隊,都可以輕松買一兩臺雲主機,裝一個軟件或者開發一個小程序就可以不再依賴公司統一的IT管理,快速的將自己的業務跑起來。所以在這種情況下,雲不僅僅是一個分布式系統,它也使得企業的IT團隊,尤其在一些大企業,開始了有了分布式的傾向和趨勢。

在這種情況下,會造成一個問題,就是大家的信息可能會相對孤立和不對稱。每個企業的IT管理可能會發生隨時隨地變化,因為它有可能開在不同雲賬號下,有的一個企業有1000臺ECS,可能分布在10個團隊,每個團隊有100臺ECS,這種情況也會有大量的出現。

4)多雲和雲計算產品叠代更新快帶來的挑戰

很多企業都慢慢的開始上雲,甚至上多個雲。但是實際上不管是從大的產品功能角度小到API、備份功能或者一個主機的編碼,甚至一些非常非常小的控制參數,比如說備份或者是磁盤拍照等等東西,其實都是不太一樣的。

並且各個雲計算廠商的產品叠代更新都非常快,要管理的要素更多,甚至包括費用。

為了適應多雲環境和雲產品的叠代更新,需要企業投入更多的力量進行統一管理。

比方說因為公司的原因,需要同時用多個雲賬號,甚至多朵雲,分別管理維護開發環境、測試環境、預發環境、生產環境,甚至要從費用角度考慮有沒有資源浪費。

沒有合適工具和管理手段的情況下,管理成本相當高:

人工的方法是記住不同的用戶密碼,登陸不同的賬號,然後去挨個看。

高級點的自己有能力去維護一套連接了這些平臺的API,然後通過API的方式去解決。但這個成本同樣很高,要對雲產品有足夠的了解,萬一雲廠商某個API改了或者是返回結構改了,還得同步學習更新和修正。

5)企業IT管理對象的復雜度帶來的挑戰

企業IT管理的對象從傳統的物理主機、存儲、網絡、數據庫、中間件變成了雲計算服務商提供的一臺臺虛擬主機、雲數據庫,甚至是雲中間件,包括RDS、OTS、KAFKA,這些都是以雲服務的形式提供,而無需自己搭建,雲廠商把IT軟硬件資源,甚至中間件都服務化了。我們關心的不僅包括虛擬主機的情況,還有雲中間件、應用層的情況,管理對象更加復雜。

以上各種雲時代對於IT管理的挑戰,也是為什麽我們提出來需要雲時代企業IT智能診斷。



本文作者:MVP時間 辰悠

原文鏈接

本文為雲棲社區原創內容,未經允許不得轉載。

“不是不需要運維工程師,是人人皆是運維”|對話阿裏雲MVP蔣爍渺(上)