1. 程式人生 > >從攜程系統癱瘓,看國內企業資料管理亂象!

從攜程系統癱瘓,看國內企業資料管理亂象!

注:2015年5月28日,攜程系統崩潰的事,想必大家都知道了,但攜程此次事件並不是個例。本文即從多個角度,講述國內企業資料管理之亂象。作者胡茂華,多備份聯合創始人& CEO,以下內容僅代表作者立場。

5月28上午11點到我寫這篇文章,攜程故障已經四個小時了還未恢復正常服務,這是繼前不久網易全服務趴下,到昨天支付寶光纖被挖掘機挖斷,中國的網際網路企業巨頭被各類安全事件挖的體無完膚,深其原因,還是因為國內企業對安全問題的漠視,大家都忙於業務、忙於競爭,所有的資源都投入到一線業務中去了。

特別企業資料的管理和保護這個領域,一旦出現問題,造成的損失無法彌補,這和國人的觀念不無關係,就像買保險一樣,大家都抱著僥倖心理,萬分之一的機率,但是萬一發生了呢?有一個數據可以例證,到微博上搜索一下備份,上面有近1億條使用者記錄痛哭流涕的抱怨自己沒有及時備份個人資料而終身遺憾,或遺憾終身!

今天攜程事件,據說是內部人為刪除了所有的資料,包括伺服器的根目錄資料,我相信備份肯定有,畢竟是上市企業,有嚴格的審計過程,資料如何管理、如何備份和恢復、涉及到哪些流程、有沒有許可權管理,應該都有四大會計所來做稽核。

我記得當初在1號店負責運維時,因為1號店被沃爾瑪收購,作為上市企業的關聯交易公司,當時沃爾瑪派KPMG來做詳細的審計,核心崗位和管理層都被做了訪談,並出具了詳細的操作流程,我親自參與這個過程,審計是做了,但我們作為執行人心中是非常沒有底氣的。在我呆過的幾個大的網際網路公司如騰訊、盛大和1號店,都有做資料管理流程和備份恢復服務,但是因為這些安全業務比較邊緣,在整個公司關注程度很低,並沒有落到實處。

我有理由相信,所有的公司都有做資料管理和備份,不論是小微企業老闆自己手動用U盤或者硬碟拷貝、還是大的網際網路公司有專門的運維人員專項負責、傳統的中大型企業用專業的軟硬體工具,關鍵是99%的公司都沒有做資料管理流程、備份和恢復的演練,恢復的資料到底可不可用,如何快速的恢復等操作演練。

再來看看歐美環境,再小的一家公司,都有專業的資料管理軟體或者專業的IT維護人員,他們極其重視資料,視資料為企業生命,所以在歐美,做資料管理和保護的IT公司不下500家,像IBM、HP、Dell、EMC、賽門鐵克、康沃、飛康、愛恩鐵山、CA、carbonite這些老牌的上市公司,還有很多新型的網際網路創業公司,如Datto、code42、durva、Rubrik等企業。

國內在企業資料管理和保護該領域企業少之可憐,國內的IT軟體公司絕大部分是代理歐美產品,極少數是自己維護開發,無法保證專業性。

究其原因,資料管理要做的非常專業實屬不易,該領域屬於基礎技術領域,要與各類作業系統、硬體平臺、檔案系統、網路和安全領域互動,比如分塊、去重、壓縮、上傳下載、增量、加密、索引、儲存分層、海量小檔案、備份和恢復時間視窗、集中管控等綜合技術難點。傳統的IT企業不願意做基礎研發、還靠代理或者買單機版軟體垂死掙扎,新型網際網路企業不願意做也看不上這個不性感且極度垂直的2B領域。

所以,國內雲平臺、企業級應用市場、大資料等領域將在未來迎來高速發展。

==========================

運維派點評:資料容災備份是每家企業都在做的,包括小組織或個人網站,其實筆者倒是有一些其它看法——1)資料備份歸檔後,是否有去校驗資料備份完整性?2)是否有在日常去演練過資料容災恢復流程?

如今雲端計算興起,是否還需要運維人員?很多人都提出了No ops,也就是不需要運維的意思,我想這次事件已經給出了答案。因為雲端計算、大資料、網際網路+的繁榮,增大了基礎設施的建設、系統的架構更加複雜、資料量更大,這些都是對運維的挑戰,與其說是No ops,我更想說是Not only ops!