資料中心運維必須掌握的機房搬遷流程及其注意事項
阿新 • • 發佈:2018-12-27
對於在資料中心或機房做運維的來說,最龐大的工程無外乎就是機房搬遷了,這可是傷筋動骨的大動作,我們必須提前做好搬遷流程的梳理,提前做好預案以備緊急問題出現能快速解決。
一、 總則:
1、所有工作時間分為3個階段:搬遷前,搬遷中,搬遷後
搬遷前:伺服器在老機房執行階段
搬遷中:老機房停止服務,下架,運輸到新機房階段 搬遷後:伺服器運送到新機房
2、整個搬遷過程需考慮如下幾個方面:機櫃空間,網路,硬體裝置、作業系統、資料完整性,基礎服務,專案應用,搬遷流程
機櫃空間:新舊機房機櫃空間大小不同,需提前安排好伺服器放置位置
網路:老機房有4個網段,需全部正確切換到新機房,並對應上伺服器所需網段,線上內網環境應保證不用任何改動,所有伺服器上線後網路自然接通
硬體裝置:交換機、路由器、伺服器硬體本身,儲存裝置,應保證正常啟動,防止配置丟失導致啟動後重新配置等問題
作業系統:需提前做好檢測,防止作業系統不能啟動
資料完整性:需要保證資料完整,防止誤操作、物理損壞等造成資料丟失
基礎服務:vpn,檔案伺服器等影響全域性的基礎服務,需保證可以首先並正確啟動
專案應用:需保證專案按照相應順序以此正常啟動,主要要確保資料庫,快取,訊息佇列等基礎服務先啟動後,再啟動專案
搬遷流程:整個搬遷流程應責任到每個人,明確責任,儘量簡化人為操作,防止人為造成損失
二、 搬遷前準備工作
1、 老機房工作
- 去老機房統計所有裝置型號,U數 統計並確認所有機櫃外網段使用情況 統計網路裝置位置資訊,使用情況等保證硬體裝置標籤完整、正確、識別性高
- 根據上述資訊,對所有硬體裝置新增標籤,註明搬遷責任人、網絡卡使用情況、新機房機櫃號等內容,便於搬遷時高效無誤的工作
2、 新機房工作
- 運維所有員工逐次到新機房熟悉地形,防止因不熟悉地形,忙中出錯 所有機櫃提前做好網線、電源線的準備工作,內網外網用不同顏色成品線區分,做到易識別
- 臨時交換機上架,測試網路連通性 測試每根網線連通性,每根電線連通性,保證上架時不是這些基礎小問題延誤工作 機櫃貼標示,再次註明機櫃同伺服器關係,避免上架時混亂
3、 遠端工作
- 統計所有nfs掛載情況,提前做好啟動自動掛載
- 做好資料庫備份方案,各個專案主庫不能啟動應急方案 做好檔案備份方案,提前備份nfs上專案檔案
- 做好基礎服務替代方案,配置好替換路由器等,防止線上路由器損壞
所有應用、系統做好關停指令碼 所有應用、系統做好啟動指令碼 測試指令碼使用效果,保證可靠性
三、 搬遷過程中
1、 老機房
- 提前到機房,每個人確認負責伺服器器,並熟悉位置
- 確認每項前期準備工作是否已經到位
- 凌晨一點,按照關閉順序,每個人登陸負責伺服器執行關停指令碼,關停所負責伺服器
- 通知機房技術人員,切換網路到新機房,並由負責人測試新機房網路連通效果,確保新機房網路正常
- 正常關閉並斷電後,下架伺服器按照順序搬到樓下運輸車上
2、 運輸過程中
- 資料庫伺服器採用防震泡沫纏繞後裝車
- 每個人負責自己的伺服器不受大的震動,防止由於大震動導致伺服器故障,不能啟動
- 到新機房樓下,按照先後順序,依次進入新機房,原則上資料庫伺服器和基礎服務伺服器先進機房
3、 搬遷到新機房後
- 每個人按照事先標識好的標籤上面的內容上架,接通網路,接通電源 首先保證所有資料庫啟動,並檢查主從狀態等 剩餘伺服器確認電源、網路都插好後,加電啟動
- 所有伺服器啟動後,觀察機櫃電流表是否有超電現象
- 有超電現象的機櫃和無超電現象伺服器調換位置,進行電力平衡
- 每個人登陸自己負責伺服器,執行啟動指令碼,依次啟動虛機,專案應用等 測試訪問情況
- 訪問沒有問題以後,給測試人員打電話,走功能測試流程 通過後,結束等待訪問量上升後無問題,離開