1. 程式人生 > >資料中心運維必須掌握的機房搬遷流程及其注意事項

資料中心運維必須掌握的機房搬遷流程及其注意事項

對於在資料中心或機房做運維的來說,最龐大的工程無外乎就是機房搬遷了,這可是傷筋動骨的大動作,我們必須提前做好搬遷流程的梳理,提前做好預案以備緊急問題出現能快速解決。

資料中心(機房)搬遷

一、 總則: 

1、所有工作時間分為3個階段:搬遷前,搬遷中,搬遷後 

搬遷前:伺服器在老機房執行階段

搬遷中:老機房停止服務,下架,運輸到新機房階段 搬遷後:伺服器運送到新機房

2、整個搬遷過程需考慮如下幾個方面:機櫃空間,網路,硬體裝置、作業系統、資料完整性,基礎服務,專案應用,搬遷流程 

機櫃空間:新舊機房機櫃空間大小不同,需提前安排好伺服器放置位置

網路:老機房有4個網段,需全部正確切換到新機房,並對應上伺服器所需網段,線上內網環境應保證不用任何改動,所有伺服器上線後網路自然接通

硬體裝置:交換機、路由器、伺服器硬體本身,儲存裝置,應保證正常啟動,防止配置丟失導致啟動後重新配置等問題

作業系統:需提前做好檢測,防止作業系統不能啟動

資料完整性:需要保證資料完整,防止誤操作、物理損壞等造成資料丟失

基礎服務:vpn,檔案伺服器等影響全域性的基礎服務,需保證可以首先並正確啟動

專案應用:需保證專案按照相應順序以此正常啟動,主要要確保資料庫,快取,訊息佇列等基礎服務先啟動後,再啟動專案

搬遷流程:整個搬遷流程應責任到每個人,明確責任,儘量簡化人為操作,防止人為造成損失

二、 搬遷前準備工作 

1、 老機房工作 

  • 去老機房統計所有裝置型號,U數   統計並確認所有機櫃外網段使用情況 統計網路裝置位置資訊,使用情況等保證硬體裝置標籤完整、正確、識別性高
  • 根據上述資訊,對所有硬體裝置新增標籤,註明搬遷責任人、網絡卡使用情況、新機房機櫃號等內容,便於搬遷時高效無誤的工作

2、 新機房工作 

  • 運維所有員工逐次到新機房熟悉地形,防止因不熟悉地形,忙中出錯 所有機櫃提前做好網線、電源線的準備工作,內網外網用不同顏色成品線區分,做到易識別
  • 臨時交換機上架,測試網路連通性 測試每根網線連通性,每根電線連通性,保證上架時不是這些基礎小問題延誤工作 機櫃貼標示,再次註明機櫃同伺服器關係,避免上架時混亂

3、 遠端工作 

  • 統計所有nfs掛載情況,提前做好啟動自動掛載
  • 做好資料庫備份方案,各個專案主庫不能啟動應急方案 做好檔案備份方案,提前備份nfs上專案檔案
  • 做好基礎服務替代方案,配置好替換路由器等,防止線上路由器損壞

所有應用、系統做好關停指令碼 所有應用、系統做好啟動指令碼 測試指令碼使用效果,保證可靠性

三、 搬遷過程中 

1、 老機房 

  • 提前到機房,每個人確認負責伺服器器,並熟悉位置
  • 確認每項前期準備工作是否已經到位
  • 凌晨一點,按照關閉順序,每個人登陸負責伺服器執行關停指令碼,關停所負責伺服器
  • 通知機房技術人員,切換網路到新機房,並由負責人測試新機房網路連通效果,確保新機房網路正常
  • 正常關閉並斷電後,下架伺服器按照順序搬到樓下運輸車上

2、 運輸過程中 

  • 資料庫伺服器採用防震泡沫纏繞後裝車
  • 每個人負責自己的伺服器不受大的震動,防止由於大震動導致伺服器故障,不能啟動
  • 到新機房樓下,按照先後順序,依次進入新機房,原則上資料庫伺服器和基礎服務伺服器先進機房

3、 搬遷到新機房後 

  • 每個人按照事先標識好的標籤上面的內容上架,接通網路,接通電源 首先保證所有資料庫啟動,並檢查主從狀態等 剩餘伺服器確認電源、網路都插好後,加電啟動
  • 所有伺服器啟動後,觀察機櫃電流表是否有超電現象
  • 有超電現象的機櫃和無超電現象伺服器調換位置,進行電力平衡
  • 每個人登陸自己負責伺服器,執行啟動指令碼,依次啟動虛機,專案應用等 測試訪問情況
  • 訪問沒有問題以後,給測試人員打電話,走功能測試流程 通過後,結束等待訪問量上升後無問題,離開