從零搭建生產Hadoop叢集(八)——上線與下線資料節點流程
阿新 • • 發佈:2018-12-21
一、概述
Hadoop叢集中,經常需要在不重啟叢集的前提下,動態地上線與下線資料節點,而使用Cloudera Manager管理的叢集,可以很方便地做到這一點,本文將介紹其相關流程。
二、節點上線流程
1. 伺服器初始化
新節點的硬體配置最好能夠跟原叢集伺服器保持一致或相差不大,而且上線之前,需要對硬體與系統層面的配置檢查與初始化,可以參考本系列文章從零搭建生產Hadoop叢集(三)——CDH叢集搭建的第二節——硬體檢查與系統配置,如關閉防火牆與Selinux、開啟ntpd服務、配置hosts等。
2. 新增新主機到CM管理系統中
下面根據CM的嚮導新增主機到叢集當中:
- 在CM“主機”頁面點選“向叢集新增新主機”
- 選擇需要新增的叢集,點選“繼續”
- 填寫新節點的主機ip,點選“繼續”
- 選擇儲存庫,選擇與“此cloudera manager server匹配的發行版”即可
- 輸入伺服器使用者名稱密碼,繼續下一步便會對主機安裝cloudera manager agent及同步CDH的parcel包
- 對伺服器與叢集其他伺服器版本檢查是否一致,不一致則需修改完再檢查一次,無誤則點選“繼續”
- 叢集部署客戶端配置
至此,新節點均已加入到CM管理當中,不過這裡別忘了,為主機分配機架,因為hadoop是有機架感知機制的,對副本的分佈有很大影響。可在“主機”頁面勾選新節點,選擇“分配機架”,填寫對應機架即可。
3.新增角色例項
一般新資料節點上會啟動datanode與nodemanager程序,也有可能有其他例項,這裡以datanode新增過程為例,其他例項也類似:
- 在CM頁面點選相應叢集的“HDFS”服務
- 點選“例項”進入例項頁面
- 點選“新增角色例項”
- 在“DataNode”選項中,選擇“自定義”,而後選擇新新增的主機
- 一路點選下一步,確認資料盤分佈等資訊無誤即可將加入服務中
例項加入HDFS服務之後,若自定義了多個配置組,需要為其制定合適的配置組:
- 在CM頁面點選相應叢集的“HDFS”服務
- 點選“配置”進入配置頁面
- 點選“角色組”
- 點選“DataNode”配置組,將新例項勾選,移動到合適的配置組中
以上步驟完了之後,便可到例項頁面,勾選對應的datanode例項,選擇啟動即可。若啟動失敗,可點選對應日誌檢查。
三、節點下線流程
下線節點流程比較簡單:
- 到對應的服務例項頁面,勾選對應例項選擇“解除授權”,執行后角色例項程序將會停止,再將其勾選刪除即可。需要注意的是,datanode下線時需要對資料進行均衡,因此如果節點資料量比較大的話,下線需要一定的時間,而且不要同時下線兩臺及以上的資料節點,可能會造成資料丟失。
- 到下線主機上停止CM Agent程序
- 確認下線主機上的例項程序均已刪除和關閉後,在“主機”頁面勾選對應主機選擇“刪除”