1. 程式人生 > >從零搭建生產Hadoop叢集(八)——上線與下線資料節點流程

從零搭建生產Hadoop叢集(八)——上線與下線資料節點流程

一、概述

Hadoop叢集中,經常需要在不重啟叢集的前提下,動態地上線與下線資料節點,而使用Cloudera Manager管理的叢集,可以很方便地做到這一點,本文將介紹其相關流程。

二、節點上線流程

1. 伺服器初始化

新節點的硬體配置最好能夠跟原叢集伺服器保持一致或相差不大,而且上線之前,需要對硬體與系統層面的配置檢查與初始化,可以參考本系列文章從零搭建生產Hadoop叢集(三)——CDH叢集搭建的第二節——硬體檢查與系統配置,如關閉防火牆與Selinux、開啟ntpd服務、配置hosts等。

2. 新增新主機到CM管理系統中

下面根據CM的嚮導新增主機到叢集當中:

  1. 在CM“主機”頁面點選“向叢集新增新主機”
  2. 選擇需要新增的叢集,點選“繼續”
  3. 填寫新節點的主機ip,點選“繼續”
  4. 選擇儲存庫,選擇與“此cloudera manager server匹配的發行版”即可
  5. 輸入伺服器使用者名稱密碼,繼續下一步便會對主機安裝cloudera manager agent及同步CDH的parcel包
  6. 對伺服器與叢集其他伺服器版本檢查是否一致,不一致則需修改完再檢查一次,無誤則點選“繼續”
  7. 叢集部署客戶端配置

至此,新節點均已加入到CM管理當中,不過這裡別忘了,為主機分配機架,因為hadoop是有機架感知機制的,對副本的分佈有很大影響。可在“主機”頁面勾選新節點,選擇“分配機架”,填寫對應機架即可。

3.新增角色例項

一般新資料節點上會啟動datanode與nodemanager程序,也有可能有其他例項,這裡以datanode新增過程為例,其他例項也類似:

  1. 在CM頁面點選相應叢集的“HDFS”服務
  2. 點選“例項”進入例項頁面
  3. 點選“新增角色例項”
  4. 在“DataNode”選項中,選擇“自定義”,而後選擇新新增的主機
  5. 一路點選下一步,確認資料盤分佈等資訊無誤即可將加入服務中

例項加入HDFS服務之後,若自定義了多個配置組,需要為其制定合適的配置組:

  1. 在CM頁面點選相應叢集的“HDFS”服務
  2. 點選“配置”進入配置頁面
  3. 點選“角色組”
  4. 點選“DataNode”配置組,將新例項勾選,移動到合適的配置組中

以上步驟完了之後,便可到例項頁面,勾選對應的datanode例項,選擇啟動即可。若啟動失敗,可點選對應日誌檢查。

三、節點下線流程

下線節點流程比較簡單:

  1. 到對應的服務例項頁面,勾選對應例項選擇“解除授權”,執行后角色例項程序將會停止,再將其勾選刪除即可。需要注意的是,datanode下線時需要對資料進行均衡,因此如果節點資料量比較大的話,下線需要一定的時間,而且不要同時下線兩臺及以上的資料節點,可能會造成資料丟失。
  2. 到下線主機上停止CM Agent程序
  3. 確認下線主機上的例項程序均已刪除和關閉後,在“主機”頁面勾選對應主機選擇“刪除”