1. 程式人生 > >hadoop入門學習教程--DKHadoop完整安裝步驟

hadoop入門學習教程--DKHadoop完整安裝步驟

dfs 空間 按鍵 name 對應關系 教程 自己 打不開 系統分區

hadoop入門學習教程--DKHadoop完整安裝步驟

使用hadoop版本是DKH標準三節點發行版,DKHadoop版本的易用性比較好,環境部署要簡單的多,參考此篇安裝前請先下載DKHadoop版本,網盤鏈接:https://pan.baidu.com/s/1-427Sh6lTLrLAPh6KMOYVg 提取碼:vg2w

第一部分:準備工作

1、大數據平臺所需配置:

(1) 系統:CentOS 6.5 64位(需默認安裝Desktop)

(2) CPU :intel E3及以上。

(3) 內存:建議最小8G,用圖計算建議32G,推薦128G。

(4) 硬盤:256G以上,推薦使用固態硬盤。

(5) 系統分區要求: 如無特殊需求,除swap分區外,可將剩余空間全部分配到/(根)分區

(6) 網絡要求:如無特殊情況,盡量可以接入外網。

(7) 至少三臺服務器(三臺服務器名字任意起,密碼須一致)。

(8)安裝使用root用戶作為默認用戶

2、遠程上傳和遠程連接工具:

(1) 若直接使用個人PC開啟的虛擬機作為服務器的基礎,直接拷貝到虛擬機下即可。

(2) 若是使用機房服務器作平臺搭建的服務器,如若不能直接接觸到服務器,則需要使用遠程工具連接並發送安裝包

第二部分:服務器操作系統配置

1.修改權限

步驟:在準備工作中拷貝安裝包DKHPlantform.zip到主節點/root/目錄後,解壓並修改文件權限(文件所有者可讀可寫可執行,與文件所有者屬於一個用戶組的其他用戶可讀可執行,其他用戶組可讀可執行)。

命令:

cd /root/

unzip DKHPlantform.zip

chmod -R 755 DKHPlantform

2. 搭建hadoop集群設置SSH免密登錄

步驟:

修改主機名 vi /etc/sysconfig/network reboot

(1)修改本機hosts文件,寫入對應關系

命令:

vi /etc/hosts

通過按鍵盤上的insert或是I鍵進入編輯模式,編輯完成後按一下Esc鍵然後按一下按Shift+:鍵,輸入wq 後回車就可以保存。輸入q!後回車則是放棄保存並退出.

進入編輯模式後,按照規則寫入主機與ip的對應關系(主機名稱dk41是自己命名的,如下圖)例:

192.168.1.41 dk41

192.168.1.42 dk42

192.168.1.43 dk43

技術分享圖片

編輯完後,保存退出。把對應關系拷到其他兩臺機器上。

命令:

scp -r /etc/hosts 192.168.1.42:/etc

scp -r /etc/hosts 192.168.1.43:/etc

(2)執行集群之間免密前的準備工作

a)執行sshpass.sh的腳本的時候會去讀sshhosts和sshslaves這兩個文件,替換sshpass.sh中的master和slave文件。

修改文件sshhosts,輸入全部機器的主機名,每行一個主機名(如下圖)

命令:

vi /root/DKHPlantform/autossh/sshhosts

通過按鍵盤上的insert或是I鍵進入編輯模式,編輯完成後按一下Esc鍵然後按一下按Shift+:鍵,輸入wq,後回車就可以保存。輸入q!後回車則是放棄保存並退出.

技術分享圖片

修改文件sshslaves,寫入除主機名之外的所有機器名(如下圖)

命令:

vi /root/DKHPlantform/autossh/sshslaves

通過按鍵盤上的insert或是I鍵進入編輯模式,編輯完成後按一下Esc鍵然後按一下按Shift+:鍵,輸入wq,後回車就可以保存。輸入q!後回車則是放棄保存並退出.

技術分享圖片

b)執行insExpect.sh,系統會裝兩個rpm包,在執行sshpass.sh的過程中無需再輸密碼和yes,腳本自動繼續執行。

命令:

cd /root/DKHPlantform/autossh

./insExpect.sh

按照提示多次輸入yes和密碼(如下圖)

技術分享圖片

c)執行changeMaster.sh腳本為了清空/root/.ssh目錄下的所有文件(在/root/DKHPlantform/autossh目錄下),避免在執行sshpass.sh腳本時產生的新密鑰時與舊的密鑰發生沖突。

命令:

./changeMaster.sh

按照提示輸入(如下圖)

技術分享圖片

(3)執行集群免密(SSH)

a)執行SSH:

命令:

cd /root/

./sshpass.sh 密碼

123456為集群密碼,根據自己實際情況輸入。

技術分享圖片

b)防止訪問服務器時某些服務被攔截,需關閉防火墻。

命令:

cd /root/DKHPlantform/autossh

./offIptables.sh

技術分享圖片

3.安裝雙機熱備份的MySQL

目的:存放Hive的元數據

步驟:

(1)從主節點分發mysql安裝目錄到第二節點

命令:

scp -r /root/DKHPlantform/mysqlInst/ 192.168.1.42:/root/

(2)主節點執行:

命令:

cd /root/DKHPlantform/mysqlInst/

./mysql.sh 1

ssh前往第二臺機器(從節點)並執行:

命令:

cd /root/mysqlInst/

./mysql.sh 2

(3)執行成功之後執行熱備份(兩臺機器上都要執行,兩個ip互換,41上寫42,42上寫41,密碼是Mysql的密碼為:123456。平臺內已經設定好,請勿修改):

命令:

source /etc/profile

./sync.sh 192.168.1.xxx(另一臺mysql地址) root 123456

4.創建數據庫

步驟:

(1)導入MySQL數據表,只在主節點執行:

命令:

mysql -uroot -p123456 < { 此處為sql文件,主目錄下文件: dkh.sql}

如:mysql -uroot -p123456 </root/DKHPlantform/dkh.sql

(2)執行完後查看一下兩臺mysql的數據表是否存在,從節點查看執行:

命令:

mysql -uroot -p123456
show databases;

技術分享圖片

第三部分:DKH系統安裝

(1)啟動安裝

步驟:執行以下命令。

命令:

cd /root/DKHPlantform/dkh-tomcat-7.0.56/bin/

./startup.sh

(2)登錄

啟動成功後瀏覽器鍵入主節點ip

登陸默認用戶名和密碼:

Username:admin

Password: 123456

後續根據提示安裝

(3)組件安裝路徑

建議采用默認安裝路徑,即/opt/dkh/,註意千萬不要放/root/,不然impala等組件的安裝可能出現問題

第四部分:常見問題解決方法

1、當hdfs的zkfc出現如下問題時,可嘗試以下方法:

技術分享圖片

(1) 先格式化hadoopzk:hdfs zkfc -formatZK

(2) 啟動zk,sbin下: ./hadoop-daemon.sh start zkfc

(3) 設定失敗轉移的namenode: hdfs haadmin -failover nn1 nn2

2、當hue頁面打不開,顯示如下內容時,說明沒有創建hue數據庫,可在主節點執行此文件,根據提示輸入Y即可

技術分享圖片

3、當hue頁面打不開,顯示如下內容時,可執行如下命令解決:

# cd /opt/dkh/hue-3.12.0/build/env/bin

# ./hue syncdb 之後輸入no

# ./hue migrate

技術分享圖片

4、Essql頁面打不開,顯示如下內容時,可通過以下方式解決

(1) 主節點運行命令:source /etc/profile,後重啟Tomcat(註意使用shutdown命令之後,若還存在相關進程,需手動kill掉)適用於環境變量不生效的情況,比如,Java的版本識別的是1.7,而不是1.8;hdfs相關命令不識別等。

(2) 重啟Tomcat,註意使用shutdown命令之後,若還存在相關進程,需手動kill掉適用於啟動了多個Tomcat進程的情況。

技術分享圖片

hadoop入門學習教程--DKHadoop完整安裝步驟