1. 程式人生 > >搭建多個節點的hadoop叢集環境(CDH)

搭建多個節點的hadoop叢集環境(CDH)

提示:如果還不瞭解Hadoop的,可以下檢視這篇文章Hadoop生態系統,通過這篇文章,我們可以首先大致瞭解Hadoop及Hadoop的生態系統中的工具的使用場景。

搭建一個分散式的hadoop叢集環境,下面是詳細步驟,使用cdh5 

一、硬體準備

基本配置:
作業系統 64位
CPU (英特爾)Intel(R) I3處理器
記憶體 8.00 GB ( 1600 MHz)
硬碟剩餘空間 50G

流暢配置:
作業系統 64位
CPU (英特爾)Intel(R) I5處理器或以上配置
記憶體 16.00 GB ( 1600 MHz)
硬碟剩餘空間 100G

注意:上面是在單個pc機上搭建叢集,所以對記憶體要求較高。若是在多臺pc機上搭建叢集環境,則只需要記憶體足夠即可。

二、軟體環境準備

這篇文章是搭建CDH5叢集環境,以上軟體可以在此網址下載

三、主機規劃

     由於我們要安裝5個節點的叢集環境,所以我們分配好ip地址和主機功能

CDHNode1

/192.168.3.188

CDHNode2

/192.168.3.189

CDHNode3

/192.168.3.190

CDHNode4

/192.168.3.191

CDHNode5

/192.168.3.192

namenode

datanode

resourcemanager

journalnode

zookeeper



注意:Journalnode和ZooKeeper保持奇數個,最少不少於 3 個節點。具體原因,以後詳敘。

        我的主機分配情況是在兩臺pc的虛擬機器上安裝centos系統,具體分配情況如下:

CDHNode1 CDHNode2 CDHNode3 CDHNode4 CDHNode4
 PC1
 PC2
這樣分配的原因是為了採用HA時,兩臺namenode在不同pc上,若有一臺pc出現異常,導致一個namenode無法運作,而standy namenode(備用namenode)可以active(啟用),而不會影響整個叢集的運作。

三、詳細安裝步驟

               我們首先在1個主機(CHDNode1/192.168.3.188)上安裝centos6.5作業系統,使用root使用者配置網路,建立hadoop使用者,關閉防火牆,安裝一些必備軟體。為記下來的叢集軟體安裝做準備。

CentOS6.5安裝

                     在主機CHDNode1/192.168.3.188,安裝CentOS6.5作業系統。詳細安裝步驟可以檢視CentOS安裝這篇文章。此處就不再贅敘。

網路配置

 1.開啟安裝好的CentOS虛擬機器CDHNode1

  

 2、登入CentOS系統

         

3.輸入ifconfig命令,先檢視ip地址

4、這個時候我們發現除了迴環地址以外,我們並不能和外界通訊,比如我們可以使用ping命令進行測試。

注意:ping 127.0.0.1時,結束icmp報文,使用Ctrl+C命令

第一次ping 百度,ping不通,說明虛擬機器無法連線外網

第二次ping 虛擬機器NAT閘道器,ping不通

 注:虛擬機器閘道器檢視方法

點選虛擬機器網路編輯器,點選VMnet8

點選Nat設定


第三次ping物理機ip地址,ping不通

注:檢視物理機IP地址,開啟cmd.exe ,輸入ipconfig


第四次ping虛擬機器的迴環地址,ping成功,說明虛擬機器的網路協議是正確的

5、修改網絡卡的配置檔案

可以看到虛擬機器網絡卡沒有開啟,因此修改ONBOOT=yes,然後儲存退出(按Esc鍵,然後輸入:wq)

6、重啟網路服務


7、再次輸入ifconfig命令,檢視ip地址。

注意:我的虛擬機器設定的是橋接模式,所以ip地址是192.168.2.X網段,或192.168.3.X網段;因為橋接模式是直接使用物理網絡卡,而我的物理主機的閘道器是192.168.0.1,子網掩碼是255.255.252.0,所以我的虛擬機器ip地址可以在192.168.0.2-192.168.3.255之間任意選擇(除了物理主機的ip)。若你的虛擬機器是使用nat模式,可能就是,如:以我的虛擬機器為例,nat閘道器是192.168.117.2,子網掩碼為255.255.255.0,所以虛擬機器的ip地址可以在192.168.117.3-192.168.117.255之間任意選擇。


此時網絡卡已經成功開啟。

8.再次ping步驟4的ip或域名,檢視具體情況

檢查本機網路協議


檢查網絡卡鏈路


檢查Nat閘道器


檢查外網

此時虛擬機器連線網際網路成功,但使用dhcp(動態主機配置協議)配置ip地址,此時的IP地址時動態生成的,不方便以後hadoop叢集環境的搭建。所以我們還需要配置靜態Ip地址,配置詳情,下面細說。

9、使用ifconfig命令可以檢視動態ip地址為192.168.3.188,所以接下來我們把此ip作為CDHNode1的靜態ip地址。注:你可以使用你的動態ip作為你當前主機的靜態ip。然後後面幾臺IP地址可以緊跟著設定成,如192.168.3.189。DHCP生成ip地址是隨機的,你可具體問題具體分析。

10、修改網絡卡配置資訊,把BOOTPROTO=dhcp修改為BOOTPROTO=static,並且新增上設定的ip地址,子網掩碼,和閘道器。

注意:由於我是在兩臺pc上配置叢集環境,所以我使用的是橋接模式。若你是在一臺主機上建議你使用Nat(網路地址轉換)模式。因為nat模式的閘道器在不同的電腦上虛擬機器VMWare虛擬出來的網段是不同的。不方便使用Xshell連線。

下面是橋接模式的配置,IPADDR是設定ip地址,NETMASK(子網掩碼)與GATEWAY(閘道器)可以設定成與物理主機一樣的NETMASK(子網掩碼)與GATEWAY(閘道器)。注:物理主機ip配置具體檢視,看上面的步驟4。

下面是Nat模式的配置,IPADDR是設定ip地址,NETMASK(子網掩碼)與GATEWAY(閘道器)可以設定成與物理主機一樣的NETMASK(子網掩碼)與GATEWAY(閘道器)。注:Nat模式ip配置具體檢視,看上面的步驟4。

上面步驟中我們可以看到Nat模式的閘道器是192.168.117.2,子網掩碼為255.255.255.0

所以具體可配置成

BOOTPROTO=static

IPADDR=192.168.117.40

NETMASK=255.255.255.0

GATEWAY=192.168.117.2

最後按Esc,然後:wq儲存退出。(注意編輯按i或a即可進入編輯模式,具體操作檢視vi命令的使用說明)

11、重啟網路服務


至此網路配置完畢。

下載必備軟體

注:1、在CDHNode1節點上安裝,使用yum命令 ,引數-y表示,下載過程中的自動回答yes,有興趣的話,可以試試不加的情況;install表示從網上下載安裝。

         2、使用yum命令安裝軟體必須是root使用者。

1、安裝lrzsz,可以方便在Xshell上,上傳和下載檔案,輸入rz命令,可以上傳檔案,sz命令可以從遠端主機上下載檔案到本地。

 

2、安裝ssh伺服器。


3、安裝ssh客戶端。


使用者建立戶

1、使用useradd命令新增使用者hadoop,並同時建立使用者的home目錄,關於useradd的引數使用可以使用 useradd -h檢視引數

2、可以切換到/home目錄下檢視,是否建立成功


3、為hadoop使用者建立密碼,這是為了接下來使用XShell軟體遠端連線CDHNode1節點做準備,出現successfully表示建立密碼成功,注意:密碼建立必須是root使用者

4、可以切換到hadoop使用者,使用 su命令,可以看到,此時[email protected]已經改成[email protected]

5、從hadoop使用者退出,使用exit命令

克隆虛擬機器

由於我們使用VMware建立的Centos虛擬機器,所以我們可以直接克隆虛擬機器,就減少了安裝的時間,提高效率。

若你是在一臺pc機上配置叢集環境,就可以按照以下步驟連續克隆出四個虛擬機器分別是CDHNode2、CDHNode3、CDHNode4、CDHNode5;我是在兩個pc機上配置的所以,我就需要在另一臺pc上重新按照第一臺pc機上安裝CDHNode1一樣,再安裝CDHNode2,然後從CDHNode2克隆CDHNode4、CDHNode5。

下面我以在CDHNode2上克隆出CDHNode5虛擬機器為例,演示以下克隆的步驟。

1、右鍵CDHNode2虛擬機器--》快照--》拍攝快照

2、點選拍攝快照,快照拍攝成功

3、再右鍵CDHNode2虛擬機器--》管理--》克隆

4、下一步

5、選擇現有快照--》下一步

6、選擇建立完整克隆--》下一步

7、輸入虛擬機器名稱,點選完成,等待克隆完成。

8、至此我們完成了克隆虛擬機器的任務


9、接下來是修改配置虛擬機器的網絡卡資訊,下面我們在CDHNode5為例,其他節點自己按照下面的自行配置。

首先開啟CDHNode5,此時顯示的主機名稱為CDHNode2,因為CDHNode5是從CDHNode2克隆來的,所以主機名稱還是CDHNode2。

10、暫時不該主機名,我們先檢視一下,此時顯示沒有網絡卡

相關推薦

搭建節點hadoop叢集環境CDH

提示:如果還不瞭解Hadoop的,可以下檢視這篇文章Hadoop生態系統,通過這篇文章,我們可以首先大致瞭解Hadoop及Hadoop的生態系統中的工具的使用場景。 搭建一個分散式的hadoop叢集環境,下面是詳細步驟,使用cdh5 。 一、硬體準備

Redis分散式叢集部署安裝及細節一臺主機搭建服務--偽叢集

Redis分散式叢集部署安裝及細節  一: redis cluster介紹篇 1:redis cluster的現狀 目前redis支援的cluster特性(已親測): 1):節點自動發現 2):slave->master選舉,叢集容錯 3):Hotreshar

阿里雲ECS上搭建Hadoop叢集環境——使用兩臺ECS伺服器搭建“Cluster mode”的Hadoop叢集環境

Ingredient: 之前在: 這4篇文章裡講述了搭建Hadoop環境時在本地“/etc/hosts”裡面的ip域名配置上應該注意的事情,以及如何配置伺服器之間的ssh免密碼登入,啟動Hadoop遇到的一些問題的解決等等,這些都是使用ECS伺服器搭

如何在同一臺機器上安裝MySQL的實例

其他 搭建 如果 com 啟動mysql default vim 比喻 width   最近由於工作的需要,需要在同一臺機器上搭建兩個MySQL的實例,(註:已經存在了一個3306的MySQL的實例)。  先說下,什麽是mysql的多實例,簡單的來說就是一臺機器上安裝了多個

從零開始搭建linux下laravel 5.6環境

yum acad 分享圖片 tps .html 啟動 服務 all 從零開始 首先你需要有一臺linux服務器,或者虛擬機,這裏就不贅述了,不會的可以自行百度。 我這裏準備的是一臺騰訊雲服務器,系統為CentOS 7.4 64位。 你可以使用騰訊雲的登錄按鈕登錄到服務器 也

圖文詳解如何搭建Windows的Android C++開發環境

分享一下我老師大神的人工智慧教程!零基礎,通俗易懂!http://blog.csdn.net/jiangjunshow 也歡迎大家轉載本篇文章。分享知識,造福人民,實現我們中華民族偉大復興!        

如何在IDEA啟動Spring Boot工程例項轉載

在我講解的案例中,經常一個工程啟動多個例項,分別佔用不同的埠,有很多讀者百思不得其解,在部落格上留言,給我發郵件,加我微信詢問。所以有必要在部落格上記錄下,方便讀者。 step 1 在IDEA上點選Application右邊的下三角 ,彈出選項後,點選Edit Configuration

搭建jdk+eclipse+meaven+comcat開發環境

首先下載並安裝這幾個開發工具 首先我們我們安裝jdk,然後配置它 jdk安裝只要點下一步即可,不過要記得自己的安裝路徑。 然後我們來配置它:--------》-------》------》 將這幾個整完後(沒有的新建,有的後面直接加,以;分開) 我們查一下jdk是否配置成功

用centOS 7安裝cadence搭建適合IC Design的科研環境——相關知識準備

這篇部落格記錄我在用centOS搭建適合模擬積體電路設計的科研環境的過程,主要內容從我的OneNote筆記中整理,一是為了從雜亂的筆記中篩選出有價值的資訊,二是希望能幫助更多像我一樣的新手少走彎路。 過程中所需要的一些背景知識我儘量附上鍊接或參考,如有差錯,還

用CentOS 7安裝cadence搭建適合IC Design的科研環境——準備安裝映象

拜謝eetop論壇大神提供的方法,我們可以直接從cadence官網下載最新的安裝包,原文在這裡。 本文的工作主要是搬運一些資訊,同時補充上一些我在安裝過程中遇到的問題,以及解決方法。 下載安裝包 從官網下載 首先在cadence官網註冊一個賬號。

用CentOS 7安裝cadence搭建適合IC Design的科研環境——IC617、MMSIM151、calibre2015安裝過程step by step

以下操作都在root許可權下執行。 建立安裝目錄 建議把這種大型軟體裝在/opt目錄下。 mkdir -p /opt/cadence/installscape mkdir -p /opt/mentor/Calibre2015 其中-p引數是直

同一個頁面提交form表單方法詳細

辦法1.同一個頁面中建立兩個表單 各自提交: <form action="?" name="form1" id="form1"> <!-- 表單內容 --> <in

十:搭建Jenkins+Jmeter+Ant自動化整合環境4---新增郵件傳送功能

1、在系統設定中找到Jenkins Locaction項填入Jenkins URL和系統管理員郵件地址,系統管理員郵件地址一定要配置,否則發不了郵件通知。因為郵件通知都是由系統管理員的郵箱發出來的2、按照上圖配置的同時,要去自己的開啟SMTP服務,並生成授權碼3、1-2步完成

python3 爬蟲—爬取天氣預報城市七天資訊

一、內容:        利用BeautifulSoup抓取中國天氣網各個城市7天的 時間 天氣狀態 最高溫 最低溫 的相關資訊,並記錄儲存在本地csv表格檔案中。 爬取的頁面截圖: html獲取資訊截圖: 二、原理:      1.利用requests獲取請求

Python實現識別條碼/二維碼

    這篇部落格實現的是“Python實現識別多個條碼/二維碼(一)”未完成的解碼任務。由於系統壞了,軟體重灌等一系列原因,所以拖到現在。。不好意思哈。     在上一篇中我們已經能把兩個條形碼找出並框起來了,接下來就是要解碼。先上程式碼吧。 from sys impo

基於單目視覺的四旋翼定點降落——如何搭建基於gazebo的pixhawk模擬環境-1

    搭建模擬環境是相當重要的,因為我們的程式碼如果直接放到飛機上去跑,那麼很容易炸機。通過模擬環境,我們至少可以保證程式碼邏輯的正確性。這篇文章還是要感謝我的隊友舒仔仔的幫助,話不多說,上正文。1 安裝gazebo一般安裝的ROS就已經自己安裝了gazebo,如果已經安裝

hbase高可用叢集部署cdh

作者簡介:趙海軍 現就職於某創業公司任職運維兼DBA,曾就職於獵豹移動,負責資料庫團隊,運維前線作者之一。 一、概要 本文記錄hbase高可用叢集部署過程,在部署hbase之前需要事先部署好hadoop叢集,因為hbase的資料需要存放在hdfs上,hadoop叢集的部署後續會有一篇文章記錄,本文假

搭建3節點hadoop叢集完全分散式部署--1 安裝虛擬機器及hadoop元件

昨晚搞到晚上11.30,終於把hadoop元件安裝好了,執行試了下,正常...這裡記錄下完全分散式hadoop叢集的搭建步驟。1.VWMare平臺安裝之前已經安裝好了,這裡不詳細說明。2.安裝CentOS虛擬機器1)下載好centos ISO安裝檔案,我安裝的是centos6

搭建3節點hadoop叢集完全分散式部署--2安裝mysql及hive

網上下載mysql安裝包檔案,我下載的是:mysql-5.7.21-linux-glibc2.12-x86_64.tar.gz,tar解壓後mv到mysql資料夾,啟動mysql服務service mysqld start登入mysqlmysql -u root -p輸入密碼

大資料作業基於docker的hadoop叢集環境搭建

主要是根據廈門大學資料庫實驗室的教程(http://dblab.xmu.edu.cn/blog/1233/)在Ubuntu16.04環境下進行搭建。 一、安裝docker(Docker CE) 根據docker官網教程(https://docs.docker.