Hadoop-2.8.0之分散式叢集（HA架構）搭建

阿新 • • 發佈：2019-01-06

1、安裝前準備

①、叢集規劃：

主機名稱	使用者	主機IP	安裝軟體	執行程序
centos71	hzq	192.168.1.201	jdk、hadoop	NameNode、DFSZKFailoverController(zkfc)
centos72	hzq	192.168.1.202	jdk、hadoop	NameNode、DFSZKFailoverController(zkfc)
centos73	hzq	192.168.1.203	jdk、hadoop	ResourceManager
centos74	hzq	192.168.1.204	jdk、hadoop	ResourceManager
centos75	hzq	192.168.1.205	jdk、hadoop	DataNode、NodeManager、JournalNode
centos76	hzq	192.168.1.206	jdk、hadoop	DataNode、NodeManager、JournalNode
centos77	hzq	192.168.1.207	jdk、hadoop	DataNode、NodeManager、JournalNode
centos78	hzq	192.168.1.205	jdk、zookeeper	QuorumPeerMain
centos79	hzq	192.168.1.206	jdk、zookeeper	QuorumPeerMain
centos710	hzq	192.168.1.207	jdk、zookeeper	QuorumPeerMain

②、每臺主機之間設定免密登陸，參考《ssh免密登陸》

③、每檯安裝jdk1.8.0_131，安裝及配置見《Linux安裝JDK步驟》

⑤、修改“etc/hosts"檔案如下：
192.168.31.128centos71
192.168.31.129centos72
192.168.31.130centos73
192.168.31.131centos74
192.168.31.132 centos76
192.168.31.133 centos75
192.168.31.137 centos77
192.168.31.134 centos78
192.168.31.135 centos79
192.168.31.136 centos710

⑥、準備Hadoop安裝包：hadoop-2.8.0.tar.gz

⑦、關閉防火牆

2、Hadoop安裝：
①、在"/home/hzq/software/"下建立"hadoop"資料夾
②、在"hadoop"目錄下建立"data"資料夾，用於存放hadoop執行時檔案
③、將"hadoop-2.8.0.tar.gz"解壓到hadoop目錄下

     tar -zxvf ../package/hadoop-2.8.0.tar.gz  -C /home/hzq/software/hadoop/

④、刪除"hadoop-2.8.0"下"share"中的doc檔案，為了提高scp拷貝時速度

     rm -rf hadoop-2.8.0/share/doc

3、Hadoop配置：

①、修改 hadoop-env.sh 配置檔案，修改JAVA_HOME

     export JAVA_HOME=/home/hzq/software/jdk1.8.0_131

②、修改core-site.xml

    <property>
            <name>fs.defaultFS</name>
            <value>hdfs://hzqnns/</value>
    </property>
    <property>
            <name>hadoop.tmp.dir</name>
            <value>/home/hzq/software/hadoop/data</value>
    </property>
    <property>
            <name>ha.zookeeper.quorum</name>
            <value>centos78:2181,centos79:2181,centos710:2181</value>
    </property>

③、修改hdfs-site.xml

    <property>  
        <name>dfs.replication</name>  
        <value>2</value>  
    </property>  
    <property>  
            <name>dfs.block.size</name>  
            <value>64M</value>  
    </property>
    <property>
    	<name>dfs.nameservices</name>
    	<value>hzqnns</value>
    </property>
    <property>
    	<name>dfs.ha.namenodes.hzqnns</name>
    	<value>nn1,nn2</value>
    </property>
    <property>
    	<name>dfs.namenode.rpc-address.hzqnns.nn1</name>
    	<value>centos71:9000</value>
    </property>
    <property>
    	<name>dfs.namenode.http-address.hzqnns.nn1</name>
    	<value>centos71:50070</value>
    </property>
    <property>
    	<name>dfs.namenode.rpc-address.hzqnns.nn2</name>
    	<value>centos72:9000</value>
    </property>
    <property>
    	<name>dfs.namenode.http-address.hzqnns.nn2</name>
    	<value>centos72:50070</value>
    </property>
    <property>
            <name>dfs.namenode.shared.edits.dir</name>
            <value>qjournal://centos75:8485;centos76:8485;centos77:8485/hzqnns</value>
    </property>
    <!-- 指定JournalNode在本地磁碟存放資料的位置 -->
    <property>
            <name>dfs.journalnode.edits.dir</name>
            <value>/home/hzq/software/hadoop/data/journaldata</value>
    </property>
    <!-- 開啟NameNode失敗自動切換 -->
    <property>
            <name>dfs.ha.automatic-failover.enabled</name>
            <value>true</value>
    </property>
    <!-- 配置失敗自動切換實現方式 -->
    <property>
            <name>dfs.client.failover.proxy.provider.hzqnns</name>
            <value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>
    </property>
    <!-- 配置隔離機制方法，多個機制用換行分割，即每個機制暫用一行-->
    <property>
            <name>dfs.ha.fencing.methods</name>
            <value>
                sshfence
                <!-- 這裡引入自己的shell指令碼-->
                shell(/bin/true)
            </value>
    </property>
    <!-- 使用sshfence隔離機制時需要ssh免登陸 -->
    <property>
            <name>dfs.ha.fencing.ssh.private-key-files</name>
            <value>/home/hzq/.ssh/id_rsa</value>
    </property>
    <property>
            <name>dfs.ha.fencing.ssh.connect-timeout</name>
            <value>30000</value>
    </property>

④、mapred-site.xml

將“mapred-site.xml.template”進行重新命名。

     mv mapred-site.xml.template  mapred-site.xml

修改mapred-site.xml

    <property>
            <name>mapreduce.framework.name</name>
            <value>yarn</value>
    </property>

⑤、yarn-site.xml

    <property>
            <name>yarn.resourcemanager.ha.enabled</name>
            <value>true</value>
    </property>
    <property>
            <name>yarn.resourcemanager.cluster-id</name>
            <value>yrc</value>
    </property>

    <property>
            <name>yarn.resourcemanager.ha.rm-ids</name>
            <value>rm1,rm2</value>
    </property>
    <property>
            <name>yarn.resourcemanager.hostname.rm1</name>
            <value>centos73</value>
    </property>
    <property>
            <name>yarn.resourcemanager.hostname.rm2</name>
            <value>centos74</value>
    </property>
    <property>
            <name>yarn.nodemanager.aux-services</name>
            <value>mapreduce_shuffle</value>
    </property>
    <property>
            <name>yarn.resourcemanager.zk-address</name>
            <value>centos78:2181,centos79:2181,centos710:2181</value>
    </property>

⑥、配置DataNode主機，修改slaves

	centos75
	centos76
        centos77

⑦、將配置好的Hadoop傳送到其他六臺主機上

     scp -r hadoop/ centos72:/home/hzq/software/ 
     scp -r hadoop/ centos73:/home/hzq/software/ 
     scp -r hadoop/ centos74:/home/hzq/software/ 
     scp -r hadoop/ centos75:/home/hzq/software/ 
     scp -r hadoop/ centos76:/home/hzq/software/ 
     scp -r hadoop/ centos77:/home/hzq/software/

4、啟動Hadoop（首次啟動必須按照順序來執行）
①、檢查Zookeeper叢集是否啟動完成，如果沒有，先啟動Zookeeper叢集。

分別在centos78,centos79,centos710啟動zookeeper

    zkServer.sh start

檢視狀態：一個leader，兩個follower

    zkServer.sh status

②、啟動journalnode（分別在centos75、centos76、centos77上執行）

     hadoop-daemon.sh start journalnode

注：執行jps命令檢驗是否啟動成功，如成功，分別在centos75、centos76、centos77多一個JournalNode程序

③、在centos71上格式化HDFS

     hdfs namenode -format

④、使兩個NameNode資料保持一直，將centos71主機上，data中的資料複製到centos72主機data中。

     scp -r data/ centos72:/home/hzq/software/hadoop/data

⑤、在centos71上格式化ZKFC

     hdfs zkfc -formatZK

⑥、在centos71上啟動HDFS

     start-dfs.sh

⑦、在centos73上啟動Resourcemanager及NodeManager

     start-yarn.sh

⑧、在centos74上啟動Resourcemanager

     yarn-daemon.sh start resourcemanager

5、驗證是否啟動成功：

①、在每臺主機上分別使用jps驗證。

②、HDFS管理介面 http://centos71:50070 或者 http://centos72:50070

③、MR管理介面 http://centos73:8088 或者 http://centos74:8088
6、常用命令：

檢視hdfs的各節點狀態資訊

    hdfs dfsadmin -report

獲取一個namenode節點的HA狀態

    hdfs haadmin -getServiceState nn1

單獨啟動一個namenode程序

    hadoop-daemon.sh start namenode

單獨啟動一個zkfc程序

    hadoop-daemon.sh start zkfc

單獨啟動Resourcemanager程序

    yarn-daemon.sh start resourcemanager

7、總結

1、搭建純屬於學習使用，沒有做優化等等。

2、望路過大神多多指點指點。

Hadoop-2.8.0之分散式叢集（HA架構）搭建

1、安裝前準備 ①、叢集規劃：主機名稱使用者主機IP 安裝軟體執行程序 centos71 hzq 192.168.1.201 jdk、hadoop NameNode、DFSZKFailoverController(zkfc

在Ubuntu 上搭建hadoop-2.6.0-cdh分散式叢集

1 虛擬機器配置序號作業系統 CPU/core 記憶體/GB 硬碟/GB IP地址主機名 1 Ubuntu 2 3 20 192.168.0.122 master 2 Ubuntu 1 2 20 192.168.0.123 slave

Hadoop-2.8.4版本分散式叢集搭建

Hadoop分散式叢集搭建建立虛擬機器（用VmWare工具,centos6）克隆三臺機器 master slaver1 slaver2 分別在每臺機器上安裝jdk >= 1.7版本 vim /etc/profile 四、同步三臺虛擬機器的時間（時間

hadoop 2.8.0在centos7 搭建（初入大資料）

第一步： ①準備三臺虛擬機器使用 VMware Workstation工具配置好使用工具CRT 連線 ②更改主機名 192.168.220.128 s1 192.168.220.128 s2 192.

初學者CentOS7安裝hadoop-2.8.0叢集詳細過程以及問題解決

一、安裝前準備 VMware-workstation-full-10.0.4 CentOS-7-x86_64-DVD-1804.iso映象 jdk-8u181-linux-x64.tar.gz hadoop-2.8.0.tar.gz 二、安裝過程虛擬機器設定（

Linux上安裝Hadoop叢集(CentOS7+hadoop-2.8.0)

關鍵字：Linux CentOS Hadoop Java 版本： CentOS7 Hadoop2.8.0 JDK1.8 說明：Hadoop從版本2開始加入了Yarn這個資源管理器，Yarn並不需要單獨安裝。只要在機器上安裝了

Hadoop-2.8.0實踐——搭建Hadoop叢集

在本地測試hadoop成功後，我們在多臺主機上搭建hadoop叢集，用於處理大規模資料… 一、準備工作 1.1 系統環境三臺 Ubuntu 16.04 64位筆記本（一臺作為Master節點，另外兩臺作為Slave節點） 1.2 建立使用者建立使用者，併為其

Hadoop-2.8.0 開發環境搭建（Mac）

Hadoop是一個由Apache基金會開發的分散式系統架構，簡稱HDFS，具有高容錯性、可伸縮性等特點，並且可以部署在低配置的硬體上；同時，提供了高吞吐量的資料訪問效能，適用於超大資料集的應用程式，以及通過叢集拓撲高效快速的處理資料的能力。本文主要介紹一下Hadoop的開

Linux上安裝Hadoop集群(CentOS7+hadoop-2.8.0)

hup dem current 格式 default dmv framework server1 上進 1下載hadoop 2安裝3個虛擬機並實現ssh免密碼登錄 2.1安裝3個機器 2.2檢查機器名稱

Linux上安裝Hadoop集群(CentOS7+hadoop-2.8.0)--------hadoop環境的搭建

html -a 總結全分布式 .html oop details clas HR Linux上安裝Hadoop集群(CentOS7+hadoop-2.8.0)------https://blog.csdn.net/pucao_cug/article/details/716

在myeclipse上連線hadoop-2.8.0 執行mapreduce程式

首先 hadoop叢集是要先搭建的沒的說。可以先在hadoop上執行自帶的mapreduce jar包，跑一下，不成功說明配置檔案沒有配置好，這裡就不說配置哪些了，網上很多。 1.在windows下下載hadoop-2.8.0.tar.gz 並且解壓 2.下載 &n

hadoop初識 - 搭建偽分散式叢集（CentOS6.5）

關於hadoop模式三種的瞭解，請自行百度瞭解，此文只說明偽分散式的搭建前提：jdk（hadoop是有java語言完成的，必須有jdk支援）可以參考我的經驗 --- > Linux-CentOS-6.5下配置JDK 一、準備工作 1、下載hadoop

Hadoop-2.8.0實踐——單機模式和偽分佈模式

一、安裝 1.1 環境系統：Ubuntu 16.04 LTS 軟體： Java 1.7及以上 ssh 和 sshd 安裝ssh: $ sudo apt-get install ssh $ sudo apt-get install rsync 1.2

centos7+hadoop 2.8 的多節點叢集搭建

1、叢集IP 192.168.2.218 hadoop-slave-1 192.168.2.4 hadoop-master 2、java 選用自帶的java 1.7.0. openjdk 關於java版本和hadoop版本的搭配可以參考hadoop官方wiki htt

centos下hadoop-2.6.0完全分散式搭建

一、Hadoop執行模式： Hadoop有三種執行模式，分別如下：單機(非分散式)模式偽分散式(用不同程序模仿分散式執行中的各類節點)模式完全分散式模式注：前兩種可以在單機執行，最後一種用於真

hadoop-2.6.5偽分散式叢集搭建

本次搭建的偽分散式hadoop叢集所使用的作業系統是紅帽5，64位系統。所以，需要注意以下幾點： 1、jdk和hadoop安裝包也應該是64位的 2、64位的jdk是從檔名可以直接看出，例如：jdk-8u172-linux-x64.tar.gz 3、而

使用SVN+Axure RP 8.0建立團隊專案（原型圖）

前言：機房合作剛剛開始，涉及到原型圖的製作，所以就想通過團隊來一起完成機房合作原型圖的製作。內容：第一種方式一、使用到的工具： VisualSVN Server --SVN伺服器：https://www.visualsvn.com/server/ Axur

編程心法之敏捷開發（新架構）Agile Team Organization Squads, Chapters, Tribes and Guilds

content 分享圖片人的 org 路線 nis 十分 develop 結構 Agile Team 參考一般情況下，一個小組有以下功能分布： Squads 每個主要的功能的開發屬於一個Squad，比如說QQ這個應用，可以分為QQ空間小組、QQ會員小組等等，每一個S

cdh5.7.0偽分散式叢集之spark-2.2.0安裝

基本環境及軟體：軟體版本軟體包 centos-6.4 JDK-1.8 jdk-8u191-linux-x64.tar.gz hadoo

cdh5.7.0偽分散式叢集之hadoop安裝

基本環境及軟體：軟體版本軟體包 centos-6.4 JDK-1.8 jdk-8u191-linux-x64.tar.gz hadoo

Hadoop-2.8.0之分散式叢集（HA架構）搭建

相關推薦