基於hadoop2.7.3搭建多機環境（YARN+HA）

阿新 • • 發佈：2019-01-02

第一：環境說明

parallels desktop
CentOS-6.5-x86_64-bin-DVD1.iso
jdk-7u79-linux-x64.tar.gz
Hadoop-2.7.3.tar.gz
搭建四個節點的叢集。他們的hostname分佈為hadoopA，hadoopB，hadoopC，hadoopD。其中hadoopA的角色為Activity namnode。hadoopB的角色為standby namenode，datanode，journalnode。hadoopC的角色為datanode，journalnode。hadoopD的角色為datanode，journalnode。

第二：作業系統配置

賦予hadoop使用者sudo許可權

[[email protected] hadoop]# visudo

## Allow root to run any commands anywhere
root    ALL=(ALL)       ALL
hadoop  ALL=(ALL)       ALL

修改hostname

[[email protected] hadoop-2.7.3]$ cat /etc/hosts
127.0.0.1   localhost localhost.localdomain localhost4 localhost4.localdomain 
4
::1         localhost localhost.localdomain localhost6 localhost6.localdomain6
192.168.1.201 hadoopA
192.168.1.202 hadoopB
192.168.1.203 hadoopC
192.168.1.204 hadoopD

第三：安裝和配置jdk

分別在hadoopA，hadoopB，hadoopC，hadoopD四個節點安裝jdk。

[hadoop@hadoopb ~]$ tar -zxvf jdk-7u79-linux-x64.tar.gz

修改jdk的名稱

[hadoop@hadoopb 
 ~]$ mv jdk1.7.0_79/  jdk1.7

第四：安裝和配置hadoop

在hadoopA,hadoopB,hadoopC,hadoopD四個節點上解壓hadoop

[hadoop@hadoopb ~]$ tar -zxvf hadoop-2.7.3.tar.gz

在hadoopA上配置hadoop-env.sh

# The java implementation to use.
export JAVA_HOME=/home/hadoop/jdk1.7

在hadoopA上配置core-site.xml

<configuration>
        <property>
                <name>fs.defaultFS</name>
                <value>hdfs://hadoopA:8020</value>
        </property>
</configuration>

在hadoopA配置hdfs-site.xml

<configuration>

<property>
  <name>dfs.nameservices</name>
  <value>hadoop-test</value>
  <description>
    Comma-separated list of nameservices.
  </description>
</property>

<property>
  <name>dfs.ha.namenodes.hadoop-test</name>
  <value>nn1,nn2</value>
  <description>
    The prefix for a given nameservice, contains a comma-separated
    list of namenodes for a given nameservice (eg EXAMPLENAMESERVICE).
  </description>
</property>

<property>
  <name>dfs.namenode.rpc-address.hadoop-test.nn1</name>
  <value>hadoopA:8020</value>
  <description>
    RPC address for nomenode1 of hadoop-test
  </description>
</property>

<property>
  <name>dfs.namenode.rpc-address.hadoop-test.nn2</name>
  <value>hadoopB:8020</value>
  <description>
    RPC address for nomenode2 of hadoop-test
  </description>
</property>

<property>
  <name>dfs.namenode.http-address.hadoop-test.nn1</name>
  <value>hadoopA:50070</value>
  <description>
    The address and the base port where the dfs namenode1 web ui will listen on.
  </description>
</property>

<property>
  <name>dfs.namenode.http-address.hadoop-test.nn2</name>
  <value>hadoopB:50070</value>
  <description>
    The address and the base port where the dfs namenode2 web ui will listen on.
  </description>
</property>

<property>
  <name>dfs.namenode.name.dir</name>
  <value>file:///home/hadoop/hdfs/name</value>
  <description>Determines where on the local filesystem the DFS name node
      should store the name table(fsimage).  If this is a comma-delimited list
      of directories then the name table is replicated in all of the
      directories, for redundancy. </description>
</property>

<property>
  <name>dfs.namenode.shared.edits.dir</name>
  <value>qjournal://hadoopB:8485;hadoopC:8485;hadoopD:8485/hadoop-test</value>
  <description>A directory on shared storage between the multiple namenodes
  in an HA cluster. This directory will be written by the active and read
  by the standby in order to keep the namespaces synchronized. This directory
  does not need to be listed in dfs.namenode.edits.dir above. It should be
  left empty in a non-HA cluster.
  </description>
</property>

<property>
  <name>dfs.datanode.data.dir</name>
  <value>file:///home/hadoop/hdfs/data</value>
  <description>Determines where on the local filesystem an DFS data node
  should store its blocks.  If this is a comma-delimited
  list of directories, then data will be stored in all named
  directories, typically on different devices.
  Directories that do not exist are ignored.
  </description>
</property>

<property>
  <name>dfs.ha.automatic-failover.enabled</name>
  <value>false</value>
  <description>
    Whether automatic failover is enabled. See the HDFS High
    Availability documentation for details on automatic HA
    configuration.
  </description>
</property>

<property>
  <name>dfs.journalnode.edits.dir</name>
  <value>/home/hadoop/hdfs/journal/</value>
</property>

</configuration>

在hadoopA配置mapred-site.xml

<configuration>

<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
<property>
<name>mapreduce.jobhistory.address</name>
<value>hadoopB:10020</value>
</property>
<property>
<name>mapreduce.jobhistory.webapp.address</name>
<value>hadoopB:19888</value>
</property>
</configuration>

在hadoopA配置yarn-site.xml

<configuration>

  <!-- Resource Manager Configs -->
  <property>
    <description>The hostname of the RM.</description>
    <name>yarn.resourcemanager.hostname</name>
    <value>hadoopA</value>
  </property>

  <property>
    <description>The address of the applications manager interface in the RM.</description>
    <name>yarn.resourcemanager.address</name>
    <value>${yarn.resourcemanager.hostname}:8032</value>
  </property>

  <property>
    <description>The address of the scheduler interface.</description>
    <name>yarn.resourcemanager.scheduler.address</name>
    <value>${yarn.resourcemanager.hostname}:8030</value>
  </property>

  <property>
    <description>The http address of the RM web application.</description>
    <name>yarn.resourcemanager.webapp.address</name>
    <value>${yarn.resourcemanager.hostname}:8088</value>
  </property>

  <property>
    <description>The https adddress of the RM web application.</description>
    <name>yarn.resourcemanager.webapp.https.address</name>
    <value>${yarn.resourcemanager.hostname}:8090</value>
  </property>

  <property>
    <name>yarn.resourcemanager.resource-tracker.address</name>
    <value>${yarn.resourcemanager.hostname}:8031</value>
  </property>

  <property>
    <description>The address of the RM admin interface.</description>
    <name>yarn.resourcemanager.admin.address</name>
    <value>${yarn.resourcemanager.hostname}:8033</value>
  </property>

  <property>
    <description>The class to use as the resource scheduler.</description>
    <name>yarn.resourcemanager.scheduler.class</name>
    <value>org.apache.hadoop.yarn.server.resourcemanager.scheduler.fair.FairScheduler</value>
  </property>

  <property>
    <description>fair-scheduler conf location</description>
    <name>yarn.scheduler.fair.allocation.file</name>
    <value>/home/hadoop/hadoop-2.7.3/etc/hadoop/fairscheduler.xml</value>
  </property>

  <property>
    <description>List of directories to store localized files in. An
      application's localized file directory will be found in:
      ${yarn.nodemanager.local-dirs}/usercache/${user}/appcache/application_${appid}.
      Individual containers' work directories, called container_${contid}, will
      be subdirectories of this.
   </description>
    <name>yarn.nodemanager.local-dirs</name>
    <value>/home/hadoop/yarn/local</value>
  </property>

  <property>
    <description>Whether to enable log aggregation</description>
    <name>yarn.log-aggregation-enable</name>
    <value>true</value>
  </property>

  <property>
    <description>Where to aggregate logs to.</description>
    <name>yarn.nodemanager.remote-app-log-dir</name>
    <value>/tmp/logs</value>
  </property>

  <property>
    <description>Amount of physical memory, in MB, that can be allocated
    for containers.</description>
    <name>yarn.nodemanager.resource.memory-mb</name>
    <value>8720</value>
  </property>

  <property>
    <description>Number of CPU cores that can be allocated
    for containers.</description>
    <name>yarn.nodemanager.resource.cpu-vcores</name>
    <value>2</value>
  </property>

  <property>
    <description>the valid service name should only contain a-zA-Z0-9_ and can not start with numbers</description>
    <name>yarn.nodemanager.aux-services</name>
    <value>mapreduce_shuffle</value>
  </property>

</configuration>

在hadoopA配置fairscheduler.xml

<allocations>

  <queue name="infrastructure">
    <minResources>102400 mb, 50 vcores </minResources>
    <maxResources>153600 mb, 100 vcores </maxResources>
    <maxRunningApps>200</maxRunningApps>
    <minSharePreemptionTimeout>300</minSharePreemptionTimeout>
    <weight>1.0</weight>
    <aclSubmitApps>root,yarn,search,hdfs</aclSubmitApps>
  </queue>

   <queue name="tool">
      <minResources>102400 mb, 30 vcores</minResources>
      <maxResources>153600 mb, 50 vcores</maxResources>
   </queue>

   <queue name="sentiment">
      <minResources>102400 mb, 30 vcores</minResources>
      <maxResources>153600 mb, 50 vcores</maxResources>
   </queue>

</allocations>

在hadoopA配置slaves檔案


[root@hadoopa hadoop]# cat slaves
hadoopB
hadoopC
hadoopD

將hadoopA上hadoop的安裝目錄複製到其它


[hadoop@hadoopa hadoop-2.7.3]$ scp etc/hadoop/* hadoopB://home/hadoop/hadoop-2.7.3/etc/hadoop/


[hadoop@hadoopa hadoop-2.7.3]$ scp etc/hadoop/* hadoopC://home/hadoop/hadoop-2.7.3/etc/hadoop/


[hadoop@hadoopa hadoop-2.7.3]$ scp etc/hadoop/* hadoopD://home/hadoop/hadoop-2.7.3/etc/hadoop/

第五：啟動hadoop

在各個JournalNode節點上，輸入以下命令啟動journalnode服務

[hadoop@hadoopb hadoop-2.7.3]$ sbin/hadoop-daemon.sh start journalnode
[hadoop@hadoopc hadoop-2.7.3]$ sbin/hadoop-daemon.sh start journalnode
[hadoop@hadoopd hadoop-2.7.3]$ sbin/hadoop-daemon.sh start journalnode

在[nn1]上，對其進行格式化，並啟動：

[root@hadoopa hadoop-2.7.3]# bin/hdfs namenode -format
[root@hadoopa hadoop-2.7.3]# sbin/hadoop-daemon.sh start namenode

在[nn2]上，同步nn1的元資料資訊

[hadoop@hadoopb hadoop-2.7.3]$ bin/hdfs namenode -bootstrapStandby

在[nn2]上，啟動NameNode：

[hadoop@hadoopb hadoop-2.7.3]$ sbin/hadoop-daemon.sh start namenode
(經過以上四步操作，nn1和nn2均處理standby狀態)

在[nn1]上，將NameNode切換為Active


[root@hadoopa hadoop-2.7.3]# bin/hdfs haadmin -transitionToActive nn1

在[nn1]上，啟動所有datanode


[root@hadoopa hadoop-2.7.3]# sbin/hadoop-daemons.sh start datanode

啟動yarn：在[nn1]上，輸入以下命令

[root@hadoopa hadoop-2.7.3]# sbin/start-yarn.sh

關閉Hadoop叢集：在[nn1]上，輸入以下命令

[root@hadoopa hadoop-2.7.3]# sbin/stop-dfs.sh
[root@hadoopa hadoop-2.7.3]# sbin/stop-yarn.sh

第六：驗證hadoop

hadoopA輸入命令


[[email protected] jdk1.7]# /home/hadoop/jdk1.7/bin/jps
10747 -- process information unavailable
15583 Jps
16576 -- process information unavailable

hadoopB輸入命令

[hadoop@hadoopb hadoop-2.7.3]$ /home/hadoop/jdk1.7/bin/jps
15709 NodeManager
2405 JournalNode
11551 NameNode
12862 DataNode
15398 Jps

hadoopC輸入命令

[hadoop@hadoopc ~]$ /home/hadoop/jdk1.7/bin/jps
2388 JournalNode
13091 Jps
13553 DataNode
15214 NodeManager

hadoopD輸入命令

[hadoop@hadoopd hadoop-2.7.3]$ /home/hadoop/jdk1.7/bin/jps
13506 DataNode
12675 Jps
15334 NodeManager
2570 JournalNode

開啟瀏覽器輸入以下地址：

http://192.168.1.201:50070/dfshealth.html#tab-overview
http://192.168.1.202:50070/dfshealth.html#tab-overview
http://192.168.1.201:8088/cluster/scheduler

第七：關閉hadoop

關閉Hadoop叢集：在[nn1]上，輸入以下命令

[root@hadoopa hadoop-2.7.3]# sbin/stop-dfs.sh
[root@hadoopa hadoop-2.7.3]# sbin/stop-yarn.sh

第八：特別說明

說明：
步驟2：在[nn1]上，對其進行格式化，並啟動：
bin/hdfs namenode -fromal
步驟3：在[nn2]上，同步nn1的元資料資訊
bin/hdfs namenode -bootstrapStandby

這兩步操作，只是在第一次建立叢集的時候才使用
下次重啟節點，是不需要操作這兩步

基於hadoop2.7.3搭建多機環境（YARN+HA）

第一：環境說明 parallels desktop CentOS-6.5-x86_64-bin-DVD1.iso jdk-7u79-linux-x64.tar.gz Hadoop-2.7.3.tar.gz 搭建四個節點的叢集。他們的hostname分佈為ha

Hadoop2.7.3單機偽分散式環境搭建

Hadoop2.7.3單機偽分散式環境搭建作者：家輝，日期：2018-07-10 CSDN部落格： http://blog.csdn.net/gobitan 說明：Hadoop測試環境經常搭建，這裡也做成一個模板並記錄下來。基礎環境

Hadoop2.7.3搭建單機、偽分佈環境

1.下載jdk並安裝去官網下就可以了，下完之後把檔案移到/opt/Java下[email protected]:~/下載$ mv ./hadoop-2.7.2-src.tar.gz /opt/

ESP32搭建3.ubuntu14.04下搭建esp32開發環境（最新版）

終端 pat 權限技術實例為我 tro component 直接硬件為樂鑫出品的ESP32一款集成了wifi和藍牙的集成模塊。 1.首先ctrl+alt+t打開終端，sudo -s選擇用root權限登陸。 2. 輸入指令：sudo apt-get install

JDK1.10+scala環境的搭建之linux環境（centos6.9）

ava header 執行 2.6 準備 img error: .com html ---恢復內容開始--- 第一步：安裝jdk1.10版本進入網頁 http://oracle.com/technetwork/java/javase/downloads/index.h

7-3 樹的同構（25 分）

color pre 相同存儲有一個 content wid -s http 題目地址： https://pintia.cn/problem-sets/15/problems/711 解決方法：　　要判斷樹是否是同構，判定存儲相同信息的節點的孩子（或父節點）是否一致即可

Sublime Text3搭建Java編譯環境（Windows系統）

Sublime Text3是一款輕量級但卻功能強大的編譯器，為它配置Java編譯環境步驟如下： 1. 首先配置好Java環境變數我的jdk版本是1.8.0_191，存放目錄是C:\Program Files\Java，因此新增以下環境變數（1）系統變數→新建 JAVA_HOME

PAT 7-3 樹的同構（25 分）

給定兩棵樹T1和T2。如果T1可以通過若干次左右孩子互換就變成T2，則我們稱兩棵樹是“同構”的。例如圖1給出的兩棵樹就是同構的，因為我們把其中一棵樹的結點A、B、G的左右孩子互換後，就得到另外一棵樹。而圖2就不是同構的。現給定兩棵樹，請你判斷它們是否是同構的。輸入格式:

Ubuntu下搭建spark2.4環境（單機版）

說明：單機版的Spark的機器上只需要安裝JDK即可，其他諸如Hadoop、Zookeeper（甚至是scala）之類的東西可以一概不安裝。叢集版搭建：Spark2.2叢集部署和配置一、安裝JDK1.8 1、下載JDK1.8，地址 2、將下載的檔案儲存在 /home/qq/j

7-3 組個最小數（20 分）

#include <bits/stdc++.h> using namespace std; int main() { int a[50]; int n, i = 0, j = 0,

EOS系列四：Ubuntu上搭建EOS開發環境（原始碼編譯）

步驟： 1、git下載原始碼 $ git clone https://github.com/EOSIO/eos --recursive 2、編譯原始碼：下載完成之後會在home目錄建立eos

在Ubuntu上搭建Android開發環境（Android Studio）

五一放假，閒著沒事，裝了最新的ubutun16.04，然後打算順道把android開發環境移植到ubuntu上來體驗一下。 1.首先下載了Android studio 2.1 之前使用的提供改host 翻牆的網站今天掛了。。。只能在國內網站下了。。。 http://w

7-3 一元多項式求導（18 分）

設計函式求一元多項式的導數。輸入格式: 以指數遞降方式輸入多項式非零項係數和指數（絕對值均為不超過1000的整數）。數字間以空格分隔。輸出格式: 以與輸入相同的格式輸出導數多項式非零項的係數和指數。數字間以空格分隔，但結尾不能有多餘空格。輸入樣例: 3 4 -5 2 6 1

Spark2.x學習筆記：6、在Windows平臺下搭建Spark開發環境（Intellij IDEA）

Spark2.x學習筆記 6、在Windows平臺下搭建Spark開發環境（Intellij IDEA+Maven） 6.1 整合開發環境IDE 為了方便應用程式開發與測試，提高開發效率，一般使用整合開發工具IDE。同樣，為了方便Spark應用程式編

習題7-3 判斷上三角矩陣（15 分）

上三角矩陣指主對角線以下的元素都為0的矩陣；主對角線為從矩陣的左上角至右下角的連線。本題要求編寫程式，判斷一個給定的方陣是否上三角矩陣。輸入格式：輸入第一行給出一個正整數T，為待測矩陣的個數。接下來給出T個矩陣的資訊：每個矩陣資訊的第一行給出一個不超過10的正整數n。隨後n行，

33.Windbg-VMware+windbg搭建雙機除錯（增加virtualKD）

虛擬機器環境 1.xp 虛擬機器用的是XP系統，找到XP系統開啟系統盤（比如C盤），找到Boot.ini，去掉這個檔案的只讀屬性，用記事本開啟Boot.ini [boot loader] timeout=30 default=multi(0)disk(0)rdisk(0)p

PTA習題7-3 判斷上三角矩陣（15 分）

#include<stdio.h> int main() { int T,N,i,j,flag; scanf("%d",&T); while(T--){ scanf("%d",&N);

Android：使用eclipse luna搭建Android開發環境（支援java8）

一、下載相關軟體　　android開發環境　　　　準備工作：下載Eclipse、JDK、Android SDK、ADT外掛　　上面要下載的4個軟體中，除了JDK之外，Eclipse、Android SDK、ADT外掛這三個都需要FQ才能夠正常下

7-3 輸出三角形字元陣列（15 分）

一、題目二、個人理解此題本質來說就是輸出 n個字母 n-1個字母 .... 1個字母主要就是模擬這個過程，我們可以另外引進一個變數進行字母的變化，另外題目保證字母在26個之內。

快速搭建IE測試環境（Virtualbox+ievms）

轉自：http://icodeit.org/2014/09/setup-ie-series-testing-enviroments/ IE下的測試作為一個有追求的程式設計師，應該儘可能的遠離Windows系統。不論從專業開發者的角度，還是僅僅作為終端使用者從使用體驗

基於hadoop2.7.3搭建多機環境（YARN+HA）

第一：環境說明

第二：作業系統配置

第三：安裝和配置jdk

第四：安裝和配置hadoop

第五：啟動hadoop

第六：驗證hadoop

第七：關閉hadoop

第八：特別說明

相關推薦