[大資料] hadoop HA 配置

阿新 • • 發佈：2018-11-01

前提：已經通過上一篇的環境配置好了zookeeper環境

1 叢集規劃

bigdata01.com	bigdata02.com	bigdata02.com
namenode	namenode
datanode	datanode	datanode
journalnode	journalnode	journalnode
zkfc	zkfc
resourcemanager	resourcemanager
nodemanager	nodemanager	nodemanager

2 HDFS HA

2.1 vi hdfs-core.xml

<configuration>

    <property>
        <name>dfs.replication</name>
        <value>2</value> 

    </property>

    <property>
      <name>dfs.nameservices</name>
      <value>ns</value>
    </property>

    <property>
      <name>dfs.ha.namenodes.ns</name>
      <value>nn1,nn2</value>
    </property>

    <property> 

      <name>dfs.namenode.rpc-address.ns.nn1</name>
      <value>bigdata01.com:8020</value>
    </property>

    <property>
      <name>dfs.namenode.rpc-address.ns.nn2</name>
      <value>bigdata02.com:8020</value>
    </property>

    <property>
      <name>dfs.namenode.http-address.ns.nn1</name>
      <value>bigdata01.com:50070</value>
    </property>

    <property>
      <name>dfs.namenode.http-address.ns.nn2</name>
      <value>bigdata02.com:50070</value>
    </property>

    <property>
        <name>dfs.permissions.enabled</name>
        <value>false</value>
    </property>

    <property>
      <name>dfs.namenode.shared.edits.dir</name>
      <value>qjournal://bigdata01.com:8485;bigdata02.com:8485;bigdata03.com:8485/ns</value>
    </property>

    <property>
      <name>dfs.journalnode.edits.dir</name>
      <value>/opt/modules/hadoop-2.5.0/data/dfs/jn</value>
    </property>

    <property>
      <name>dfs.client.failover.proxy.provider.ns</name>
      <value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>
    </property>

    <property>
      <name>dfs.ha.fencing.methods</name>
      <value>sshfence</value>
    </property>

    <property>
      <name>dfs.ha.fencing.ssh.private-key-files</name>
      <value>/home/kfk/.ssh/id_rsa</value>
    </property>

    <property>
      <name>dfs.ha.automatic-failover.enabled.ns</name>
      <value>true</value>
    </property>
</configuration>

2.2 vi core-site.xml

    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://ns</value>
    </property>

    <property>
        <name>hadoop.http.staticuser.user</name>
        <value>kfk</value>
    </property>

    <property>
       <name>ha.zookeeper.quorum</name>
       <value>bigdata01.com:2181,bigdata02.com:2181,bigdata03.com:2181</value>
    </property>


    <property>
        <name>hadoop.tmp.dir</name>
        <value>/opt/modules/hadoop-2.5.0/data/tmp</value>
    </property>

2.3 分發hdfs-site.xml 和core-site.xml 到其餘機器中

2.4 啟動HA

First Step:

開啟hadoopHA的初始化
1. 在各個節點上啟動journalnode

sbin/hadoop-daemon.sh start journalnode

在[nn1]上，對其進行格式化，並啟動

bin/hdfs namenode -format
sbin/hadoop-daemon.sh start namenode

[nn2]中同步nn1的元資料

bin/hdfs namenode -bootstrapStandby

啟動nn2

sbin/hadoop-daemon.sh start namenode

將nn1切換成Active

bin/hdfs haadmin -transitionToActive nn1

啟動所有節點的datanode

sbin/hadoop-daemons.sh start datanode

Second Step:

故障自動轉移
1. 先關閉所有的hdfs服務

sbin/stop-dfs.sh

啟動zookeper叢集

#所有的機器都要執行
bin/zkServer.sh

初始化HA在zookeeper中的狀態

bin/hdfs zkfc -formatZK

啟動hdfs服務

sbin/start-dfs.sh

啟動DFSZK服務

sbin/hadoop-daemon.sh start zkfc

3 yarn HA

3.1 vi yarn-site.xml


<configuration>

    <property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
    </property>

    <property>
        <name>yarn.log-aggregation-enable</name>
        <value>true</value> 
    </property>

    <property>
        <name>yarn.log-aggregation.retain-seconds</name>
        <value>10000</value> 
    </property>

    <property>
       <name>yarn.resourcemanager.ha.enabled</name>
       <value>true</value>
     </property>

     <property>
       <name>yarn.resourcemanager.cluster-id</name>
       <value>cluster1</value>
     </property>

     <property>
       <name>yarn.resourcemanager.ha.rm-ids</name>
       <value>rm1,rm2</value>
     </property>

     <property>
       <name>yarn.resourcemanager.hostname.rm1</name>
       <value>bigdata01.com</value>
     </property>
     <property>
       <name>yarn.resourcemanager.hostname.rm2</name>
       <value>bigdata02.com</value>
     </property>

     <property>
       <name>yarn.resourcemanager.zk-address</name>
       <value>bigdata01.com:2181,bigdata01.com:2181,bigdata01.com:2181</value>
     </property>

     <property>
       <name>yarn.resourcemanager.recovery.enabled</name>
       <value>true</value>
     </property>

      <property>
       <name>yarn.resourcemanager.store.class</name>
       <value>org.apache.hadoop.yarn.server.resourcemanager.recovery.ZKRMStateStore</value>
     </property>

</configuration>

3.2 分發到其他機器

3.3 啟動

啟動resourcemanager
啟動nodemanager
測試mapreduce wordcount

[大資料] hadoop HA 配置

前提：已經通過上一篇的環境配置好了zookeeper環境 1 叢集規劃 bigdata01.com bigdata02.com bigdata02.com namenode n

[大資料]hbase HA配置

1 叢集規劃 bigdata01.com bigdatan2.com bigdata03.com master master region

[大資料]hadoop 環境配置(1)

1 基礎環境搭建 Centos 6.4 環境 hadoop 環境搭建 1 使用者新增 sodo adduser kfk 2 hostname 更改 sudo vi /etc/sysconfig/network 3 hosts 更改 sudo vi /etc/h

[大資料]hadoop 聯邦機制及配置檔案

hadoop 聯邦機制 1 原理即多個ha 聯合組成一套叢集環境，對外提供一致介面【ViewFs】（相當於擴容）即cluserID 相等但是相同的datanode服務於不同的namenode。原理是通過namenodeID和blockPool-id來判別檔案存放的位置

大資料Hadoop系列之Hadoop服務開機自啟動配置

1. 編寫執行指令碼 $ sudo cd /etc/init.d $ sudo vi hadoop #!/bin/bash #chkconfig:35 95 1 #description:script to start/stop hadoop su - hadoop

大資料 Hadoop介紹、配置與使用

前言 Hadoop是Apache軟體基金會旗下的一個開源分散式計算平臺。大資料基礎概念大資料 Centos基礎大資料 Shell基礎大資料 ZooKeeper 大資料 Hadoop介紹、配置與使用大資料 Hadoop之HDFS

大資料-Hadoop生態(1)-CentOS6.8的安裝,配置和克隆

準備工作 150G及以上的硬碟空間(因為要搭建3個系統組成的叢集),cpu儘量i7-7xxx標壓以上,記憶體16G及以上自行搜尋,下載,安裝VMWare 準備CentOS6.8的映象檔案注意:安裝虛擬機器前必須開啟BIOS虛擬化支援安裝CentOS

學習筆記:從0開始學習大資料-4.Eclipse配置hadoop開發環境

Eclipse配置hadoop開發環境 1. 下載 hadoop-eclipse-plugin-2.6.0.jar https://github.com/winghc/hadoop2x-eclipse-plugin/tree/v2.6.0 2. 複

[大資料]Hadoop大資料開發基礎----環境配置(四)

在上一章配置完master虛擬機器之後，下面我們要把它克隆，生成三個新的虛擬機器slave1,slave2,slave3 開啟VMware虛擬機器，選擇虛擬機器選項卡，然後選擇管理選項卡，點選克隆，點選下一步，選擇克隆源，這裡選擇虛擬機器中的當前狀態，點選下一

大資料(hadoop-HDFS的本地開發環境的配置與常見的HDFS的JAVA API)

HDFS的本地開發環境搭建 1：所需工具 1）hadoop2.7.3安裝包 2）hadoop-eclipse-plugin

Hadoop-HA配置詳細步驟

eno col ice nbsp 版本 files tab des frame 1. HA服務器配置對hdfs做高可用 1.1服務器詳情服務器：centos7 Hadoop:2.6.5 Jdk:1.8 共四臺服務器 192.168.1.111 node1 192

大資料 Hadoop之HDFS

前言 HDFS（Hadoop Distributed File System）是基於流資料模式訪問和處理超大檔案的需求而開發的，它可以運行於廉價的商用伺服器上。大資料基礎概念大資料 Centos基礎大資料 Shell基礎大資料 ZooKeepe

大資料Hadoop學習筆記（三）

1.HDFS架構講解 2.NameNode啟動過程 3.YARN架構組建功能詳解 4.MapReduce 程式設計模型 HDFS架構講解源自谷歌的GFS論文 HDFS： *抑鬱擴充套件的分散式系統 *執行在大量普通的鏈家機器上，提供容錯機制 *為

大資料Hadoop學習筆記（二）

Single Node Setup 官網地址 1. 本地模式 2.偽分散式模式 ************************* 本地模式 **************************** . grep input output ‘dfs[a-

大資料Hadoop學習筆記（一）

大資料Hadoop2.x hadoop用來分析儲存網路資料 MapReduce：對海量資料的處理、分散式。思想————> 分而治之，大資料集分為小的資料集，每個資料集進行邏輯業務處理合並統計資料結果（reduce）執行模式：本地模式和yarn模式 input—

大資料Hadoop學習筆記（五）

分散式部署本地模式Local Mode 分散式Distribute Mode 偽分散式一臺機器執行所有的守護程序從節點DN和NM只有一個完全分散式

大資料Hadoop學習筆記（四）

MapReduce執行過程 ======== step1 ： input InputFormat 讀取資料轉換成<key, value>

大資料Hadoop學習筆記（六）

HDFS HA 背景：在hadoop2.0之前，HDFS叢集中的NameNode存在單點故障（SPOF）對於只有一個NameNode的叢集，若NameNode機器出現故障，則整個叢集將無法使用，直到NameNode重新啟動 NameNode主要在一下兩方面影響

大資料Hadoop學習系列之Hadoop、Spark學習路線

1 Java基礎：視訊方面：推薦畢老師《畢向東JAVA基礎視訊教程》。學習hadoop不需要過度的深入，java學習到javase，在多執行緒和並行化多多理解實踐即可。書籍方面：推薦李興華的《java開發實戰經典》 2 Linux基礎：視訊方面：（1）馬哥的高薪Linux

大資料架構師：如何從零基礎搭建大資料hadoop生態圈

從年初起，幾家國際大廠的開發者大會，無論是微軟Build、Facebook F8還是稍後的Google I/O，莫不把“AI優先”的大旗扯上雲霄。如果這一波AI大潮只是空喊幾句口號，空提幾個戰略，空有幾家炙手可熱的創業公司，那當然成不了什麼大氣候。但風浪之下，我們看到的卻是，Google一線的各大業

[大資料] hadoop HA 配置

1 叢集規劃

2 HDFS HA

2.1 vi hdfs-core.xml

2.2 vi core-site.xml

2.3 分發hdfs-site.xml 和core-site.xml 到其餘機器中

2.4 啟動HA

3 yarn HA

3.1 vi yarn-site.xml

3.2 分發到其他機器

3.3 啟動

相關推薦