HDFS高可用（HA）配置

阿新 • • 發佈：2019-01-27

關於HDFS HA如何進行設計，請檢視——>HDFS高可用（HA）設計，以下的配置也都是根據此文中的設計方式進行配置，所以為了更好的理解下面各個配置的含義，務必先閱讀此文。

對各個節點進行劃分：

選項	主機1	主機2
NameNode	NameNode
JournalNode	JournalNode	JournalNode
DataNode	DataNode	DataNode

此處不再需要SecondaryNameNode，因為SecondaryNameNode的作用時合併映象檔案和日誌檔案，防止下次啟動時讀取資料的速度太慢，而配置高可用之後不需要再次啟動。

這裡的配置將基於之前已經配置過的hadoop分散式叢集進行配置，叢集搭建這裡不再進行討論，至於如何配置hadoop分散式叢集，請檢視——>Hadoop叢集搭建——環境配置

這裡寫圖片描述

配置HDFS HA

以下的配置也是根據官方文件進行的配置，您也可以直接檢視官方文件

配置core-site.xml

<configuration>      
        <!--配置客戶端的ns--> 
        <property> 
                <name>fs.defaultFS</name> 
                <value 
>hdfs://ns1</value> 
        </property> 
                <!--臨時目錄--> 
        <property> 
                <name>hadoop.tmp.dir</name> 
                <value>/home/bxp/Documents/install/hadoop-2.6.5-hdfsha/data/tmp</value>
        </property> 
        <!--垃圾回收--> 
 
        <property> 
                <name>fs.trash.interval</name> 
                <value>420</value> 
        </property> 
</configuration>

配置hdfs-site.xml


<configuration>

    <!--nameservices,管理namenode的空間-->
    <property>
         <name>dfs.nameservices</name>
        <value>ns1</value>
    </property>

    <!--配置nameservices所管理的namenode,即ns1管理的namenode為nn1,nn2-->
    <property>
        <name>dfs.ha.namenodes.ns1</name>
        <value>nn1,nn2</value>
    </property>
    <!--配置兩個namenode所在主機-->
    <property>
        <name>dfs.namenode.rpc-address.ns1.nn1</name>
        <value>hadoop-series.bxp.com:8020</value>
    </property>
    <property>
        <name>dfs.namenode.rpc-address.ns1.nn2</name>
        <value>hadoop-series1.bxp.com:8020</value>
    </property>
    <!--配置兩個namenode的web 50070埠-->
    <property>
        <name>dfs.namenode.http-address.ns1.nn1</name>
        <value>hadoop-series.bxp.com:50070</value>
    </property>
    <property>
        <name>dfs.namenode.http-address.mycluster.nn2</name>
        <value>hadoop-series1.bxp.com:50070</value>
    </property>
    <!--jernalNode所在主機-->
    <property>
        <name>dfs.namenode.shared.edits.dir</name>
        <value>qjournal://hadoop-series.bxp.com:8485;hadoop-series1.bxp.com:8485;hadoop-series2.bxp.com:8485/ns1</value>
    </property>
    <!--配置客戶端代理-->
    <property>
        <name>dfs.client.failover.proxy.provider.mycluster</name>
        <value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>
    </property>
    <!--配置兩個namenode之間的隔離方式-->
    <property>
        <name>dfs.ha.fencing.methods</name>
        <value>sshfence</value>
    </property>
    <!--此處是自己主機的ssh-key路徑
    注意：此處使用的是ssh隔離方式，必須提前配置兩個namenode所在主機之間能夠進行無金鑰登陸，否則會失敗
    -->



    <property>
        <name>dfs.ha.fencing.ssh.private-key-files</name>
        <value>/home/bxp/.ssh/id_rsa</value>
    </property>
    <!--配置jernal日誌檔案存放在本地磁碟的那個目錄下-->
    <property>
        <name>dfs.journalnode.edits.dir</name>
        <value>/home/bxp/Documents/install/hadoop-2.6.5-hdfsha/data/dfs/jn</value>
    </property>

    <!-- 副本數量不需要進行控制，預設就可以-->
    <!--    
    <property>
             <name>dfs.replication</name>
            <value>1</value>
        </property>
    -->
    <!-- secondaryNamenode放在第hadoop-series2.bxp.com上-->
    <!--
    <property>
      <name>dfs.namenode.secondary.http-address</name>
      <value>hadoop-series2.bxp.com:50070</value>
    </property>
    -->
</configuration>

啟動HDFS HA叢集

1、逐個啟動journalnode

sbin/hadoop-daemon.sh start journalnode

2、格式化nn1，並啟動nn1的namenod

bin/hdfs namenode -format
sbin/hadoop-daemon.sh start namenode

3、在nn2上執行如下命令從nn1上拷貝格式化生成的映象檔案，並啟動nn2的namenode

bin/hdfs namenode -bootstrapStandby
sbin/hadoop-daemon.sh start namenode

4、逐個啟動datanode

 sbin/hadoop-daemon.sh start datanode

5、將nn1設定為Active NameNode

bin/hdfs haadmin -transitionToActive nn1

Zookeeper實現namenode間自動故障轉移

啟動後都是Standby，通過Zookeeper選舉一個為Active。並通過zookeeper監控兩個namenode。(ZKFC, FailoverController)
這裡寫圖片描述

1、配置自動故障轉移

hdfs-site.xml中增加如下配置

<!--下面時配置自動故障轉移-->  
    <property>
        <name>dfs.ha.automatic-failover.enabled</name>
        <value>true</value>
    </property>

core-site.xml中增加如下配置

<!--指定zookeeper所在主機-->
    <property>
        <name>ha.zookeeper.quorum</name>
        <value>hadoop-series.bxp.com:2181,hadoop-series1.bxp.com:2181,hadoop-series2.bxp.com:2181</value>
    </property>

2、重新啟動叢集

（1）關閉所有的HDFS服務
（2）啟動Zookeeper叢集

zookeeper-3.5.0-alpha/bin/zkServer.sh start

（3）初始化HA在Zookeeper中狀態

bin/hdfs zkfc -formatZK

初始化成功，會提示 Successfully created /hadoop-ha/ns1 in ZK.
通過zk客戶端進行檢視會發現確實建立了/hadoop-ha/ns1目錄

zookeeper-3.5.0-alpha/bin/zkCli.sh
ls /hadoop-ha

（4）啟動HDFS服務
在各個NameNode節點上啟動DFSZK Failover Controller，現在哪個主機上啟動，那個主機NameNode就是Active NameNode。

sbin/hadoop-daemon start zkfc

（5）驗證自動故障轉移配置成功。
將Active NameNode程序殺死，檢視Standby是否會迅速轉換成Active

kill -9 16299

將Active NameNode網路斷開，檢視Standby是否會迅速轉換成Active

service network stop

HDFS高可用（HA）配置

關於HDFS HA如何進行設計，請檢視——>HDFS高可用（HA）設計，以下的配置也都是根據此文中的設計方式進行配置，所以為了更好的理解下面各個配置的含義，務必先閱讀此文。對各個節點進行劃分：選項主機1 主機2 主機3

Hadoop 及 YARN 的高可用（HA）配置

機器節點名稱：node1、node2、node3、 Linux：Centos6.9 上傳 Hadoop 的配置 1.使用 hadoop 使用者進入/home/hadoop/apps 目錄下 2.上傳安裝檔案並解壓：tar -zxvf hadoop-2

HDFS高可用（HA）設計

首先通過配置Active/Standby兩個NameNode實現叢集中對NameNode的熱備（所謂熱備就是當Active NameNode發生故障，Standby NameNode馬上接手 Activy NameNode的工作）。要實現熱備，需要滿足以下條件：

使用Keepalived配置主從熱備實現Nginx高可用（HA）

_id keep 過去基礎 inter icmp interval RR 轉發 Keepalived 簡要介紹 Keepalived 是一種高性能的服務器高可用或熱備解決方案,Keepalived 可以用來防止服務器單點故障的發生,通過配合 Nginx 可以實現 w

Keepalived+Nginx實現高可用（HA）

nginx+keepalived ha高可用高可用有2中方式。1、Nginx+keepalived 主從配置這種方案，使用一個vip地址，前端使用2臺機器，一臺做主，一臺做備，但同時只有一臺機器工作，另一臺備份機器在主機器不出現故障的時候，永遠處於浪費狀態，對於服務器不多的網站，該方案不經濟實惠。2、Ngin

Corosync+pacemaker+DRBD+mysql（mariadb）實現高可用（ha）的mysql集群（centos7）

corosync+pacemaker+drbd+mysql（mariadb）實現高可用（ha）的mysql集群（centos7）Corosync+pacemaker+DRBD+mysql（mariadb）實現高可用（ha）的mysql集群（centos7）目錄：介紹環境借助pcs安裝與配置corosync和p

HDFS高可用（HA)機制

定義：解決系統單點故障問題，防止一臺nameNode掛了，就會出現資料丟失等問題。原理：（1）將資料記載在Qjournal分散式日誌管理系統裡面，活躍的nameNode會定時將資料上傳到Qjournal裡面，Qjou

Linux 高可用（HA）叢集基本概念詳解

目錄十二、總結一、高可用叢集的定義高可用叢集，英文原文為High Availability Cluster，簡稱HACluster，簡單的說，叢集（cluster）就是一組計算機，它們作為一個整體向用戶提供一組網路資

YARN 高可用（HA）叢集搭建（CDH）

HDFS 高可用叢集安裝完成之後，緊接著快速搞定YARN的叢集搭建。 1.修改YARN配置檔案 1.1修改yarn-site.xml <configuration> <property> <name>yarn.resourcem

redis sentinel 高可用（HA）方案部署，及python應用示例

簡介介紹 redis sentinel（哨兵）叢集的部署，配置一主兩從的redis叢集，並通過 python 程式例項講解通過 redis sentinel 訪問叢集什麼是哨兵（Sentinel）模式 Redis sentinel 為 Redis 叢集提供了高可

理解 OpenStack 高可用（HA）（5）：RabbitMQ HA

本系列會分析OpenStack 的高可用性（HA）概念和解決方案： 1. RabbitMQ 叢集你可以使用若干個RabbitMQ 節點組成一個 RabbitMQ 叢集。叢集解決的是擴充套件性問題。所有的資料和狀態都會在叢集內所有的節點上被複制，只

理解 OpenStack 高可用（HA）（3）：Neutron 分散式虛擬路由（Neutron Distributed Virtual Routing）

本系列會分析OpenStack 的高可用性（HA）概念和解決方案： Neutron 作為 OpenStack 一個基礎性關鍵服務，高可用性（HA）和擴充套件性是它的基本需求之一。對 neutron server 來說，因為它是無狀態的，我們可以使用負載均衡器（Load B

理解 OpenStack 高可用（HA）（2）：Neutron L3 Agent HA 之虛擬路由冗餘協議（VRRP）

本系列會分析OpenStack 的高可用性（HA）概念和解決方案： 1. 基礎知識 1.1 虛擬路由冗餘協議 - VRRP 1.1.1 概念路由器是整個網路的核心。一個網路內的所有主機往往都設定一條預設路由，這樣，主機發出的目的地址不在本網段的報文將被通過預設路由

理解 OpenStack 高可用（HA）（1）：OpenStack 高可用和災備方案 [OpenStack HA and DR]

本系列會分析OpenStack 的高可用性（HA）概念和解決方案： 1. 基礎知識 1.1 高可用（High Availability，簡稱 HA）高可用性是指提供在本地系統單個元件故障情況下，能繼續訪問應用的能力，無論這個故障是業務流程、物理設施、IT軟/硬體的

openstack cinder-volume 的高可用（HA）

為了保證雲平臺的穩定性，需要做很多部分的高可用。比如控制節點高可用、計算節點高可用、網路節點高可用、儲存的高可用等；控制節點的高可用與網路節點的高可用都有官方的文件，有詳細的安裝步驟，實現起來相對來說比

Win2012R2 Hyper-V之17 配置Hyper-V群集高可用（上）

雲計算虛擬化在前面的章節中我們已經完成對於常規故障服務器的一些處理方法，即保存副本等，那如果我們需要實現高可用性怎麽辦了？即當這臺服務器性能不足或非常規宕機的時候，能夠無縫的自動實時遷移對應的虛擬服務器，以保證業務的24小時無間斷。這就是我們今天的重點Hyper-V服務器群集高可用

Spring Cloud：配置中心服務化和高可用（08）

在前兩篇的介紹中，客戶端都是直接呼叫配置中心的server端來獲取配置檔案資訊。這樣就存在了一個問題，客戶端和服務端的耦合性太高，如果server端要做叢集，客戶端只能通過原始的方式來路由，server端改變IP地址的時候，客戶端也需要修改配置，不符合springcloud服務治理的理念。sprin

淺談秒級故障切換！用MHA輕松實現MySQL高可用（三）

mysql 高可用 mha MySQL復制是異步或者半同步的。當master故障時，一些slave可能並沒有收到最新的relay log，也就意味著每個slave可能處於不同的狀態。手動處理這些一致性問題是小事，因為不修復這些問題，就不能開始復制。但是手動修復這些問題，花費一個小時或更多的時間並不

Redis入門到高可用（三）—— API理解和使用

入門到 16px ron 節點理解高可用怎麽生產 sca 一、通用命令查看所有key 127.0.0.1:6379> keys * keys命令一般不在生產環境使用！ keys命令怎麽用？ ①熱備從節點（從節點一般不在生產環境使用，可以在從節點上執

Redis入門到高可用（二）—— Redis啟動及使用

CP ber eve inf 大小 div redis-cli 號碼更改 1. 三種啟動方式 ♦? 最簡啟動 ./redis-server 使用Redis默認配置進行啟動; ♦? 動態參數啟動 * redis-server

HDFS高可用（HA）配置

配置HDFS HA

啟動HDFS HA叢集

Zookeeper實現namenode間自動故障轉移

1、配置自動故障轉移

2、重新啟動叢集

相關推薦