大資料Hadoop學習筆記（六）

阿新 • • 發佈：2018-11-09

HDFS HA

背景：

在hadoop2.0之前，HDFS叢集中的NameNode存在單點故障（SPOF）對於只有一個NameNode的叢集，若NameNode機器出現故障，則整個叢集將無法使用，直到NameNode重新啟動

NameNode主要在一下兩方面影響叢集：
- NM機器發生意外
- NM機器需要升級

HDFS HA通過配置Active/Standby兩個NM實現在叢集中對NM的熱備份來解決上述問題。

HDFS HA設計

配置HA要點：

share edits
- journalNode
NameNode（active、standby）
client proxy
- proxy代理管理NM地址，客戶端請求時，通過proxy去尋找active的NameNode
fence 隔離
- 同一時刻僅僅有一個NM對外提供服務
- 使用sshfence
  - 必須保證兩個NM之間能夠ssh無密碼登陸
如何保證兩個NM資料一致同步呢？
- 關鍵在編輯檔案edits
如何保證edits檔案的安全性和可靠性？（
HA核心）
- activeNM往共享檔案中寫入，standbyNM從共享檔案中讀取
- 編輯日誌儲存在zookeeper（主要因為zk是基數臺機器）的journalNode程序。如果有n個機器寫入成功，則代表standbyNM可以去共享檔案中讀取。
如何保證兩個NM不搶佔工作？
- 配置NameNode隔離性

配置

規劃叢集

.	hdp-node-01	hdp-node-02	hdp-node-03
HDFS	NameNode	NameNode
.	DataNode	DataNode	DataNode
.	JournalNode	JournalNode	JournalNode
YARN		ResourceManager
.	NodeManager	NodeManager	NodeManager
MapReduce	JobHistoryServer

步驟：

官網連結

準備環境（在之前分散式檔案基礎上修改）
- 先將之前分散式檔案備份（每臺機器）
  - cp -r hadoop-2.5.0/ dist-hadoop-2.5.0
  - mv hadoop-2.5.0/data/tmp/ dist-tmp
  - mkdir hadoop-2.5.0/data/tmp
- hdfs-site.xml

<configuration>
	<property>
	  <name>dfs.nameservices</name>
	  <value>mycluster</value>
	</property>

	<property>
	  <name>dfs.ha.namenodes.mycluster</name>
	  <value>nn1,nn2</value>
	</property>

	<!-- NameNode RPC ADDRESS -->
	<property>
	  <name>dfs.namenode.rpc-address.mycluster.nn1</name>
	  <value>hdp-node-01:8020</value>
	</property>
	<property>
	  <name>dfs.namenode.rpc-address.mycluster.nn2</name>
	  <value>hdp-node-02:8020</value>
	</property>

	<!-- NameNode HTTP WEB ADDRESS -->
	<property>
	  <name>dfs.namenode.http-address.mycluster.nn1</name>
	  <value>hdp-node-01:50070</value>
	</property>
	<property>
	  <name>dfs.namenode.http-address.mycluster.nn2</name>
	  <value>hdp-node-02:50070</value>
	</property>

	<!-- NameNode SHARED EDITS ADDRESS -->
	<property>
	  <name>dfs.namenode.shared.edits.dir</name>
	  <value>qjournal://hdp-node-01:8485;hdp-node-02:8485;hdp-node-03:8485/mycluster</value>
	</property>

	<property>
	  <name>dfs.journalnode.edits.dir</name>
	  <value>/opt/app/hadoop-2.5.0/data/dfs/jn</value>
	</property>

	<!-- HDFS PROXY CLIENT -->
	<property>
	  <name>dfs.client.failover.proxy.provider.mycluster</name>
	  <value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>
	</property>

	<!-- HDFS SSH FENCE -->
	<property>
	  <name>dfs.ha.fencing.methods</name>
	  <value>sshfence</value>
	</property>
	<property>
	  <name>dfs.ha.fencing.ssh.private-key-files</name>
	  <value>/root/.ssh/id_rsa</value>
	</property>


</configuration>

core-site.xml

<configuration>

    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://mycluster</value>
    </property>
    <property>
        <name>hadoop.tmp.dir</name>
        <value>/opt/app/hadoop-2.5.0/data/tmp</value>
    </property>
	
</configuration>

啟動

將修改的配置檔案同步到其他機器：
- scp -r etc/hadoop/core-site.xml etc/hadoop/hdfs-site.xml [email protected]:/opt/app/hadoop-2.5.0/etc/hadoop/
- scp -r etc/hadoop/core-site.xml etc/hadoop/hdfs-site.xml [email protected]:/opt/app/hadoop-2.5.0/etc/hadoop/
step 1：啟動三臺機器的journalnode
- sbin/hadoop-daemon.sh start journalnode
step 2：將nn1格式化，並啟動
- bin/hdfs namenode -format
- sbin/hadoop-daemon.sh start namenode
step 3：在nn2上，同步nn1的元資料資訊
- bin/hdfs namenode -bootstrapStandby
step 4：啟動nn2
- sbin/hadoop-daemon.sh start namenode
step 5：將nn1切換為active
- bin/hdfs haadmin -transitionToActive nn1
step 6：在nn1上啟動所有的datanode
- sbin/hadoop-daemon.sh start datanode
  bin/hdfs haadmin命令：
-transitionToActive 使狀態變成active
-transitionToStandby 使狀態變成standby
-failover [–forcefence] [–forceactive]
-getServiceState 檢視狀態
-checkHealth
-help

HA 自動故障轉移

.	hdp-node-01	hdp-node-02	hdp-node-03
HDFS	NameNode	NameNode
.	ZKFC	ZKFC
.	DataNode	DataNode	DataNode
.	JournalNode	JournalNode	JournalNode
YARN		ResourceManager
.	NodeManager	NodeManager	NodeManager
MapReduce	JobHistoryServer

啟動以後都是standby
- 選舉一個為active
監控
- ZKFC (zookeeper failoverController)

如果zkservice掛了會影響系統工作麼？
-不會。zkfc相當於zk的客戶端，是配置在HDFS上的

配置檔案

hdfs-site.xml

	<!-- automatic failover  -->
	 <property>
	   <name>dfs.ha.automatic-failover.enabled</name>
	   <value>true</value>
	</property>

core-site.sml

	<property>
	   <name>ha.zookeeper.quorum</name>
	   <value>hdp-node-01:2181,hdp-node-02:2181,hdp-node-03:2181</value>
	</property>

啟動

關閉所有的HDFS服務 sbin/stop-dfs.sh
同步配置檔案
啟動zk叢集：bin/zkServer.sh start
初始化HA在zk中狀態：bin/hdfs zkfc -formatZK
- 在zk中建立了 /hadoop-ha/mycluster檔案
啟動HDFS服務：sbin/start-dfs.sh

掌握下面的這張圖：
在這裡插入圖片描述

大資料Hadoop學習筆記（六）

HDFS HA 背景：在hadoop2.0之前，HDFS叢集中的NameNode存在單點故障（SPOF）對於只有一個NameNode的叢集，若NameNode機器出現故障，則整個叢集將無法使用，直到NameNode重新啟動 NameNode主要在一下兩方面影響

大資料Hadoop學習筆記（三）

1.HDFS架構講解 2.NameNode啟動過程 3.YARN架構組建功能詳解 4.MapReduce 程式設計模型 HDFS架構講解源自谷歌的GFS論文 HDFS： *抑鬱擴充套件的分散式系統 *執行在大量普通的鏈家機器上，提供容錯機制 *為

大資料Hadoop學習筆記（二）

Single Node Setup 官網地址 1. 本地模式 2.偽分散式模式 ************************* 本地模式 **************************** . grep input output ‘dfs[a-

大資料Hadoop學習筆記（一）

大資料Hadoop2.x hadoop用來分析儲存網路資料 MapReduce：對海量資料的處理、分散式。思想————> 分而治之，大資料集分為小的資料集，每個資料集進行邏輯業務處理合並統計資料結果（reduce）執行模式：本地模式和yarn模式 input—

大資料Hadoop學習筆記（五）

分散式部署本地模式Local Mode 分散式Distribute Mode 偽分散式一臺機器執行所有的守護程序從節點DN和NM只有一個完全分散式

大資料Hadoop學習筆記（四）

MapReduce執行過程 ======== step1 ： input InputFormat 讀取資料轉換成<key, value>

大資料入門學習筆記（貳）- 初識Hadoop

文章目錄 Hadoop概述 Hadoop能做什麼 Hadoop核心元件分散式檔案系統HDFS 分散式檔案系統HDDS 資源排程系統YARN 分散式計算框架MapReduce Had

大資料入門學習筆記（叄）- 布式檔案系統HDFS

文章目錄 HDFS概述及設計目標什麼是HDFS HDFS的設計目標 HDFS架構 HDFS副本機制副本存放策略![在這裡插入圖片描述](https://img-blog.csdnimg.cn/20181

大資料入門學習筆記（壹） - 大資料概述

文章目錄大資料故事大資料背景大資料基本概念大資料定義大資料4V特徵大資料要解決的問題大資料涉及到的技術大資料帶來的技術挑戰在技術架構上的挑戰其他挑戰

spark快速大資料分析學習筆記（1）

本文是《spark快速大資料分析學習》第三章學習筆記，文中大量摘抄書中原本，僅為個人學習筆記。 RDD基礎： RDD是一個不可變的分散式物件集合。每個RDD都被分為多個分割槽，這個分割槽執行在叢集的不同節點上。RDD可以包含Python、Java、Scala中任意型別的物件。建立RDD的方式：

大資料學習筆記（六）-Spark環境配置

Spark配置： spark-env配置： export SPARK_MASTER_IP=hadoop000 slaves配置： hadoop000 調整Spark-shell的日誌輸出級別： conf/log4j.propert

大資料分析學習筆記（Z檢驗，分類器以及Association Rule）

大資料分析學習筆記（Z檢驗，分類器以及Association Rule） Task 1 – Hypothesis Testing To improve student learning performance, a teacher developed two new learning app

學習筆記（六）（預測貸款使用者是否會逾期）資料分析的簡單處理

資料的簡單處理學習筆記（六）資料分析的簡單處理特徵工程初步的處理 1. 資料預覽 2. 資料型別的轉化日期格式資料的處理無關特徵

內建資料型別（下）---Python基礎學習筆記（六）

一、if-else條件語句條件語句，條件滿足，執行一部分程式碼，不滿足，執行另一部分程式碼四種基本格式： 1、單if …① if條件：條件滿足時執行的程式碼…② …③ 執行順序： S1：執行① S2

大資料基礎學習筆記（安裝CDH）

CM安裝1.安裝Cloudera manager server,agent mkdir /opt/cloudera-manager tar -zxvf cloudera-manage

大資料基礎學習筆記（安裝CDH的環境配置）

1.下載軟體地址(（以centos7.4）) CDH安裝包地址： http://archive.cloudera.com/cdh5/parcels/5.14.0/ CDH-5.14.0-1.cdh5.14.0.p0.24-el7.parcel CDH-5.14.0-1.cdh5.14.0.p0.

ES6學習筆記（六）--set,map資料結構和for...of遍歷

Set 新的資料解構，成員值是唯一的 //不能新增相同的值 var s = new Set(); [2, 3, 5, 4, 5, 2, 2].map(x => s.add(x)); for (let i of s) { console.lo

Caffe學習筆記（六）—— Windows下訓練自己的資料

本文主要介紹：Windows下，根據自己的資料訓練自己的網路模型。 1. 影象資料轉化為lmdb格式 comput_image_mean.bat，生成兩個mldb資料夾：mytrainldb 和 myvalldb； 2.計算訓練樣本均值（1）編譯caffe-windo

MySQL學習筆記（六）—— MySQL自連接

概念 cor 子查詢 ron 表操作例子質量 _id order by 有的時候我們需要對同一表中的數據進行多次檢索,這個時候我們可以使用之前學習過的子查詢,先查詢出需要的數據,再進行一次檢索。例如:一張products表,有產品id,供應商id(vend_

學習筆記（六）

tde 監聽文本 ren 頁面 define www 顯示 back BUG集錦：1. storage on 事件監聽必須兩個頁面同時打開，且處於服務器訪問狀態2. submit 和 button 不能套在 a 裏面，否則 submit 事件將消失3. 新建 Object

大資料Hadoop學習筆記（六）

HDFS HA

背景：

HDFS HA通過配置Active/Standby兩個NM實現在叢集中對NM的熱備份來解決上述問題。

HDFS HA設計

配置HA要點：

配置

規劃叢集

步驟：

啟動

HA 自動故障轉移

配置檔案

啟動

相關推薦