Hadoop的配置文件設置(HDFS HA)

阿新 • • 發佈：2017-12-26

stop love edi 搶占守護 core .html 搶占式 zookeep

參考：http://hadoop.apache.org/docs/r2.7.4/hadoop-project-dist/hadoop-hdfs/HDFSHighAvailabilityWithQJM.html

各虛擬節點配置

		YARN		HDFS
hostname	IP	ResourceManager	NodeManager	NameNode	DataNode	Zookeeper	JournalNode	Process
master	192.168.2.1	Y		Y		Y	Y	NameNode JournalNode DFSZKFailoverController QuorumPeerMain ResourceManager
slave1	192.168.2.2	Y	Y	Y	Y	Y	Y	NameNode JournalNode DFSZKFailoverController DataNode QuorumPeerMain ResourceManager NodeManager
slave2	192.168.2.3		Y		Y	Y	Y	JournalNode DataNode QuorumPeerMain NodeManager

1：原理

hadoop 2.x 中支持NFS及QJM (Quorum Journal Manager), QJM 是由Cloudera 提出的基於Paxos的方案

技術分享圖片

Hadoop提供了ZKFailoverController角色，部署在每個NameNode的節點上，作為一個deamon進程, 簡稱zkfc，示例圖如下

技術分享圖片

ZKFailoverController 主要包括三個組件:

HealthMonitor: 　　監控NameNode是否處於unavailable或unhealthy狀態，當前通過RPC調用NN相應的方法完成
ActiveStandbyElector: 管理和監控自己在ZK中的狀態

ZKFailoverController 它訂閱HealthMonitor 和ActiveStandbyElector 的事件，並管理NameNode的狀態

ZKFailoverController主要職責：

健康監測：周期性的向它監控的NN發送健康探測命令，從而來確定某個NameNode是否處於健康狀態，如果機器宕機，心跳失敗，那麽zkfc就會標記它處於一個不健康的狀態
會話管理：如果NN是健康的，zkfc就會在zookeeper中保持一個打開的會話，如果NameNode同時還是Active狀態的，那麽zkfc還會在Zookeeper中占有一個類型為短暫類型的znode，當這個NN掛掉時，這個znode將會被刪除，然後備用的NN，將會得到這把鎖，升級為主NN，同時標記狀態為Active
當宕機的NN新啟動時，它會再次註冊zookeper，發現已經有znode鎖了，便會自動變為Standby狀態，如此往復循環，保證高可靠，需要註意，目前僅僅支持最多配置2個NN
master選舉：如上所述，通過在zookeeper中維持一個短暫類型的znode，來實現搶占式的鎖機制，從而判斷那個NameNode為Active狀態

2：配置

Hadoop HA的配置包括2部分，HDFS HA用於NameNode及YARN HA用於ResourceManager, 本節先配置hdfs ha

創建journal臨時目錄：/home/mytestzk/Hadoop-2.7.4/tmp/journal

修改core-site.xml，增加節點ha.zookeeper.quorum

技術分享圖片

修改hdfs-site.xml

刪除節點dfs.namenode.secondary.http-address，並增加以下配置節點（紅框內）：

技術分享圖片

3：首次啟動：

3.1 首先啟動zookeeper集群, 分別在master, slave1, slave2執行以下命令

　　./bin/zkServer.sh start

3.2 初始化HA空間，在master namenode節點執行命令，格式化zkfc，在zookeeper中生成znode節點，用來保存HA或failover的數據

　　./bin/hdfs zkfc -formatZK

3.3 啟動journalnode集群, 在每個節點用如下命令啟日誌程序

NameNode將元數據操作日誌記錄在JournalNode上，主備NameNode通過記錄在JouralNode上的日誌完成元數據同步

　./sbin/hadoop-daemon.sh start journalnode

3.4 格式化主namenode節點

./bin/hdfs namenode -format mycluster

3.5 初始化JournalNode （直接配置HA時不需要這步）

　　如果是非HA轉HA才需要這一步，在其中一個JournalNode上執行以下命令，用namenode的edits初始化JournalNode：

　　bin/hdfs namenode -initializeSharedEdits

3.6 啟動NameNode

在主namenode節點，執行命令啟動namenode：./sbin/hadoop-daemon.sh start namenode

在備namenode節點，首先執行命令：./bin/hdfs namenode -bootstrapStandby

這個是把備namenode節點的目錄格式化並把元數據從主namenode節點copy過來，並且這個命令不會把journalnode目錄再格式化了

然後再執行命令啟動備namenode進程：./sbin/hadoop-daemon.sh start namenode

3.7 啟動ZKFC，在兩個namenode節點都執行以下命令

./sbin/hadoop-daemon.sh start zkfc

3.8 啟動datanode, 在所有datanode節點都執行以下命令

./sbin/hadoop-daemon.sh start datanode

4：正常啟動結束方法：

啟動：

下次啟動的時候，先啟動zookeeper，然後執行以下命令就可以全部啟動所有進程和服務了：

./sbin/start-dfs.sh

結束：

停止所有HDFS相關的進程服務，執行以下命令：

./sbin/stop-dfs.sh

5：測試HA的高可用性

在active namenode上執行如下命令關閉namenode： sbin/hadoop-daemon.sh stop namenode

然後訪問以下兩個地址查看namenode的狀態：

http://master:50070/dfshealth.html

http://slave1:50070/dfshealth.html

從HDFS Non-HA 升級到 HDFS HA

停止HDFS：./sbin/stop-dfs.sh
修改配置文件 core-site.xml, hdfs-site.xml並覆蓋到每臺機器上
啟動zookeeper
啟動journalnode集群，上述第3.3步驟
初始化JournalNode，上述第3.5步驟
啟動namenode節點，上述第3.6步驟
啟動datanode節點，上述第3.8步驟

上面步驟只是配置了手動failover，在這種模式下，系統不會自動觸發failover，即不會將Standby提升為Active，即使Active已經失效。接下來介紹如何實現自動failover。

初始化HA空間，上述第3.2步驟

完成上訴步驟後，就可以正常啟動hdfs了，此時hdfs已經具備自動failover功能。

ZKFC和Namenodes守護進程的啟動順序沒有關系，ZKFC只是調度Namenode的存活狀態，如果不啟動ZKFC，此Namenode將無法參與自動failover過程。

Hadoop的配置文件設置(HDFS HA)

stop love edi 搶占守護 core .html 搶占式 zookeep 參考：http://hadoop.apache.org/docs/r2.7.4/hadoop-project-dist/hadoop-hdfs/HDFSHighAvailabilityWi

hadoop分布式安裝部署具體視頻教程(網盤附配好環境的CentOS虛擬機文件/hadoop配置文件)

down hdf lan nag home 開機啟動 prop baidu ifcfg-eth 參考資源下載：http://pan.baidu.com/s/1ntwUij3視頻安裝教程：hadoop安裝.flvVirtualBox虛擬機：hadoop.part1-part

Maven項目pom文件設置JDK版本

cti config code pid plugin apache data- 問題 pac maven項目創建之後有時候默認設定了java的低版本，每次導入項目或者更新maven的時候可能或出現一些報錯，在pom.xml設定版本免除這個問題 <build>

hadoop配置文件

col mapreduce als sla fin rep name con temp 1、啟動腳本文件 hadoop-env.sh yarn-env.sh 2、參數配置文件 core-site.xml hdfs-site.xml yarn-site.xml mapred-

http跳轉htts的htaccess文件設置

options order rom rul htaccess serve mod host eba RewriteEngine OnRewriteCond %{SERVER_PORT} 80RewriteRule ^(.*)$ https://%{HTTP_HOST}/$1

pom.xml文件設置

div bsp 無法使用 model account compiler nag snapshot deploy 一個相對完整的maven配置文件 <?xml version="1.0" encoding="UTF-8"?> <project xmlns

python讀寫文件,設置文件的字符編碼比如utf-8

python字符串 rep char 系統環境內存 test 編碼方式 -a 編碼格式一. python打開文件代碼如下： f = open("d:\test.txt", "w") 說明：第一個參數是文件名稱，包括路徑；第二個參數是打開的模式mode ‘r‘：只讀（缺

PHP無法獲取.env文件設置的值

eve lin 1.5 無法 pan product div 服務器配置不為 EGPCS指代的是什麽？指的是可以從服務器配置和請求的信息中獲取的信息，它包括了environment（環境）、GET、POST、cookie、server，對應的全局數組:$_EN

spring配置文件applicationContext.xml的路徑設置

framework pan 痛苦 erl -c 發現 load contex ade 先看web.xml 配置 1  2 <listener> 3 <listener-c

linux下Nginx配置文件(nginx.conf)配置設置詳解（windows用phpstudy集成）

兩個 response 機制 .so 不用 filename 發送 php文件 code linux備份nginx.conf文件舉例: cp /usr/local/nginx/nginx.conf /usr/local/nginx/nginx.conf-2017111

設置vim配置文件使得tab為4個空格

file 寬度 vim配置文件 expand shift 麻煩錯誤朋友問題　　 set shiftwidth=4 "這個量是每行的縮進深度，一般設置成和tabstop一樣的寬度" set tabstop=4 "設置Tab顯示的寬度，Python建議設置成4" "

SpringBoot多環境部署，在啟動時動態設置相應的配置文件

img nbsp rod boot 技術分享 ava 運行不同的 span 項目中，往往在測試環境和正式環境擁有不同的配置，例如數據庫連接，第三方庫的appkey等。這時候，我們就要在不同的環境啟用不同的配置下面新建三個文件，分別表示開發環境，生產環境和測試環境的配置文

PyCharm 恢復默認設置 | JetBrains IDE 配置文件安裝目錄

pro store mar gpo shel 並且 log arm 配置網上的答案為什麽都亂七八糟並且全都全篇一律？某度知道是發源地？先說 Mac 按需運行下面的 rm 刪除命令 # Configuration rm -rf ~/Library/Preferences/

IIS部署ASP.NET網站後提示只有在配置文件或 Page 指令中將 enableSessionState 設置為 true 時，才能使用會話狀態...

text 效果 handlers 用戶空間 ren 分享 tpc out 調試今天，在IIS上部署網站後，出現了下面錯誤：只有在配置文件或 Page 指令中將 enableSessionState 設置為 true 時，才能使用會話狀態。還請確保在應用程序配置的 <

lnmp環境下TP框架的項目nginx配置文件的設置

php thinkphp開發時用的apache服務器。TP框架。 lnmp服務器(lnmp.org)：lnmp add後自動生成的配置文件為： server{listen 80;#listen [::]:80;server_name ---.----.--;index index.html index.ht

web.xml中如何設置配置文件的加載路徑

一個啟動需要通配名稱 classpath web應用 clas 最好原文鏈接：https://www.cnblogs.com/ConfidentLiu/p/7141126.html web應用程序通過Tomcat等容器啟動時，會首先加載web.xml文件，通常我

MySql5.7 配置文件 my.cnf 設置

bar 內存日誌 external efi pda uic server pac https://blog.csdn.net/gzt19881123/article/details/52594783 # MySql5.7配置文件my.cnf設置 [client] por

Java日誌組件logback使用：加載非類路徑下的配置文件並設置定時更新

arc .get courier sprint 日誌配置 microsoft poi con tag Java日誌組件logback使用：加載非類路徑下的配置文件並設置定時更新摘自： https://blog.csdn.net/johnson_moon/article/

WPF 分享一種設置程序保存配置文件的方法

combo chang col ORC 地方 data 修改配置 set mys 最近需要做一個配置程序，主要給其他程序做相關配置的小工具。配置項蠻多的，一般我們都是將各個配置項寫到配置文件的節點中，比如App.config文件或者自定義的xml文件。因為我用的是wp

Nginx配置文件的高亮顯示設置

font str 16px pan get 其中 size http 路徑 linux系統下vim或者vi編輯器默認是沒有對nginx的語法高亮設置。 1.下載vi語法高亮配置到 ~/.vim/syntax，如果不存在則創建該目錄，cd ~/.vim/syntax w

Hadoop的配置文件設置(HDFS HA)

相關推薦