HDFS高可用完全分散式搭建

阿新 • • 發佈：2019-01-04

叢集規劃

在這裡插入圖片描述

關閉防火牆

時間同步

安裝ntp

	yum install ntp

網上查詢最新的時間伺服器，如ntp1.aliyun.com,在所有節點時間同步

	ntpdate ntp1.aliyun.com

修改hosts檔案

vim /etc/hosts
192.168.80.131 node01
192.168.80.132 node02
192.168.80.133 node03
192.168.80.134 node04

配置免密登入

所有節點執行  ssh-keygen -t rsa -P '' -f ~/.ssh/id_rsa

node01->node01 node01->node02 node01->node03 node01->node04
node02->node01
在node02節點執行，將node01的公鑰加入到其他節點的白名單中 ssh-copy-id -i ~/.ssh/id_rsa.pub [email protected]

所有節點配置JDK

解除安裝舊有jdk

	rpm -qa|grep java
	rpm -e --nodeps java-1.7.0-openjdk-1.7.0.45-2.4.3.3.el6.x86_64
	rpm -e --nodeps java-1.6.0-openjdk-1.6.0.0-1.66.1.13.0.el6.x86_64
	rpm -e --nodeps tzdata-java-2013g-1.el6.noarch

配置新jdk

	#vi /etc/profile 加入如下內容：
	export JAVA_HOME=/opt/software/jdk/jdk1.8.0_151
	export PATH=$PATH:$JAVA_HOME/bin

配置hadoop

修改hdfs-site.xml配置檔案

	<property>
	 		    <name>dfs.nameservices</name>
	 		    <value>mycluster</value>
	</property>
	<property>
	  <name>dfs.ha.namenodes.mycluster</name>
	  <value>nn1,nn2</value>
	</property>
	<property>
	  <name>dfs.namenode.rpc-address.mycluster.nn1</name>
	  <value>node01:8020</value>
	</property>
	<property>
	  <name>dfs.namenode.rpc-address.mycluster.nn2</name>
	  <value>node02:8020</value>
	</property>
	<property>
	  <name>dfs.namenode.http-address.mycluster.nn1</name>
	  <value>node01:50070</value>
	</property>
	<property>
	  <name>dfs.namenode.http-address.mycluster.nn2</name>
	  <value>node02:50070</value>
	</property>
	<property>
	  <name>dfs.namenode.shared.edits.dir</name>
	  <value>qjournal://node01:8485;node02:8485;node03:8485/mycluster</value>
	</property>
	<property>
	  <name>dfs.journalnode.edits.dir</name>
	  <value>/var/sxt/hadoop/ha/jn</value>
	</property>
	<property>
	  <name>dfs.client.failover.proxy.provider.mycluster</name>  	<value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>
	</property>
	<property>
	  <name>dfs.ha.fencing.methods</name>
	  <value>sshfence</value>
	</property>
	<property>
	  <name>dfs.ha.fencing.ssh.private-key-files</name>
	  <value>/root/.ssh/id_rsa</value>
	</property>
	<property>
	   <name>dfs.ha.automatic-failover.enabled</name>
	   <value>true</value>
	 </property>

修改core-site.xml配置檔案

	<property>
	   <name>fs.defaultFS</name>
	   <value>hdfs://mycluster</value>
	</property>
	<property>
	   <name>ha.zookeeper.quorum</name>
	   <value>node02:2181,node03:2181,node04:2181</value>
	</property>

修改slaves檔案

node01
node02
node03

修改hadoop-env.sh 中的JAVA_HOME=/opt/software/java/jdk1.8.0
將配置好的HDFS安裝包拷貝到node02 node03 node04

	scp -r hadoop-2.6.5 [email protected]:/opt/software/hadoop/
	scp -r hadoop-2.6.5 [email protected]:/opt/software/hadoop/
	scp -r hadoop-2.6.5 [email protected]:/opt/software/hadoop/

注意傳輸後的位置，我的是/opt/software/hadoop/hadoop-2.6.5

搭建zookeeper叢集

解壓zookeeper-3.4.10
以我為例，解壓到了/opt/software/hadoop，跟/opt/software/hadoop/hadoop-2.6.5在同級目錄
修改conf目錄下的zoo_sample.cfg

	#解壓後，進入conf目錄內，將zoo_sample.cfg重新命名，改為zoo.cfg
	mv zoo_sample.cfg zoo.cfg
	#修改zoo.cfg
	dataDir=/var/zfg/zookeeper
	server.1=node02:2888:3888
	server.2=node03:2888:3888
	server.3=node04:2888:3888

在dataDir目錄下建立一個myid檔案，在這個檔案中寫上當前節點ID號
比如我這裡在node02節點上是ID號是1
將配置好的zookeeper安裝包拷貝到node03 node04
拷貝完畢後，在各自節點上建立myid號，ID號要依次遞增

新增環境變數

 export PATH=$PATH:/opt/software/hadoop/zookeeper-3.4.10/bin

啟動node2、node3、node4節點上的zookeeper
```
 ./zkServer.sh start
```

格式化

啟動 journalnode
在node01、node02、node03分別執行如下命令在node01、node02、node03分別執行如下命令
```
 hadoop-daemon.sh start journalnode
```
隨機選擇一臺NameNode執行，我這裡在node01節點即NameNode1上執行
```
hdfs namenode -format
hadoop-daemon.sh start namenode
```
另外一臺NameNode節點執行
```
 hdfs namenode  -bootstrapStandby
```
啟動zkfc服務
```
  hdfs zkfc -formatZK
```
關閉所有節點上的程序
```
 stop-dfs.sh
```
啟動HDFS
```
 start-dfs.sh
```

驗證HA故障自動切換

可以看到NameNode1和NameNode2現在分別為active和standby狀態
在這裡插入圖片描述

在NameNode1所在的node01節點上，kill掉NameNode1程序

再檢視兩個NameNode2狀態，可以看到已轉為active狀態

需要注意的問題

要先啟動zookeeper服務再進行NameNode初始化。
如果最後啟動的節點不全或者datanode啟動後馬上自動關閉。需要刪除/tmp目錄下的hadoop-root臨時檔案和dfs.journalnode.edits.dir配置的目錄檔案，比如我這裡是
```
 <property>
 	  <name>dfs.journalnode.edits.dir</name>
 	  <value>/var/sxt/hadoop/ha/jn</value>
 </property>
```

那就刪除var目錄下的指定目錄（以我為例，是sxt目錄）。然後重新搭建格式化NameNode。

HDFS高可用完全分散式搭建步驟

一、準備階段分散式思想分散式叢集規劃主機名 IP地址 NN-1 NN-2 DN ZK ZKFC JNN

HDFS高可用完全分散式搭建

目錄叢集規劃關閉防火牆時間同步修改hosts檔案配置免密登入所有節點配置JDK 配置hadoop 搭建zookeeper叢集格式化驗證HA故障自動切換需要注意的問題叢集

大資料(六) --高可用完全分散式搭建

說明搭建之前, 先根據HDFS三種模式一文將叢集的初始環境配置OK. 高可用完全分散式搭建叢集規劃 NN(active) NN(standby) DN ZK ZKFC JNN node01 √ – – – √ √ node02

hadoop+zookeeper+yarn搭建高可用完全分散式環境詳細步驟

一、zookeeper叢集的安裝。（我親自成功搭建過的一套叢集，涉及到很多的細節，但是有的細節地方我不一定能完全寫出，如果有遇到問題的可以留言）前提準備3臺centos7.0虛擬機器 (1)首先設定每臺虛擬機器的網路連線方式為net方式，然後修改每臺虛

高可用完全分散式

NN-1 NN-2 DN ZK ZKFC JNN node01 √ √ √

hadoop3.1.0 HA高可用完全分散式叢集的安裝部署（詳細教程）

1.環境介紹伺服器環境：CentOS 7 5臺伺服器兩臺namenode 三臺datanode 節點 IP NN DN ZK ZKFC

HDFS高可用的完全分散式搭建流程

HDFS高可用的完全分散式設計架構圖 HDFS的高可用指的是HDFS持續對各類客戶端提供讀、寫服務的能力，因為客戶端對HDFS的讀、寫操作之前都要訪問Namenode伺服器，客戶端只有從Namenode獲取元資料之後才能繼續進行讀、寫。所以HDFS的高可用的關

hadoop完全分散式搭建HA（高可用）

首先建立5臺虛擬機器（最少三臺），並且做好部署規劃ip地址主機名安裝軟體程序 192.168.xx.120 master jdk,hadoop,zookeeper namenode,ZKFC,Resourcemanager 192.168.xx.121 m

HDFS完全分散式搭建步驟

1.準備階段分散式叢集規劃準備4個Linux作業系統，並配置好IP地址，將NameNode在Hadoop1節點上啟動，SecondaryNameNode和DataNode在Hadoop2節點上啟動，其餘兩個DataNode分別在Hadoop3和Hadoop4節點

HDFS HA完全分散式搭建

叢集規劃配置免密登入 node01->node01 node01->node02 node01->node03 node01->node04 node02->no

HDFS完全分散式搭建

目錄前期配置時間同步配置免密登入配置/etc/hosts（所有節點內）修改hadoop配置檔案將配置好的安裝包分發到其他節點上 JDK配置（所有節點）格式化NameNode並啟動HDFS 可能遇到的問題

理解HDFS高可用性架構

共享存儲 src mage namenode 存儲系統 tro ima 會同同時在Hadoop1.x版本的時候，Namenode存在著單點失效的問題。如果namenode失效了，那麽所有的基於HDFS的客戶端——包括MapReduce作業均無法讀，寫或列文件，因為nam

Flume 學習筆記之 Flume NG高可用集群搭建

哈哈 process bind under hdf ora chan lsp max Flume NG高可用集群搭建：架構總圖：架構分配：角色 Host 端口 agent1 hadoop3 52020 collect

HADOOP docker(二):HDFS 高可用原理

原來 gem relative 超時 proxy 問題要求 his pro 1.環境簡述2.QJM HA簡述2.1為什麽要做HDFS HA？2.2 HDFS HA的方式2.2 HSFS HA的結構2.3 機器要求3.部署HDFS HA3.1 詳細配置3.2 部署H

高可用flume-ng搭建

flume一、概述1.通過搭建高可用flume來實現對數據的收集並存儲到hdfs上，架構圖如下：二、配置Agent1.cat flume-client.properties#name the components on this agent 聲明source、channel、sink的名稱 a1.sou

heartbeat v1(CRM)+DRBD實現數據庫服務器高可用集群搭建

drbd mariadb heartbeat 一. 方案簡介本方案采用Heartbeat雙機熱備軟件來保證數據庫的高穩定性和連續性，數據的一致性由DRBD這個工具來保證。默認情況下只有一臺mysql在工作，當主mysql服務器出現問題後，系統將自動切換到備機上繼續提供服務，當主數據庫修復完畢，又將

RabbitMQ 高可用集群搭建及電商平臺使用經驗總結

喜歡 inf 分布式一個 ipo 匹配模式 ide 總結 hosts配置面向EDA（事件驅動架構）的方式來設計你的消息 AMQP routing key的設計 RabbitMQ cluster搭建 Mirror queue policy設置兩個不錯的RabbitMQ

MHA MySQL 高可用集群搭建

配置文件 manage 獲取 getopt server rsa 安裝 ref == 軟件版本MySQL: 5.7MHA: 0.56CentOS: 7.4 MySQL服務器Master: 192.168.1.224 mysql01Slave1: 192.168.1.22

JAVA微服務架構，高併發，高效能，高可用，分散式，叢集，快取，電商實戰教程下載

JAVA微服務架構，高併發，高效能，高可用，分散式，叢集，快取，電商實戰教程下載39套Java架構師，高併發，高效能，高可用，分散式，叢集，電商，快取，微服務，微信支付寶支付，公眾號開發，java8新特性，P2P金融專案，程式設計，功能設計，資料庫設計，第三方支付，web安全，效能調優，設計模式，資

SpringCloud進擊 | 一深入：高可用的分散式配置中心（Spring Cloud Config）【Finchley版本】

1.前言上一節：SpringCloud進擊 | 七淺出：服務閘道器 - 過濾器（Zuul Filter）【Finchley版本】通常情況下，Config Server 與 Eureka 服務註冊中心一樣，也需要將其架構成高可用的叢集。所以，我們來改進一下，以一種更為簡單的方式 -

HDFS高可用完全分散式搭建

目錄

叢集規劃

關閉防火牆

時間同步

修改hosts檔案

配置免密登入

所有節點配置JDK

配置hadoop

搭建zookeeper叢集

格式化

驗證HA故障自動切換

需要注意的問題

相關推薦