HA高可用

阿新 • • 發佈：2018-07-28

mas node ssh ots fault check 完成 web 兩個

HA:高可用
-----------------------------------------------------------
1.Quorum Journal Manager:群體日誌管理
　　個數2n+1個，保證節點宕機次數為(n-1)/2;一般情況下，JNS在slave節點開啟；
2.HA的namenode個數:一定是兩個：nn1和nn2;
3.搭建HA步驟：
0.創建軟連接：指向hadoop_cluster_HA
1.修改【hdfs-site.xml】
　　<property>
　　　　<name>dfs.nameservices</name>

　　　　<value>mycluster</value>
　　</property>
　　//指定兩個namenode的唯一標識：註意一定是兩個
　　<property>
　　　　<name>dfs.ha.namenodes.mycluster</name>
　　　　<value>nn1,nn2</value>
　　</property>
　　//修改namenode RPC訪問端口
　　<property>
　　　　<name>dfs.namenode.rpc-address.mycluster.nn1</name>

　　　　<value>master:9000</value>
　　</property>
　　<property>
　　　　<name>dfs.namenode.rpc-address.mycluster.nn2</name>
　　　　<value>slave1:9000</value>
　　</property>
　　//修改http-WEBUI訪問端口
　　<property>
　　　　<name>dfs.namenode.http-address.mycluster.nn1</name>

　　　　<value>master:50070</value>
　　</property>
　　<property>
　　　　<name>dfs.namenode.http-address.mycluster.nn2</name>
　　　　<value>slave1:50070</value>
　　</property>
　　//標識NameNodes寫入/讀取編輯的一組JNs的URI
　　<property>
　　　　<name>dfs.namenode.shared.edits.dir</name>
　　　　<value>qjournal://master:8485;slave1:8485;slave2:8485/mycluster</value>
　　</property>
　　<property>
　　　　<name>dfs.client.failover.proxy.provider.mycluster</name>
　　　　<value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>
　　</property>

　　<property>
　　　　<name>dfs.ha.fencing.methods</name>
　　　　<value>sshfence</value>
　　</property>

　　<property>
　　　　<name>dfs.ha.fencing.ssh.private-key-files</name>
　　　　<value>/home/exampleuser/.ssh/id_rsa</value>
　　</property>

2.修改【core-site.xml】
　　<property>
　　　　<name>fs.defaultFS</name>
　　　　<value>hdfs://mycluster</value>
　　</property>
　　<property>
　　　　<name>dfs.journalnode.edits.dir</name>
　　　　<value>/home/hyxy/tmp/journal</value>
　　</property>
3.將所有的配置項分發至其他節點
　　$>scp -r hadoop_cluater_ha hyxy@slave1:~/soft/hadoop/etc/
　　$>scp -r hadoop_cluater_ha hyxy@slave2:~/soft/hadoop/etc/
4.在【master:8485;slave1:8485;slave2:8485】三個節點上分別開啟journalnode
　　$>hadoop-daemon.sh start journalnode
　　$>jps
5.一旦啟動了JournalNodes，就必須首先同步兩個HA NameNodes的磁盤元數據。
　　a.如果要設置新的HDFS集群，則應首先在其中一個NameNode上運行format命令
　　　　$>hdfs namenode -format
　　　　慎用！！！
　　b.如果您已經格式化了NameNode，或者正在將啟用了HA的群集轉換為啟用HA，
　　在未格式化的NameNode上,則現在應該通過運行命令“ hdfs namenode -bootstrapStandby”將NameNode元數據目錄的內容復制到另一個未格式化的NameNode上。
　　運行此命令還將確保JournalNodes（由dfs.namenode.shared.edits.dir配置）包含足夠的編輯事務，以便能夠啟動兩個NameNode。
　　確保JournalNodes開啟，在nn2上執行以下命令;
　　　　$>hadoop-daemon.sh start namenode(首先在nn1開啟namenode進程)
　　　　$>hdfs namenode -bootstrapStandby
　　說明：將nn1節點的fsimage復制到nn2中【{HADOOP_TMP_DIR}/dfs/name】
　　c.如果要將非HA NameNode轉換為HA，則應運行命令“ hdfs namenode -initializeSharedEdits ”，該命令將使用來自本地NameNode編輯目錄的編輯數據初始化JournalNodes。
　　在nn1上，執行以下命令;
　　　　$>hadoop-daemon.sh stop namenode(關閉namenode)
　　　　$>hdfs namenode -initializeSharedEdits
6.start-dfs.sh
7.驗證：分別打開WebUI，查看nn1和nn2的相關信息，均為standby(備用狀態)
8.HA 集群管理：
用法：hdfs haadmin
[ -transitionToActive <serviceId>] // 將給定NameNode的狀態轉換為Active
[-transitionToStandby <serviceId>] // 將給定NameNode的狀態轉換為Standby
[-failover [--forcefence] [--forceactive] <serviceId> <serviceId>]
[-getServiceState <serviceId>]
[-checkHealth <serviceId> ]
[-help <command>]

手動切換Active/Standby狀態：
　　$>hdfs haadmin -transitionToActive nn1
　　$>hadoop fs -put tt.txt
　　$>hdfs haadmin -transitionToStandby nn1
　　$>hdfs haadmin -transitionToActive nn2
　　$>hadoop fs -put tt1.txt

自動容災
-----------------------------------------------
1.完成自動容災，需在HDFS部署環境中增加兩個組件：
　　a.Zookeeper 集群
　　b.ZKFC：zookeeper FailoverController process
2.Zookeeper作用：
　　Apache ZooKeeper是一種高可用性服務，用於維護少量協調數據，通知客戶端該數據的更改以及監視客戶端的故障。自動HDFS故障轉移的實現依賴於ZooKeeper來實現以下功能：
　　a.故障檢測：集群中的每個NameNode計算機都在ZooKeeper中維護一個持久會話。如果計算機崩潰，ZooKeeper會話將過期，通知另一個NameNode應該觸發故障轉移。
　　b.active活躍節點的選舉：ZooKeeper提供了一種簡單的機制，可以將節點專門選為活動節點。如果當前活動的NameNode崩潰，則另一個節點可能在ZooKeeper中采用特殊的獨占鎖，指示它應該成為下一個活動的。
3.ZKFailoverController（ZKFC）作用：
　　a.它是一個ZooKeeper客戶端，它還監視和管理NameNode的狀態。
　　b.運行NameNode的每臺機器也運行ZKFC，ZKFC負責:
　　運行狀況監視:ZKFC定期使用運行狀況檢查命令對其本地NameNode進行ping操作。只要NameNode及時響應健康狀態，ZKFC就會認為該節點是健康的。如果節點已崩潰，凍結或以其他方式進入不健康狀態，則運行狀況監視器會將其標記為運行狀況不佳。
　　ZooKeeper會話管理:當本地NameNode運行正常時，ZKFC在ZooKeeper中保持會話打開。如果本地NameNode處於活動狀態，它還擁有一個特殊的“鎖定”znode。此鎖使用　　ZooKeeper對“臨時”節點的支持; 如果會話到期，鎖定節點將自動刪除。
　　選舉制度：如果本地NameNode是健康的，並且ZKFC發現沒有其他節點當前持有鎖znode，它將自己嘗試獲取鎖。如果成功，那麽它“贏得了選舉”，並負責運行故障轉移以使其本地NameNode處於活動狀態。故障轉移過程類似於上述手動故障轉移：首先，必要時對先前的活動進行隔離，然後本地NameNode轉換為活動狀態。
4.安裝zookeeper
　　a.下載zookeeper3.4.6.tar.gz
　　b.解壓至【/home/hyxy/soft】
　　c.創建軟連接：$>ln -s zookeeper3.4.6/ zookeeper
　　d.配置環境變量：在~/.bash_profile中追加
　　　　export ZOOKEEPER_HOME=/home/hyxy/soft/zookeeper
　　　　export PATH=$ZOOKEEPER_HOME/bin:$PATH
　　e.修改【{ZOOKEEPER_HOME}/conf/zoo.cfg】zoo.cfg需cp
　　　　tickTime=2000
　　　　initLimit=10
　　　　syncLimit=5
　　　　dataDir=/home/hyxy/tmp/zookeeper
　　　　clientPort=2181
　　f.開啟zookeeper Server
　　　　$>zkServer.sh start
　　　　$>jps
　　　　　　5914 QuorumPeerMain //QuorumPeerMain:zookeeper Server的守護進程
　　　　　　5931 Jps
　　g.客戶端連接:
　　　　$>zkCli.sh
　　　　　　5988 ZooKeeperMain //ZooKeeperMain:zookeeper client的守護進程
　　h.關機Zookeeper Server
　　　　$>zkServer.sh stop

HA高可用

HA 高可用mysql集群

註意保持 service title pri 數據庫用戶和組 ash lin 註意問題： 1.保持mysql用戶和組的ID號是一致的； 2.filesystem 共享存儲必須要有寫入權限； 3.刪除資源必須先刪除約束，在刪除資源； 1.安裝數據庫，這裏使用maridb數

Codis3.2集群HA高可用方案

ha codis sentinel Codis3.2集群HA高可用方案Codis高可用方案官方推薦使用SentinelRedis 本身就是最終一致性的。Master 掛了，Promote Slave 成為新的 Master 需要時間（測試15秒內）。其實 Sentinel 就是這個邏輯。Codis

keepalived for linux(HA 高可用集群)

keepalived 高可用集群的實現是由基於vrrp協議(虛擬冗余路由協議)的keepalived軟件實現的； VRRP協議：下面開始配置keepalived 實現高可用集群操作首先準備好2臺調度器(DR1,DR2)，2臺RS服務器(RS1,RS2)，1臺客戶機；要做高可用的前提需要註意：

Jenkins HA高可用

ha高可用 png 分享圖片心跳 alt 方式技術分享 info blog 商用版Jenkins（CloudBee）提供HA插件，開源版本可以借助心跳腳本+sync的方式實現高可用。 Jenkins HA高可用

（FortiGate）飛塔防火墻HA(高可用性)解決方案

可用要求 mes 級別協議三方而且也會 pan 1. 概述 HA問題是建設TCP/IP網絡需要考慮的一個重要問題。當因為某個設備出現宕機時，如何保證網絡依舊暢通是依賴於關鍵業務的公司的網絡建設的核心。所有流量都要經過安全網關，設計網絡讓安全網關不會成為單點故

HA高可用

mas node ssh ots fault check 完成 web 兩個 HA:高可用----------------------------------------------------------- 1.Quorum Journal Manager:群體日誌

SpringCloud系列四：Eureka 服務發現框架（定義 Eureka 服務端、Eureka 服務信息、Eureka 發現管理、Eureka 安全配置、Eureka-HA(高可用) 機制、Eureka 服務打包部署）

pac elf figure 傳遞 uri rect body 情況服務組 1、概念：Eureka 服務發現框架 2、具體內容對於服務發現框架可以簡單的理解為服務的註冊以及使用操作步驟，例如：在 ZooKeeper 組件，這個組件裏面已經明確的描述了一個服務的註冊以及發

SparkStreaming HA高可用性

程序 spl 計算 atop gen generated 需要 prope stat 1、UpdateStateByKey、windows等有狀態的操作時，自動進行checkpoint,必須設置checkpoint目錄，數據保留一份在容錯的文件系統中，一旦內存中的數據丟失，

【完全分散式Hadoop】（二）HDFS、YARN以及HA高可用概念介紹

一、HDFS-Hadoop分散式檔案系統 HDFS 採用Master/Slave的架構來儲存資料，這種架構主要由四個部分組成，分別為HDFS Client、NameNode、DataNode和Secondary NameNode。下面我們分別介紹這四個組成部分 1、Client：就

CentOS 7部署Hadoop叢集（HA高可用叢集）

目錄測試環境 Hadoop 組織框架 HDFS架構 YARN架構 HA叢集部署規劃自動故障轉移關於叢集主機時間 Linux環境搭建配置Java環境安裝單機版Hadoop Zookeeper叢集安裝配置環境變數關閉防火牆修

Hadoop-2.7.3 HA高可用搭建

0.zookeeper叢集的搭略，自行百度 1.hadoop2.7.3下載 http://hadoop.apache.org/releases.html 2.tar 解壓，mv到 /data，並將資料夾改為hadoop（也可以不改，

遷移PaloAlto HA高可用防火牆到Panorama

對於有多臺PaloAlto防火牆需要統一管理的企業來說，Panorama是個不錯的選擇，利用Panorama可以做到中心化和統一管理的目的。這裡簡單給大家demo一下如何對現有的PaloAlto HA高可用防火牆遷移到Panorama上。環境介紹： Panorama:192.168.55.5

配置Hadoop的HA(高可用)

在搭建完全分散式的基礎上配置HA。 1、首先將完全分散式的配置檔案備份。複製一份配置檔案用來搭建HA。 $ cp -r /home/betty/soft/hadoop/etc/cluster_hadoop /home/betty/soft/hadoop/etc/HA_hadoop

Spark HA高可用部署

1.說明： Spark Standalone 叢集是Master--Slaves架構的叢集模式，和大部分的Master--Slaves 結構叢集一樣，存在著Master單點故障的問題。Spark提供了兩種解決方案去解決這個單點故障的問題；方案一：基於檔案系統的單點恢復 &nb

hadoop namenode HA 高可用概念及配置說明

可以看到之前配置的完全分散式中只有一個nn節點，不能高可用。在1x版本中存在這些問題： hdfs：nn單點故障，壓力過大，記憶體受限，擴充套件受阻。 MapReduce（MR）:jboTracker訪問壓力大，擴充套件受阻；難以支援MR以外的計算框架，如

Hadoop部署（六）——CentOS 7部署Hadoop叢集（HA高可用叢集）

目錄測試環境關閉防火牆測試環境 Linux系統版本：CentOS 7 64位 Hadoop 組織框架 Hadoop主要包括兩部分：一部分是HDFS（Hadoop Distr

大資料之四 hadoop HDFS HA 高可用的完全分散式

HDFS HA HA即為High Availability，用於解決NameNode單點故障問題，該特性通過熱備的方式為主NameNode提供一個備用者，一旦主NameNode出現故障，可以迅速切換至備NameNode，從而實現對外提供更穩定的服務 Second

Hadoop叢集的ResourceManager HA高可用配置

ResourceManager HA yarn-site.xml： <configuration>  <property> <n

Hadoop叢集的Namenode HA高可用配置

HA配置首先要有zookeeper叢集，這裡就不再說明zookeeper叢集的搭建了，可以在我的前面的文章中找到我這裡是在之前Hadoop單點的基礎上進行HA配置的叢集HA規劃： cdh0： Namenode Datanode JournalNod

centos7 hadoop HA高可用叢集搭建（ hadoop2.7 zookeeper3.4 ）

目錄七、總結上篇文章寫了如何用ssh免密登入，當然這些操作都是在hadoop賬號上的操作，包括這篇文章也是一樣三臺主機一、伺服器環境主機名 IP 使用者名稱密碼安裝目錄 node1 192.168.31.