1. 程式人生 > >測試hadoop2.x HA主備切換遇到的問題和解決辦法 [

測試hadoop2.x HA主備切換遇到的問題和解決辦法 [

手動kill 主namenode後,備用namenode沒有主動從standby切換到active!!!

解決辦法:
備用namenode上檢視 Hadoop-grid-zkfc-server102.log日誌,發現異常如下
2016-10-16 00:09:32,465 WARN org.apache.hadoop.ha.SshFenceByTcpPort: PATH=$PATH:/sbin:/usr/sbin fuser -v -k -n tcp 53310 via ssh: bash: fuser: command not found
2016-10-16 00:09:32,465 WARN org.apache.hadoop.ha.NodeFencer: Fencing method org.apache.hadoop.ha.SshFenceByTcpPort(null) was unsuccessful.

2016-10-16 00:09:32,465 WARN org.apache.hadoop.ha.ActiveStandbyElector: Exception handling the winning of election
2016-10-16 00:09:34,552 WARN org.apache.hadoop.ha.FailoverController: Unable to gracefully make NameNode at server101.hadoop.com/192.168.1.101:53310 standby (unable to connect)
2016-10-16 00:09:34,592 WARN org.apache.hadoop.ha.SshFenceByTcpPort.jsch: Permanently added 'server101.hadoop.com' (RSA) to the list of known hosts.



由上面的警告可知:fuser: command not found,在做主備切換時執行fuser命令失敗了。

檢視hdfs-site.xml配置檔案,
<property>
<name>dfs.ha.fencing.methods</name>
<value>sshfence</value>
</property>

hdfs-site.xml通過引數dfs.ha.fencing.methods來實現,在出現故障時通過哪種方式登入到另一個namenode上進行接管工作。


====》》》dfs.ha.fencing.methods引數

系統在任何時候只有一個namenode節點處於active狀態。

在主備切換的時候,standby namenode會變成active狀態,原來的active namenode就不能再處於active狀態了,
否則兩個namenode同時處於active狀態會有問題。
所以在failover的時候要設定防止2個namenode都處於active狀態的方法,可以是Java類或者指令碼。

fencing的方法目前有兩種,sshfence和shell

sshfence方法是指通過ssh登陸到active namenode節點殺掉namenode程序,所以你需要設定ssh無密碼登陸,還要保證有殺掉namenode程序的許可權。


解決步驟:
# 查詢fuser
[[email protected] ~]# yum provides "*/fuser"
Loaded plugins: fastestmirror
Determining fastest mirrors
* epel: mirrors.tuna.tsinghua.edu.cn
psmisc-22.20-9.el7.x86_64 : Utilities for managing processes on your system
Repo        : base
Matched from:
Filename    : /usr/sbin/fuser

# 在namenode主、備節點上安裝fuser(datanode節點不用安裝)
[[email protected] ~]# yum -y install psmisc
[[email protected] ~]# yum -y install psmisc

安裝完成後,再次測試,namenode自動切換成功!!!

相關推薦

測試hadoop2.x HA切換遇到的問題解決辦法 [

手動kill 主namenode後,備用namenode沒有主動從standby切換到active!!!解決辦法:在備用namenode上檢視 Hadoop-grid-zkfc-server102.log日誌,發現異常如下2016-10-16 00:09:32,465 WAR

基於ZooKeeper實現HA高可用性以及自動切換

預設情況下,standalone cluster manager對於worker節點的失敗是具有容錯性的(迄今為止,Spark自身而言對於丟失部分計算工作是有容錯性的,它會將丟失的計算工作遷移到其他worker節點上執行)。然而,排程器是依託於master程序來

HA路由模式的原理

gfw 重新 進行 負載 不響應 相同 過程 響應 同時 HA是High Availability縮寫,即高可用性 ,可防止網絡中由於單個防火墻的設備故障或網絡故障導致網絡中斷,保證網絡服務的連續性和安全強度。目前,ha功能已經是防火墻內一個重要組成部分。

飛塔防火墻HA模式配置步驟

飛塔防火墻 ha 主備模式配置 fortinetHA主備A-P模式配置方法一、HA網絡拓撲結構註意:進行HA 的配置, 硬件和軟件版本需滿足如下要求:① 防火墻硬件型號相同;② 同型號硬件需要為相同的硬件版本,內存容量,CPU 型號,硬盤容量等相同;③ 相同的軟件版本版本;④ 設備的所有接口不能工作在 DHC

zookeeper切換學習

sem ant gen pri print 建立 mode reat 調用 今天了解了下Zookeeper的主備方案 大致就是兩個應用運行後同時搶一個臨時節點,zookeeper可以保證只會有一個註冊成功這個節點,然後都對這個節點進行watch,監聽事件NodeDelete

Keepalived切換時執行腳本

Linux Keepalived 高可用 定義通知腳本:notify_master <STRING>|<QUOTED-STRING>:當前節點成為主節點時觸發的腳本notify_backup <STRING>|<QUOTED-STRING>:當前節點

Keepalived中MasterBackup切換機制淺析

keepalived priority weight BACKUP nginx 在keepalived的VRRP實例配置中會一般會設置Master和Backup來指定初始狀態,但是這並不意味著此節點一直就是Master角色。控制節點角色的是Keepalived配置文件中的“pr

DG切換主要說明

DGalter system switch logfile; 切換主庫日誌 select max(sequence#) from v$archived_log; 對比主備庫日誌,同步才能做下一步 alter database commit to switchover to standby with sess

VRRP負載均衡及端口跟蹤實現切換

.com http 虛擬 1.2 shu color virt ges prior VRRP 實驗 1、 實現PC1和PC2的流量分別走R1和R2,實現負載均衡2、 跟蹤端口,當外部鏈路出現故障實現主備切換. R1#conf tR1(config)#interface

Linux下PostgreSQL環境搭建切換

1. 概念 資料庫熱備:資料庫熱備是指為主資料庫的建立、維護和監控一個或多個備用資料庫,它們時刻處於開機狀態,同主機保持同步。當主機失靈時,可以隨時啟用熱備資料庫來代替,以保護資料不受故障、災難、錯誤和崩潰的影響。 流複製(streaming replication):PostgreSQL提

nginx健康檢查切換

1、參考部落格 https://blog.csdn.net/moqiang02/article/details/42846221 2、使用第一種方式注意點 在主備切換的方式下需要指定備用節點 upstream mysvr { server 192.168.0.104:8080;

Zookeeper C++程式設計實戰之切換

預設zookeeper日誌輸出到stderr, 可以呼叫zoo_set_log_stream(FILE*)設定輸出到檔案中 還可以呼叫zoo_set_debug_level(ZooLogLevel)控制日誌級別!!! 類CZookeeperHelper提供基於zookeeper的主備切換介面和讀

Data Guard切換

一、Switchover正常切換 1、主庫 (1)、檢視主庫狀態及角色 SQL> select name,database_role from v$database; NAME   DATABASE_ROLE --------- ---------------

DATA GUARD 切換

一、Switchover正常切換 1、主庫 (1)、檢視主庫狀態及角色 SQL> select name,database_role from v$database; NAME   DATABASE_ROLE --------- ----------------

FreeSWITCH折騰筆記7——使用keepalived進行切換高可用部署

freeSWITCH的高可用部署方式有兩種:主備切換和負載均衡,官方文件介紹的主備切換部署是採用Corosync & Pacemaker,負載均衡採用前置opensips。但對使用keepalived進行主備切換的高可用方式沒有介紹,同時網上對該種部署方式也沒有介

redis配置主從備份以及切換方案配置

前提:redis中,主從切換場景中,沒有絕對的主和從,只有初始化的主和從,然後當主down後,從就變成主了,而主即使連線上,也是從,不會變為主 1、redis-server的主備關係:    

redis 主從備份及其切換

首先原文是用了3 個伺服器,我是用了一個伺服器;然後再原文的基礎上,稍加了自己的整理。前提:redis中,主從切換場景中,沒有絕對的主和從,只有初始化的主和從,然後當主down後,從就變成主了,而主即使連線上,也是從,不會變為主1.redis-server的主備關係:   

redis-cluster核心原理分析:gossip通訊、jedis smart定位、切換

1、節點間的內部通訊機制 1.1 基礎通訊原理 redis cluster節點間採取gossip協議進行通訊 維護叢集的元資料有兩種方式:集中式和gossip 集中式: 優點在於元資料的更新和讀取,時效性非常好,一旦元資料出現變更立即就會更新到集

23、redis cluster的核心原理分析:gossip通訊、jedis smart定位、切換

一、節點間的內部通訊機制 1、基礎通訊原理 (1)redis cluster節點間採取gossip協議進行通訊; 跟集中式不同,不是將叢集元資料(節點資訊,故障,等等)集中儲存在某個節點上,而是互相之間不斷通訊,保持整個叢集所有節點的資料是完整的維護叢集的元資料用得,集中式,一種叫做go

19-05、redis哨兵切換的資料丟失問題:非同步複製、叢集腦裂

1、兩種資料丟失的情況 主備切換的過程,可能會導致資料丟失。 (1)非同步複製導致的資料丟失 因為master -> slave的複製是非同步的,所以可能有部分資料還沒複製到slave,master就宕機了,此時這些部分資料就丟失了。 非同步複製導致的資料丟失問題.png