1. 程式人生 > >常見HBase故障分析和解決方法

常見HBase故障分析和解決方法

1. java.net.SocketException: Too many open files

問題原因:

問題現象:所有節點region server程序掛掉,hbase不可訪問,檢視日誌有如下資訊

tail hbase-hbase-regionserver-ip-10-233-146-35.log

2016-07-12 14:10:40,074 ERROR org.apache.hadoop.hdfs.DFSClient: Exception closing file /hbase/ResourceURL/eeeab3a7fb4d0d198c939eebf8e7a774/.tmp/bbbfccc607f14f7ab6e76f4b61bf23db : java.net.SocketException: Too many open files

java.net.SocketException: Too many open files
    at sun.nio.ch.Net.socket0(Native Method)
    at sun.nio.ch.Net.socket(Net.java:424)
    at sun.nio.ch.Net.socket(Net.java:417)
    at sun.nio.ch.SocketChannelImpl.<init>(SocketChannelImpl.java:104)
    at sun.nio.ch.SelectorProviderImpl.openSocketChannel(SelectorProviderImpl.java:60)
    at java.nio.channels.SocketChannel.open(SocketChannel.java:142)
    at org.apache.hadoop.net.StandardSocketFactory.createSocket(StandardSocketFactory.java:58)
    at org.apache.hadoop.hdfs.DFSClient$DFSOutputStream.createBlockOutputStream(DFSClient.java:3423)
    at org.apache.hadoop.hdfs.DFSClient$DFSOutputStream.nextBlockOutputStream(DFSClient.java:3381)
    at org.apache.hadoop.hdfs.DFSClient$DFSOutputStream.access$2600(DFSClient.java:2589)
    at org.apache.hadoop.hdfs.DFSClient$DFSOutputStream$DataStreamer.run(DFSClient.java:2829)

檢視允許的最大檔案數,發現只有1024

[email protected]:/opt/hbase-0.94.8/logs$ ulimit -a
core file size          (blocks, -c) 0
data seg size           (kbytes, -d) unlimited
scheduling priority             (-e) 0
file size               (blocks, -f) unlimited
pending signals                 (-i) 59518
max locked memory       (kbytes, -l) 64
max memory size         (kbytes, -m) unlimited
open files                      (-n) 1024
pipe size            (512 bytes, -p) 8
POSIX message queues     (bytes, -q) 819200
real-time priority              (-r) 0
stack size              (kbytes, -s) 8192
cpu time               (seconds, -t) unlimited
max user processes              (-u) 59518
virtual memory          (kbytes, -v) unlimited
file locks                      (-x) unlimited

解決辦法:

修改ulimit 值為8192,在master 節點上執行$hbase_home/bin/start-hbase.sh 重啟所有節點上的region server,服務恢復.

相關推薦

常見HBase故障分析解決方法

1. java.net.SocketException: Too many open files 問題原因: 問題現象:所有節點region server程序掛掉,hbase不可訪問,檢視日誌有如下資訊 tail hbase-hbase-regionserver-ip-10

NFS服務常見故障排查解決方法

NFS,全名叫Network File System,中文叫網路檔案系統,是Linux、UNIX系統的分散式檔案系統的一個組成部分,可實現在不同網路上共享遠端檔案系統。NFS由Sun公司開發,目前已經成為檔案服務的一種標準之一(RFC1904,RFC1813)。其最大的功

inode檔案佔滿問題分析解決方法

1. 在Linux系統通過df -i檢視inode值,如果inode值滿了,即使磁碟空間很大,也無法建立檔案,使用touch  abc.txt都無法執行 2. 在Solaris系統通過命令df -o i檢視inode值 3. 在centos檢視inode的方法 &nb

一個JAVA單例模式的典型錯誤應用的分析解決方法

                問題來自論壇,其程式碼如下:[java] view plain copy print?import java.sql.Connection;  import java.sql.PreparedStatement;  import java.sql.ResultSet;  imp

關於SqlServer服務無法啟動的症狀分析解決方法

http://blog.sina.com.cn/s/blog_541dc5670100atzr.html 前幾天重灌了系統,在家使用SQL Server一切正常,可是到了單位,SQL Server服務怎麼也起不來了,在網上查資料,折騰了一個多小時沒有搞定,準備放棄了:再次重

用axis2解析xml失敗的原因分析解決方法

和同事之間調介面時遇到了如下的問題,同事用的LotusScript(wsdl檔案是由他那邊提供的),我用的是Java,我這邊通過axis2去解析該wsdl,但解析時報下面這樣的錯。 More than one part for message XMLMAINRequest

小程式使用selectComponent獲取自定義元件時,返回null(分析解決方法

一、原因:        元件所在的佈局層級不同,該元件被建立的時間會有所不同,意味著ready(元件生命週期函式,元件佈局完成後執行)被呼叫的時間有所不同。由於元件建立完成的時間晚於頁面建立完成,即元件生命週期函式的ready被執行的時間晚於頁面生命週期

子元素浮動造成父元素坍塌的原因分析解決方法

現象: 在製作網頁的導航欄的時候,往往會在父元素.nav 中加入一個logo或者標題 h1 再來加入一個導航列表 ul,這個時候會分別給他們加上 float:left / right 樣式。使用chrome的盒子模型檢視的時候會發現.nav 高度為0,也就是“坍塌”了。 用

前端頁面佈局常見的相容性問題解決方法

前端頁面相容問題主要表現在我們所做的頁面在不同瀏覽器顯示會有所不同,目前主要的相容性問題比較多的是IE6和IE7,另外針對html5和css3新標籤,比如css3動畫,媒體查詢,畫布,視訊等暫時不做討論,下面就針對常見的相容性問題做下總結。 一 、不同瀏覽器margin和p

api-ms-win-crt**.dll缺失原因分析解決方法

  系統是否安裝了此類更新,可以通過檢視“系統資訊”來判斷,操作:Win鍵+R,輸入 cmd  /k  systeminfo.exe 確定。當然,也可以通過開啟控制面板或使用第三方工具來檢視。   如果系統中未安裝KB2999226、KB3118401更新,則利用系統Windows Update掃描更新

C++中關於類重複定義的分析解決方法

在C++中將類以及類中的成員函式的宣告放在.h的標頭檔案中,而將類中成員函式的定義(即實現程式碼)放在.cpp的原始檔中,這樣我們的程式設計起來更加的模組化,但是,這樣的設計也會帶來一些問題,我們分析以下的程式碼,從中找的問題,並給出問題的解決方法。首先我們在VC下新建一個

I2C從機掛死分析解決方法

I2C幾乎是嵌入系統中最為通用序列匯流排,MCU周邊的各種器件只要對速度要求不高都可以使用。優點是相容性好(幾乎所有MCU都有I2C主機控制器,沒有也可以用IO模擬),管腳佔用少,晶片實現簡單。I2C協議雖然簡單,實際使用過程中小毛病還不少。今天先來看一個平日最為常見的問

Python 爬蟲常見的坑解決方法

gpo 爬蟲 nic 詳細 true wow user html encoding 1.請求時出現HTTP Error 403: Forbidden headers = {‘User-Agent‘:‘Mozilla/5.0 (Windows NT 6.1; WOW64;

ABAP--關於Unicode的常見錯誤解決方法

分享一下我老師大神的人工智慧教程!零基礎,通俗易懂!http://blog.csdn.net/jiangjunshow 也歡迎大家轉載本篇文章。分享知識,造福人民,實現我們中華民族偉大復興!        

Swift中自定義類==比較方法未被呼叫的分析解決

在專案中自定義了2個類:A和B,其中A含有B的例項變數. 在這2個類中都定義了==比較方法,按照正常來說:比較A,必然比較B.因為需要比較A中型別為B的例項變數. 但實際執行中發現,兩個字面上完全一樣的A例項物件,比較竟然不相等!!! 在A的==方法中下斷點,發

關於在RIP 域 OSPF域 中做雙向路由引入而導致的問題分析解決方法

實驗拓撲如圖。步驟:左邊R1、R2、R3採用RIPV2學習彼此的路由。右邊R2、R3、R4採用OSPF學習路由。然後在路由器R2和R3上做雙向路由引入。(產生問題的前提)。按照如圖所示的內容對路由器進行配置,然後檢視R2和R3的路由表;R2:R3:實驗現象:針對4.4.4.4

常見錯誤分析解決方法

Such as :compile block ----Con_appError:make[1]: *** No rule to make target `Hai_Extern.obj', needed by `build/GXQ26_07B/gprs/MT6226o/lib/conn_app.lib'.  S

FindBugs常見錯誤描述解決方法

SHOULD BE A STATIC INNER CLASS 官方介紹: This class is an inner class, but does not use its embedded reference to the object which created i

傳送郵件常見的錯誤解決方法

傳送郵件是生活工作中最常見不過的事情了,但是在這個過程中,很多人都碰到過傳送錯誤,本文給列舉了這些常見的錯誤和解決方法,希望對大家有所幫助。 錯誤1 550 Mail content denied 這種是內容的問題,使用者加伺服器IP白名單就可以了。 錯誤2

HBase中正則過濾表示式與JAVA正則表示式不一致問題的分析解決

HBase提供了豐富的查詢過濾功能。 比如說它提供了RegexStringComparator這樣的函式,可以實現按照正則表示式進行過濾。它可以有效地彌補向前綴查詢這樣的機制,從而可以使hbase也