1. 程式人生 > >大資料解決方案:Hadoop監控

大資料解決方案:Hadoop監控

Hadoop監控

目前採用方案:Zabbix+Hue+Kafka Manager

1.Zabbix

Zabbix主要監控相關程序是否存活以及針對執行時間過長的任務進行報警,目前暫定為1個小時

原理:通過Hadoop提供的jmx介面獲取相關資料給zabbix

監控的專案:

程序ResourceManager,NameNode,HMaster 0的時候觸發報警。

Hadoop叢集的節點數不為16的時候觸發報警。

Hadoop 正在 執行任務超過60分鐘的任務個數,不為0的時候觸發報警。

2.Hue

Hue是cloudera開源的一套針對Hadoop及相關元件的視覺化及監控工具

目前可以對hdfs,mapreduce,hive,hbase,zookeeper,oozie,spark等進行監控。

目前監控的專案:

hdfs中的資料

mapreduce相關任務情況

hbase中的資料

zookeeper的執行情況

3.Kafka Manager

Kafka Manager是雅虎開源的一套針對Kafka的監控工具。修復了一些Kafka開源監控因為Spark Streaming系統並沒有將消費的偏移量傳送到Zookeeper中導致監控失效的缺點。

目前監控的專案:

Kafka叢集執行情況及各個Topic的詳細引數

部分截圖如下:

重要問題彙總:

1. 啟動服務後若網頁顯示django錯誤:attempt to write a readonly database或 unable to open database file,

是因為目錄或檔案許可權不夠,導致sqlite無法訪問到資料庫檔案及臨時檔案。

修改命令如下:

chmod 777 hue-master/desktop/

chmod 766 hue-master/desktop/desktop.db

2.about頁顯示配置錯誤:Hive Editor – Failed to access Hive warehouse: /user/hive/warehouse

解決方案:找到原始碼中 /apps/beeswax/src/beeswax/conf.py第138行,修改hive屬性 hive.metastore.warehouse.dir 到/hive/warehouse,

3.Hbase app報錯:

無法聯絡到 HBase Thrift  伺服器:Could not connect to localhost:9090

原因是1.沒有啟動HBase Thrift,2.沒有安裝Thrift。

Hbase預設Thrift只支援java連線,需要編譯安裝Thrift來支援python,php等語言。

解決方案:在Hadoop22上安裝Thrift後啟動Hbase thrift。

相關推薦

資料解決方案Hadoop監控

Hadoop監控 目前採用方案:Zabbix+Hue+Kafka Manager 1.Zabbix Zabbix主要監控相關程序是否存活以及針對執行時間過長的任務進行報警,目前暫定為1個小時 原理:通過Hadoop提供的jmx介面獲取相關資料給zabbix 監控

資料解決方案挖掘資料價值,讓選擇更有依據

隨著科技的高速發展,資料在人們生活和決策中所佔的比重越來越大,大資料的熱浪已然覆蓋了整個時代。資料顯示,到2020年,中國大資料產業規模或達13626億元。大資料一直在積極賦能眾多產業,包括金融、醫療、農業、教育等,如何在各個行業中深度挖掘大資料價值,讓決策者的選擇有據可依,這就需要專業的大資料解決

《Oracle資料解決方案》學習筆記5——Oracle資料機的配置、部署架構和監控-1(BDA Config, Deployment Arch, and Monitoring)

這章的內容很多,有的學了。   1. Oracle大資料機——靈活和可擴充套件的架構 2. Hadoop叢集的基本配置   3. Oracle大資料機的硬體配置   4. Oracle大資料機X3-2滿

人力資源資料解決方案

人力資源大資料解決方案 大資料技術的應用正在潛移默化改變著我們的日常生活習慣和工作方式,很多看起來有點“不可思議”的事情也漸漸被我們“習以為常”。大資料可能在國內的起步較晚,但我們可能卻是對大資料應用最好的了代表了。前些時候有分享了一個大資料技術在智慧人社上面的應用案例,最近也一直看一些人力

理解資料解決方案的架構層

概述 介紹了一種評估大資料解決方案可行性的基於維度的方法。如果您已經使用上一篇文章中的問題和提示分析了自己的情況,並且已經決定開始構建新的(或更新現有的)大資料解決方案,那麼下一步就是識別定義專案的大資料解決方案所需的元件。 大資料解決方案的邏輯層 邏輯層提供了一種組織您的元件的方式。這

《Oracle資料解決方案》學習筆記4——選擇Appliance的理由(Why an Appliance?)

雖然這章的內容有點像Oracled的市場宣傳資料,但也因此學習了一些大資料相關硬體的知識。 1. Oracle大資料機(Big Data Appliance)X3-2硬體規格(全機架配置,18個節點) 2. Oracle大資料機全機架配置環境規格 3. Orac

MongoDB + Spark: 完整的資料解決方案

Spark介紹 按照官方的定義,Spark 是一個通用,快速,適用於大規模資料的處理引擎。 通用性:我們可以使用Spark SQL來執行常規分析, Spark Streaming 來流資料處理, 以及用Mlib來執行機器學習等。Java,python,scala及R語言的

瞎掰資料-- 世界的本質是資料,胡侃瞎掰,專注微軟資料解決方案

1. 技術負債在敏捷團隊中會快速的膨脹。 2. 敏捷軟體開發團隊會想當然地認為每個團隊成員都專業,稱職並富有責任心。如果事實不是如此,專案開發很快會變得舉步維艱。 3. 由於對敏捷開發實踐的錯誤理解,導致團隊不合理地頻繁交付,疲於奔命。 4. 實施敏捷的門檻太高,敏捷開發需

簡單粗暴的“資料解決方案

這裡說“大資料”確實有點譁眾取寵,但確確實實是解決一些大資料量的情況。比如常用的布隆過濾器(BloomFilter)、常用的文字相似比較演算法SimHash等,這裡介紹的都是看上去是簡單粗暴的方法,但當你深入瞭解後你就會發現什麼叫簡約而不簡單,掌握這些常用的手段

資料框架對比Hadoop、Storm、Samza、Spark和Flink

今天看到一篇講得比較清晰的框架對比,這幾個框架的選擇對於初學分散式運算的人來說確實有點迷茫,相信看完這篇文章之後應該能有所收穫。簡介大資料是收集、整理、處理大容量資料集,並從中獲得見解所需的非傳統戰略和技術的總稱。雖然處理資料所需的計算能力或儲存容量早已超過一臺計算機的上限,

最全的資料解決方案(多圖)

來源:網路大資料未來智慧實驗室是人工智慧學家與科學院相關機構聯合成立的人工智慧,網際網路和腦科學

高併發與資料解決方案概述

概述 隨著業務的不斷豐富,高併發和海量資料的處理日益成為影響系統性能的重要問題。下面將提供一些針對併發問題和海量資料處理的解決方案。 海量資料的解決方案: 快取 頁面靜態化 資料庫優化 分離活躍資料 批量讀取和延遲修改 讀寫分離 分散式資料

資料開發利器Hadoop(11) Hadoop2 HA(High Availability)

本節主要介紹了HDFS HA(High Availability)的原理、主備切換過程以及基於JournalNode的共享儲存系統。 1. 前言 在當初介紹Hadoop2.0時,我們簡單提到了Hadoop框架中MapReduce的不足與改進。(即

Lambda plus: 雲上資料解決方案

本文會簡述大資料分析場景需要解決的技術挑戰,討論目前主流大資料架構模式及其發展。最後我們將介紹如何結合雲上儲存、計算元件,實現更優

Elastic Stack 開源的資料解決方案

目的 本文主要介紹的內容有以下三點: 一. Elastic Stack是什麼以及組成部分 二. Elastic Stack前景以及業務應用 三. Elasticsearch原理(索引方向) 四. Elasticsearch相對薄弱的地方 一、Elastic Stack是什麼以及組成部分 介紹Elastic

資料24小時中國平安推出區塊鏈解決方案“壹賬鏈”,雲從科技釋出3D結構光人臉識別技術

【資料猿導讀】釋出3D結構光人臉識別技術;計算機視覺創企雲從科技對外發布3D結構光人臉識別技術;

開源監控解決方案ZABBIX部署實錄

lamp zabbix 安裝 Apache HTTP Server [root@king01 ~]# groupadd apache [root@king01 ~]# useradd apache -g apache -s /bin/nologin[root@king01 ~]# tar zxvf a

開源監控解決方案Observium部署實錄

lamp observium snmp [root@king01 ~]# rpm -ivh https://mirror.webtatic.com/yum/el6/latest.rpm [root@king01 ~]# rpm -ivh epel-release-6-8.noarch.rpm [

開源監控解決方案Icinga(Nagios)部署實錄

apache mysql nagios [root@king01 ~]# rpm -ivh http://repo.mysql.com/mysql-community-release-el6-5.noarch.rpm [root@king01 ~]# yum install -y mysql-

容量NoSql解決方案Aerospike實戰

技術 能夠 部署 結果 接口 碎片 數量 get family 個推專註為開發者們提供消息推送服務多年。通過個推SDK,手機終端與服務器建立長連接,維持在線狀態。然而在網絡異常等情況下,消息無法實時送達到終端用戶,因而推送服務器建立了一份離線消息列表,以待用戶重新登錄時,進