CDH安裝Oozie/Hue，以及其基本使用

阿新 • • 發佈：2019-01-27

安裝Oozie：

1.登入資料庫後：

create database oozie default character set utf8;

grant all privileges on oozie.* to ‘oozie’@’localhost’ identified by ‘oozie’;

grant all privileges on oozie.* to ‘oozie’@’%’ identified by ‘oozie’;

flush privileges;

2.Add the MySQL JDBC Driver JAR to Oozie：

cp /usr/mysql-connector-java-5.1.45-bin.jar /opt/cloudera/parcels/CDH/lib/oozie/lib/

這裡寫圖片描述

3.Oozie WebUI
http://ip10:11000/oozie/

首次使用報錯：

Oozie web console is disabled.

To enable Oozie web console install the Ext JS library.

Refer to Oozie Quick Start documentation for details.

【Oozie Web控制檯已禁用。要啟用Oozie Web控制檯，請安裝Ext JS庫。有關詳細資訊，請參閱Oozie快速入門文件。】

下載ExtJS庫（必須是2.2版本）
拷貝到 /opt/cloudera/parcels/CDH/lib/oozie/libext/

unzip解壓：unzip ext-2.2.zip
chown -R oozie:oozie ext-2.2
成功

關於Oozie

Oozie是管理Apache Hadoop作業的工作流排程程式系統。
Oozie是一個執行在Java servlet容器中的Java Web應用程式。這些操作構成一個有向無環圖。
工作流操作通過遠端系統啟動任務。當任務完成後，遠端系統會進行回撥來通知任務已經結束，然後再開始下一個操作。
Oozie4.1Web API
[4]

設想一下，當你的系統引入了spark或者hadoop以後，基於Spark和Hadoop已經做了一些任務，比如一連串的Map Reduce任務，但是他們之間彼此右前後依賴的順序，因此你必須要等一個任務執行成功後，再手動執行第二個任務。是不是很煩！這個時候Oozie就派上用場了，它可以把多個任務組成一個工作流，自動完成任務的呼叫。
Oozie圍繞兩個核心：工作流(控制流節點)和協調器（動作節點），前者定義任務的拓撲和執行邏輯，後者負責工作流的依賴和觸發。[2]

安裝Hue

仔細閱讀上文的注意事項，我這裡只需在/etc/my.cnf下新增bind-address=0.0.0.0
重啟資料庫
為Hue建立資料庫

create database hue default character set utf8 default collate utf8_general_ci;

grant all on hue.* to ‘hue’@’%’ identified by ‘huepassword’;

select * from information_schema.schemata;

新增服務Hue，連線資料庫
首次登入需建立超級使用者
因為之前沒有其他資料，所以我這不需要資料遷移，否則
介面

這裡寫圖片描述

關於Hue

Hue是一個用於操作和開發Apache Hadoop應用程式的圖形使用者介面。Hue應用程式被收集到桌面風格的環境中，並作為Web應用程式交付。
通過使用Hue我們可以在Web控制檯上與Hadoop叢集進行互動分析/處理資料，例如操作HDFS上的資料，執行MapReduce Job，執行Hive的SQL語句，瀏覽HBase資料庫等等。
核心功能
- SQL編輯器，支援Hive, Impala, MySQL, Oracle, PostgreSQL等資料視覺化
- Spark、Hadoop、Sqoop的友好介面支援
- 支援排程系統Apache Oozie，可進行workflow的編輯、檢視，任務排程[1]

Hue的入門級使用

配置hue.ini【先備份】，由於初次配置，我僅修改了yarn與Hive的配置
hue.ini中有大量的安全許可權類配置

需要用Hue進行操作的，應該都需要在hue.ini中進行配置

1.Hue使用入門——Hue中使用Hive

先在Hive建立個簡單的資料庫：
- belline進入Hive0.11之後推薦的互動式命令列【連線上HiveServer2前的命令在最前面都需要加上”!”】
- !connect jdbc:hive2://ipaddress:10000連線開啟HiveServer2服務的機器【之後的操作和之前的Hive CLI就幾乎一樣了】
- 準備資料
  sudo -uhdfs hdfs dfs -mkdir /tmp_data_2018511 sudo -uhdfs hdfs dfs -put /tmp/tmp2018511/emp.txt /tmp_data_2018511
- 建立外部資料表：
  create EXTERNAL table IF NOT EXISTS tmp2018511.employee( empno int, ename string, job string, mgr int, hiredate string, sal double, comm double, deptno int ) ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t' location '/tmp_data_2018511';
sudo -uhdfs hdfs dfs -chown hive:hive /tmp_data_2018511
Hue中可以直接檢視hdfs部分資料

“裝載”資料：
load data inpath '/tmp_data_2018511/emp.txt' overwrite into table employee;【因為是hdfs資料，所以沒有local欄位】

Hue中可以執行SQL查詢，以及一些基本的查詢結果視覺化，還可以匯出查詢結果。
這裡寫圖片描述

CDH服務字母

HBASE部分
M —Master
HBTS –HBase Thrift Server
G –Gateway
HBRS –HBase REST Server
RS –RegionServer

HDFS部分
B –HDFS Balancer
FC –Failover Controller
SNN –SecondaryNameNode
NFSC –NFS Gateway
HFS –HttpFS
NFSG –HDFS NFS Gateway
NN –Namenode
G –Gateway
JN –JournalNode
DN –DateNode

Hive部分
HMS –Hive Metastore Server
WHC –WebHCat Server
HS2 –HiveServer2
G –Hive Gateway

Hue部分
HS –Hue Server
KTR kerberos Ticket Renewer

Oozie部分
OS –Oozie Server

YARN部分
G –Gateway
NM –NodeManager

Zookeeper
S –Server

~~Spark部分，以上總結意義不大，web中檢視更方便~~

參考

CDH安裝Oozie/Hue，以及其基本使用

安裝Oozie： 1.登入資料庫後： create database oozie default character set utf8; grant all privileges on oozie.* to ‘oozie’@’loc

遞歸返回指定文件夾中文件的路徑，以及其包含文件夾中文件的路徑

user ldp 中文包含 child sof listdir use ros import osdef print_directory_contents(sPath): for sChild in os.listdir(sPath): sChildP

CDH安裝失敗了，如何重新安裝

erl mysql- AR IE ini var init.d about root 1> 刪除Agent節點的UUID # rm -rf /opt/cm-5.12.0/lib/cloudera-scm-agent/* 2> 清空主節點CM數據庫

stream介紹，以及其常用方法的使用示例

Stream 就如同一個迭代器（Iterator），單向，不可往復，資料只能遍歷一次，遍歷過一次後即用盡了，就好比流水從面前流過，一去不復返。有多種方式生成 Stream Source：從 Collection 和陣列 Collection.

說明UML適用的建模領域，以及其作用和主要的參與人員。

業務建模，用來加強對業務領域的瞭解，以領域專家為主，需求分析人員是主力，系統分析員、架構師可參與。需求模型，用來加強需求瞭解，便於技術決策，以需求分析人員為主，系統分析員是主力，領域專家提供指導，架構師和資深開發人員參與。設計模型：包括高層設計模型和

Tomcat安裝的常見問題以及其第一個應用

1、Tomcat的下載安裝：進入官網http://tomcat.apache.org/，即可下載其安裝包，不過安裝包太多，因為是新手，一直都是achieve去獲取，結果，彈出一個不能下載的介面，後面才曉得可以通過獲得core windows 32 位安裝包可以獲取（筆者是32位window7版

火狐Firefox瀏覽器安裝Selenium_IDE的步驟以及其使用規則

火狐瀏覽器安裝Selenium ide圖解步驟步驟1.用火狐瀏覽器進入selenium官網，地址：http://docs.seleniumhq.org/，點選Download Selenium，如下圖所示；步驟2.安裝好後，可在火狐瀏

18、linux筆記--為什麼要使用YOCTO，以及其便捷之處

作為靈活多變且經濟高效的解決方案，嵌入式 Linux展現了巨大的價值，並廣泛應用於消費電子裝置、網路裝置、零售點和行業應用程式。然而，廣泛的應用也意味著多樣化的業務需求，嵌入式解決方案開發人員必須構建定製Linux 版本來滿足其特定需求。這導致了嵌入式Linux 市場

Http協議中，主要常見的傳送資料到伺服器有哪兩種方式，這兩種方式的特點和區別，以及其在Http協議中的位置

Get 和 Post 的區別兩點：一、這兩者傳遞引數時所用的編碼不一定是一樣的。在 Tomcat 中似乎 Get 的編碼方式是根據頁面中指定的編碼方式，而 Post 則是一直使用同一種編碼方式，可在 Tomcat 的 server.xml 中配置。二、使用 Get 的時候，引數會顯示在位址列上，而 Po

真實機下 ubuntu 18.04 安裝GPU +CUDA+cuDNN 以及其版本選擇（親測非常實用）

ubuntu 18.04 安裝GPU +CUDA+cuDNN ：目前，大多情況下，能搜到的基本上都ubuntu 14.04.或者是ubuntu 16.04的作業系統安裝以及GPU 環境搭建過程，博主就目前自身實驗室環境進行分析，總結一下安裝過程。 1.實驗室硬體配置（就

什麼是孿生網路，以及其應用

孿生神經網路是一類包含兩個或更多個相同子網路的神經網路架構。這裡相同是指它們具有相同的配置即具有相同的引數和權重。引數更新在兩個子網上共同進行。孿生神經網路在涉及發現相似性或兩個可比較的事物之間的關係的任務中流行。一些例子是複述評分，其

有一個3*4的矩陣，要求程式設計求出其中值最大的那個元素的值，以及其所在行號列號

#include <stdio.h> #include <conio.h> int main(){ int a[3][4]={1,2,3,4,5,6,7,8,23,48,11,12}; int i,j,max=a[0][0],row,colu

JAVA反射修改常量，以及其侷限（修改private final限制）

轉載：PS：不過很好奇下面的那個private屬性怎麼被另一個類訪問到的。注：又研究了下，發現特麼應該下面的修改常量的核心程式碼應該是在這個類的main函式裡面，坑，寫清楚點撒對如下Bean類，其中的INT_VALUE是私有靜態常量 [java] view p

JAVA反射改動常量，以及其局限

搭建CDH實驗環境，以三個節點為例的安裝配置

包名技術 move remote type -s 用戶密碼 reat 51cto （一）實驗環境l 實驗介質n CentOS-7-x86_64-Everything-1708.ison jdk-8u161-linux-x64.rpmn cloudera-manager-c

下載google的crx插件，360極速瀏覽器安裝postman插件，安裝crx顯示必須以application/x-chrome-extension類型提供

nload googl cati start logs 分享 load html ogl 1.下載crx插件 Start | Chrome Extension Downloaderhttps://chrome-extension-downloader.com/ 2.安裝

cdh版本的hue安裝配置部署以及集成hadoop hbase hive mysql等權威指南

service sources ces 兩個配置語句基金會 pan 創建 hue下載地址：https://github.com/cloudera/hue hue學習文檔地址：http://archive.cloudera.com/cdh5/cdh/5/hue-3.7

【Java】基本數據類型以及其轉換

行數 -s www. 取值 a+b valueof eight color 比對整理了一下Java基本數據類型和面試可能涉及的知識。字節數（byte）位數（bit）取值範圍整型 byte 1 8 -2^7 ~ 2^7 -1

在CentOS7.5上安裝MySQL（5.7版本），掌握MySQL基本操作。

tex RoCE 使用 9.png apache error 需求結果加強當今主流數據庫概略：在數據庫技術日益發展的今天，主流數據庫代表著成熟的數據庫技術。了解常用數據庫，就能知道數據庫技術發展的程度，以及未來的大體方向。數據庫分關系型數據庫和非關

CM+CDH安裝大數據組件過程當中，一直報日誌的創建權限的問題。

技術分享 alt 分享圖片 ack inf 用戶 nbsp 選項感覺最近通過CM的形式安裝大數據組件，然後出現了各種問題。看到上面的截圖，第一感覺是不是哪裏沒有設置好，或者是什麽情況，然後查看打印出來的日誌。日誌的截圖如下：這個感覺就是日誌目錄創建不了，肯定

CDH安裝Oozie/Hue，以及其基本使用

安裝Oozie：

關於Oozie

安裝Hue

關於Hue

Hue的入門級使用

參考

相關推薦