Azkaban實戰，Command型別單一job示例，任務中執行外部shell指令碼，Command型別多job工作flow,HDFS操作任務，MapReduce任務，HIVE任務

阿新 • • 發佈：2019-02-05

1.Azkaban實戰

Azkaba內建的任務型別支援command、java

Command型別單一job示例

1、建立job描述檔案

vi command.job
#command.job
type=command                                                    
command=echo 'hello'

2、將job資原始檔打包成zip檔案
zip command.job

3、通過azkaban的web管理平臺建立project並上傳job壓縮包
首先建立project
這裡寫圖片描述
上傳zip包，例如：

zip包中的內容如下：

上傳介面：

4、啟動執行該job
可以檢視指令碼的內容：
這裡寫圖片描述

執行工作流：

上面的已經變成了綠色了，表示已經執行完成了。
這裡寫圖片描述

上面的repeat表示每天執行一次
這裡寫圖片描述

1.2.通過任務執行shell指令碼

編寫command.job檔案
內容如下：

#command.job
type=command
command=sh hello.sh

上面的command=sh hello.sh表示的意思是執行hello.sh指令碼，其中hello.sh的指令碼如下：

#!/bin/bash
echo 'hello' > /home/tuzq/software/azkabandata/hello.txt

按照上面的案例，上傳上去，並且執行。
這裡寫圖片描述
上傳任務的指令碼

執行工作流：

進入/home/tuzq/software/azkabandata檢視是否有檔案：

[root@hadoop1 azkabandata]# cd /home/tuzq/software/azkabandata
[root@hadoop1 azkabandata]# ls
hello.txt
[root@hadoop1 azkabandata]# cat hello.txt 
hello
[root@hadoop1 azkabandata]#

1.3.Command型別多job工作流flow

1、建立有依賴關係的多個job描述
第一個job：foo.job

# foo.job
type=command
command=echo foo

第二個job：bar.job依賴foo.job

# bar.job
type=command
#表示這個命令依賴foo這個任務
dependencies=foo
command=echo bar

2、將所有job資原始檔打到一個zip包中
這裡寫圖片描述

3、在azkaban的web管理介面建立工程並上傳zip包
這裡寫圖片描述

4、啟動工作流flow
這裡寫圖片描述

1.4.HDFS操作任務

1、建立job描述檔案

# fs.job
type=command
command=/home/tuzq/software/hadoop-2.8.0/bin/hdfs dfs -mkdir /azaz

2、將job資原始檔打包成zip檔案
這裡寫圖片描述
3、通過azkaban的web管理平臺建立project並上傳job壓縮包
4、啟動執行該job

通過上滿的結果可以證明，可以通過job來自行hdfs的命令

1.5.MAPREDUCE任務

Mr任務依然可以使用command的job型別來執行
1、建立job描述檔案，及mr程式jar包（示例中直接使用hadoop自帶的example jar）

# mrwc.job
type=command
command=/home/tuzq/software/hadoop-2.8.0/bin/hadoop jar hadoop-mapreduce-examples-2.8.0.jar wordcount hdfs://hadoop1/wordcount/input hdfs://hadoop1/wordcount/azout

2、將所有job資原始檔打到一個zip包中
這裡寫圖片描述

其中hadoop-mapreduce-examples-2.8.0.jar 在$HADOOP_HOME/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.8.0.jar

3、在azkaban的web管理介面建立工程並上傳zip包

上傳之後的準備工作是：
將wordcount/input上傳到hdfs,命令如下：

[[email protected] software]# hdfs dfs -put wordcount /
[[email protected] software]# hdfs dfs -ls /
Found 8 items
drwxr-xr-x   - root supergroup          0 2017-06-13 12:01 /40000
drwxr-xr-x   - root supergroup          0 2017-06-14 18:31 /azaz
drwxr-xr-x   - root supergroup          0 2017-06-13 23:43 /flume
drwxr-xr-x   - root supergroup          0 2017-06-14 18:46 /input
-rw-r--r--   3 root supergroup       3719 2017-06-10 12:11 /kms.sh
drwxrwxrwx   - root supergroup          0 2017-06-14 18:43 /tmp
drwxr-xr-x   - root supergroup          0 2017-06-10 22:27 /user
drwxr-xr-x   - root supergroup          0 2017-06-14 18:47 /wordcount

[[email protected] software]# hdfs dfs -ls hdfs:/wordcount/input
Found 9 items
-rw-r--r--   3 root supergroup        604 2017-06-14 18:47 hdfs:///wordcount/input/1.txt
-rw-r--r--   3 root supergroup        604 2017-06-14 18:47 hdfs:///wordcount/input/2.txt
-rw-r--r--   3 root supergroup        604 2017-06-14 18:47 hdfs:///wordcount/input/3.txt
-rw-r--r--   3 root supergroup        604 2017-06-14 18:47 hdfs:///wordcount/input/4.txt
-rw-r--r--   3 root supergroup        604 2017-06-14 18:47 hdfs:///wordcount/input/5.txt
-rw-r--r--   3 root supergroup   27209520 2017-06-14 18:47 hdfs:///wordcount/input/a.txt
-rw-r--r--   3 root supergroup   27209520 2017-06-14 18:47 hdfs:///wordcount/input/aaa.txt
-rw-r--r--   3 root supergroup   27787264 2017-06-14 18:47 hdfs:///wordcount/input/b.txt
-rw-r--r--   3 root supergroup   26738688 2017-06-14 18:47 hdfs:///wordcount/input/c.txt

其中1.txt中內容類似：
這裡寫圖片描述

4、啟動job
現象：
這裡寫圖片描述

執行完成之後的狀態是：

檢視hdfs上的內容：

開始的時候發現在/wordcount下只有input這個資料夾，當執行完成之後，發現有了azout這個資料夾。

綜上所述，說明通過azkaban在hdfs上生成了檔案

1.5.HIVE指令碼任務

建立job描述檔案和hive指令碼
Hive指令碼： test.sql

use default;
drop table aztest;
create table aztest(id int,name string) row format delimited fields terminated by ',';
load data inpath '/aztest/hiveinput' into table aztest;
create table azres as select * from aztest;
insert overwrite directory '/aztest/hiveoutput' select count(1) from aztest;

Job描述檔案：hivef.job

#hivef.job
type=command
command=/home/tuzq/software/hive/apache-hive-1.2.1-bin/bin/hive -f 'test.sql'

2、將所有job資原始檔打到一個zip包中
這裡寫圖片描述
3、在azkaban的web管理介面建立工程並上傳zip包
4、啟動job
準備工作（在hdfs上建立一個hive執行sql後依賴的資料夾）：
[[email protected] apache-hive-1.2.1-bin]# hdfs dfs -mkdir -p /aztest/hiveoutput
執行完成之後效果如下：
這裡寫圖片描述

特別注意的是：如果執行錯了，可以檢視任務的日誌輸出：

Azkaban實戰，Command型別單一job示例，任務中執行外部shell指令碼，Command型別多job工作flow,HDFS操作任務，MapReduce任務，HIVE任務

1.Azkaban實戰

Command型別單一job示例

1.2.通過任務執行shell指令碼

1.3.Command型別多job工作流flow

1.4.HDFS操作任務

1.5.MAPREDUCE任務

1.5.HIVE指令碼任務

Azkaban實戰，Command型別單一job示例，任務中執行外部shell指令碼，Command型別多job工作flow,HDFS操作任務，MapReduce任務，HIVE任務

centos6，centos7 根據ip地址列表檔案進行防火牆封殺的shell指令碼

Mac執行shell指令碼提示command not found的一種解決方案

scikit-learn初步，一個KNN算法示例

實戰分享，教你藍牙在小程序中的應用

感悟：決定一個系統走勢是多因素構成，而非單一因素決定。

最新版 INSPINIA IN+ - WebApp Admin Theme v2.7.1，包含asp.net MVC5示例代碼，做管理系統最佳的選擇。

十二、事件，委托，泛型委托，集合（泛型和非泛型），Lambda表達式（聲明委托，使用委托，簡單的委托示例，action<T>和func<t>委托，多播委托，匿名方法，Lambda表達式，參數，事件）

回調函數參數問題，閉包解決方案示例

【算法與數據結構實戰】線性表操作-實現A並B，結果放入A中

Python學習：5、if語句，while語句，函數以及商城示例

概率軟邏輯（PSL，Probabilistic soft logic）示例演練和模塊解釋

入門python程式：分支迴圈，break和continue使用示例

Oracle 使用DBMS_JOB和DBMS_SCHEDULER 建立定時任務建立管理job示例

oozie錯誤：job一直在running或者SUSPENDED，但是就是不執行。任務單獨執行是可以的。

說明Linux系統上命令的使用格式；介紹一些命令的使用，並配合相應的示例來闡述

sklearn中lr模型的評價指標函式，含義及應用程式碼示例

ajax請求成功之後返回的資料，怎樣顯示到頁面，跟隨表單一起提交

python3 keras獲取GRU的每一個時刻的輸出,，切分GRU的輸出示例

求共同好友，多job運用

Azkaban實戰，Command型別單一job示例，任務中執行外部shell指令碼，Command型別多job工作flow,HDFS操作任務，MapReduce任務，HIVE任務

1.Azkaban實戰

Command型別單一job示例

1.2.通過任務執行shell指令碼

1.3.Command型別多job工作流flow

1.4.HDFS操作任務

1.5.MAPREDUCE任務

1.5.HIVE指令碼任務

相關推薦