大資料筆記06--YARN的搭建與案例
阿新 • • 發佈:2018-12-16
yarn的搭建
叢集規劃
配置
- 修改配置檔案mapred-sitex.xml
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
<-- 跨平臺配置 -->
<property>
<name>mapreduce.app-submission.cross-platform</name>
<value>true</value>
</property >
- 修改配置檔案yarn-site.xml
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
<property>
<name>yarn.resourcemanager.ha.enabled</name>
<value>true</value>
</property>
<property >
<name>yarn.resourcemanager.cluster-id</name>
<value>cluster1</value>
</property>
<property>
<name>yarn.resourcemanager.ha.rm-ids</name>
<value>rm1,rm2</value>
</property>
<property>
<name>yarn.resourcemanager.hostname.rm1</ name>
<value>node01</value>
</property>
<property>
<name>yarn.resourcemanager.hostname.rm2</name>
<value>node02</value>
</property>
<property>
<name>yarn.resourcemanager.zk-address</name>
<value>node02:2181,node03:2181,node04:2181</value>
</property>
- 將配置好資訊分發到所有節點
- 在node02 node03 node04上啟動zookeeper
./zkServer.sh start
- node01上啟動hdfs和yarn叢集
start-dfs.sh
start-yarn.sh
- 在node02上單獨啟動一個備用ResourceManager (node01上已自動啟動一個active的RM)
yarn-daemon.sh start resourcemanager
- 從8088埠檢視管理頁面
測試案例
wordcount
使用MapReduce提供的測試用例wordcount
- 到mapreduce的jar包目錄下
cd $HADOOP_HOME/share/hadoop/mapreduce
- 執行測試用例
hadoop jar hadoop-mapreduce-examples-2.6.5.jar wordcount /input /output
- input:是hdfs檔案系統中資料所在的目錄
- ouput:是hdfs中不存在的目錄,程式執行的結果會輸出到該目錄,若目錄存在會報錯
- 檢視執行結果
hdfs dfs -cat /output/*