Hadoop HDFS 配置、格式化、啟動、基本使用Hadoop MapReduce配置、wordcount程式提交

阿新 • • 發佈：2019-01-08

Hadoop的安裝方式
   單機：所有的服務執行在一個程序裡面，開發階段才會使用
   分散式：將多個服務（JVM），分別執行在多臺機器上。
   偽分散式：將多個服務（JVM）執行在一臺機器上

Hadoop偽分散式安裝
文件：http://hadoop.apache.org/docs/r2.7.6/hadoop-project-dist/hadoop-common/SingleCluster.html
安裝過程：
（1）上傳解壓
tar -zxvf hadoop-2.7.3.tar.gz -C /opt/modules/

rm -rf sbin/*.cmd

（3）修改配置檔案（安裝模組來配置）
-》*-env.sh 環境變數檔案
hadoop-env.sh

yarn-env.sh

修改JAVA_HOME=/opt/modules/jdk1.8.0_91

   -》common
       core-site.xml
       
       <property>
           <name>fs.defaultFS</name>
           <value>hdfs://bigdata-hpsk01.huadian.com:8020</value>
       </property>

<property>
           <name>hadoop.tmp.dir</name>
           <value>/opt/modules/hadoop-2.7.3/datas/tmpData</value>
       </property>

-》HDFS
       hdfs-site.xml
           
           <property>
               <name>dfs.replication</name>
               <value>1</value>
           </property>

slaves
指定DataNode執行在那些機器上
一行一個主機名，DataNode將會執行在此主機上

   -》啟動HDFS
       -》格式化檔案系統
           bin/hdfs namenode -format
           成功的標準：

18/09/04 00:15:05 INFO util.ExitUtil: Exiting with status 0
       -》啟動
           主節點：NameNode
               sbin/hadoop-daemon.sh start namenode

-》驗證是否啟動
方式一：
Jps

方式二：
通過Web UI檢視
bigdata-hpsk01.huadian.com:50070

訪問失敗的原因：
                   （1）確定程序是否啟動
                   （2）對映是否配置成功
                   （3）防火牆是否關閉，selinux是否設定為disable

   -》HDFS的基本使用
       幫助文件
       bin/hdfs dfs
       - 建立目錄
           bin/hdfs dfs -mkdir -p /datas/input

- 上傳檔案
bin/hdfs dfs -put /opt/datas/input.data /datas/input/

- 列舉目錄檔案
bin/hdfs dfs -ls /datas
webUI

- 檢視檔案內容
bin/hdfs dfs -text /datas/input/input.data

- 刪除檔案
bin/hdfs dfs -rm -f -r /datas/input/input.data

-》YARN
       yarn-site.xml
           
           <property>
               <name>yarn.resourcemanager.hostname</name>
               <value>bigdata-hpsk01.huadian.com</value>
           </property>
           
           <property>
               <name>yarn.nodemanager.aux-services</name>
               <value>mapreduce_shuffle</value>
           </property>

slaves --我們不需要配置，剛剛已經配置過一次了
指定NodeManager執行在那些機器上
一行一個主機名，DataNode將會執行在此主機上

-》啟動YARN
       啟動
           主節點
               sbin/yarn-daemon.sh start resourcemanager
           從節點
               sbin/yarn-daemon.sh start nodemanager
       驗證：
           方式一：JPS
           方式二：WebUI，8088埠
           bigdata-hpsk01.huadian.com:8088

   -》MapReduce
       mv mapred-site.xml.template mapred-site.xml
           
           <property>
               <name>mapreduce.framework.name</name>
               <value>yarn</value>
           </property>
   -》將MapReduce程式執行在YARN上
       準備測試：需要分享的資料
           /datas/input/input.data
       MapReduce程式
/opt/modules/hadoop-2.7.3/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.3.jar
       提交
           將mapreduce程式提交到YARN上執行
           bin/yarn jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.3.jar wordcount /datas/input/input.data /datas/output/output1

Hadoop HDFS 配置、格式化、啟動、基本使用Hadoop MapReduce配置、wordcount程式提交

Hadoop HDFS 配置、格式化、啟動、基本使用Hadoop MapReduce配置、wordcount程式提交

[Swift通天遁地]五、高階擴充套件-(6)對基本型別：Int、String、Array、Dictionary、Date的擴充套件

Hadoop原始碼：namenode格式化和啟動過程實現

Hadoop HDFS安裝、環境配置

Hadoop — HDFS的概念、原理及基本操作

【Spring Boot】（22）、Spring Boot啟動配置原理

Hadoop HDFS基本操作（ubuntu16.04 、Hadoop 3.0.3）

高效能Redis快取伺服器-redis.conf檔案配置埠號、授權IP、Redis後臺啟動、Redis日誌、Redis密碼

C#、JAVA操作Hadoop（HDFS、Map/Reduce）真實過程概述。元件、原始碼下載。無法解決：Response status code does not indicate success: 500。

Java程式碼靜態檢查、規範、格式化和checkstyle檢查配置文件

Intellij IDEA記憶體設定(32位、64位啟動配置檔案)

獨立模式、偽分佈模式、hbase和hadoop HA（高可用）完全分散式模式。整合配置

【一】linux安裝redis（單機版）、3種啟動方式、及配置檔案介紹。

GO語言學習筆記（二）IDE安裝與配置、格式化代碼、生成代碼文檔

APMServ錯誤解決辦法：1、Apache啟動失敗,請檢查相關配置

1、Apache啟動失敗，請檢查相關配置。2、MySQL5.1啟動失敗，請檢查相關配置。

1、SpringBoot_jar方式啟動並配置日誌檔案

django項目外部的腳本文件執行ORM操作，無需配置路由、視圖啟動django服務

Tomcat、mysql在Linux上的安裝與配置

Linux存儲管理及硬盤分區、格式化、掛載

Hadoop HDFS 配置、格式化、啟動、基本使用Hadoop MapReduce配置、wordcount程式提交

相關推薦