CentOS7 下 Hadoop 分布式部署

阿新 • • 發佈：2019-03-31

dns get order sna framework implement 格式 ipad pat

Hadoop 服務劃分

使用三臺節點，集群部署規劃如下

服務\主機	hadoop1	hadoop2	hadoop3
HDFS	NameNode DataNode	DataNode	SecondaryNameNode DataNode
YARN	NodeManager	ResourceManager NodeManager	NodeManager

服務\主機

hadoop1

hadoop2

hadoop3

HDFS

NameNode

DataNode

SecondaryNameNode

DataNode

YARN

NodeManager

ResourceManager

NodeManager

IP地址規劃

hadoop1    192.168.123.11
hadoop2    192.168.123.12
hadoop3    192.168.123.13

系統環境配置

一、基本信息配置（三臺節點需要分別配置）

IP地址配置

# 配置 IP 地址，網卡配置文件不一定相同
vim /etc/sysconfig/network-scripts/ifcfg-ens33

# 自啟動網卡
ONBOOT="yes"
# IP地址
IPADDR="192.168.123.11"
# 子網頁碼
PREFIX="24"
# 網關
GATEWAY="192.168.123.2"
# DNS 服務器
DNS1="119.29.29.29"

# 重啟網絡服務
systemctl restart network

修改主機名

# 修改主機名字為 hadoop1
hostnamectl set-hostname hadoop1

# 退出當前用戶再登錄即可看見
logout

關閉防火墻，也可放行

# 關閉防火墻
systemctl stop firewalld

# 關閉防火墻開機自啟動
systemctl disable firewalld

安裝 Rsync 工具，用於同步主機之間的文件，這樣後面的配置文件修改就不用每臺機器都改一遍，直接同步過去即可

# 清空 yum 源。若已配置源，直接安裝即可
rm -rf /etc/yum.repos.d/*

# 配置阿裏 yum 源
curl -o /etc/yum.repos.d/CentOS-Base.repo http://mirrors.aliyun.com/repo/Centos-7.repo

# 安裝 rsync
yum install -y rsync

二、基本服務配置（配置一臺主機，其他主機同步即可）

配置主機之間相互免密登錄

# 以一臺機器為例子，其他一樣

# 生成密鑰文件，一直回車
ssh-keygen -t ecdsa -b 521

# 配置免密登錄，需要輸入遠程主機密碼，本機也需要配置
ssh-copy-id -i ~/.ssh/id_ecdsa.pub hadoop1
ssh-copy-id -i ~/.ssh/id_ecdsa.pub hadoop2
ssh-copy-id -i ~/.ssh/id_ecdsa.pub hadoop3

# 驗證，不用輸密碼即為成功
ssh hadoop1 ls /

添加主機名到 Hosts 文件

vim /etc/hosts

127.0.0.1   localhost localhost.localdomain localhost4 localhost4.localdomain4
::1         localhost localhost.localdomain localhost6 localhost6.localdomain6
# 對應本機IP地址，非 127.0.0.1
192.168.123.11 hadoop1
192.168.123.12 hadoop2
192.168.123.13 hadoop3

安裝 JDK https://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html

# 解壓
tar -zxf /opt/jdk-8u202-linux-x64.tar.gz -C /opt/

# 配置環境變量
vim /etc/profile

# JAVA_HOME
export JAVA_HOME=/opt/jdk1.8.0_202/
export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar:$CLASSPATH
export PATH=$JAVA_HOME/bin:$JAVA_HOME/jre/bin:$PATH

# 刷新環境變量
source /etc/profile

# 驗證
java -version

# java version "1.8.0_202"
# Java(TM) SE Runtime Environment (build 1.8.0_202-b08)
# Java HotSpot(TM) 64-Bit Server VM (build 25.202-b08, mixed mode)

安裝 Hadoop https://hadoop.apache.org/releases.html

# 解壓
tar -zxf /opt/hadoop-2.9.2-snappy-64.tar.gz -C /opt/

# 配置環境變量
vim /etc/profile

# HADOOP_HOME
export HADOOP_HOME=/opt/hadoop-2.9.2
export PATH=$PATH:$HADOOP_HOME/bin
export PATH=$PATH:$HADOOP_HOME/sbin

# 刷新環境變量
source /etc/profile

# 驗證
hadoop version

# Hadoop 2.9.2
# Subversion Unknown -r Unknown
# Compiled by root on 2018-12-16T09:39Z
# Compiled with protoc 2.5.0
# From source with checksum 3a9939967262218aa556c684d107985
# This command was run using /opt/hadoop-2.9.2/share/hadoop/common/hadoop-common-2.9.2.jar

同步服務到其他機器

# 同步 Hosts 文件
rsync -avz /etc/hosts hadoop2:/etc/
rsync -avz /etc/hosts hadoop3:/etc/

# 同步 JDK，源路徑不要帶斜杠
rsync -avz /opt/jdk1.8.0_202 hadoop2:/opt/
rsync -avz /opt/jdk1.8.0_202 hadoop3:/opt/

# 同步 Hadoop，源路徑不要帶斜杠
rsync -avz /opt/hadoop-2.9.2 hadoop2:/opt/
rsync -avz /opt/hadoop-2.9.2 hadoop3:/opt/

# 同步環境變量文件 profile，目標主機上的環境變量需要手動刷新：source /etc/profile
rsync -avz /etc/profile hadoop2:/etc/
rsync -avz /etc/profile hadoop3:/etc/

Hadoop分布式配置

配置一臺機器，其他同步即可，配置文件目錄：hadoop-2.9.2/etc/hadoop/

一、基本配置

core-site.xml

<configuration>
  <!-- 指定HDFS中NameNode的地址 -->
  <property>
    <name>fs.defaultFS</name>
    <value>hdfs://hadoop1:9000</value>
  </property>
  
  <!-- 指定Hadoop運行時產生文件的存儲目錄 -->
  <property>
    <name>hadoop.tmp.dir</name>
    <value>/opt/hadoop-tmp</value>
  </property>
</configuration>

hadoop-env.sh

# The java implementation to use.
export JAVA_HOME=/opt/jdk1.8.0_202/

二、HDFS 配置

hdfs-site.xml

<configuration>
  <!-- 指定文件塊副本數 -->
  <property>
    <name>dfs.replication</name>
    <value>3</value>
  </property>
  
  <!-- 指定Hadoop輔助名稱節點主機配置 -->
  <property>
    <name>dfs.namenode.secondary.http-address</name>
    <value>hadoop3:50090</value>
  </property>
</configuration>

三、YARN 配置

yarn-env.sh

# some Java parameters
export JAVA_HOME=/opt/jdk1.8.0_202/

yarn-site.xml

<configuration>
<!-- Site specific YARN configuration properties -->
  <!-- Reducer獲取數據方式 -->
  <property>
    <name>yarn.nodemanager.aux-services</name>
    <value>mapreduce_shuffle</value>
  </property>
  
  <!-- 指定YARN的ResourceManager地址 -->
  <property>
    <name>yarn.resourcemanager.hostname</name>
    <value>hadoop2</value>
  </property>
</configuration>

四、MapReduce 配置

mapred-env.sh

# limitations under the License.

export JAVA_HOME=/opt/jdk1.8.0_202/

# when HADOOP_JOB_HISTORYSERVER_HEAPSIZE is not defined, set it.

mapred-site.xml，將 mapred-site.xml.template 重命名為 mapred-site.xml

<configuration>
  <!-- 指定MapReduce運行在Yarn上 -->
  <property>
    <name>mapreduce.framework.name</name>
    <value>yarn</value>
  </property>
</configuration>

五、集群節點地址配置

slaves

# 所有節點主機的地址
hadoop1
hadoop2
hadoop3

六、將配置文件同步到其他節點

# 將 Hadoop 配置文件同步到其他節點上
rsync -avz /opt/hadoop-2.9.2 hadoop2:/opt/
rsync -avz /opt/hadoop-2.9.2 hadoop3:/opt/

啟動 Hadoop 集群

一、第一次使用需要先格式化 NameNode，這裏是在 hadoop1 上執行格式化

hadoop namenode -format

技術分享圖片

二、在 NameNode 所在節點啟動 hdfs，這裏是 hadoop1

start-dfs.sh

技術分享圖片

三、在 ResourceManger 所在節點啟動 yarn，這裏是 hadoop2

start-yarn.sh

技術分享圖片

查看各個節點進程

技術分享圖片

http://hadoop.apache.org/docs/current/hadoop-project-dist/hadoop-common/ClusterSetup.html

CentOS7 下 Hadoop 分布式部署

dns get order sna framework implement 格式 ipad pat Hadoop 服務劃分使用三臺節點，集群部署規劃如下服務\主機 hadoop1 hadoop2 hadoop3 HD

【Hadoop 分布式部署五：分布式部署之分發、基本測試及監控】

conda -s 啟動上啟 res 點擊 mon web頁面 mapr 1.對 hadoop 進行格式化　　　　到 /opt/app/hadoop-2.5.0 目錄下　　執行命令： bin/hdfs namenode -format 　　　　　　執行的效果圖

【Hadoop 分布式部署八：分布式協作框架Zookeeper架構功能講解及本地模式安裝部署和命令使用】

.gz 權限實現 creat info 應用 data 就是數據結構 What is Zookeeper 　　　　是一個開源的分布式的，為分布式應用提供協作服務的Apache項目　　　　提供一個簡單的原語集合，以便與分布式應用可以在他之上構建更高層次的同步服務

【Hadoop 分布式部署九：分布式協作框架Zookeeper架構分布式安裝部署】

文件 com info 框架分享圖片 zkserver bubuko 情況 soft 1.首先將運行在本地上的 zookeeper 給停止掉 2.到/opt/softwares 目錄下將 zookeeper解壓到 /opt/app 目錄下　　　　命令: ta

hadoop分布式部署

mark fig webapp schedule spec handle http size 文件系統環境：CentOS7.5 192.168.11.205 test2 192.168.11.206 test3 192.168.11.207 test4-8g

CentOS7 下 Hadoop 單節點(偽分布式)部署

cati center etc 火墻 exp ech source add code Hadoop 下載 (2.9.2) https://hadoop.apache.org/releases.html 關閉防火墻 (也可放行) # 停止防火墻 system

hadoop分布式安裝部署具體視頻教程(網盤附配好環境的CentOS虛擬機文件/hadoop配置文件)

down hdf lan nag home 開機啟動 prop baidu ifcfg-eth 參考資源下載：http://pan.baidu.com/s/1ntwUij3視頻安裝教程：hadoop安裝.flvVirtualBox虛擬機：hadoop.part1-part

Hadoop 2.7.3 完全分布式部署

sbin oot oop .com body acl border tool user 本次測試環境如下 IP host JDK linux hadop role 172.16.101.55 sht-sgmhadoopnn-01 1.8.0_111

Hadoop學習------Hadoop安裝方式之(三)：分布式部署

之間 root用戶 jar .sh author tables eth1 report 標識這裏為了方便直接將單機部署過的虛擬機直接克隆，當然也可以不這樣做，一個個手工部署。創建完整克隆——>下一步——>安裝位置。等待一段時間即可。我這邊用了三臺虛擬

hadoop偽分布式部署

hadoop偽分布式========一.hadoop偽分布式========= <code> 偽分布式環境配置需要安裝openjdk 和openjdk-devel軟件包（用的是1.8.0版本） rpm -ql Java-openjdk-devel-1.8.0 | grep ‘/bin/javac

大數據之---hadoop偽分布式部署(HDFS)全網終極篇

偽分布式部 hadoop 1、軟件環境RHEL6 jdk-8u45 hadoop-2.8.1.tar.gz ssh xx.xx.xx.xx ip地址 hadoop1 xx.xx.xx.xx ip地址 hadoop2 xx.xx.xx.xx ip地址 hadoop3 xx.xx.xx.xx ip地址 h

Hadoop偽分布式部署(HDFS)

Hadoop環境要求：java、ssh 1.上傳並解壓tar包 [root@hadoop000 software]# rz #上傳hadoop-2.8.1.tar.gz [root@hadoop000 software]# tar -xzvf hadoop-2.8.1.tar.gz 2.配置環境變量 [ro

hadoop完全分布式部署

hadoop部署 hadoop完全分布式部署一、概述概念：是一個可靠的、可伸縮的、分布式計算的開源軟件。是一個框架，允許跨越計算機集群的大數據及分布式處理，使用簡單的編程模型（mapreduce）可從單臺服務器擴展至幾千臺主機，每個節點提供了計算和存儲功能。不依賴於硬件處理HA，在應用層面實現

[Hadoop]部署-偽分布式部署

cor namenode default 不成功 hadoop roo proto 成功 16px 前文已經完成了編譯,接下來就是部署了這裏部署還是采用偽分布式部署,硬件條件沒辦法,我的破機器內存實在是拖不起三臺,只能裝一臺用偽分布式了. 1.基本安裝找到我

Hadoop生態圈-Kafka的完全分布式部署

SpringCloud從入門到進階（四）——生產環境下Eureka的完全分布式部署

分開 -s rip linux mas 此外實例名 leo 版本內容　　由於前兩節的內容我們知道，開啟了preferIpAddress後，Eureka的偽分布式部署會提示replica不可用。這一節我們講解如何在生產環境下部署完全分布式的Eureka集群，確保開啟了p

Hadoop 完全分布式部署

roo pda adding value 時間同步解壓 pre module ive 完全分布式部署Hadoop 分析： 1）準備3臺客戶機（關閉防火墻、靜態ip、主機名稱） 2）安裝jdk 3）配置環境變量

Zookeeper 分布式部署

zookeeper/opt/app/zookeeper-3.4.5/conf/zoo.cfg tickTime=2000 initLimit=10 syncLimit=5 dataDir=/opt/app/zookeeper-3.4.5/data/zkData clientPort=2181 server.1

MongoDB的分布式部署

數據庫分片大數技術分享 cti 不同的 bpa rtm mon .com 　　一、分片的概念　　　　分片（sharding）是指根據片鍵，將數據進行拆分，使其落在不同的機器上的過程。如此一來，不需要功能，配置等強大的機器，也能儲存大數據量，處理更高的負載。　　二、分

redis 特點分布式部署

queue 什麽是 adl 數據分片繼續有理 sets 多功能策略（1）什麽是redis? Redis 是一個基於內存的高性能key-value數據庫。 (有空再補充，有理解錯誤或不足歡迎指正) （2）Reids的特點 Redis本質上是一個Key-Val

CentOS7 下 Hadoop 分布式部署

Hadoop 服務劃分

系統環境配置

一、基本信息配置（三臺節點需要分別配置）

二、基本服務配置（配置一臺主機，其他主機同步即可）

Hadoop分布式配置

配置一臺機器，其他同步即可，配置文件目錄：hadoop-2.9.2/etc/hadoop/

一、基本配置

二、HDFS 配置

三、YARN 配置

四、MapReduce 配置

五、集群節點地址配置

六、將配置文件同步到其他節點

啟動 Hadoop 集群

查看各個節點進程

http://hadoop.apache.org/docs/current/hadoop-project-dist/hadoop-common/ClusterSetup.html

相關推薦