基於CentOS6.5系統Hadoop2.7.3完全分散式叢集搭建詳細步驟

阿新 • • 發佈：2019-01-07

前言：本次搭建hadoop叢集使用虛擬機器克隆方式克隆slave節點，這樣做可以省去很多不必要的操作，來縮短我們的搭建時間。

一、所需硬體，軟體要求

使用 VMWare構建三臺虛擬機器模擬真實物理環境

作業系統：CentOS6.5

二、必備條件

hadoop搭建需要在三臺機器上進行，並且不能是root使用者，我們需要建立普通使用者，進行下面的操作，三臺機器分別都要建立普通使用者，而且三臺機器上的使用者名稱稱是相同的。

注意：以下操作除了修改/etc目錄下檔案內容，和建立使用者等使用root許可權，其他所有操作均使用普通使用者許可權

a.建立使用者並設定密碼

$>useradd scott
$>passwd scott

三、設定靜態ip

1.關閉DHCP

開啟：VMWare-->編輯-->虛擬網路編輯器-->選中VMB--關閉DHCP

2.開啟虛擬機器，修改相關網路檔案

修改eth0檔案【/etc/sysconfig/network-scripts/ifcfg-eth0】

$>gedit /etc/sysconfig/network-scripts/ifcfg-eth0

修改內容，沒有的選項請補充：

BOOTPROTO=static #設定網絡卡獲得ip地址的方式，可能的選項為static，dhcp或bootp，分別對應靜態指定的 ip地址，通過dhcp協議獲得的ip地址，通過bootp協議獲得的ip地址
ONBOOT=yes

#對應的子網廣播地址，保持在同一個網段，末尾是255
BROADCAST=192.168.111.255

#設定自己喜歡的ip地址，保持在同一個網段
IPADDR=192.168.111.152
#網絡卡對應的網路掩碼
NETMASK=255.255.255.0
#保持在同一網段，末尾設定為2
GATEWAY=192.168.111.2
#子網
NETWORK=192.168.111.0
#DNS1伺服器地址，保持在同一個網段，末尾設定為2
DNS1=192.168.111.2
這兩個GATEWAY,DNS必須按照上面的規則設定,否則是無法ping通的.

3.生效網路

$>service network restart

4.修改主機名和ip對映

$>su
$>vi /etc/hosts

追加內容：

192.168.111.151 master

重啟生效：

$>reboot

5.windows設定靜態ip

修改windows中的VMWare8的網路地址為靜態ip，否則windows系統會ping不通虛擬機器，也沒有辦法使用遠端工具

四、關閉防火牆，Selinux服務

說明：不關閉這兩個我們的外部網路是不可以訪問虛擬機器CentOS系統的

1.關閉防火牆

永久關閉防火牆命令：

$>chkconfig iptables off
$>chkconfig ip6tables off

檢視防火牆狀態：

$>chkconfig iptables --list
$>chkconfig ip6tables --list

2.關閉selinux

$>vi /etc/sysconfig/selinux

修改內容：

【

找到：selinux=enforcing
更改為：selinux=disabled

】

3.重啟系統，生效

$>su
$>reboot

五、解壓JDK/HADOOP軟體，並配置環境變數

可以使用SSH遠端工具把軟體上傳到我們的虛擬機器上，

SSH使用方法請參考部落格：

https://blog.csdn.net/lg_49/article/details/80199602

1.解壓相關軟體

$>tar -zxvf jdk.xxx.tar.gz
$>tar -zxvf hadoop.2.7.3.tar.gz ~/soft

2.建立軟連結

建立軟連結便於我們以後的版本切換

$>ln -s jdk.xxx/ jdk
$>ln -s hadoop.xxx/ hadoop

4.配置環境變數

$>cd ~

$>vi .bash_profile 或使用：gedit

在檔案最後追加一下內容：

#jdk install
export JAVA_HOME=/home/hyxy/soft/jdk
export PATH=$JAVA_HOME/bin:$PATH
#hadoop install
export HADOOP_HOME=/home/hyxy/soft/hadoop
export PATH=$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH

讓環境變數生效：

$>source .bash_profile

說明：

1.我們這檔案.bash_profile配置的環境變數，只有當前普通使用者組的使用者可以使用

2.重新整理完之後，只有當前會話可用，建議reboot（重啟），使用命令：

$>su
$>reboot

六、配置SSH免密登入

1.修改主機名稱

$>su
$>vi /etc/sysconfig/network

修改內容：【HOSTNAME=master】

重啟生效：

$>reboot

2.生成金鑰

$>ssh-keygen -t rsa -P ‘’ -f ~/.ssh/id_rsa

說明：

-t:設定生成金鑰的演算法，採用rsa演算法

-P:設定密碼，預設為空

-f：設定金鑰生成的檔案位置，~/.ssh

3.生成認證庫

$>cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys

4.修改認證庫（authorized_keys）的許可權為600

$>chmod 600 ~/.ssh/authorized_keys

5.免密登入成功

ssh master

七、克隆兩個節點

虛擬機器克隆參考部落格：

https://blog.csdn.net/lg_49/article/details/80412192

注意：三臺機器上的ip地址都應是不同的，所以修改

/etc/sysconfig/network-scripts/ifcfg-eth0檔案中的IPADDR為相同ip段不同ip地址

$>su
$>vi /etc/sysconfig/network-scripts/ifcfg-eth0

八、修改主機名【master（主）、slave1（從）、slave2（從）】

$>su
$>vi /etc/sysconfig/network

修改內容格式例：【HOSTNAME=slave1】

九、修改ip和主機名的對映：【/etc/hosts】

$>su
$>vi /etc/hosts

追加內容：

192.168.111.151 master
192.168.111.152 slave1
192.168.111.153 slave2

主機和克隆機這個檔案都要追加

十、修改hadoop配置檔案

進入~/soft/hadoop/etc/hadoop

使用命令：

cd ~/soft/hadoop/etc/hadoop

1.vi core-site.xml

新增內容：

<configuration> 
    <property> 
        <name>fs.defaultFS</name> 
        <value>hdfs://Master:9000</value> 
    </property>

    <property> 
        <name>hadoop.tmp.dir</name> 
        <value>/home/hyxy/tmp/hadoop</value>  
    </property>
 	
</configuration>

2.vi hdfs-site.xml

<configuration> 
    <property> 
        <name>dfs.replication</name>
        <value>3</value>
        <description>
           預設塊複製。副本數
           建立檔案時可以指定實際的複製次數。
           如果在建立時未指定複製，則使用預設值。
        </description>
    </property> 
    <property> 
        <name>dfs.namenode.name.dir</name>
        <value>file://${hadoop.tmp.dir}/dfs/name</value> 
    </property> 
    <property> 
        <name>dfs.datanode.data.dir</name> 
        <value>file://${hadoop.tmp.dir}/dfs/data</value>
    </property> 
</configuration>

3.vi mapred-site.xml

增加內容：

<configuration> 
    <property> 
        <name>mapreduce.framework.name</name>
        <value>yarn</value> 
        <description>用於執行MapReduce作業的執行時框架。
           可以是local，classic或yarn之一。
    </description>
    </property>
    <property>
        <name>mapreduce.jobhistory.address</name>
        <value>master:10020</value>
    <description>MapReduce JobHistory伺服器IPC主機：埠</description>
    </property>
    <property>
 	<name>mapreduce.jobhistory.webapp.address</name> 				 
        <value>master:19888</value>
        <description>MapReduce JobHistory伺服器Web UI主機：埠</description>
    </property>
< /configuration>

注：發現我們沒有這個檔案，我們需要把mapred-site.xml .template複製一份，命名成mapred-site.xml ，

執行命令:

cp mapred-site.xml.template mapred-site.xml

4.vi yarn-site.xml

增加內容：

<configuration>

    <property>

        <name>yarn.resourcemanager.hostname</name>

        <value>master</value>

        <description>RM的主機名。</description>

    </property>

    <property>

        <name>yarn.nodemanager.aux-services</name>

        <value>mapreduce_shuffle</value>

        <description>以逗號分隔的服務名稱應該僅限於服務名稱列表

       包含a-zA-Z0-9_並且不能以數字開頭</description>

     </property>

 </configuration>

5.vi slaves

把原來的localhost刪除，新增：

slave1
slave2

注意：這裡是初學者比較糾結的事情，所以不用糾結不管是主機還是從機內容都是一樣的，這裡也可以是從機的ip地址，因為我們配置了/etc/hosts這個檔案，所以我們可以使用名稱來找到對應的ip地址。

6.vi hadoop-env.sh

找到這個位置，並修改

# The java implementation to use.

#export JAVA_HOME=${JAVA_HOME}

修改內容：

export JAVA_HOME=/home/llg/soft/jdk

jdk的安裝路徑

7.vi yarn-env.sh

新增JAVA_HOME

我們需要改變的檔案為下面幾個：

注意：

1）將hosts檔案分發到所有節點

$>scp /etc/hosts [email protected]:/etc/

2) 將hadoop目錄分發到所有從節點

$>scp -r ~/soft/hadoop/etc/hadoop [email protected]:~/soft/hadoop/etc

十一、格式化

a. 刪除hadoop.tmp.dir路徑下的所有檔案（所有節點）

b. 刪除HADOOP_LOG_DIR設定路徑下的日誌檔案（所有節點）

c. 格式化：

$>hdfs namenode -format（主節點）

注：

1.這個是命令使用普通使用者執行的，不能使用root許可權，會報錯，並且是在主節點上執行的

2.如果你的hadoop叢集搭建成功了，這個格式化只需要執行一次，你想再格式化之前，請把上面a、b兩個檔案刪除乾淨

十二、開啟完全分散式：

$>start-all.sh

使用命令檢視工作程序

$>jps

瀏覽器上輸入：http://192.168.111.151:50070/，出現：

並且可以檢視到有兩個存活節點，表示搭建成功，如果不成功不要氣餒，檢視日誌檔案~/soft/hadoop/logs找到錯誤

我們可以使用命令：

$>hadoop fs -put ./test.txt /

上傳檔案到我們hadoop根目錄

檢視我們是否上傳成功：

出現：

十三、關閉完全分散式：

$>stop-all.sh

到此我們的hadoop環境就搭建成功了！！！

十四、補充知識：

1.解決CentOS6.5sudo不可用問題

修改/etc/sudoers檔案

$>su
$>visudo

在

root ALL=(ALL) ALL

下插入：

hyxy ALL=(ALL)  ALL

2.補充命令：

安全模式解除指令：

$>hadoop dfsadmin -safemode leave

刪除hadoop叢集檔案指令：

$>hadoop fs -rm /test.txt

基於CentOS6.5系統Hadoop2.7.3完全分散式叢集搭建詳細步驟

前言：本次搭建hadoop叢集使用虛擬機器克隆方式克隆slave節點，這樣做可以省去很多不必要的操作，來縮短我們的搭建時間。一、所需硬體，軟體要求使用 VMWare構建三臺虛擬機器模擬真實物理環境作業系統：CentOS6.5 二、必備條件 hadoop搭建需

hbase1.2.3+zookeeper3.4.9+hadoop2.7.3完全分散式部署遇到的問題

啟動start-hbase.sh 後hbase沒有啟動檢視日誌如下： ERROR [main] master.HMasterCommandLine: Master exiting java.io.IOException: Could not start ZK with 3

CentOS7下搭建hadoop2.7.3完全分散式

這裡搭建的是3個節點的完全分散式，即1個nameNode，2個dataNode，分別如下： CentOS-master nameNode 192.168.11.128 CentOS-node1 dataNode 192.168.11.131 Cen

hadoop2.7.3完全分散式安裝-docker-hive1.2.1-hiveserver2-weave1.9.3

0.環境介紹：１）ubuntu14.04 docker映象地址：https://github.com/gaojunhao/ubuntu14.04 2)hadoop2.7.3 地址：http://www.apache.org/dyn/closer.cgi/hadoop/c

Hadoop2.7.4完全分散式環境搭建

軟體版本虛擬機器管理軟體：VMware WorkStation Pro 12.0 作業系統：CentOS 6.7 Hadoop：Hadoop 2.7.4 JDK：jdk-8u65-linux-x64.tar.gz 一、環境準備 1、修改各個節點主機名：vi /e

centos6.5 安裝hadoop2.7.6 1master2node

centos6.5 hadoop 2.7環境采用centos 6.5最小化安裝,hadoop下載的hadoop2.7.6.tar.gz安裝，Java下載的oracle官網的1.8.0_172的包安裝。參考了別人的文檔，遇到了不同的問題。 1. 3臺centos6.5 vmware 192.168.17.

（學習筆記版）Hadoop入門（一）：Hadoop2.7.3完全分布式集群安裝

min property per cal mon 分別是 master 修改 node 在這裏寫下安裝hadoop2.7.3版本的完全分布式的過程，因為剛開始學習hadoop不久，希望自己把學習的東西記錄下來，和大家一起分享，可能有錯誤的地方，還請大牛們批評指正，在我學習的

hadoop2.7.1在vmware上3臺centos7虛擬機器上的完全分散式叢集搭建

叢集架構 centos7的安裝安裝java hadoop全分佈 ssh無密碼登入 hadoop叢集正常啟動測試以下內容均屬個人理解，如有偏差，望大家諒解。叢集架構 3臺虛擬機器都在同一個區域網中，網段是192.168.10.0，子網掩碼是

Hadoop2.7.3+Spark2.1.0完全分散式叢集搭建過程

1.選取三臺伺服器（CentOS系統64位）　　114.55.246.88 主節點　　114.55.246.77 從節點　　114.55.246.93 從節點之後的操作如果是用普通使用者操作的話也必須知道root使用者的密碼，因為有些操作是得用root使用者操作。如

hadoop2.7.4 完全分散式搭建(4臺)

1. 叢集的規劃描述：hadoop HA機制的搭建依賴與zookeeper，所以選取三臺當作zookeeper叢集，總共準備了4臺主機，分別是hadoop01,hadoop02,hadoop03,hadoop04，其中hadoop01和hadoop02做namenode主

新手上路——hadoop2.7.3單機模式環境搭建

目的本人是一隻hadoop新手，本篇文章主要是個人學習hadoop的學習筆記，內容是搭建單機模式下hadoop2.7.3開發環境。搭建環境及所需軟體 VMWare 12（64位），ubuntu-16.04（64位），hadoop2.7.3.tar H

hadoop學習第二天~Hadoop2.6.5完全分散式叢集搭建和測試

環境配置：系統 centos7 節點 192.168.1.111 namenode 192.168.1.115 datanode2 192.168.1.116 datanode3 java 環境 :

hadoop2.7.3 HA YARN 環境搭建

<configuration>  <property> <name>yarn.nodemanager.aux-services<

Hadoop2.7.2安裝與叢集搭建

1.環境準備 jdk需要1.7以上版本64位. 建立hadoop使用者. 在hadoop使用者目錄下解壓安裝包hadoop-2.7.2.tar.gz 2.配置免密碼登入各節點分別執行生成公鑰和私鑰:ssh-keygen -t rsa 四次enter. 將公鑰新增進公鑰庫:cat

Hadoop從入門到精通系列之--3.完全分散式環境搭建

目錄一什麼是完全分散式二準備伺服器三叢集分發指令碼 3.1 scp（secure copy）安全拷貝 3.2 rsync遠端同步 3.3 叢集分發指令碼四叢集規劃 4.1 規劃思想 4.2 具體配置 4.3 ssh免密登陸一什麼

Hadoop-3.1.1完全分散式叢集搭建

一、工作準備 1.虛擬機器安裝Vmware 安裝CentOs虛擬機器三臺 master 192.168.33.101 slave1 192.168.33.102 slave2 192.168.33.103 2.虛擬機器配置

一、Hadoop2.x完全分散式叢集搭建

實驗環境規劃 192.168.1.101 cmaster0 192.168.1.102 cslave0 192.168.1.103 cslave1 三臺伺服器都是安裝的CentOS6.8作業系統配置/etc/hosts [[email protected] ~]#

# 從零開始搭建Hadoop2.7.1的分散式叢集

Hadoop 2.7.1 (2015-7-6更新)，Hadoop的環境配置不是特別的複雜，但是確實有很多細節需要注意，不然會造成許多配置錯誤的情況。儘量保證一次配置正確防止反覆修改。網上教程有很多關於Hadoop配置的，但是每一個教程都對應了一個版本資訊，有

Hadoop2.8.1完全分散式環境搭建

前言本文搭建了一個由三節點（master、slave1、slave2）構成的Hadoop完全分散式叢集（區別單節點偽分散式叢集），並通過Hadoop分散式計算的一個示例測試叢集的正確性。本文叢集三個節點基於三臺虛擬機器進行搭建，節點安裝的作業系統為Centos7（yum源），Hadoop版本選取為2.8

阿里雲CentOS 7.3安裝Redis3.2.6詳細步驟

############ 準備 ############### 從Redis官網下載Linux redis3.2.6版本,我下載的redis-3.2.6.tar.gz(目前最新穩定版),下載到/usr/local/src目錄，如果沒有就mkdir建立一個. 下載連結:https:/

基於CentOS6.5系統Hadoop2.7.3完全分散式叢集搭建詳細步驟

前言：本次搭建hadoop叢集使用虛擬機器克隆方式克隆slave節點，這樣做可以省去很多不必要的操作，來縮短我們的搭建時間。

一、所需硬體，軟體要求

二、必備條件

a.建立使用者並設定密碼

三、設定靜態ip

1.關閉DHCP

2.開啟虛擬機器，修改相關網路檔案

3.生效網路

4.修改主機名和ip對映

5.windows設定靜態ip

四、關閉防火牆，Selinux服務

1.關閉防火牆

2.關閉selinux

3.重啟系統，生效

五、解壓JDK/HADOOP軟體，並配置環境變數

1.解壓相關軟體

2.建立軟連結

4.配置環境變數

六、配置SSH免密登入

1.修改主機名稱

2.生成金鑰

3.生成認證庫

4.修改認證庫（authorized_keys）的許可權為600

5.免密登入成功

七、克隆兩個節點

八、修改主機名【master（主）、slave1（從）、slave2（從）】

九、修改ip和主機名的對映：【/etc/hosts】

十、修改hadoop配置檔案

1.vi core-site.xml

2.vi hdfs-site.xml

3.vi mapred-site.xml

4.vi yarn-site.xml

5.vi slaves

6.vi hadoop-env.sh

7.vi yarn-env.sh

十一、格式化

十二、開啟完全分散式：

十三、關閉完全分散式：

十四、補充知識：

1.解決CentOS6.5sudo不可用問題

相關推薦