Ubuntu Hadoop 完全分散式搭建

阿新 • • 發佈：2019-01-31

系統：Ubuntu16.04
jdk：jdk1.8.0_101
Hadoop：hadoop2.7.3

首先需要有兩臺以上的計算機，一臺作為Master節點，其他的作為Slave節點，所有的伺服器上都需要配置好jdk的環境，
我這裡準備了兩臺伺服器作為節點
Master 192.168.92.129
Slave1 192.168.92.130

首先修改Master節點的配置

sudo vim /etc/hosts

在裡面新增上

192.168.92.129  Master
192.168.92.130  Slave1

（當然在Slave1節點上也需要添上）

然後我們來實現Master節點免密碼登陸Slave節點
在Master節點的~/.ssh 目錄下，存在檔案id_rsa.pub,通過ssh把這個檔案傳給Slave1節點

scp ~/.ssh/id_rsa.pub hadoop@Slave1:/home/hadoop

然後我們在Slave1節點上操作

mkdir ~/.ssh
cat ~/id_rsa.pub >> authorizde_keys

回到Master節點

對免密碼登陸進行測試

ssh Slave1

如果沒有提示輸入密碼，直接登陸說明配置成功

然後我們需要修改Hadoop的配置檔案
首先是core-site.xml檔案

vim /usr/lib/hadoop/etc/hadoop/core-site.xml

開啟，然後在<configuration></configuration>

之間新增

    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://127.0.0.1:9000</value>
    </property>
    <property>
        <name>io.file.buffer.size</name>
        <value>131072</value>
    </property>
    <property>
        <name 
>hadoop.tmp.dir</name>
        <value>file:/usr/lib/hadoop/tmp</value>
        <description>Abasefor other temporary directories.</description>
    </property>
    <property>
        <name>hadoop.proxyuser.spark.hosts</name>
        <value>*</value>
    </property>
    <property>
        <name>hadoop.proxyuser.spark.groups</name>
        <value>*</value>
    </property>

然後是hdfs-site.xml

vim /usr/lib/hadoop/etc/hadoop/hdfs-site.xml

同樣插入

    <property>
        <name>dfs.namenode.secondary.http-address</name>
        <value>127.0.0.1:9001</value>
    </property>
    <property>
        <name>dfs.namenode.name.dir</name>
        <value>file:/usr/lib/hadoop/tmp/dfs/name</value>
    </property>
    <property>
        <name>dfs.datanode.data.dir</name>
        <value>file:/usr/lib/hadoop/tmp/dfs/data</value>
    </property>
    <property>
        <name>dfs.replication</name>
        <value>1</value>
    </property>
    <property>
        <name>dfs.webhdfs.enabled</name>
        <value>true</value>
    </property>

mapred-site.xml

vim /usr/lib/hadoop/etc/hadoop/mapred-site.xml

    <property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
    </property>
    <property>
        <name>mapreduce.jobhistory.address</name>
        <value>127.0.0.1:10020</value>
    </property>
    <property>
        <name>mapreduce.jobhistory.webapp.address</name>
        <value>127.0.0.1:19888</value>
    </property>

yarn-site.xml

vim /usr/lib/hadoop/etc/hadoop/yarn-site.xml

    <property>
        <name>yarn.resourcemanager.hostname</name>
        <value>127.0.0.1</value>
    </property>
    <property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
    </property>

然後我們需要在主節點中新增子節點的資訊
需要在slaves檔案中進行新增

 vim /usr/lib/hadoop/etc/hadoop/slaves

這個檔案是用來儲存dataNode的節點資訊，檔案裡面原有localhost，可以刪除，也可以不刪除（這樣master節點既有NameNode又有DataNode）
當然我們需要在這個之後加上

Slave1

這樣Slave1上的DataNode才會啟動
最後我們修改hadoop-env.sh
中的JAVA_HOME配置

vim /usr/lib/hadoop/etc/hadoop/hadoop-env.sh

找到JAVA_HOME改為

export JAVA_HOME=/usr/lib/jdk/jdk1.8.0_101

然後把配置好的Hadoop通過ssh傳送到Slave節點上

scp -r /usr/lib/hadoop hadoop@Slave1:/home/hadoop

然後在Slave1上把hadoop放到和Master相同的目錄下

格式化hdfs

/usr/lib/hadoop/bin/hdfs namenode -format

啟動hadoop

/usr/lib/hadoop/sbin/start-dfs.sh
/usr/lib/hadoop/sbin/start-yarn.sh
/usr/lib/hadoop/sbin/mr-jobhistory-daemon.sh start historyserver

這個時候在Master節點上執行jps會出現

JobHistorySever
SecondaryNameNode
Jps
ResourceManager
NameNode

在Slave節點上會出現

Jps
DataNode
NodeManager

然後我們需要在HDFS上建立目錄

hdfs dfs -mkdir /user/hadoop
hdfs dfs -mkdir input

在本地建立一個words檔案，裡面放入一些字元

word
edmond
monkey
broewning
king
...

把words文件放到HDFS上

hdfs dfs -put words input

我們執行hadoop自帶的example測試是否能正常執行

hadoop jar /usr/lib/hadoop/share/mapreduce/hadoop-mapreduce-examples-2.7.3.jar wordcount input output

然後會出現類似於：

16/10/13 12:55:19 INFO client.RMProxy: Connecting to ResourceManager at /127.0.0.1:8032
16/10/13 12:55:19 INFO input.FileInputFormat: Total input paths to process : 1
16/10/13 12:55:19 INFO mapreduce.JobSubmitter: number of splits:1
16/10/13 12:55:19 INFO mapreduce.JobSubmitter: Submitting tokens for job: job_1476329370564_0003
16/10/13 12:55:20 INFO impl.YarnClientImpl: Submitted application application_1476329370564_0003
16/10/13 12:55:20 INFO mapreduce.Job: The url to track the job: http://15ISK:8088/proxy/application_1476329370564_0003/
16/10/13 12:55:20 INFO mapreduce.Job: Running job: job_1476329370564_0003
16/10/13 12:55:25 INFO mapreduce.Job: Job job_1476329370564_0003 running in uber mode : false
16/10/13 12:55:25 INFO mapreduce.Job:  map 0% reduce 0%
16/10/13 12:55:29 INFO mapreduce.Job:  map 100% reduce 0%
16/10/13 12:55:33 INFO mapreduce.Job:  map 100% reduce 100%
16/10/13 12:55:33 INFO mapreduce.Job: Job job_1476329370564_0003 completed successfully
16/10/13 12:55:33 INFO mapreduce.Job: Counters: 49
    File System Counters
        FILE: Number of bytes read=221
        FILE: Number of bytes written=238271
        FILE: Number of read operations=0
        FILE: Number of large read operations=0
        FILE: Number of write operations=0
        HDFS: Number of bytes read=283
        HDFS: Number of bytes written=171
        HDFS: Number of read operations=6
        HDFS: Number of large read operations=0
        HDFS: Number of write operations=2
    Job Counters 
        Launched map tasks=1
        Launched reduce tasks=1
        Data-local map tasks=1
        Total time spent by all maps in occupied slots (ms)=1771
        Total time spent by all reduces in occupied slots (ms)=2005
        Total time spent by all map tasks (ms)=1771
        Total time spent by all reduce tasks (ms)=2005
        Total vcore-milliseconds taken by all map tasks=1771
        Total vcore-milliseconds taken by all reduce tasks=2005
        Total megabyte-milliseconds taken by all map tasks=1813504
        Total megabyte-milliseconds taken by all reduce tasks=2053120
    Map-Reduce Framework
        Map input records=13
        Map output records=12
        Map output bytes=204
        Map output materialized bytes=221
        Input split bytes=120
        Combine input records=12
        Combine output records=11
        Reduce input groups=11
        Reduce shuffle bytes=221
        Reduce input records=11
        Reduce output records=11
        Spilled Records=22
        Shuffled Maps =1
        Failed Shuffles=0
        Merged Map outputs=1
        GC time elapsed (ms)=101
        CPU time spent (ms)=1260
        Physical memory (bytes) snapshot=459825152
        Virtual memory (bytes) snapshot=3895697408
        Total committed heap usage (bytes)=353370112
    Shuffle Errors
        BAD_ID=0
        CONNECTION=0
        IO_ERROR=0
        WRONG_LENGTH=0
        WRONG_MAP=0
        WRONG_REDUCE=0
    File Input Format Counters 
        Bytes Read=163
    File Output Format Counters 
        Bytes Written=171

注：

在hosts檔案中不能有除了Master和Slave節點資訊外的其他資訊，具體情況可能要根據自己的主機情況配置

Ubuntu Hadoop 完全分散式搭建

系統：Ubuntu16.04 jdk：jdk1.8.0_101 Hadoop：hadoop2.7.3 首先需要有兩臺以上的計算機，一臺作為Master節點，其他的作為Slave節點，所有的伺服器上都需要配置好jdk的環境，我這裡準備了兩臺伺服器作為

ubantu 16.4 Hadoop 完全分散式搭建

一個虛擬機器　　1.以 NAT網絡卡模式裝載虛擬機器　　2.最好將幾個用到的虛擬機器修改主機名，靜態IP /etc/network/interface，這裡是 s101 s102 s103 三

Hadoop完全分散式搭建步驟

請在搭建偽分散式的基礎上搭建完全分散式 1、克隆兩臺虛擬機器(點選藍色超連結有如何克隆虛擬機器)。 2、克隆完成之後首先在三臺機器上都分別輸入 $ ifconfig 檢視是否有eth0 如下：是正確的。【 eth0 &nbs

ubantu 16.4 Hadoop 完全分散式搭建

一個虛擬機器　　1.以 NAT網絡卡模式裝載虛擬機器　　2.最好將幾個用到的虛擬機器修改主機名，靜態IP /etc/network/interface，這裡是 s101 s102 s103 三臺主機 ubantu，改/etc/hostname檔案　　3.安裝ssh 　　

hadoop完全分散式搭建

1、安裝linux作業系統。 2、配置網路，固定ip。本人一般採用nat模式。 3、關閉防火牆檢視防火牆狀態 chkconfig iptables --list chkconfig ip6tables --list 臨時關閉防火牆（立即生效） service ipta

hadoop完全分散式搭建HA（高可用）

首先建立5臺虛擬機器（最少三臺），並且做好部署規劃ip地址主機名安裝軟體程序 192.168.xx.120 master jdk,hadoop,zookeeper namenode,ZKFC,Resourcemanager 192.168.xx.121 m

Hadoop完全分散式搭建流程---超詳細

1.克隆兩個節點 2.修改靜態IP 3.修改主機名：【master(主)，slave1(從)，slave2(從)】 4.修改IP和主機名的對映：【/etc/hosts】 5.SSH無密登入： a.修改hostname $>su root $>gedi

Ubuntu Hadoop偽分散式搭建

系統：Ubuntu16.04 JDK：JDK1.8.0_101 Hadoop：2.7.3 JDK安裝路徑：/usr/lib/jdk/jdk1.8.0_101 Hadoop安裝路徑：/usr/lib/hadoop 首先我們要新建一個叫hadoop的賬戶

詳細Ubuntu系統下搭建Hadoop完全分散式

1.Hadoop的執行環境介紹hadoop主要有三種執行模式：單機模式、偽分佈模式、完全分佈模式。其中在單機模式下所有3個XML檔案均為空，當配置檔案為空時，Hadoop會完全執行在本地，因為不需要與其他節點互動，單機模式就不使用HDFS，也不載入任何Hadoop的守護程序。

超級無敵詳細使用ubuntu搭建hadoop完全分散式叢集

## 一、軟體準備 1. 安裝VMware 2. 下載ubuntu映象（[阿里源ubuntu下載地址](http://mirrors.aliyun.com/ubuntu-releases/)）選擇自己適合的版本，以下我使用的是18.04-server版就是沒有桌面的。安裝桌面版如果自己電腦配置不行的

史上最簡單詳細的Hadoop完全分散式叢集搭建

一.安裝虛擬機器環境 Vmware12中文官方版連結：https://pan.baidu.com/s/1IGKVfaOtcFMFXNLHUQp41w 提取碼：6rep 啟用祕鑰：MA491-6NL5Q-AZAM0-ZH0N2-AAJ5A 這個安裝就十分的簡單了，只需要不斷點選下

Hadoop完全分散式叢集的搭建

如果前一章的內容你看懂了，那麼請先刪除之前搭建的三個新伺服器重新克隆三個！！！(博主絕對不是故意為之，真的只是忘記了？) Hadoop完全分散式叢集的搭建 1.分散式叢集搭建規劃 2.叢集的配置（許可權問題，命令執行位置問題請自行注意） 2.1

Hadoop筆記之六——Hadoop2.x 完全分散式搭建

1、準備伺服器，並規劃伺服器角色 3臺虛擬機器Linux s-hadoop01.lele.com 4G 記憶體 40G （機子配置較差 1G） NameNode ResourceManager DataNode NodeManager

centos下hadoop-2.6.0完全分散式搭建

一、Hadoop執行模式： Hadoop有三種執行模式，分別如下：單機(非分散式)模式偽分散式(用不同程序模仿分散式執行中的各類節點)模式完全分散式模式注：前兩種可以在單機執行，最後一種用於真

CentOS6.5搭建hadoop完全分散式叢集

搭建完全分散式叢集-------------------------------前提條件：已經按照之前的步驟搭建完偽分散式。https://blog.csdn.net/weixin_42006411/article/details/80500217搭建hadoop偽分散式連結

centos7搭建hadoop完全分散式叢集

搭建步驟 1.安裝centos7，並進行準備工作（可以安裝一個之後然後克隆） 2.修改各個centos7的hostname和hosts 3.建立使用者和使用者組 4.配置centos7網路，是centos7系統之間以及和hosts主機之間可以通過互相ping通

linux hadoop完全分散式叢集搭建圖文詳解

一.前期準備 1.1 Win7官網下載hadoop包本文使用版本hadoop-2.6.5.tar.gz 1.2 配置jdk 1.3 centos7叢集伺服器主機名系統

Hadoop完全分散式環境搭建

試驗環境： 1臺NameNode伺服器，2臺DataNode伺服器安裝步驟： ①：配置/etc/hosts檔案：實現叢集內部的DNS解析，無需查詢DNS伺服器，當訪問遠端主機時首先查詢hosts檔案是否有配置，如果配置則直接按照指定的IP直接訪問遠端主機(

ubuntu18.04 搭建hadoop完全分散式叢集（Master、slave1、slave2）共三個節點

一、硬體配置以及作業系統：所需要的機器以及作業系統：一臺mac os筆記本、一臺window筆記本（CPU雙核四執行緒，記憶體8G），其中mac os用於遠端操作，window筆記本裝有虛擬機器，虛擬出3個ubuntu18.04系統（配置CPU1個執行緒2個，記憶體1.5G，硬碟分配每個7

VM+CentOS+hadoop2.7搭建hadoop完全分散式叢集

寫在前邊的話：最近找了一個雲端計算開發的工作，本以為來了會直接做一些敲程式碼，處理資料的活，沒想到師父給了我一個課題“基於質量資料的大資料分析”，那麼問題來了首先要做的就是搭建這樣一個平臺，毫無疑問，底層採用hadoop叢集，在此之上，進行一些其他元件的安裝和二

Ubuntu Hadoop 完全分散式搭建

回到Master節點

注：

在hosts檔案中不能有除了Master和Slave節點資訊外的其他資訊，具體情況可能要根據自己的主機情況配置

相關推薦