【hadoop】hadoop完全分散式叢集安裝

阿新 • • 發佈：2018-11-12

文章目錄

前言
裝備
Core
總結

前言

後面準備更新hdfs操作（shell命令版本），hbase，hive的操作。

所以這裡先更新一下hadoop叢集安裝。

裝備

1.hadoop-2.6.5.tar.gz

2.三臺伺服器（虛擬機器就可以）

3.centos7

Core

伺服器規劃

後面我就直接說名字不說IP了

（192.168.31.60）master	（192.168.31.61）slave1	（192.168.31.62）slave2
NameNode	ResourceManage	SecondaryNameNode
DataNode	DataNode	DataNode
NodeManager	NodeManager	NodeManager
HistoryServer

下載hadoop原始碼包和JDK

hadoop官方下載

https://archive.apache.org/dist/hadoop/common/

java官方下載

https://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html

上傳到伺服器master

根據個人規劃路徑

# cd /app/install
# ls
hadoop-2.6.5.tar.gz
jdk-8u171-linux-x64.tar.gz

建立hadoop使用者
```
# useradd hadoop
# passwd hadoop
```

配置hostname

# vi /etc/hosts

192.168.31.60       master
192.168.31.61       slave1
192.168.31.62       slave2

配置SSH免密登入

# cd ~/.ssh/  
# ssh-keygen -t rsa
# ssh-copy-id -i 192.168.31.60
# scp -r /root/.ssh/ [email protected]:/root/ 
# scp -r /root/.ssh/ [email protected]:/root/

安裝JDK

$ cd /app/install
$ tar -zxvf jdk-8u171-linux-x64.tar.gz -C /usr/local/java

配置java環境變數

$ vi /etc/profile

#set java environment
JAVA_HOME=/usr/local/java/jdk1.8.0_171
JRE_HOME=$JAVA_HOME/jre
PATH=$PATH:$JAVA_HOME/bin:$JRE_HOME:/bin
CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar:$JRE_HOME/lib
export JAVA_HOME JRE_HOME PATH CLASSPATH

安裝Hadoop

$ cd /app/install
$ tar -zxvf hadoop-2.6.5.tar.gz -C /usr/local/

配置hadoop環境變數

$ vi /etc/profile

#set hadoop environment
export HADOOP_HOME=/usr/local/hadoop-2.6.5
export PATH=$PATH:$HADOOP_HOME/bin

讓配置檔案起效

$ source /etc/profile
$ source /etc/hosts

修改hadoop配置檔案

$ cd /usr/local/hadoop-2.6.5/etc/hadoop

修改hadoop-env.sh、mapred-env.sh、yarn-env.sh新增jdk路徑
```
$ export JAVA_HOME=/usr/local/java/jdk1.8.0_171
```

配置core-site.xml

$ vi core-site.xml

<configuration>
 #NameNode的地址+埠
 <property>
   <name>fs.defaultFS</name>
   <value>hdfs://master:8020</value>
 </property>
 #hadoop臨時目錄的地址，預設情況NameNode和DataNode的資料檔案都會存在這個目錄
 <property>
   <name>hadoop.tmp.dir</name>
   <value>/usr/local/hadoop-2.6.5/data/tmp</value>
 </property>
 <property>
     <name>dfs.namenode.name.dir</name>
     <value>file://${hadoop.tmp.dir}/dfs/name</value>
 </property>
 <property>
     <name>dfs.datanode.data.dir</name>
     <value>file://${hadoop.tmp.dir}/dfs/data</value>
 </property>
</configuration>

配置hdfs-site.xml

$ vi hdfs-site.xml

<configuration>
 #secondaryNameNode的地址+埠號
 <property>
   <name>dfs.namenode.secondary.http-address</name>
   <value>slave2:50090</value>
 </property>
</configuration>

配置slaves
```
master
slave1
slave2
```

配置yarn-site.xml

$ vi yarn-site.xml

<configuration>
    <property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
    </property>
     #resourcemanager的地址
    <property>
        <name>yarn.resourcemanager.hostname</name>
        <value>slave1</value>
    </property>
    #啟用日誌聚集功能
    <property>
        <name>yarn.log-aggregation-enable</name>
        <value>true</value>
    </property>
    #日誌儲存時間
    <property>
        <name>yarn.log-aggregation.retain-seconds</name>
        <value>106800</value>
    </property>
</configuration>

配置mapred-site.xml

$ cp mapred-site.xml.template mapred-site.xml
$ vi cp mapred-site.xml.template mapred-site.xml

<configuration>
    #設定yarn執行mapreduce任務
    <property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
    </property>
    #mapreduce的history伺服器安裝節點
    <property>
        <name>mapreduce.jobhistory.address</name>
        <value>master:10020</value>
    </property>
    #history的web地址
    <property>
        <name>mapreduce.jobhistory.webapp.address</name>
        <value>master:19888</value>
    </property>
</configuration>

刪除doc

$ cd /usr/local/hadoop-2.6.5/share
$ rm -rf doc

配置另外兩臺伺服器(slave1,slave2)

#複製hadoop到slave1,slave2
$ scp -r hadoop-2.6.5/ [email protected]:/usr/local/
$ scp -r hadoop-2.6.5/ [email protected]:/usr/local/
#複製jdk到slave1,slave2
$ scp -r java/ [email protected]:/usr/local/
$ scp -r java/ [email protected]:/usr/local/

#複製環境變數到slave1,slave2
$ scp /etc/profile [email protected]:/etc/
$ scp /etc/profile [email protected]:/etc/

#複製hostname到slave1,slave2
$ scp /etc/hosts [email protected]:/etc/
$ scp /etc/hosts [email protected]:/etc/
#記得source起效

NameNode格式化

$ cd /usr/local/hadoop-2.6.5/bin
$ sh hdfs namenode –format

啟動叢集

$ cd /usr/local/hadoop-2.6.5/sin
$ sh start-dfs.sh

啟動yarn
```
$ sh start-yarn.sh
```

Slave1啟動ResourceManager

$ ssh slave1
$ cd /usr/local/hadoop-2.6.5/sin
$ sh yarn-daemon.sh start resourcemanager

master啟動historyServer

$ cd /usr/local/hadoop-2.6.5/sin
$ sh mr-jobhistory-daemon.sh start historyserver

web頁面訪問

http://master:50070/

http://slave1:8088/cluster
圖看效果

cluster

總結

搭建叢集不難。重點是親手去操作。
後面用上hive了，加hive，用了hbase，加hbase
更新到了zookeeper，就慢慢改造成高可用的
轉載註明下作者感謝~

【hadoop】hadoop完全分散式叢集安裝

文章目錄前言裝備 Core 總結前言後面準備更新hdfs操作（shell命令版本），hbase，hive的操作。所以這裡先更新一下hadoop叢集安裝。裝備 1.hadoop-2.6.5.tar.gz

【Spark】Ubuntu16.04 spark 叢集安裝（standalone模式）

一、前言目前 Apache Spark 支援三種分散式部署方式，分別是： standalone spark on mesos spark on YARN 其中，第一種類似於MapReduce 1.0所採用的模式，內部實現了容錯性和資源管理，後兩種則是未來發

CentOS7+Hadoop2.7.2(HA高可用+Federation聯邦)+Hive1.2.1+Spark2.1.0 完全分散式叢集安裝

本文件主要記錄了Hadoop+Hive+Spark叢集安裝過程，並且對NameNode與ResourceManager進行了HA高可用配置，以及對NameNode的橫向擴充套件（Federation聯邦） 1VM網路配置將子網IP設定為192.168.1.0：將閘道器設定

HBase 1.2.6 完全分散式叢集安裝部署詳細過程

Apache HBase 是一個高可靠性、高效能、面向列、可伸縮的分散式儲存系統，是NoSQL資料庫，基於Google Bigtable思想的開源實現，可在廉價的PC Server上搭建大規模結構化儲存叢集，利用Hadoop HDFS作為其檔案儲存系統，利用Hadoo

【完全分散式Hadoop】（三）叢集設定SSH無密碼登陸

之前的文章已經有SSH免密部分，這裡單獨列出來只是為了方便查詢打通SSH，設定ssh無密碼登陸（所有節點）組建了三個節點的叢集hadoop000、hadoop001、hadoop002 在所有節點上執行 ssh-keygen -t rsa 一路回車，生成無密碼的金鑰對。將各個節點的公鑰

【Hadoop】Hadoop 2.7.6安裝_偽分散式叢集

本篇主要演示在Linux上安裝單節點Hadoop模式，以及偽分散式Hadoop模式。一安裝環境作業系統：Oracle Linux Server release 6.5；Java版本：java-1.7.0-openjdk-1.7.0.45；Hadoop版本：hadoop-2.

Docker實戰之安裝配置Hadoop-2.5.2完全分散式叢集

環境配置 VM：VMware Workstation OS：Ubuntu 14.04 LTS Hadoop：hadoop-2.5.2 Hadoop叢集規劃 172.17.0.2 hadoop-master 172.17.

【異常】Hadoop分散式叢集搭建之zookeeper故障

各節點中均已安裝配置好zookeeper。在主節點中用遠端命令啟動個節點中的zookeeper。執行成功。然而在檢視各節點的zookeeper狀態時，主節點報錯 Error contacting service. It is probably no

【轉載】Hadoop 2.7.3 和Hbase 1.2.4安裝教程

啟動運行 property new rop net 文本文 .tar.gz cor 轉載地址：http://blog.csdn.net/napoay/article/details/54136398 目錄(?)[+] 一、機器環境

hadoop-2.7.6 完全分散式的安裝

準備環境 CentOS 7 jdk1.8 (這裡建議使用1.8版本的jdk 連結:https://www.oracle.com/technetwork/ja

【Hadoop】在Ubuntu系統下安裝Hadoop單機/偽分布式安裝

multi .cn 編輯器重新偽分布式 sources edit 信息情況 Ubuntu 14.10 前方有坑：由於之前的分布式系統電腦帶不動，所以想換一個偽分布式試一試。用的是Virtualbox + Ubuntu 14.10 。結果遇到了 apt-get 源無

【Hadoop】在Ubuntu系統下安裝Spark

clas 進行運行輸出結果 oca .com 修改我們 with Spark 版本：spark-2.4.0-bin-without-hadoop.tgz 下載地址：http://spark.apache.org/downloads.html 下載的時候註意一下，需要

史上最簡單詳細的Hadoop完全分散式叢集搭建

一.安裝虛擬機器環境 Vmware12中文官方版連結：https://pan.baidu.com/s/1IGKVfaOtcFMFXNLHUQp41w 提取碼：6rep 啟用祕鑰：MA491-6NL5Q-AZAM0-ZH0N2-AAJ5A 這個安裝就十分的簡單了，只需要不斷點選下

分散式叢集安裝Hadoop

準備從節點(Slave) 通過想一下步驟準備好一個新的機器作為從節點(Slave)，新增入叢集：系統要求 OS: Linux (Ubuntu preferable) Admin accounter: hadoopAdmin Hostname: hadoop

Hadoop完全分散式叢集的搭建

如果前一章的內容你看懂了，那麼請先刪除之前搭建的三個新伺服器重新克隆三個！！！(博主絕對不是故意為之，真的只是忘記了？) Hadoop完全分散式叢集的搭建 1.分散式叢集搭建規劃 2.叢集的配置（許可權問題，命令執行位置問題請自行注意） 2.1

Hadoop-3.1.1完全分散式叢集搭建

一、工作準備 1.虛擬機器安裝Vmware 安裝CentOs虛擬機器三臺 master 192.168.33.101 slave1 192.168.33.102 slave2 192.168.33.103 2.虛擬機器配置

VirtualBox+Centos7+(jdk1.7.0_71+Hadoop-2.6.0)/(jdk1.10+Hadoop-2.9.1)搭建完全分散式叢集平臺

VirtualBox+Centos7+(jdk1.7.0_71+Hadoop-2.6.0)/(jdk1.10+Hadoop-2.9.1)搭建完全分散式叢集平臺本文有很多是自定義的，可以根據自己的實際情況和需求修改，儘量會用紅色標註出來，當然按照步驟，一步一步應該也能成功，不

CentOS6.5搭建hadoop完全分散式叢集

搭建完全分散式叢集-------------------------------前提條件：已經按照之前的步驟搭建完偽分散式。https://blog.csdn.net/weixin_42006411/article/details/80500217搭建hadoop偽分散式連結

centos7搭建hadoop完全分散式叢集

搭建步驟 1.安裝centos7，並進行準備工作（可以安裝一個之後然後克隆） 2.修改各個centos7的hostname和hosts 3.建立使用者和使用者組 4.配置centos7網路，是centos7系統之間以及和hosts主機之間可以通過互相ping通

linux hadoop完全分散式叢集搭建圖文詳解

一.前期準備 1.1 Win7官網下載hadoop包本文使用版本hadoop-2.6.5.tar.gz 1.2 配置jdk 1.3 centos7叢集伺服器主機名系統

【hadoop】hadoop完全分散式叢集安裝

文章目錄

前言

裝備

Core

總結

相關推薦