Centos 7下Hadoop分散式叢集搭建

阿新 • • 發佈：2018-12-10

一、關閉防火牆（直接用root使用者）

#關閉防火牆

sudo systemctl stop firewalld.service

#關閉開機啟動

sudo systemctl disable firewalld.service

二、修改每臺主機的Hostname(三臺主機都一樣）

vim /etc/hosts

註釋原有的內容，加入如下內容，ip地址為你自己的虛擬機器的IP地址：

more /etc/hosts檢視是否正確，需要重啟後方能生效。重啟命令reboot now

more /etc/hosts

reboot now

三、免密登陸

1.給3個機器生成金鑰檔案

由於Namenode會執行一系列指令碼去控制Datanode，因此需要設定SSH免金鑰登入，省去輸入密碼的麻煩。

ssh-keygen  -t   rsa   -P  ''

2.生成SSH KEY並將其拷貝到各個節點主機上

依次執行如下命令：

ssh-keygen 
ssh-copy-id Master-huyaqiong #免金鑰登入本機 
ssh-copy-id Slave1-huyaqiong
ssh-copy-id Slave2-huyaqiong

3．進行免密碼登陸測試

四、安裝JDK

1.下載JDK，

我下載的版本為：jdk-8u191-linux-x64.rpm

2.安裝

rpm -ivh jdk-8u191-linux-x64.rpm

3.配置環境變數

export JAVA_HOME=/usr/java/default 
export PATH=$PATH:$JAVA_HOME/bin 
export CLASSPATH=.:$JAVA_HOME/jre/lib:$JAVA_HOME/lib:$JAVA_HOME/lib/tools.jar

4．使環境變數生效

執行如下命令：

source /etc/profile

5.選擇正確的JDK版本

為防止系統裡存在多個版本的JDK，需要使用alternatives選擇正確的版本：

alternatives --config java

請選擇/usr/java/jdk1.8.0_71/jre/bin/java對應的數字標號。

檢視java版本

Java -version

五安裝hadoop

本步驟需要在每個節點下載和安裝hadoop，並做簡單的配置。

1.安裝Hadoop

tar zxvf hadoop-2.7.3.tar.gz -C /usr/hadoop --strip-components 1

2.配置環境變數

開啟~/.bashrc檔案，在檔案末新增如下內容：

export HADOOP_HOME=/usr/hadoop 
export HADOOP_COMMON_HOME=$HADOOP_HOME
 export HADOOP_HDFS_HOME=$HADOOP_HOME 
export HADOOP_MAPRED_HOME=$HADOOP_HOME 
export HADOOP_YARN_HOME=$HADOOP_HOME 
export HADOOP_OPTS="-Djava.library.path=$HADOOP_HOME/lib/native"

 export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_HOME/lib/native
 export PATH=$PATH:$HADOOP_HOME/sbin:$HADOOP_HOME/bin

3.使環境變數生效

source ~/.bashrc

六. 配置hadoop

1.首先登陸到Master節點

2.建立Datanode檔案目錄

mkdir ~/datanode

# 遠端到Datanode節點建立對應的目錄

ssh Slave1-huyaqiong "mkdir ~/datanode" 
ssh Slave2-huyaqiong "mkdir ~/datanode"

3.配置hdfs

首先開啟/usr/hadoop/etc/hadoop /hdfs-site.xml檔案，在<configuration>

</configuration>之間新增如下內容：

<property>
    <name>dfs.replication</name>
    <value>2</value>
  </property>
  <property>
    <name>dfs.datanode.data.dir</name>
    <value>file:///usr/hadoop/datanode</value>
  </property>

4.將配置檔案同步到Datanode

scp  /usr/hadoop/etc/hadoop hdfs-site.xml [email protected]:/usr/hadoop/etc/hadoop
scp  /usr/hadoop/etc/hadoop hdfs-site.xml [email protected]:/usr/hadoop/etc/hadoop

5.配置hadoop core

首先開啟/usr/hadoop/etc/hadoop/core-site.xml檔案，在<configuration> - </configuration>之間新增如下內容：

6.在hadoop中設定JAVA_HOME環境變數

首先通過如下命令在本機修改hadoop-env.sh檔案中的環境變數：

sed -i -e 's/\${JAVA_HOME}/\/usr\/java\/default/' /usr/hadoop/etc/hadoop/hadoop-env.sh

7.配置檔案同步到Datanode

scp  /usr/hadoop/etc/hadoop/hadoop-env.sh [email protected]172.20.20.107:/usr/hadoop/etc/hadoop/
scp  /usr/hadoop/etc/hadoop/hadoop-env.sh [email protected]172.20.20.249:/usr/hadoop/etc/hadoop/

8.建立Namenode檔案目錄

本步驟只需在Namenode上操作。
首先建立目錄：

mkdir /root/Namenode

9.配置hdfs-site.xml

編輯usr/hadoop//etc/hadoop/hdfs-site.xml檔案，增加如下的配置項：

<property>
    <name>dfs.namenode.name.dir</name>
    <value>file:///usr/hadoop/namenode</value>
</property>

10.配置map-reduce

本步驟只需在Namenode上操作，開啟/ usr/hadoop/etc/hadoop/mapred-site.xml檔案，新增如下內容：

<configuration>
   <property>
     <name>mapreduce.framework.name</name>
     <value>yarn</value>
   </property>
</configuration>

11.配置yarn

首先開啟/ usr/hadoop/etc/hadoop/yarn-site.xml檔案，在<configuration> - </configuration>之間新增如下內容：

<property>
    <name>yarn.resourcemanager.hostname</name>
    <value>Master-huyaqiong</value>
  </property>
  <property>
    <name>yarn.nodemanager.aux-services</name>
    <value>mapreduce_shuffle</value>
  </property>

12.將配置檔案同步到Datanode：

scp yarn-site.xml [email protected]172.20.20.249://usr/hadoop/etc/hadoop

scp yarn-site.xml [email protected]172.20.20.110://usr/hadoop/etc/hadoop

13.配置slave

開啟etc/hadoop/slaves檔案，新增如下內容：

七、啟動驗證

分別啟動hdfs和yarn服務：執行示例進行驗證

start-dfs.sh
start-yarn.sh

在Namenode上執行jps命令，應該會看到如下程序：

在Datanode上執行jps命令，應該會看到如下程序：

通過web介面檢視：

訪問 http://172.20.20.249:8088/，可以看到如下圖所示的頁面，用來監控任務的執行情況：

Centos 7下Hadoop分散式叢集搭建

一、關閉防火牆（直接用root使用者） #關閉防火牆 sudo systemctl stop firewalld.service #關閉開機啟動 sudo systemctl disable firewalld.service 二、修改每臺主機

vmware centos hadoop分散式叢集搭建粗略筆記

初始設定：虛擬了三個CentOs系統（安裝CentOs的步驟省略），一臺master 兩臺slave，使用者名稱全部為hadoop，具體如下（除了第一步使用root使用者操作，其他均使用hadoop使用者）： 1.新增hadoop使用者第一步：grou

Hadoop分散式叢集搭建方法（Version： java 1.8+CentOS 6.3）

夏天小廚前言大資料這個概念，說的通俗點就是對海量資料的處理分析。據不完全統計，世界百分之九十的資料都由近幾年產生，且不說海量資料的ETL，單從資料的儲存和資料展現的實時性，傳統的單機就已經無法滿足實際場景的需要例如很多OLAP系統。由此引出了Hadoop，Hadoop

Hadoop 分散式叢集搭建

1 修改配置檔案 1.1 hadoop-env.sh export JAVA_HOME=/usr/apps/jdk1.8.0_181-amd64 1.2 core-site.xml <property> <name>fs.def

安裝Spark+hadoop，spark、hadoop分散式叢集搭建...(親自搭建過！！)

首先說一下我所用的版本： spark-2.1.1-bin-hadoop2.7.tgz hadoop-2.7.3.tar.gz jdk-8u131-linux-x64.rpm 我們實驗室有4臺伺服器：每個節點硬碟：300GB，記憶體：64GB。四個

基於CentOS6.5系統Hadoop2.7.3完全分散式叢集搭建詳細步驟

前言：本次搭建hadoop叢集使用虛擬機器克隆方式克隆slave節點，這樣做可以省去很多不必要的操作，來縮短我們的搭建時間。一、所需硬體，軟體要求使用 VMWare構建三臺虛擬機器模擬真實物理環境作業系統：CentOS6.5 二、必備條件 hadoop搭建需

hadoop分散式叢集搭建

提示閱讀本文需要同時對c++和java有一定了解。背景有時我們比較兩個字串時不考慮它們是大寫還是小寫；舉個例子，在這種情況下我們認為“BanAna”和“baNaNA”是等價的。其中一種思路是： 1. 將兩個字串都轉換為小寫（或者都轉換為大寫）； 2.比較轉換後的兩個字

hadoop分散式叢集搭建及其常見問題

hadoop分散式叢集的搭建這裡我用3臺虛擬機器搭建hadoop叢集——分別為：mini1、mini2、mini3。hadoop版本為：hadoop-2.8.4版本。下載地址：hadoop-2.8.

Hadoop分散式叢集搭建完全教程

Hadoop分散式叢集環境搭建步驟如下實驗環境：系統：win7 記憶體：8G(因要開虛擬機器，記憶體建議不低於8G) 硬碟：建議固態虛擬機器：VMware 12 Linux：Centos 7 jdk1.7.0_67 hadoop-2.5.0

【異常】Hadoop分散式叢集搭建之zookeeper故障

各節點中均已安裝配置好zookeeper。在主節點中用遠端命令啟動個節點中的zookeeper。執行成功。然而在檢視各節點的zookeeper狀態時，主節點報錯 Error contacting service. It is probably no

5節點Hadoop分散式叢集搭建經驗分享

本文我們使用hadoop2.6.0版本配置Hadoop叢集，同時配置NameNode+HA、ResourceManager+HA，並使用zookeeper來管理Hadoop叢集。 1.1 寫在前面的話 1.2 (一)HDFS概述 1.2.1 基礎架構 1、NameNod

Centos 7下VMware三臺虛擬機器Hadoop叢集初體驗

一、下載並安裝Centos 7 　　傳送門：https://www.centos.org/download/ 　注：下載DVD ISO映象這裡詳解一下VMware安裝中的兩個過程網絡卡配置二、SecureCRT遠端操控 p

hadoop-2.7.4-翻譯文件-分散式叢集搭建

安裝簡介安裝Hadoop叢集通常需要在叢集中的所有機器上進行統一安裝，或者通過適合目標作業系統的打包系統進行安裝。安裝的要點是對不同的節點分配不同的功能。其他服務（例如Web App Proxy Server和MapReduce作業歷史記錄伺服器）通常根據負載在專用硬體或共享裝置上

linux CentOS 7下zookeeper叢集環境搭建

zookeeper說明 ZooKeeper是一個分散式的，開放原始碼的分散式應用程式協調服務，是Google的Chubby一個開源的實現，是Hadoop和Hbase的重

CentOS 7下搭建高可用叢集

本文以兩臺機器實現雙集熱備高可用叢集，主機名node1的IP為192.168.122.168 ，主機名node2的IP為192.168.122.169 。一、安裝叢集軟體必須軟體pcs，pacemaker，corosync，fence-agents-all，如果需要配置相關服務，也要安裝對

CentOS 7下Hbase1.3.1分散式環境搭建

平臺環境：Java1.8.0_144、Hadoop2.7.4、Zookeeper3.4.9 簡介：HBase – Hadoop Database，是一個高可靠性、高效能、面向列、可伸縮的分散式儲存系統

CentOS 7下 linux中Solr偽叢集搭建

什麼是SolrCloudSolrCloud(solr 雲)是Solr提供的分散式搜尋方案，當你需要大規模，容錯，分散式索引和檢索能力時使用 SolrCloud。當一個系統的索引資料量少的時候是不需要使用SolrCloud的，當索引量很大，搜尋請求併發很高，這時需要使用Solr

CentOS 7下搭建高可用集群

default pacemaker local 時間同步 use 告訴 -c ddr 目標一、安裝集群軟件必須軟件pcs，pacemaker，corosync，fence-agents-all，如果需要配置相關服務，也要安裝對應的軟件。二、配置防火墻1、禁止防火墻和

CentOS 7下搭建配置SVN服務器

col 目錄賬號密碼 .cn .html 亂碼錯誤 dmi cal 原文鏈接：https://www.cnblogs.com/tdalcn/p/6937714.html 同步：http://blog.csdn.net/u011884440/article/details

Linux運維高級篇—CentOS 7下Postfix郵件服務器搭建

linux下構建postfix郵件服務器第一章實驗環境硬件環境：Linux服務器一臺，IP地址：192.168.80.10；WIN7客戶端一臺，擁有OUTLOOK2013，測試用，與服務器在同一局域網內。 Linux系統環境，如下圖：第二章實驗內容一：搭建DNS服務器二：搭建postfix服務

Centos 7下Hadoop分散式叢集搭建

一、關閉防火牆（直接用root使用者）

二、修改每臺主機的Hostname(三臺主機都一樣）

三、免密登陸

1.給3個機器生成金鑰檔案

2.生成SSH KEY並將其拷貝到各個節點主機上

3．進行免密碼登陸測試

四、安裝JDK

1.下載JDK，

2.安裝

3.配置環境變數

4．使環境變數生效

5.選擇正確的JDK版本

五 安裝hadoop

1.安裝Hadoop

2.配置環境變數

3.使環境變數生效

六. 配置hadoop

1.首先登陸到Master節點

2.建立Datanode檔案目錄

3.配置hdfs

4.將配置檔案同步到Datanode

5.配置hadoop core

6.在hadoop中設定JAVA_HOME環境變數

7.配置檔案同步到Datanode

8.建立Namenode檔案目錄

9.配置hdfs-site.xml

10.配置map-reduce

11.配置yarn

12.將配置檔案同步到Datanode：

13.配置slave

七、啟動驗證

相關推薦

五安裝hadoop