linux-hadoop叢集搭建

阿新 • • 發佈：2018-12-14

A、系統：

centos7.2
hadoop-2.6.0-cdh5.15.1	http://archive.cloudera.com/cdh5/cdh/5/hadoop-2.6.0-cdh5.15.1.tar.gz

B、角色分配（修改/etc/hostname,/etc/hosts）：

192.168.2.199 bigdata0000.tfpay.com bigdata000

192.168.2.201

bigdata01.tfpay.com bigdata01

192.168.2.202 bigdata02.tfpay.com bigdata02

bigdata000 NameNode DataNode ResourceManager Master

bigdata01 DataNode NodeManageer

bigdata02 DataNode NodeManageer

所需檔案：

~~CDH-5.15.1-1.cdh5.15.1.p0.4-el7.parcel~~

~~CDH-5.15.1-1.cdh5.15.1.p0.4-el7.parcel.sha1~~

~~cloudera-manager-centos7-cm5.15.1_x86_64.tar.gz~~

~~creat_sh.sh~~

hadoop-2.6.0-cdh5.15.1.tar.gz

hadoop-native-64-2.6.0.tar

jdk-8u191-linux-x64.rpm

~~manifest.json~~

~~MySQL-5.6.26-1.linux_glibc2.5.x86_64.rpm-bundle.tar~~

~~mysql-connector-java-5.1.47-bin.jar~~

~~mysql-connector-java-5.1.47.zip~~

~~mysql-connector-java-6.0.2.jar~~

~~setup.sh~~

C、環境搭建

一、ssh配置免密碼

ssh-keygen -t rsa（所有節點）

ssh-copy-id -i ~/.ssh/id_rsa.pub bigdata01

ssh-copy-id -i ~/.ssh/id_rsa.pub bigdata02

ssh-copy-id -i ~/.ssh/id_rsa.pub bigdata000

驗證：

ssh bigdata000

ssh bigdata01

ssh bigdata02

二、JDK安裝：

rpm -ivh --prefix=/app/ ./jdk-8u191-linux-x64.rpm

配置環境變數：

在~/.bash_profile寫入

export JAVA_HOME=/app/jdk1.8.0_191-amd64/

export PATH=$PATH:$JAVA_HOME/bin

生效環境變數:

source ~/.bash_profile

驗證:

java -version

java version "1.8.0_191"

Java(TM) SE Runtime Environment (build 1.8.0_191-b12)

Java HotSpot(TM) 64-Bit Server VM (build 25.191-b12, mixed mode)

javac -version

javac 1.8.0_191

三、叢集搭建

解壓hadoop

mkdir /app

chmod 777 /app

tar -zxvf ./hadoop-2.6.0-cdh5.15.1.tar.gz -C /app/

tar -xvf /mnt/bi/hadoop-native-64-2.6.0.tar -C /app/hadoop-2.6.0-cdh5.15.1/lib/native/

配置環境變數:

在~/.bash_profile寫入

export HADOOP_HOME=/app/hadoop-2.6.0-cdh5.15.1

export PATH=$PATH:$HADOOP_HOME/bin

生效環境變數:

source ~/.bash_profile

驗證:

hadoop

Usage: hadoop [--config confdir] COMMAND

where COMMAND is one of:

fs run a generic filesystem user client

.....................

配置hadoop-env.sh和core-site.xml

etc/hadoop/hadoop-env.sh

寫入

export JAVA_HOME=/app/jdk1.8.0_191-amd64/

etc/hadoop/core-site.xml:

<name>fs.defaultFS</name>

<value>hdfs://bigdata000</value>

</property>

<name>hadoop.tmp.dir</name>

<value>/app/hadoop-2.6.0-cdh5.15.1/tmp</value>

</property>

</configuration>

etc/hadoop/hdfs-site.xml:

<!--

副本系數預設為三個，偽分散式環境下一般不用修改

-->

<!--

<name>dfs.replication</name>

</property>

-->

<!--

配置namenode路徑

-->

<name>dfs.namenode.name.dir</name>

<value>/app/hadoop-2.6.0-cdh5.15.1/tmp/dfs/name</value>

</property>

<!--

配置datanode路徑

-->

<name>dfs.datanode.data.dir</name>

<value>/app/hadoop-2.6.0-cdh5.15.1/tmp/dfs/data</value>

</property>

</configuration>

etc/hadoop/yarn-site.xml:

<!--

使用mapreduce

-->

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

<name>yarn.resourcemanager.hostname</name>

<value>bigdata000</value>

</property>

</configuration>

etc/hadoop/mapred-site.xml（需要從etc/mapred-site.xml.template複製）:

<!--

mapreduce使用的框架

-->

<name>mapreduce.framework.name</name>

</property>

</configuration>

etc/hadoop/slaves寫入slave node的host：

bigdata000

bigdata01

bigdata02

四、master分配到slaves

scp -r /app [email protected]:/

scp -r /root/.bash_profile [email protected]:/root

scp -r /app [email protected]:/

scp -r /root/.bash_profile [email protected]:/root

五、格式化NameNode

hdfs namenode -format

六、開啟關閉

/app/hadoop-2.6.0-cdh5.15.1/sbin/stop-all.sh

/app/hadoop-2.6.0-cdh5.15.1/sbin/start-all.sh

使用jps驗證：

bigdata000：

3620 ResourceManager

3717 NodeManager

5461 Jps

3450 SecondaryNameNode

3197 NameNode

3294 DataNode

bigdata01：

1923 NodeManager

1819 DataNode

2253 Jps

bigdata02:

1639 DataNode

2071 Jps

1743 NodeManager

使用Web Interfaces驗證：

http://192.168.2.199:50070

http://192.168.2.199:8088

使用命令列驗證：

[[email protected] ~]# hadoop fs -put /tmp/yarn-root-nodemanager.pid

[[email protected] ~]# hadoop fs -ls /

Found 1 items

-rw-r--r-- 3 root supergroup 5 2018-11-17 01:56 /yarn-root-nodemanager.pid

七、使用hadoop叢集

八、異常

多次執行格式化時會出錯（hdfs namenode -format）:

a、datanode無法啟動成功

重新格式化後NameNode的clusterID變化，與DataNode中的不一致

修改方法：從/app/hadoop-2.6.0-cdh5.15.1/tmp/dfs/name/current/VERSION中獲取clusterID=CID-c043fc46-adf6-4ad9-ab73-a66e75e32567，將其修改至每一個/app/hadoop-2.6.0-cdh5.15.1/tmp/dfs/data/current/VERSION中，重啟叢集

b、web ui中只顯示一個datanode

slaves從master scp時，/app/hadoop-2.6.0-cdh5.15.1/tmp/dfs/data/current/VERSION也拷貝過去了，每個DataNode的storageID都一致，只能顯示一個，需修改每個storageID，重啟叢集

Linux Hadoop叢集搭建第二步：--------SSH免密登陸

內容和Linux 搭建 Hadoop叢集--Jdk配置相關聯三臺虛擬機器的操作 Linux SSH免密登陸：參考網址：http://www.cnblogs.com/999-/p/6884861.html 第一步：在master主機上 vim /etc/ssh/sshd_config

linux-hadoop叢集搭建

A、系統： centos7.2 hadoop-2.6.0-cdh5.15.1 http://archive.cloudera.com/cdh5/cdh/5/hadoop-2.6.0

Hadoop----叢集搭建指南（下卷）

前言什麼是Hadoop? Apache Hadoop is a framework for running applications on large cluster built of commodity hardware. The Hadoop framewor

Hadoop----叢集搭建指南（中卷）

前言本文的搭建基於上卷的配置，環境不再一一贅述。網路配置好的5臺節點均可相互ping通，對於節點hadoop1(192.168.20.2)可以ping同其餘四臺hadoop2(192.168.20.3)、hadoop3(192.168.20.4)、hadoop4(192.16

Hadoop----叢集搭建指南（上卷）

前言閱讀本文，需要具備Linux、計算機網路的基礎知識。所以在文中出現的相關基礎知識，均以連結的形式給出，務必理解該連結的內容後，繼續閱讀本指南。叢集搭建的環境多種多樣，本文采用VitualBox安裝5臺虛擬機器構建叢集。具體環境： CentOS 6.5 6

CentOS7下靜態ip地址分配（Hadoop叢集搭建）

作業系統是CentOS 在搭建Hadoop過程中，發現每一次啟動虛擬機器，ip地址就會變化。這是由於一開始安裝CentOS的時候，有一個自動連線乙太網，他會自動給你分配ip地址，但是我們往往需要的是另一個。首先看我的主機對映，可以看到131，132,133 對應是，主機，

hadoop叢集搭建（docker）

背景　　　　目前在一家快遞公司工作，因專案需要，對大資料平臺做個深入的瞭解。工欲利其器必先利其器，在網上找了許多教程，然後自己搭建一個本地的環境並記錄下來，增加一些印象。環境搭建 1）Ubuntu docker pull ubuntu:16.04 docker images&nb

Hadoop叢集搭建以及遇到問題詳解

轉載：http://dblab.xmu.edu.cn/blog/install-hadoop-cluster/ centos7單機、分散式、偽分佈：https://blog.csdn.net/qq_40938267/article/details/83416665 有詳細的搭建過程

分散式系統詳解--框架（Hadoop-叢集搭建）

分散式系統詳解--框架（Hadoop-叢集搭建）前面的文章也簡單介紹了，hadoop的環境搭建分為三種，單機版，偽分

ssh無密登入配置詳解（hadoop叢集搭建）

ssh無密登入原理注：私鑰和公鑰是每個使用者獨有的，而不是機器或者伺服器的，比如一臺電腦或者伺服器或者虛擬機器，可以同時存在多個使用者，但不同使用者需要遠端登入其他伺服器或者虛擬機器時，都必須配置各自的私鑰和公鑰，而且使用者之間的各不相同常用命令 ssh ip(遠端登入也可

Hadoop叢集搭建一：Single node cluster

Hadoop叢集搭建一：Single node cluster 本文主要介紹在單個ubantu機器上搭建hadoop叢集。 1.ubuntu虛擬機器安裝採用Vmware workstation10工具來安裝ubuntu系統，ubuntu使用的是64位的18.04-desktop版本

【大資料技術】1.hadoop叢集搭建

近年來，大資料技術越來越吃香，也是追求高薪的必備技能之一。近些日子，打算技術轉型，開始研究大資料技術，基於對JAVA、LINUX系統有一定的基礎，完成hadoop叢集搭建（1個master和1個slave）。一、準備工具 VMvare、centOS6.3、SSH Secure客戶端（

Hadoop叢集搭建與經驗總結

(002)最近要研發一款資料傳輸服務的產品需要用到Hadoop叢集，之前搭建過後來長時間不用就給忘記了，這次搭好來記錄一下搭建方法與經驗總結 Hadoop叢集的搭建原料： VM虛擬機器 JDK1.8 hadoop2.7.3 注：將jdk1.8.ta

hadoop--01（hadoop叢集搭建）

1.什麼是HADOOP？ HADOOP是apache旗下的一套開源軟體平臺，HADOOP提供的功能：利用伺服器叢集，根據使用者的自定義業務邏輯，對海量資料進行分散式處理 HADOOP的核心元件有 HDFS（分散式檔案系統）

Hadoop叢集搭建中ssh免密登入

參考：大資料系列（3） Hadoop中的ssh無密碼登入配置解決 Agent admitted failure to sign using the key 問題 with ssh

大資料hadoop叢集搭建之後的操作

1.節點的服役和退役(hdfs) [退役] 1.新增退役節點的ip到黑名單,不要更新白名單. [/soft/hadoop/etc/dfs.hosts.exclude.txt] s205 2.配置hdfs-site.xml

hadoop叢集搭建3之叢集啟動

前面叢集已經成功搭建，現在來嘗試啟動叢集。第一次系統啟動的時候，是需要初始化的啟動zookeeper 1.啟動zookeeper的命令：./zkServer.sh start|stop|status [[email protected] ~]$3 zkServer.s

hadoop叢集搭建2

下面提到的一些配置檔案，因為篇幅過大，就不放上面了，我已經壓縮好放在連結裡，可以自行下載，配置引數也都做了詳細的備註說明 hadoop配置中的一些.xml檔案 java的部署 [[email protected] software]$3代表小視窗中同時將命令列輸入到三臺機器

Hadoop初探——Hadoop叢集搭建

本人在進行Hadoop叢集搭建建立了三臺虛擬機器，一臺作為master，另外兩臺為slave，在搭建叢集的過程中採用是centOs7，Java版本為1.8，Hadoop版本為2.7。三臺虛擬機器對應的IP為：192.168.25.128，192.168.25.129，19

1.環境搭建-Hadoop叢集搭建

本文主要是在CentOS叢集基礎上搭建Hadoop叢集。【CentOS叢集：node1,node2,node3 】【注：搭建hadoop叢集的前提是三個節點都已經配置好了靜態ip,虛擬機器終端內執行vi /etc/sysconfig/network-scri

linux-hadoop叢集搭建

相關推薦