搭建3個節點的hadoop叢集（完全分散式部署）--1 安裝虛擬機器及hadoop元件

阿新 • • 發佈：2019-01-08

昨晚搞到晚上11.30，終於把hadoop元件安裝好了，執行試了下，正常...

這裡記錄下完全分散式hadoop叢集的搭建步驟。

1.VWMare平臺安裝

之前已經安裝好了，這裡不詳細說明。

2.安裝CentOS虛擬機器

1）下載好centos ISO安裝檔案，我安裝的是centos6.5版本，安裝mini desk模式

2）安裝好後，再安裝VMTools，方便複製及操作centos系統。

3）安裝Java JDK，我安裝的版本是java 1.8.0_121

先下載jdk安裝包檔案，直接使用wegt java**************

java安裝在目錄 /opt/java1.8.0_121

配置環境變數：

vim /etc/profile

export JAVA_HOME=/opt/jdk1.8.0_121
export JRE_HOME=/opt/jdk1.8.0_121/jre
export HADOOP_HOME=/opt/hadoop-2.7.5
export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar:$JRE_HOME/lib:$CLASSPATH
export PATH=$JAVA_HOME/bin:$JRE_HOME/bin:$HADOOP_HOME/bin:$PATH然後

然後 source /etc/profile，使環境變數生效

執行java -version,javac -version看環境變數配置是否成功。

4）利用克隆方式，安裝另外兩個節點虛擬機器。

到此，三個虛擬機器已建立完成。

3.配置三個虛擬機器的靜態ip地址

vim /etc/udev/rules.d/70-persistent-net.rules,設定網絡卡（eth0,eht1 or eth2）

vim /etc/sysconfig/network-scripts/ifcfg-eth0 設定靜態ip

DEVICE=eth0
HWADDR=00:0C:29:A6:58:96
TYPE=Ethernet
UUID=9d043430-26c5-41e8-96c7-54255364c884
ONBOOT=yes
NM_CONTROLLED=yes
BOOTPROTO=static
IPADDR=192.168.205.137
NETMASK=255.255.255.0
PREFIX=24
GATEWAY=192.168.205.2
DNS1=192.168.205.2
DEFROUTE=yes
#IPV4_FAILURE_FATAL=yes

configure VPN設定如下

虛擬網路設定採用NAT模式，如下截圖，可以在裡面看到閘道器地址為192.168.205.2

經過如上幾步，三個節點的靜態ip可配置完成，ip分別為

192.168.205.136 elephant

192.168.205.137 monkey

192.168.205.138 tiger

4.設定三個節點的hostname

vim /etc/sysconfig/network

分別設定為elephant,monkey,tiger

5.設定ip與hostname的對映關係

vim /etc/hosts

127.0.0.1   localhost localhost.localdomain localhost4 localhost4.localdomain4
::1         localhost localhost.localdomain localhost6 localhost6.localdomain6
192.168.205.136 elephant
192.168.205.137 monkey
192.168.205.138 tiger

6.設定免密匙登入

所有節點：
生成金鑰節點：ssh-keygen
monkey子節點將公鑰傳給elephant：scp ~/.ssh/id_rsa.pub [email protected]:~/.ssh/monkey.pub
elephant主節點將各個私鑰打包：  cat id_ras.pub  >> ~/.ssh/authorized_keys
				(cat ~/.ssh/*.pub  >> ~/.ssh/authorized_keys)
將elephant的authorized_keys分發至各節點：scp ~/.ssh/authorized_keys [email protected]:~/.ssh/

7.安裝nptd，設定時間同步

8.在elephant節點安裝hadoop元件，

1）下載hadoop,我下載的是hadoop 2.7.5版本，然後放在/opt/hadoop2.7.5資料夾下面。

2）配置檔案修改（core-site.xml,hdfs-site.xml,hadoop-env.sh,mapred-site.xml,slaves）

core-site.xml如下：

<configuration>
  <property>
    <name>fs.default.name</name>
    <value>hdfs://elephant:9000</value>
  </property>
  <property>
     <name>hadoop.tmp.dir</name>
     <value>/opt/hadoop-2.7.5/tmp</value>
  </property>
</configuration>

hdfs-site.xml如下：

configuration>
  <property>
    <name>dfs.replication</name>
    <value>2</value>
   </property>
   <property>
     <name>dfs.namenode.name.dir</name>
     <value>file:/opt/hadoop-2.7.5/dfs/name</value>
   </property>
   <property>
     <name>dfs.datanode.data.dir</name>
     <value>file:/opt/hadoop/dfs/data</value>
    </property>

</configuration>

hadoop-env.sh如下：

export JAVA_HOME=/opt/jdk1.8.0_121
export HADOOP_HOME=/opt/hadoop-2.7.5

mapred-site.xml如下：

<configuration>
  <property>
   <name>mapreduce.framework.name</name>
    <value>yarn</value>
   </property>
   <property>
      <name>mapreduce.jobhistory.address</name>
      <value>elephant:10020</value>
    </property>
   <property>
      <name>mapreduce.jobhistory.webapp.address</name>
      <value>elephant:19888</value>
     </property>
</configuration>

slaves如下：

monkey
tiger
~

到此，hadoop相關的配置檔案已全部設定完成。

3）格式化namenode

hadoop namenode -format

啟動hadoop

./opt/hadoop-2.7.5/sbin/start-all.sh

利用jps可以檢視已啟用的程序

[[email protected] hadoop-2.7.5]# jsp
-bash: jsp: command not found
[[email protected] hadoop-2.7.5]# jps
4418 NodeManager
4949 Jps
4150 SecondaryNameNode
3991 DataNode
[[email protected] hadoop-2.7.5]# hadoop fs -ls /
Found 1 items
drwxr-xr-x   - root supergroup          0 2018-03-28 23:09 /user
[[email protected] hadoop-2.7.5]#

搭建3個節點的hadoop叢集（完全分散式部署）--1 安裝虛擬機器及hadoop元件

昨晚搞到晚上11.30，終於把hadoop元件安裝好了，執行試了下，正常...這裡記錄下完全分散式hadoop叢集的搭建步驟。1.VWMare平臺安裝之前已經安裝好了，這裡不詳細說明。2.安裝CentOS虛擬機器1）下載好centos ISO安裝檔案，我安裝的是centos6

搭建3個節點的hadoop叢集（完全分散式部署）--2安裝mysql及hive

網上下載mysql安裝包檔案，我下載的是：mysql-5.7.21-linux-glibc2.12-x86_64.tar.gz，tar解壓後mv到mysql資料夾，啟動mysql服務service mysqld start登入mysqlmysql -u root -p輸入密碼

Centos 7.0 下hadoop叢集模式安裝（以3個節點為例，master,slave1,slave2）超詳細

一、目標：構建由3臺PC機構成的hadoop環境，安裝完成後使用HDFS、Mapreduce、Hbase等完成一些小例子。二、硬體需求： 3臺Centos 7.0 系統PC機，每臺PC機4G記憶

CentOs7搭建hadoop叢集（偽分散式）下

在yarn-site.xml新增 ` <property> <name>yarn.nodemanager.vmem-check-enabled</name&

Hadoop叢集（第8期）_HDFS初探之旅

1、HDFS簡介　　HDFS（Hadoop Distributed File System）是Hadoop專案的核心子專案，是分散式計算中資料儲存管理的基礎，是基於流資料模式訪問和處理超大檔案的需求而開發的，可以運行於廉價的商用伺服器上。它所具有的高容錯、高可靠性、高可擴充套件性、高獲得性、高吞吐

ProxmoxVE安裝簡單叢集（非分散式儲存）

上面左邊是我的個人微信，如需進一步溝通，請加微信。右邊是我的公眾號“Openstack私有云”，如有興趣，請關注。公司有兩臺測試伺服器，是華為的RH2288 V3 ，配置64G記憶體，2顆16核CPU ，4塊1T

Hadoop + HBase + Hive 完全分散式部署筆記

完全分散式Hadoop + HBase + Hive 部署過程的的一些問題。 NameNode: 192.168.229.132 DataNode: 192.168.229.133/192.168.229.134 ----------------------------

Java程式設計師從笨鳥到菜鳥之（九十四）深入java虛擬機器（三）——類的生命週期下）類的初始化

分享一下我老師大神的人工智慧教程！零基礎，通俗易懂！http://blog.csdn.net/jiangjunshow 也歡迎大家轉載本篇文章。分享知識，造福人民，實現我們中華民族偉大復興！

Java程式設計師從笨鳥到菜鳥之（九十九）深入java虛擬機器（八）開發自己的類載入器

歡迎閱讀本專題的其他部落格：在大多數情況下，系統預設提供的類載入器實現已經可以滿足需求。但是在某些情況下，您還是需要為應用開發出自己的類載入器。比如您的應用通過網路來傳輸 Java 類的位元組程式碼，為了保證安全性，這些位元組程式碼經過了加密處理。這個時候您

Java程式設計師從笨鳥到菜鳥之（九十六）深入java虛擬機器（五）——java本地介面JNI詳解

對於java程式設計師來說，java語言的好處和優點，我想不用我說了，大家自然會說出很多一套套的。但雖然我們作為java程式設計師，但我們不得不承認java語言也有一些它本身的缺點。比如在效能、和底層打交道方面都有它的缺點。所以java就提供了一些本地介面，他主要的作用就是提供一個標準的方式讓

我在安裝虛擬機器和Hadoop過程中遇到的問題和解決方法

下面是我自己在安裝hadoop過程中遇到的一些，希望對大家在安裝hadoop的時候有所幫助，少走彎路。 1、大家在修改完某些配置檔案後，記得用source命令是改過的配置檔案生效，不然你得重啟後才能生效，比如在安裝JDK的時候，要在/etc目錄下的profile檔案中加入環

Java程式設計師從笨鳥到菜鳥之（九十五）深入java虛擬機器（四）——java虛擬機器的垃圾回收機制

Java語言從出現到現在，一直佔據程式語言前列，他很大的一個原因就是由於java應用程式所執行的平臺有關。我們大家都知道java應用程式執行在java虛擬機器上。這樣就大大減少了java應用程式和底層作業系統打交道的頻率。這也就為java程式的跨平臺提供了良好的基礎。在java虛擬機器中

Java程式設計師從笨鳥到菜鳥之（九十八）深入java虛擬機器（七）深入原始碼看java類載入器ClassLoader

歡迎閱讀本專題的其他部落格： ClassLoader類載入器是負責載入類的物件。ClassLoader 類是一個抽象類。如果給定類的二進位制名稱（即為包名加類名的全稱），那麼類載入器會試圖查詢或生成構成類定義的資料。一般策略是

搭建多個節點的hadoop叢集環境（CDH）

提示：如果還不瞭解Hadoop的，可以下檢視這篇文章Hadoop生態系統，通過這篇文章，我們可以首先大致瞭解Hadoop及Hadoop的生態系統中的工具的使用場景。搭建一個分散式的hadoop叢集環境，下面是詳細步驟，使用cdh5 。一、硬體準備

用Docker在一臺膝上型電腦上搭建一個具有10個節點7種角色的Hadoop叢集（下）-搭建Hadoop叢集

上篇介紹了快速上手Docker部分，下面接著介紹搭建Hadoop叢集部分。六、搭建Hadoop偽分佈模式我們先用前面建立的這個容器來搭建Hadoop偽分佈模式做測試，測試成功後再搭建完全分散式叢集。1.SSH這個centos容器可以看做是一個非常精簡的系統，很多功能沒有，需要自己安裝。Hado

用Docker在一臺膝上型電腦上搭建一個具有10個節點7種角色的Hadoop叢集（上）-快速上手Docker

如果想在一臺電腦上搭建一個多節點的Hadoop叢集，傳統的方式是使用多個虛擬機器。但這種方式佔用的資源比較多，一臺筆記本能同時執行的虛擬機器的數量是很有限的。這個時候我們可以使用Docker。Docker可以看做是一種輕量級的虛擬機器，佔用資源少，用起來和傳統的虛擬機器很像，使用的時候可以類比VMware或V

從零搭建生產Hadoop叢集（八）——上線與下線資料節點流程

一、概述 Hadoop叢集中，經常需要在不重啟叢集的前提下，動態地上線與下線資料節點，而使用Cloudera Manager管理的叢集，可以很方便地做到這一點，本文將介紹其相關流程。二、節點上線流程 1. 伺服器初始化新節點的硬體配置最好能夠跟原叢集伺服器

阿里雲ECS伺服器部署HADOOP叢集（一）：Hadoop完全分散式叢集環境搭建

準備：兩臺配置CentOS 7.3的阿里雲ECS伺服器； hadoop-2.7.3.tar.gz安裝包； jdk-8u77-linux-x64.tar.gz安裝包； hostname及IP的配置：更改主機名：由於系統為CentOS 7，可以直接使用‘hostnamectl set-hostname 主機

手把手在虛擬機器中搭建四個節點的centos叢集

叢集，一個很熟悉的名字，是一種較新的技術，通過叢集技術，可以在付出較低成本的情況下獲得在效能、可靠性、靈活性方面的相對較高的收益，其任務排程則是集群系統中的核心技術。下面手把手教你在虛擬機器中搭建4個節點的centos叢集，跟著步驟操作即可。工具：virtualbox、cen

hadoop搭建（完全分散式）

連結：https://pan.baidu.com/s/1F7Ke7RHBjYCz3ISKuGPRTQ 提取碼：y7t2 本教程由centos7加hadoop2.7.5加jdk1.7構成：一、網路檔案設定（涉及ifcfg-ens33、hostname、hosts）克隆三個虛擬機器分別命

搭建3個節點的hadoop叢集（完全分散式部署）--1 安裝虛擬機器及hadoop元件

相關推薦