1. 程式人生 > >基於Virtualbox虛擬機器搭建hadoop叢集環境

基於Virtualbox虛擬機器搭建hadoop叢集環境

1.1安裝centos7

在centos官網下載centos7映象檔案,在Virtualbox軟體中匯入映象檔案進行安裝,本次由於實驗環境限制,只安裝了三臺centos7虛擬機器,分別命名為hadoop1,hadoop2,hadoop3,為保證三臺虛擬機器能夠正常通訊,三臺虛擬機器的網路連線方式均設定為僅主機(Host-only)介面卡模式,每臺虛擬機器分配記憶體為2G,儲存為8G。在VrtualBox中搭建好的虛擬機器叢集如下圖所示:

1.2安裝JDK

1.2.1安裝包準備

由於hadoop是運行於Java之上的,所以安裝hadoop之前必須在系統中安裝JDK,本次選用的JDK版本為JDK1.8。在oracle官網上下載64位JDK1.8安裝檔案jdk-8u151-linux-x64.tar.gz,通過建立本地檔案傳輸將系統中的安裝包上傳到linux系統中,輸入:tar –zxvf jdk-8u151-linux-x64.tar.gz命令對壓縮包進行解壓,完成安裝。

1.2.2配置java環境變數

在linux系統中通過編輯profile檔案設定Java環境變數,具體操作為:

輸入命令:vi/etc/profile,按I鍵進入profile檔案的編輯模式

在profile檔案中加入以下幾行命令:

JAVA_HOME=/apps/jdk1.8.0_151   #jdk的解壓目錄

CLASSPATH=.:$JAVA_HOME/lib.tools.jar

PATH=$JAVA_HOME/bin:$PATH

export JAVA_HOME CLASSPATH PATH

修改好檔案後通過wq命令儲存並退出,再輸入source/etc/profile命令使修改生效。

1.2.3驗證jdk的有效性

輸入java –version命令檢查jdk是否安裝配置成功,如下圖:

證明jdk安裝成功

1.3安裝hadoop

1.3.1建立ip與域名的對映

為方面後續的相關工作,為每一臺虛擬機器分配一個靜態ip並建立起域名對映。通過編輯/etc/sysconfig/network-scripts/ifcfg-enp0s3檔案,輸入以下引數進行靜態ip配置:

其中的IPADDR即為分配給該主機的靜態IP。本次分配給三臺虛擬主機的的靜態IP分別為:192.168.56.2;192.168.56.3;192.168.56.4.

通過編輯etc/hosts檔案建立主機名與域名的對映,本次將三臺虛擬主機的域名分別設定為nmnode,ddnode1,ddnode2,如下圖:

1.3.2配置ssh免密登入

為方便三臺虛擬主機之間的通訊,減少輸入密碼的次數,為三臺主機配置ssh免密登入。

輸入ssh-keygen -t rsa命令在本臺主機生成金鑰,再通過ssh copy-id [email protected]主機域名命令實現將金鑰拷貝到另一臺主機中,實現該主機免密登入本主機。在每臺主機生成金鑰再將其分發早三臺主機之中,實現三臺主機之間的免密登入

1.3.3hadoop安裝包準備

在apache官網下載hadoop2.6.5安裝包hadoop-2.6.5.tar.gz,上傳到linux系統後,通過tar命令解壓到相應的目錄,得到的安裝目錄結構如下圖所示:

1.3.4修改主要配置檔案

主要配置hadoop-2.6.5/etc/hadoop資料夾下的hadoop-env.sh,yarn-env.sh,core-site.xml, hdfs-site.xml, yarn-site.xml,slaves檔案。

①   修改hadoop-env.sh,yarn-env.sh的jdk路徑

在兩個shell檔案中修改匯入jdk路徑的命令,由相對路徑改為絕對路徑:

export JAVA_HOME=/apps/jdk1.8.0_151

②   core-site.xml

該配置檔案包含hadoop的一些核心基本配置,本次主要配置了兩個屬性:

  1. <property>

  2. <name>fs.defaultFS</name>

  3. <value>hdfs://nmnode:9000</value>#預設的檔案系統為hdfs,入口為nmnode的9000埠

  4. </property>

  5. <property>

  6. <name>hadoop.tmp.dir</name>

  7. <value>/apps/hadoop2.6/tmp</value>#設定hadoop臨時快取資料夾

  8. </property>

③   hdfs-site.xml

         該配置檔案主要包含hadoop的分散式檔案系統hdfs的一些基本資訊,本次主要配置了一個屬性:

  1. <property>

  2. <name>dfs.replication</name>

  3. <value>1</value>#檔案的備份數為1

  4. </property>

④   yarn-site.xml

該配置檔案主要包含hadoop分散式計算框架yarn的一些基本資訊,本次主要配置如下:

  1. <property>

  2. <name>yarn.nodemanager.aux-services</name>

  3. <value>mapreduce_shuffle</value>

  4. </property>

  5. <property> <name>yarn.resourcemanager.webapp.address</name> <value>${yarn.resourcemanager.hostname}:8088</value>

  6. </property>

⑤   Slaves

Hadoop通過slave檔案確定namenode和datanode,本次將三臺虛擬機器中的hadoop1作為namenode,hadoop2,hadoop3作為datanode,在salve檔案中填入兩臺datanode的域名ddnode1和ddnode2。

1.3.5啟動hadoop

Hadoop配置完畢後,通過scp命令將各配置檔案複製到其他主機上,替換原來的檔案保證各主機配置相同,此時在namenode節點中通過執行hadoop-2.6.5/sbin資料夾中的start-dfs.sh檔案啟動hadoop的分散式檔案系統hdfs;再執行該資料夾下的start-yarn.sh啟動分散式計算框架yarn。啟動完成後,在各主機通過jps命令檢視hadoop執行狀態如下圖:

Namenode

Datanode1

Datanode2

基於虛擬機器的hadoop叢集就此搭建成功

相關推薦

基於Virtualbox虛擬機器搭建hadoop叢集環境

1.1安裝centos7 在centos官網下載centos7映象檔案,在Virtualbox軟體中匯入映象檔案進行安裝,本次由於實驗環境限制,只安裝了三臺centos7虛擬機器,分別命名為hadoop1,hadoop2,hadoop3,為保證三臺虛擬機器能夠正常通訊,三臺

搭建VM的虛擬機器hadoop叢集環境

前言 大家都知道,Hadoop的部署方式可分為 單機模式偽分散式完全分散式 本篇主要講解的就是完全分散式。 搭建完全分散式的叢集環境,需要多臺的硬體裝置,作為初學者,為了搭建叢集去買多臺電腦,多少有點不現實,所以這裡我採用的是VM虛擬機器,模擬

利用虛擬機器搭建hadoop叢集

概述 在搭建hadoop叢集時,主要參考了網上的幾篇部落格,但也遇到一些問題。 點選原文 問題一:core-site.xml檔案中的錯誤 <property> <name>hadoop.tmp.dir</name>

虛擬機器搭建hadoop叢集

1.虛擬機器安裝系統(個人安裝系統是centos 6.x final版) 1.在虛擬機器安裝了三個系統(centos 6.x final版的)目前兩個都是安裝的,一個是在檔案複製的。 2. 安裝完系統後開始安裝rz命令包(由於系統在window系統用crt操作linux系

微信棋牌原始碼虛擬機器搭建Hadoop叢集

虛擬機器搭建Hadoop叢集安裝包準備作業系統:ubuntu-16.04.3-desktop-amd64.iso軟體包:VirtualBox安裝包:hadoop-3.0.0.tar.gz,jdk-8u161-linux-x64.tar.gz1. 環境準備使用VirtualBo

使用3臺虛擬機器搭建Hadoop HA叢集(1)

系列部落格目錄連結:Hadoop權威指南學習筆記:總章 基礎環境搭建:使用3臺虛擬機器搭建Hadoop HA叢集(1) HA環境搭建:使用3臺虛擬機器搭建Hadoop HA叢集(2) 工欲善其事,必先利其器,要學好大資料,就必須首先學會自己動手

使用3臺虛擬機器搭建Hadoop HA叢集(2)

系列部落格目錄連結:Hadoop權威指南學習筆記:總章 基礎環境搭建:使用3臺虛擬機器搭建Hadoop HA叢集(1) HA環境搭建:使用3臺虛擬機器搭建Hadoop HA叢集(2) 本部分包含以下基本分內容 安裝部署zookeeper

阿里雲虛擬機器搭建Hadoop-2.6.0-cdh5.7.1安裝詳解(偽分散式環境

首先先搭配安全組 開啟映象後輸入以下內容:             重要:  yum -y install lrzsz HOSTNAME=(自己的主機名字) hostname $HOSTNAME echo "$(grep -E '127|::1' /etc/host

在linux上基於KVM虛擬機器搭建lamp

1.準備網路拓撲圖實現基於KVM的虛擬化,需要三臺kvm虛擬機器,分別安裝mysql,php-fpm,httpd,其次,需要在安裝php-fpm上安裝php-mysql,用來使php能夠連線上mysql資料庫,同時需要兩個虛擬網橋,以及一個物理橋用來保證外部與php-fpm伺服器的連線,同時保證mysql伺服

搭建Hadoop叢集環境時遇到的一些問題

最近在學習搭建hadoop叢集環境,在搭建的過程中遇到很多問題,在這裡做一些記錄。1. SSH相關的問題  問題一: ssh: connect to host localhost port 22: Connection refused  問題二: 遠端連線需要輸入密碼。  參照以下部落格即可解決:    Li

在Linux的Centos6.5搭建hadoop叢集環境

Centos6.5搭建hadoop叢集環境 先概括一下整體思路 安裝centos6.5主機 關閉防火牆和selinux 配置網路 時間同步 ssh無密碼登入設定 安裝jdk 安裝hadoop 啟動 wordcount測試 安

三臺機器搭建Hadoop叢集

上的各種守護程序的。這就必須在節點之間執行指令的時候是不需要輸入密碼的形式,故我們需要配置SSH運用無密碼公鑰認證的形式,這樣NameNode使用SSH無密碼登入並啟動DataName程序,同樣原理,DataNode上也能使用SSH無密碼登入到 NameNode。

阿里雲ECS上搭建Hadoop叢集環境——使用兩臺ECS伺服器搭建“Cluster mode”的Hadoop叢集環境

Ingredient: 之前在: 這4篇文章裡講述了搭建Hadoop環境時在本地“/etc/hosts”裡面的ip域名配置上應該注意的事情,以及如何配置伺服器之間的ssh免密碼登入,啟動Hadoop遇到的一些問題的解決等等,這些都是使用ECS伺服器搭

配置SecureCRT連線VirtualBox虛擬機器中的Linux環境

首先感謝作者提供,按步驟操作完成成功,這裡記下來 在實際的運維中我們常常使用SecuriteCRT來遠端控制Linux伺服器。下面將詳細介紹windows 7下通過VirtualBox搭建linux開發環境,並最終通過SecurityCRT來遠端訪問linux伺服器。

linux虛擬機器安裝hadoop叢集hadoop-2.7.5)

<property> <name>dfs.replication</name> <value>2</value> </property> <property> <name>dfs.namenode.name.di

Mac下CentOS虛擬機器Hadoop叢集、zookeeper叢集、HBase叢集

開工前的資源準備1、電腦安裝VMware Fusion,並安裝centos 72、下載需要的工具包一、虛擬機器配置聯網3臺虛擬機器都安裝完畢處於原始狀態,這個時候虛擬機器還是處於不可聯網的狀態,需要配置虛擬機器處於可以聯網,配置方式如下:    設定 -> 網路介面卡

3臺虛擬機器搭建Hadoop HA

1.修改Linux主機名 2.修改IP 3.修改主機名和IP的對映關係 4.關閉防火牆 5.ssh免登陸 6.安裝JDK,配置環境變數等 叢集規劃: 主機名 IP 安裝的軟體 執行的程序 3臺虛擬機器 node1 jdk、hadoop、zookeeper zookee

多臺虛擬機器搭建zookeeper叢集

一、什麼是zookeeper(摘自百度百科) ZooKeeper是一個分散式的,開放原始碼的分散式應用程式協調服務,是Google的Chubby一個開源的實現,是Hadoop和Hbase的重要元件。它是一個為分散式應用提供一致性服務的軟體,提供的功能包括:配置維護、域名服務

在windows下用虛擬機器搭建 linux開發環境

  ============================= 常用的命令: ============================ 【掛載檔案】 sudo mount -t vboxsf cct /mnt/share    假如您不想每一次都手動掛載,可以在/etc/f

windows中通過虛擬機器搭建iphone開發環境

很多朋友希望在體驗或學習iphone開發,但是iphone開發環境一般需要 安裝在mac計算機下mac os中。 這給許多朋友帶來了額外成本投入。 網上已經有各種破解方法,在非蘋果電腦上安裝iphone開發環境,給我們帶來了佳音。但是各種版本比較雜亂,可能會費時費力而無果。 最近,蘋果推出了新的開發環