1. 程式人生 > >hadoop-2.2.0偽分散式與(全分佈叢集安裝於配置續,很詳細的哦~)

hadoop-2.2.0偽分散式與(全分佈叢集安裝於配置續,很詳細的哦~)

         hadoop-2.2.0偽分散式與(全分佈叢集安裝於配置續)

hadoop-2.2.0全分佈叢集安裝於配置點選開啟連結

一、偽分佈模式

1、前提說明

我這裡配置hadoop叢集均是在虛擬機器上配置的,使用的安裝環境說明如下:

      (1) 宿主機win7x64

      (2) Vmware-workstation10.0.4

      (3) 虛擬機器Ubuntu12.0.4(較穩定版本):使用的是32位,沒有使用64的原因是為了方便配置hbase,hbase目前 

           不直接提供64位版本的,需要自己編譯原始碼,為了方便選擇32位的。
      (4) JDK1.8.0(Apache版本)

      (5) Hadoop-2.2.0

2、虛擬環境配置

    (1) VMwareWorkstation安裝,下載連結:http://bfile.xp510.com:801/bigfile/VMware-workstation_xp510.com.zip

(2) Ubuntu12.0.4安裝,映象檔案官網下載地址:

           http://mirrors.hustunique.com/ubuntu-releases//precise/ubuntu-12.04.4-desktop-i386.iso

      (3) 虛擬機器安裝好以後是英文版本的,漢化步驟如下:

首先進入虛擬機器系統設定

           更新語言包(或者直接使用下面的命令安裝),將語言選擇成簡體中文

           編輯locale如下配置檔案,修改好後重啟虛擬機器即可

         

      (4) 虛擬機器安裝好了,可以進行接下里的工作了

3、升級軟體、安裝ssh

執行以下命令將部分軟體升級,以及將ssh安裝好

      sudo apt-get update;

      sudo apt-get upgrade;

       sudo apt-get install openssh-server;

4、JDK安裝

 (1) 建立使用者以及使用者組,命令如下:

            建立使用者:sudo addgroup hadoop

            建立使用者,並新增到hadoop使用者組中: sudo adduser --ingroup hadoop hduser

      (2)  建立ssh信任關係,在啟動hadoop時要頻繁輸入密碼,建立這個關係後可省去輸入密碼麻煩

         cd /home/hduser

         ssh-keygen -t rsa -P ""

         cat .ssh/id_rsa.pub >>.ssh/authorized_keys

         成功執行三條命令後,通過ssh localhost驗證,如下圖不需要輸入密碼就表示成功了

        

 (3) 將下載後的jdk解壓到某個路徑下,我這裡是解壓到/opt

          解壓命令如下:

          sudo tar zxf /home/lzliu/software/jdk-8-linux-i586.gz /opt

    (4) 配置java環境變數

           編輯profile檔案:sudo gedit /etc/profile

           在檔案後面加入jdk路徑

              

一般系統裡面都預先安裝了openjdk,我們可以通過以下方法將預設jdk更改過來

        

        

        

        

如果輸入命令java -version顯示的是你安裝的java版本就對了。

5、hadoop-2.2.0配置(偽分佈模式)

 (1) 到Apache官網下載hadoop-2.2.0版本,網址:http://mirrors.cnnic.cn/apache/hadoop/common/hadoop-                        2.2.0/hadoop-2.2.0.tar.gz

      (2) 將hadoop解壓到/home/hduser目錄下,命令如下

             tar -zxf /home/lzliu/software/hadoop-2.2.0.tar.gz /home/hduser/

      (3) 配置hadoop-env.sh(JAVA路徑安裝)

            編輯檔案:sudo /home/hduser/hadoop-2.2.0/etc/hadoop/hadoop-env.sh

            export JAVA_HOME=/opt/jdk1.8.0

      (4) 接下來編輯如下三個檔案:

            sudo gedit /home/hduser/hadoop-2.2.0/etc/hadoop/core-site.xml

            

 sudo gedit /home/hduser/hadoop-2.2.0/etc/hadoop/hdfs-site.xml

           

sudo gedit /home/hduser/hadoop-2.2.0/etc/hadoop/mapred-queues.xml(如果沒有這個檔案,可通過mapred-                queues.xml.template這個模板檔案複製一個)

                  

6、hadoop-2.2.0偽分佈模式測試

(1) 啟動hadoop

          cd ~/sbin

          ./start-all.sh

          輸入jps檢視程序,如果有以下幾個程序證明啟動成功:

           

(2) 執行hadoop自帶的詞頻統計的例子

        (執行以下步驟的前提是先啟動hadoop,namenode和datanode程序必須啟動)

          首先在hdfs虛擬檔案上建立資料夾input 命令:hdfsdfs -mkdir /input

         上傳檔案到hdfs上命令:hdfs dfs -put /home/hduser/hadoop-2.2.0/etc/hadoop/ /input

          執行例子,命令

          hadoop jar/home/hduser/hadoop-2.2.0/share/hadoop/mapreduce/hadoop-mapreduce-examples-                                 2.2.0.jarwordcount /input/hadoop /output

          結果:

                

       自此,hadoop-2.2.0偽分佈模式就配置成功了,接下來的一片部落格裡我將介紹,hadoop-2.2.0全分佈叢集配置,將的也很詳細哦~

(我是劉立洲,我為自己帶鹽,IT屌絲~)