1. 程式人生 > >Hadoop從入門到精通系列之--1.環境搭建

Hadoop從入門到精通系列之--1.環境搭建

目錄

 

一 Hadoop簡介

二 Hadoop執行環境搭建前準備

2.1虛擬機器準備

2.2網路配置

2.3修改Linux主機名稱

三 Hadoop執行環境搭建

3.1 克隆虛擬機器

3.2修改靜態ip

3.3修改主機名稱(見上)

3.4關閉防火牆

3.5建立使用者wanglei

3.6給wanglei配置root許可權

3.7在/opt下新建software存放安裝包,module安裝軟體資料夾

四 安裝JDK和Hadoop

4.1使用xFtp傳輸jdk的tar包

4.2安裝Hadoop

4.3 總結:hadoop的環境配置是開始最難的一步,需要一定的Linux基礎,不然很難理解,我自己也是花了一個月時間將Linux學習了一遍,在配置的時候還是蠻順利的,這裡分享一下我的Linux學習視訊


一 Hadoop簡介

關於Hadoop,去百度上搜索能收到很多關於它的介紹,我用自己的話來介紹一下,Hadoop是Apache的一個專案,現在的社會已經步入了大資料時代,這個時代的特點就是資料量特別大,那麼就會遇到一個問題,資料量太大了,怎麼處理呢?Hadoop框架的作用就兩個:1.儲存 2.計算。儲存就是資料太大了,一臺電腦已經儲存不了了,那麼就需要好多臺電腦存資料,那麼這麼多電腦存,會遇到很多問題,比如怎麼存等等;計算就是比如我想統計一下阿里巴巴的日訪問量,阿里那麼大的訪問量怎麼統計求和呢?Hadoop就是為了處理這樣的問題誕生的。

Hadoop的下載:hadoop官網:http://hadoop.apache.org/

點選Download或者Getting   started均可,選擇對應的版本下載,建議hadoop2.x下載

二 Hadoop執行環境搭建前準備

2.1虛擬機器準備

關於虛擬機器的準備可以檢視我在部落格中Linux分類下的虛擬機器和Linux安裝的部分,需要相關軟體的,連結:https://pan.baidu.com/s/1NuLTfrRmBNQlPq0bpsd9Ng 提取碼:qs2w,百度雲連結失效的可以發郵件到我的郵箱[email protected];我會及時補上。

https://blog.csdn.net/Haidaiya/article/details/81005032

2.2網路配置

網路配置的作用是設定伺服器的靜態ip,並且使得我們Linux系統可以上網,具體步驟如下圖所示

  1. 命令列模式下輸入vim /etc/sysconfig/network-scripts/ifcfg-eth0
  2. 按照修改紅色方框中的內容修改

2.3修改Linux主機名稱

修改Linux主機的名稱是為了讓我們在訪問伺服器的時候更加方便一點,比如說訪問baidu時,我們更傾向於訪問www.baidu.com,而不是它的IP地址。

修改的步驟如下:

  1. hostname檢視當前的名稱
  2. vim /etc/sysconfig/network修改主機名稱
  3. 將主機名稱修改為hadoop101,其實這個名稱隨意起
  4. vim /etc/sysconfig/network,修改主機名稱到IP地址的對映
  5. 上一部分,設定的ip地址和這裡的主機名稱對應起來,這樣以後訪問這個伺服器就不要輸入ip地址了,直接輸入hadoop101就可以訪問了。

如有需要也可以在windows下新增對映,這樣可以ping通主機名稱

三 Hadoop執行環境搭建

3.1 克隆虛擬機器

右鍵虛擬機器,管理,克隆

3.2修改靜態ip

針對克隆過來的虛擬機器

  1. 因為虛擬機器是直接複製前面一步安裝的,所以對於它的網絡卡部分需要修改
  2. 註釋下圖中的那行,複製物理網絡卡地址,修改NAME為eth0

配置網路

將上一部中複製的網絡卡地址複製到下圖的位置

3.3修改主機名稱(見上)

見2.3

3.4關閉防火牆

service   iptables stop

3.5建立使用者wanglei

建立使用者useradd    wanglei

指定密碼passwd     wanglei

3.6給wanglei配置root許可權

給普通使用者wanglei配置root許可權是為了方便一些操作,因為有些資料夾普通使用者打不開。

如果發現這個下圖中的檔案是隻讀檔案,就是用chmod  744   sudoers命令修改一下,即可編輯這個檔案,在檔案中新增紅色框中的命令。


3.7在/opt下新建software存放安裝包,module安裝軟體資料夾

sudo   mkdir  software

sudo   mkdir  module

四 安裝JDK和Hadoop

4.1使用xFtp傳輸jdk的tar包

這裡解釋一下為什麼要安裝JDK,因為Hadoop框架是用java寫的,沒錯就是這樣,使用Xftp工具將jdk-8u144-linux-x64.tar.gz傳輸到Linux伺服器上的softwar目錄,並且將壓縮包解壓到module目錄下,命令如下:tar    -zxvf    jdk-8u144-linux-x64.tar.gz     -C      /opt/module/

配置環境變數,輸入vim    /etc/profile  ,  新增兩行

export   JAVA_HOME=/opt/module/jdk1.8.0_144

export   PATH=$PATH:$JAVA_HOME/bin

4.2安裝Hadoop

步驟與jdk的安裝步驟相同,環境變數的配置不同

輸入hadoop可以順利看到這些資訊說明hadoop的環境已經基本搭建好了,這裡講的很詳細了,但是如果沒有Linux基礎的話可能還是看的雲裡霧裡,需要提前看一下Linux基礎

4.3 總結:hadoop的環境配置是開始最難的一步,需要一定的Linux基礎,不然很難理解,我自己也是花了一個月時間將Linux學習了一遍,在配置的時候還是蠻順利的,這裡分享一下我的Linux學習視訊

https://www.bilibili.com/video/av31902291/?p=1