Hadoop從入門到精通系列之--1.環境搭建
目錄
3.7在/opt下新建software存放安裝包,module安裝軟體資料夾
一 Hadoop簡介
關於Hadoop,去百度上搜索能收到很多關於它的介紹,我用自己的話來介紹一下,Hadoop是Apache的一個專案,現在的社會已經步入了大資料時代,這個時代的特點就是資料量特別大,那麼就會遇到一個問題,資料量太大了,怎麼處理呢?Hadoop框架的作用就兩個:1.儲存 2.計算。儲存就是資料太大了,一臺電腦已經儲存不了了,那麼就需要好多臺電腦存資料,那麼這麼多電腦存,會遇到很多問題,比如怎麼存等等;計算就是比如我想統計一下阿里巴巴的日訪問量,阿里那麼大的訪問量怎麼統計求和呢?Hadoop就是為了處理這樣的問題誕生的。
Hadoop的下載:hadoop官網:http://hadoop.apache.org/
點選Download或者Getting started均可,選擇對應的版本下載,建議hadoop2.x下載
二 Hadoop執行環境搭建前準備
2.1虛擬機器準備
關於虛擬機器的準備可以檢視我在部落格中Linux分類下的虛擬機器和Linux安裝的部分,需要相關軟體的,連結:https://pan.baidu.com/s/1NuLTfrRmBNQlPq0bpsd9Ng 提取碼:qs2w,百度雲連結失效的可以發郵件到我的郵箱[email protected];我會及時補上。
https://blog.csdn.net/Haidaiya/article/details/81005032
2.2網路配置
網路配置的作用是設定伺服器的靜態ip,並且使得我們Linux系統可以上網,具體步驟如下圖所示
- 命令列模式下輸入vim /etc/sysconfig/network-scripts/ifcfg-eth0
- 按照修改紅色方框中的內容修改
2.3修改Linux主機名稱
修改Linux主機的名稱是為了讓我們在訪問伺服器的時候更加方便一點,比如說訪問baidu時,我們更傾向於訪問www.baidu.com,而不是它的IP地址。
修改的步驟如下:
- hostname檢視當前的名稱
- vim /etc/sysconfig/network修改主機名稱
- 將主機名稱修改為hadoop101,其實這個名稱隨意起
- vim /etc/sysconfig/network,修改主機名稱到IP地址的對映
- 上一部分,設定的ip地址和這裡的主機名稱對應起來,這樣以後訪問這個伺服器就不要輸入ip地址了,直接輸入hadoop101就可以訪問了。
如有需要也可以在windows下新增對映,這樣可以ping通主機名稱
三 Hadoop執行環境搭建
3.1 克隆虛擬機器
右鍵虛擬機器,管理,克隆
3.2修改靜態ip
針對克隆過來的虛擬機器
- 因為虛擬機器是直接複製前面一步安裝的,所以對於它的網絡卡部分需要修改
- 註釋下圖中的那行,複製物理網絡卡地址,修改NAME為eth0
配置網路
將上一部中複製的網絡卡地址複製到下圖的位置
3.3修改主機名稱(見上)
見2.3
3.4關閉防火牆
service iptables stop
3.5建立使用者wanglei
建立使用者useradd wanglei
指定密碼passwd wanglei
3.6給wanglei配置root許可權
給普通使用者wanglei配置root許可權是為了方便一些操作,因為有些資料夾普通使用者打不開。
如果發現這個下圖中的檔案是隻讀檔案,就是用chmod 744 sudoers命令修改一下,即可編輯這個檔案,在檔案中新增紅色框中的命令。
3.7在/opt下新建software存放安裝包,module安裝軟體資料夾
sudo mkdir software
sudo mkdir module
四 安裝JDK和Hadoop
4.1使用xFtp傳輸jdk的tar包
這裡解釋一下為什麼要安裝JDK,因為Hadoop框架是用java寫的,沒錯就是這樣,使用Xftp工具將jdk-8u144-linux-x64.tar.gz傳輸到Linux伺服器上的softwar目錄,並且將壓縮包解壓到module目錄下,命令如下:tar -zxvf jdk-8u144-linux-x64.tar.gz -C /opt/module/
配置環境變數,輸入vim /etc/profile , 新增兩行
export JAVA_HOME=/opt/module/jdk1.8.0_144
export PATH=$PATH:$JAVA_HOME/bin
4.2安裝Hadoop
步驟與jdk的安裝步驟相同,環境變數的配置不同
輸入hadoop可以順利看到這些資訊說明hadoop的環境已經基本搭建好了,這裡講的很詳細了,但是如果沒有Linux基礎的話可能還是看的雲裡霧裡,需要提前看一下Linux基礎
4.3 總結:hadoop的環境配置是開始最難的一步,需要一定的Linux基礎,不然很難理解,我自己也是花了一個月時間將Linux學習了一遍,在配置的時候還是蠻順利的,這裡分享一下我的Linux學習視訊
https://www.bilibili.com/video/av31902291/?p=1