windows子系統(wsl) Ubuntu16.04 下安裝hadoop

阿新 • • 發佈：2018-11-19

使用命令檢視系統版本

sudo lsb_release -a

1.準備工作

1.1 建立hadoop使用者

01:先開啟終端（Ctrl+Alt+T）

鍵入指令：

sudo useradd -m hadoop -s /bin/bash

02:設定使用者hadoop的登入密碼

sudo passwd hadoop

提示會要求輸入兩次密碼（鍵入密碼不會顯示），這裡我就用的hadoop。

03:為使用者hadoop增加管理員許可權

sudo adduser hadoop sudo

（雖然增加了管理員許可權，但後面有些地方還是需要進入root使用者進行操作）

1.2 更新apt

接下來登出，登入到hadoop使用者下。

為了安裝一些軟體，我們需要更新apt。

sudo apt-get update

1.3 安裝SSH並配置SSH無密碼登入

之前配置過hadoop的同學們，肯定是知道這個的。

網上是說Ubuntu已經自帶了SSH client，還需要安裝SSH server

sudo apt-get install openssh-server

這裡安裝完後如果重啟了wsl下並不會啟動sshd，必須手動啟動

sudo service ssh restart

這裡可用新增到 vi /etc/profile 裡啟動時可以自動執行

使用命令登入本機

這樣做了，我們每次登入還是會需要輸入密碼。

接下來配置SSH無密碼登入。

SSH設定和金鑰生成

SSH設定需要在叢集上執行不同的操作，如啟動，停止和分散式守護shell操作。進行身份驗證不同的Hadoop使用者，需要一種用於Hadoop的使用者提供的公鑰/私鑰對，並用不同的使用者共享。

以下的命令被用於生成使用SSH金鑰值對。複製公鑰從id_rsa.pub為authorized_keys，並提供所有者，讀寫許可權到authorized_keys檔案。

# su hadoop

$ ssh-keygen -t rsa

$ cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys

$ chmod 0600 ~/.ssh/authorized_keys

驗證ssh

ssh localhost

接下來可以再次嘗試ssh localhost，如若無需再次輸入密碼，既成功。

1.4 安裝Java環境

01:下載和安裝jdk

這裡選擇的版本是1.8.0_161

JDK1.8.0_161 64bit下載

下載好後，找到檔案所在位置（以我的為例，在下載目錄下）

cd ~/下載
mv ~/下載/jdk-8u161-linux-x64.tar.gz /usr/java //若提示許可權不夠，則進入root下操作
tar -xvf /usr/java/jdk-8u161-linux-x64.tar.gz

可以在對應的路徑下找到解壓好的jdk檔案

02:配置環境變數

vi /etc/profile

將如下環境變數寫入檔案的最後（i鍵，對文件開始編輯）

export JAVA_HOME=/usr/java/jdk1.8.0_161/
export CLASSPATH=/usr/java/jdk1.8.0_161/lib/*

儲存，退出。（Esc--:wq）

接下來需要讓環境變數生效：

source /etc/profile

檢查是否配置正確：

java -version

還有一種安裝方法可以參考：

https://www.cnblogs.com/smiler/p/6939913.html

這裡安裝完 java 在 /usr/lib/jvm/java-8-oracle 裡

export JAVA_HOME=/usr/lib/jvm/java-8-oracle/
export CLASSPATH=/usr/lib/jvm/java-8-oracle/lib/*

2.安裝Hadoop

http://hadoop.apache.org/releases.html

cd /usr/local/

wget http://mirrors.advancedhosters.com/apache/hadoop/common/hadoop-3.1.0/hadoop-3.1.0.tar.gz

tar -vzxf hadoop-3.1.0.tar.gz

mv hadoop-3.1.0  hadoop

cd hadoop

./bin/hadoop version

可以通過附加下面的命令在 vi /etc/profile檔案中以設定 Hadoop 環境變數。

export HADOOP_HOME=/usr/local/hadoop
export HADOOP_MAPRED_HOME=$HADOOP_HOME
export HADOOP_COMMON_HOME=$HADOOP_HOME
export HADOOP_HDFS_HOME=$HADOOP_HOME
export YARN_HOME=$HADOOP_HOME
export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_HOME/lib/native
export PATH=$PATH:$HADOOP_HOME/sbin:$HADOOP_HOME/bin
export HADOOP_INSTALL=$HADOOP_HOME

現在，應用所有更改到當前正在執行的系統。

source /etc/profile

3.Hadoop偽分散式配置

01. 配置core-site.xml

core-site.xml檔案中包含，如：用於Hadoop例項的埠號，分配給檔案系統，儲存器限制用於儲存資料儲存器和讀/寫緩衝器的大小的資訊。

vim /usr/local/hadoop/etc/hadoop/core-site.xml

<configuration>
<property>
             <name>hadoop.tmp.dir</name>
             <value>file:/usr/local/hadoop/tmp</value>
             <description>Abase for other temporary directories.</description>
        </property>
        <property>
             <name>fs.defaultFS</name>
             <value>hdfs://localhost:9000</value>
        </property>
</configuration>

02. 配置hadoop-env.sh

vim /usr/local/hadoop/etc/hadoop/hadoop-env.sh

找到被註釋掉的JAVA_HOME

03. 配置hdfs-site.xml

hdfs-site.xml檔案中包含，如：複製資料的值，NameNode的路徑，本地檔案系統，要儲存Hadoop基礎架構的Datanode路徑的資訊。

vi /usr/local/hadoop/etc/hadoop/hdfs-site.xml

<configuration>
            <property>
                 <name>dfs.replication</name>
                 <value>1</value>
            </property>
            <property>
                 <name>dfs.namenode.name.dir</name>
                 <value>file:/usr/local/hadoop/tmp/dfs/name</value>
            </property>
            <property>
                 <name>dfs.datanode.data.dir</name>
                 <value>file:/usr/local/hadoop/tmp/dfs/data</value>
            </property>
    </configuration>

注：上面的檔案，所有的屬性值是使用者定義的，可以根據自己的Hadoop的基礎架構進行更改。

配置完成後，執行NameNode的格式化

/usr/local/hadoop/bin/hdfs namenode -format

驗證Hadoop安裝

下面的步驟是用來驗證Hadoop的安裝。

第1步 - 名稱節點設定

設定名稱節點使用“hdfs namenode -format”命令如下

$ /usr/local/hadoop/bin/hdfs namenode -format

預期的結果如下。

10/24/14 21:30:55 INFO namenode.NameNode: STARTUP_MSG:
/************************************************************
STARTUP_MSG: Starting NameNode
STARTUP_MSG: host = localhost/192.168.1.11
STARTUP_MSG: args = [-format]
STARTUP_MSG: version = 2.4.1
...
...
10/24/14 21:30:56 INFO common.Storage: Storage directory
/home/hadoop/hadoopinfra/hdfs/namenode has been successfully formatted.
10/24/14 21:30:56 INFO namenode.NNStorageRetentionManager: Going to
retain 1 images with txid >= 0
10/24/14 21:30:56 INFO util.ExitUtil: Exiting with status 0
10/24/14 21:30:56 INFO namenode.NameNode: SHUTDOWN_MSG:
/************************************************************
SHUTDOWN_MSG: Shutting down NameNode at localhost/192.168.1.11
************************************************************/

第2步 - 驗證Hadoop DFS

下面的命令用來啟動DFS。執行這個命令將啟動Hadoop檔案系統。

這裡不能再root下執行，切換到 hadoop使用者下執行

#su hadoop
sudo /usr/local/hadoop/sbin/start-dfs.sh

這裡如果出現許可權問題

執行命令

sudo chown -R hadoop:root /usr/local/hadoop

把hadoop目錄所有使用者改到hadoop上

再次執行命令

/usr/local/hadoop/sbin/start-dfs.sh

就是成功了

至此，完成配置，可通過jps檢視是否啟動成功。

訪問Hadoop上的瀏覽器

訪問Hadoop的預設埠號為50070。使用以下網址，以獲取Hadoop服務在瀏覽器中。

http://localhost:50070

若發現404問題

1. 手動修改hdfs-site.xml 新增如下：

<property>
  <name>dfs.http.address</name>
  <value>127.0.0.1:50070</value>
</property>

127.0.0.1是對應的localhost地址

yarn-site.xml

此檔案用於配置成yarn在Hadoop中。開啟yarn-site.xml檔案，並在<configuration><configuration>標籤之前新增以下屬性到這個檔案中。

vi /usr/local/hadoop/etc/hadoop/yarn-site.xml

<configuration>
<property>
 <name>yarn.nodemanager.aux-services</name>
 <value>mapreduce_shuffle</value>
 </property>
</configuration>

mapred-site.xml

此檔案用於指定MapReduce框架以使用。預設情況下Hadoop包含yarn-site.xml模板。首先，它需要從mapred-site.xml複製模板到mapred-site.xml檔案，使用下面的命令來。

vi /usr/local/hadoop/etc/hadoop/mapred-site.xml

如果存在不存在 mapred-site.xml 檔案 
$ cp /usr/local/hadoop/etc/hadoop/mapred-site.xml.template /usr/local/hadoop/etc/hadoop/mapred-site.xml

開啟 mapred-site.xml 檔案，並在<configuration> 和 </configuration>標籤之間新增以下屬性。

<configuration>
<property>
 <name>mapreduce.framework.name</name>
 <value>yarn</value>
 </property>
</configuration>

驗證Yarn指令碼

下面的命令用來啟動yarn指令碼。執行此命令將啟動yarn守護程序。

$ sudo /usr/local/hadoop/sbin/start-yarn.sh

驗證叢集中的所有應用程式

訪問群集的所有應用程式的預設埠號為8088。使用以下URL訪問該服務。

http://localhost:8088/

部分轉載： https://blog.csdn.net/guomei_eros/article/details/79513597

之後如果要啟動hadoop可以用以下命令批量啟動

/usr/local/hadoop/sbin/start-all.sh

windows子系統(wsl) Ubuntu16.04 下安裝hadoop

使用命令檢視系統版本 sudo lsb_release -a 1.準備工作 1.1 建立hadoop使用者 01:先開啟終端（Ctrl+Alt+T）鍵入指令： sudo useradd -m hadoop -s /bin/bash

ubuntu16.04下安裝qq/tim、微信等windows應用並解決無法輸入中文的問題

1.安裝deepin-wine環境： git clone https://gitee.com/wszqkzqk/deepin-wine-for-ubuntu.git cd deepin-wine-for-ubuntu ./install.sh 2.下載並安裝所需要的dee

ubuntu16.04 下安裝phpMyAdmin

image ubuntu16 log 一個 workbench 過程 cnblogs share enc 由於 ubuntu上沒有什麽好的數據庫界面,當然說mysql_workbench 的大神不要見笑, 本人英語水平有限,雖然用起來沒有什麽影響,但是就是感覺不舒服於是

Ubuntu16.04下安裝elasticsearch+kibana實現php客戶端的中文分詞

lba 實例 exc common adding creat 啟動服務 uid dbms 1.下載安裝elasticsearch和kibana wget https://artifacts.elastic.co/downloads/elasticsearch/elasti

ubuntu16.04下安裝emacs

輸入 mac aps pda posit ins pos snap ubunt 1.直接在軟件中心下載. 2.終端下載: 依次輸入這三條命令即可 sudo add-apt-repository ppa:ubuntu-elisp/ppasudo apt-get updates

Ubuntu16.04下安裝redis並實現helloworld

ber -a lang 配置 ges image download rep mon 原文出處：http://blog.csdn.net/xiangwanpeng 1 sudo wget http://download.redis.io/releases/redis-3.2.

Ubuntu16.04下安裝Chrome出現“未安裝軟件包 libappindicator1”問題的解決辦法

googl spa 軟件包依賴 mic 安裝軟件 ren for 其中 1. 強制安裝chrome sudo dpkg -i google-chrome-stable_current_i386.deb --force 2. 補齊依賴 sudo apt-get i

Ubuntu16.04下安裝tensorflow（Anaconda3+pycharm+tensorflow+CPU）

arc apt 沒有 3.4 charm tps repo 1.2 net 1.下載並安裝Anaconda 1.1 下載從Anaconda官網（https://www.continuum.io/downloads）上下載Linux版本 https://repo.conti

Ubuntu16.04下安裝jdk1.8過程

ubunt 地址 ins 退出 .com 安裝jdk AD size class 筆者環境：騰訊雲服務器 Ubuntu16.04 x64 一 . 去oracle官網下載對應的jdk 下載地址：http://www.oracle.com/technetwork/java/

ubuntu16.04下安裝sourcesinsight

sde asp .exe window file 隱藏目錄安裝目錄 sudo reg 參考： https://blog.csdn.net/qq_22122811/article/details/66975946 參考1：http://blog.csdn.net/yunfe

Ubuntu16.04 下安裝PHP+apache2+mysql以及MySQL擴展

依然兩個 -s amp cli 安裝 oot 連接用戶註：本人是在騰訊雲服務器上安裝了Ubuntu16.04系統，在騰訊雲中安裝測試使用的。 1、安裝前建議先進入到Root狀態下 2、這個時候更新系統 apt update 3、安裝Apache2 apt instal

ubuntu16.04下安裝aria2

sub nload submit 文檔 exp 會有 amp led 但是 1. 下載aria2 去官方github下載aria2 選擇1.32.0這個版本，然後下載 PS: 只要版本大於1.32.0不知道為什麽編譯失敗，1.32.0是能編譯成功的最新版本 #

Ubuntu16.04下安裝和配置Redis

req get 添加 run 文件 redis安裝 server ubunt bin 一、前提條件需要連接互聯網，然後執行sudo apt-get update更新軟件包二、執行安裝命令 sudo apt-get install redis-server 執行後

Ubuntu16.04下安裝opencv-3.4.1

百度 asp libjpeg ID 添加 dconf mkdir 文件目錄 fly 前期準備　　下載OpenCV源碼包　　進入OpenCV官方下載頁面```https://opencv.org/releases.html``` 　　選擇Sources類型下載（這

ubuntu16.04 下安裝配置python3.6

沒有 nbsp usr true brush repos 系統默認執行配置在ubuntu 16.04版本中，系統默認安裝了python 2.7和3.5版本，但在開發過程中我們可能用到到python3.6，刪除默認的版本又擔心系統有問題，因此可以選擇在系統中再裝上py

ubuntu16.04下安裝mysql詳細步驟

libmysql 51cto ima star 進入 linu term 軟件檢驗我們打開Xshell，通過如入命令安裝mysql 依次輸入這三條命令; sudo apt-get install mysql-server sudo apt install mys

【深度學習】ubuntu16.04下安裝opencv3.4.0

form 線程 ubunt con sudo ive tbb 依賴包復制代碼１、首先安裝一些編譯工具＃　安裝編譯工具 sudo apt-get install build-essential ＃　安裝依賴包 sudo apt-get install cmake

ubuntu16.04下安裝docker

存儲 arch rem 通過 prop 更新 system apt-key world 本文開發環境為Ubuntu 16.04 LTS 64位系統，通過apt的docker官方源安裝最新的Docker CE(Community Edition)，即Docker社區版，是開發

ubuntu16.04下安裝深度學習框架

fault star nac config 文件的 call bsp mirrors tor 1.Pytorch 下載anaconda，最新的即可，https://www.anaconda.com/download/#linux ，命令：sh Anaconda3-5.3.

ubuntu16.04下安裝KDevelop和notepad++

安裝KDevelop sudo apt-get install cmake sudo apt-get install kdevelop 安裝notepad++ sudo add-apt-repository ppa:notepadqq-team/notepadqq

windows子系統(wsl) Ubuntu16.04 下安裝hadoop

1.準備工作

1.1 建立hadoop使用者

1.2 更新apt

SSH設定和金鑰生成

驗證ssh

1.4 安裝Java環境

2.安裝Hadoop

3.Hadoop偽分散式配置

驗證Hadoop安裝

第1步 - 名稱節點設定

第2步 - 驗證Hadoop DFS

訪問Hadoop上的瀏覽器

驗證Yarn指令碼

驗證叢集中的所有應用程式

相關推薦