hadoop單機部署,用來測試

阿新 • • 發佈：2019-02-04

2. Hadoop安裝

2.1 安裝java

Hadoop是使用JAVA寫的，所以需要先安裝JAVA環境。

本次安裝的是hadoop-2.7.0，需要JDK 7以上版本。

 yum install java-1.7.0-openjdk
 yum install java-1.7.0-openjdk-devel

安裝後確認

java –version

2.2 需要ssh和rsync

Linux系統一般都已經預設安裝了，如果沒有，yum安裝。
2.3 下載Hadoop

從官網下載Hadoop最新版2.7.0

 wget http://mirror.bit.edu.cn/apache/hadoop/common/hadoop-2.7 
.0/hadoop-2.7.0.tar.gz

將hadoop解壓到/usr/local/下

 cd /usr/local/
 tar zxvf /root/hadoop-2.7.0.tar.gz

2.4 設定環境變數

設定JAVA的環境變數，JAVA_HOME是JDK的位置

 vi /etc/profile
export PATH=/usr/local/hadoop-2.7.0/bin:$PATH
export JAVA_HOME=/usr/lib/jvm/java-1.7.0-openjdk-1.7.0.91-2.6.2.3.el7.x86_64

讓設定生效

 source /etc/profile

設定Hadoop的JAVA_HOME

cd hadoop-2.7.0/
vi etc/hadoop/hadoop-env.sh
export JAVA_HOME=/usr/lib/jvm/java-1.7.0-openjdk-1.7.0.91-2.6.2.3.el7.x86_64

到此，Hadoop的安裝就算完成了，接下來進行部署和使用。

3. 單機部署

Hadoop部署方式分三種，Standalone mode、Pseudo-Distributed mode、Cluster mode，其中前兩種都是在單機部署。

3.1 standalone mode（本地單獨模式）

這種模式，僅1個節點執行1個java程序，主要用於除錯。
- 3.1.1 在Hadoop的安裝目錄下，建立input目錄

 mkdir input

3.1.2 拷貝input檔案到input目錄下

 cp etc/hadoop/*.xml input

3.1.3 執行Hadoop job

 hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.0.jar grep input output 'dfs[a-z.]+'

上面的job是使用hadoop自帶的樣例，在input中統計含有dfs的字串。

3.1.4 確認執行結果

 cat output/*

3.1.5 問題點

WARN io.ReadaheadPool: Failed readahead on ifile
EBADF: Bad file descriptor

如果出現上面的警告，是因為快速讀取檔案的時候，檔案被關閉引起，也可能是其他bug導致，此處忽略。

3.2 pseudo-distributed mode（偽分佈模式）

這種模式是，1個節點上執行，HDFS daemon的 NameNode 和 DataNode、YARN daemon的 ResourceManger 和 NodeManager，分別啟動單獨的java程序，主要用於除錯。
3.2.1 修改設定檔案

 vi etc/hadoop/core-site.xml
<configuration>
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://localhost:9000</value>
    </property>
</configuration>

# vi etc/hadoop/hdfs-site.xml
<configuration>
    <property>
        <name>dfs.replication</name>
        <value>1</value>
    </property>
</configuration>

3.2.2 設定本機的無密碼ssh登陸

# ssh-keygen -t rsa
# cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys

3.2.3 執行Hadoop job

MapReduce v2 叫做YARN，下面分別操作一下這兩種job
3.2.4 執行MapReduce job
3.2.4.1 格式化檔案系統

# hdfs namenode -format

3.2.4.2 啟動名稱節點和資料節點後臺程序

# sbin/start-dfs.sh

在localhost啟動一個1個NameNode和1個DataNode，在0.0.0.0啟動第二個NameNode

3.2.4.3 確認

# jps

3.2.4.4 訪問NameNode的web頁面

http://localhost:50070/

3.2.4.5 建立HDFS

# hdfs dfs -mkdir /user
# hdfs dfs -mkdir /user/test

3.2.4.6 拷貝input檔案到HDFS目錄下

# hdfs dfs -put etc/hadoop /user/test/input

確認，檢視

# hadoop fs -ls /user/test/input

3.2.4.7 執行Hadoop job

# hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.0.jar grep /user/test/input output 'dfs[a-z.]+'

3.2.4.8 確認執行結果

# hdfs dfs -cat output/*

或者從HDFS拷貝到本地檢視

# bin/hdfs dfs -get output output
# cat output/*

3.2.4.9 停止daemon

# sbin/stop-dfs.sh

3.2.5 執行YARN job

MapReduce V2框架叫YARN
3.2.5.1 修改設定檔案

cp etc/hadoop/mapred-site.xml.template etc/hadoop/mapred-site.xml
 vi etc/hadoop/mapred-site.xml
<configuration>
    <property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
    </property>
</configuration>

 vi etc/hadoop/yarn-site.xml
<configuration>
    <property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
    </property>
</configuration>

3.2.5.2 啟動ResourceManger和NodeManager後臺程序

 sbin/start-yarn.sh

3.2.5.3 確認

# jps

3.2.5.4 訪問ResourceManger的web頁面

http://localhost:8088/

3.2.5.5 執行hadoop job

# hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.0.jar grep /user/test/input output 'dfs[a-z.]+'

3.2.5.6 確認執行結果

# hdfs dfs -cat output/*

執行結果和MapReduce job相同

3.2.5.7 停止daemon

# sbin/stop-yarn.sh

3.2.5.8 問題點
1. 單節點測試情況下，同樣的input，時間上YARN比MapReduce好像慢很多，檢視日誌發現DataNode上GC發生頻率較高，可能是測試用VM配置比較低有關。
2. 出現下面警告，是因為沒有啟動job history server

java.io.IOException: java.net.ConnectException: Call From test166/10.86.255.166 to 0.0.0.0:10020 failed on connection exception: java.net.ConnectException: Connection refused;

啟動jobhistory daemon

 sbin/mr-jobhistory-daemon.sh start historyserver

# jps

訪問Job History Server的web頁面

http://localhost:19888/

3. 出現下面警告，DataNode日誌中有錯誤，重啟服務後恢復

java.io.IOException: java.io.IOException: Unknown Job job_1451384977088_0005

3.3 啟動/停止

也可以用下面的啟動/停止命令，等同於start/stop-dfs.sh + start/stop-yarn.sh

# sbin/start-all.sh

# sbin/stop-all.sh

3.4 日誌

日誌在Hadoop安裝路徑下的logs目錄下

hadoop單機部署,用來測試

2. Hadoop安裝 2.1 安裝java Hadoop是使用JAVA寫的，所以需要先安裝JAVA環境。本次安裝的是hadoop-2.7.0，需要JDK 7以上版本。 yum

IOS PushMeBaby(是一款用來測試ANPs的開源Mac項目)

cnblogs color ont log span 開源接下來 font 註釋 ● PushMeBaby是一款用來測試ANPs的開源Mac項目 ● 它充當了服務器的作用,用法非常簡單 ● 它負責將內容提交給蘋果的APNs服務器,蘋果的APNs服務器再將內容推送給用戶

hadoop單機部署

1、安裝java環境（此處省略）2、解壓hadoop，並配置hadoop環境變數到/etc/profile解壓hadoop-2.9.0.tar.gztar -xzvf hadoop-2.9.0.tar.gz新增hadoop環境變數vim /etc/profile# hadoo

Hadoop 單機部署與eclipse開發

A)版本 hadoop-1.0.3 jdk1.6.0_32eclipse hadoop開發外掛 hadoop-eclipse-plugin-1.0.3.jarhadoop-1.0.3 使用單機模式安裝，埠 hdfs 9000 mapred 9001B)環境conf/co

Hadoop學習------Hadoop安裝方式之(一)：單機部署

root權限出錯密碼登錄例子 .tar.gz sta /usr 成功 tput Hadoop 默認模式為單機(非分布式模式)，無需進行其他配置即可運行。非分布式即單 Java 進程，方便進行調試。 1、創建用戶 1.1創建hadoop用戶組和用戶一般我們不會

大數據測試之hadoop單機環境搭建(超級詳細版)

com jvm 末尾內容取數搭建 cluster replicat specific 友情提示：本文超級長，請備好瓜子 Hadoop的運行模式單機模式是Hadoop的默認模式，在該模式下無需任何守護進程，所有程序都在單個JVM上運行，該模式主要用於開發和調試map

Django本身提供了runserver，為什麼不能用來部署？(runserver與uWSGI的區別)

1.runserver方法是除錯 Django 時經常用到的執行方式，它使用Django自帶的 WSGI Server 執行，主要在測試和開發中使用，並且 runserver 開啟的方式也是單程序。 2.uWSGI是一個Web伺服器，它實現了WSGI協議、uwsgi、http 等協議。注意

Django 本身提供了 runserver，為什麼不能用來部署？

runserver 方法是除錯 Django 時經常用到的執行方式，它使用 Django 自帶的 WSGI Server 執行，主要在測試和開發中使用，並且 runserver 開啟的方式也是單程序。 uWSGI 是一個 Web 伺服器，它實現了 WSGI 協議、uwsgi、h

用實際程式來測試udp sendto函式的最大發包大小------為什麼是65507？

我們知道， IP包頭有一個16bit的長度，對應的二進位制最大值是2^16 -1，也就是說一個IP包整個長度的最大值是2^16 - 1 位元組，如果考慮UDP通訊，那麼除去IP頭的20個位元組，除去UDP頭的8個位元組，還剩2^16 - 1 - 20 - 8 位元組

Centos7 安裝nginx（稍後用來部署Django程式碼）

一、安裝準備首先由於nginx的一些模組依賴一些lib庫，所以在安裝nginx之前，必須先安裝這些lib庫，這些依賴庫主要有g++、gcc、openssl-devel、pcre-devel和zlib-devel 所以執行如下命令安裝 $ yum in

hadoop單機模式的構建、配置與執行測試步驟(ubuntu14.04)

PS：全程以root的角色進行配置安裝本篇文章的前期準備工作可以看我之前的部落格連結：參照上面兩篇文章，設定好機器環境和準備好檔案包，這篇文章是以下載好相應的jdk、hadoop檔案的

Hadoop可以用來做什麼？

在資料為王的時代，資料探勘能力已經成為衡量企業競爭力的重要指標之一。如何利用好通用大資料平臺Hadoop，如何選擇一款合適企業業務的Hadoop發行版也毫無疑問成為了企業的必備技能。在這個成本高昂的探索過程中，大資料行業內各個領域無疑成為了各個機構一個重要的認知

用一測試面試題來探討測試用例設計的六大思路

有這樣一個面試題：在一個Web測試頁面上，有一個輸入框，一個計數器（count）按鈕，用於計算一個文字字串中字母a出現的個數。請設計一系列測試用例用以測試這個Web頁面。 <ignore_js_op> &

spring boot（用postman來測試rest api）

前言我們開發完spring boot rest介面後，需要自測，當然可能通過junit test 來測試service或用restTemplate來測試rest controller方法，但還是和調方的請求方式有差距，這時可以用postman來模擬http請求，是比較方便的 1

用hadoop自帶的wordcount測試

1、建立檔案example.txt,並將其拷貝到hdfs的/user/root中 ./hadoop fs -put /root/example.txt /user/root 2、執行hadoop-mapreduce-examples-2.8.0.jar

一個專門用來給測試學習者進行介面測試的公開介面

1、獲取學生資訊介面： 2、使用者註冊介面 3、登入 3、新增學生資訊 4、學生金幣充值需要設定headers和body兩部分： 1.新增金幣需要以管理者身份新增（剛才“登入”介面測試時已經註冊了一個新使用者zhaixl，這個使用者已經被額外授權為管理員，

LiveKd用來在單機上實現Windbg核心除錯

　　前段時間用Windbg進行核心除錯，用VMWare構建虛擬機器組建雙機環境～安裝完後複雜的配置，漫長的啟動過程真是一種折磨，配置完卻不能在Winxp上建立虛擬環境，一查原因，我狂暈：Ghost安裝的Xp不能建立虛擬機器！只有用本地核心除錯，但有諸多限制！　　昨晚整理一些

用PHP來測試SNMP

1.原來PHP也是支援SNMP的,看來條條道路通羅馬,語言只是一個工具而已。。。 2.首先開啟php.ini中extension=php_snmp.dll,然後從PHP手冊上覆制一段程式碼:<?php$quickprint = snmp_get_quick_print(

Hadoop：是什麼，如何工作，可以用來做什麼

Hadoop由來在Google的早些時候，為了充分利用為大量結構化資料建立的索引，向用戶提供有用的資訊，這項技術被髮明瞭。當時沒有可以利用的解決大量資料的技術，所以他們構建了自己的平臺。Google的這項技術被用到了Nutch，一個開源的專案，後來，Had

private(私有)方法單元測試無法覆蓋？那就用反射呼叫來測試private（私有）方法

程式碼測試覆蓋率是衡量軟體質量的重要指標，但常規的Junit不能對private方法進行測試，那麼就會影響我們的覆蓋率。不過有一個辦法可以在Junit框架中測試private的方法，那就是反射！我們知道可以通過反射method.invoke來呼叫某個方法，但如果方法前面

hadoop單機部署,用來測試

2. Hadoop安裝

3. 單機部署

相關推薦