Hadoop2.7.2之叢集搭建（單機）

阿新 • • 發佈：2019-01-01

下載安裝Hadoop

1、下載地址

http://hadoop.apache.org/releases.html

這裡寫圖片描述

我下載的是2.7.2，官網在2.5之後預設提供的就是64位的，這裡直接下載下來用即可

2、安裝Hadoop

tar -zxvf hadoop-2.7.2.tar.gz -C /opt/soft

cd /opt/soft/hadoop-2.7.2/lib/native
file libhadoop.so.1.0.0

這裡寫圖片描述

4、配置/etc/hosts

vi /etc/hosts

這裡寫圖片描述

配置啟動Hadoop

1、修改hadoop2.7.2/etc/hadoop/hadoop-env.sh指定JAVA_HOME

# The java implementation to use.
export JAVA_HOME=/opt/soft/jdk1.8.0_91

2、修改hdfs的配置檔案

修改hadoop2.7.2/etc/hadoop/core-site.xml 如下：

<configuration>
    <!-- 指定HDFS老大（namenode）的通訊地址 -->
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://singlenode:9000</value 
>
    </property>
    <!-- 指定hadoop執行時產生檔案的儲存路徑 -->
    <property>
        <name>hadoop.tmp.dir</name>
        <value>/opt/soft/hadoop-2.7.2/tmp</value>
    </property>
</configuration>

這裡fs.defaultFS的value最好是寫本機的靜態IP當然寫本機主機名，再配置hosts是最好的，如果用localhost，然後在windows用java操作hdfs的時候，會連線不上主機。

修改hadoop2.7.2/etc/hadoop/hdfs-site.xml 如下：

<configuration>
    <!-- 設定hdfs副本數量 -->
    <property>
        <name>dfs.replication</name>
        <value>1</value>
    </property>
</configuration>

3、配置SSH免密碼登入

配置前：

ssh localhost

這裡寫圖片描述

會出現如上效果，要求我輸入本機登入密碼

配置方法：

ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa
cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys
chmod 0600 ~/.ssh/authorized_keys

配置後，不用密碼可以直接登入了

這裡寫圖片描述

4、hdfs啟動與停止

第一次啟動得先格式化（最好不要複製）：

./bin/hdfs namenode –format

啟動hdfs

./sbin/start-dfs.sh

看到如下效果表示成功：

這裡寫圖片描述

測試用瀏覽器訪問：（如果沒響應，則開發50070埠）

firewall-cmd --zone=public --add-port=50070/tcp --permanent
firewall-cmd --reload

http://192.168.2.100:50070/

效果如下：
這裡寫圖片描述

停止hdfs

sbin/stop-dfs.sh

5、常用操作：
HDFS shell
檢視幫助

hadoop fs -help <cmd>

上傳

hadoop fs -put <linux上檔案>  <hdfs上的路徑>

檢視檔案內容

hadoop fs -cat <hdfs上的路徑>

檢視檔案列表

hadoop fs -ls /

下載檔案

hadoop fs -get <hdfs上的路徑>  <linux上檔案>

上傳檔案測試
建立一個words.txt 檔案並上傳

vi words.txt

Hello World
Hello Tom
Hello Jack
Hello Hadoop
Bye   hadoop

將words.txt上傳到hdfs的根目錄

bin/hadoop fs -put words.txt /

這裡寫圖片描述

這裡的words.txt就是我們上傳的words.txt

配置啟動YARN

這裡寫圖片描述

從上圖看看出我們的MapReduce是執行在YARN上的，而YARN是執行在HDFS之上的，我們已經安裝了HDFS現在來配置啟動YARN，然後執行一個WordCount程式。

1、配置etc/hadoop/mapred-site.xml：

mv mapred-site.xml.template mapred-site.xml

<configuration>
    <!-- 通知框架MR使用YARN -->
    <property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
    </property>
</configuration>

2、配置etc/hadoop/yarn-site.xml:

<configuration>
    <!-- reducer取資料的方式是mapreduce_shuffle -->
    <property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
    </property>
</configuration>

3、YARN的啟動與停止

啟動

./sbin/start-yarn.sh

如下：

這裡寫圖片描述

測試用瀏覽器訪問：（如果沒響應，則開發8088埠）

這裡寫圖片描述

停止

sbin/stop-yarn.sh

現在我們的hdfs和yarn都執行成功了，我們開始執行一個WordCount的MP程式來測試我們的單機模式叢集是否可以正常工作。

執行一個簡單的MP程式

我們的MapperReduce將會跑在YARN上，結果將存在HDFS上：

./bin/hadoop jar /opt/soft/hadoop-2.7.2/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.2.jar  wordcount hdfs://localhost:9000/words.txt hdfs://localhost:9000/out

用hadoop執行一個叫 hadoop-mapreduce-examples.jar 的 wordcount 方法，其中輸入引數為 hdfs上根目錄的words.txt 檔案，而輸出路徑為 hdfs跟目錄下的out目錄，執行過程如下：

這裡寫圖片描述

我們通過瀏覽器訪問和下載檢視結果：

這裡寫圖片描述

這裡下載的時候會跳轉到另一個地址如下：

http://singlenode:50075/webhdfs/v1/out/part-r-00000?op=OPEN&namenoderpcaddress=localhost:9000&offset=0

1、需把singlenode換成192.168.2.100或是在hosts里加入 192.168.2.100 singlenode 隱射關係

2、需開放50075埠。

下載下來結果如下：

Bye 1
Hadoop  2
Hello   4
Jack    1
Tom 1
World   1

說明我們已經計算出了，單詞出現的次數。

至此，我們Hadoop的單機模式搭建成功。

Hadoop2.7.2之叢集搭建（單機）

下載安裝Hadoop 1、下載地址 http://hadoop.apache.org/releases.html 我下載的是2.7.2，官網在2.5之後預設提供的就是64位的，這裡直接下載下來用即可 2、安裝Hadoop tar -

Hadoop2.7.2之叢集搭建（高可用）

叢集規劃主機名 ip 安裝的軟體程序 hadoop01 192.168.1.101 jdk、hadoop NN、DFSZKFailoverController hadoop02 192.1

Hadoop2.7.2之叢集搭建（三臺）

叢集規劃主機名 ip 安裝的軟體程序 master 192.168.1.111 jdk、hadoop namenode ressourcemanager slave1 192.168.1.1

Spark專案之環境搭建（單機）三 scala-2.12.7+ spark-2.3.2-bin-hadoop2.7安裝

上傳scala和spark架包解壓然後重新命名 tar -zxf scala-2.12.7.tgz mv scala-2.12.7 scala tar -zxf spark-2.3.2-bin-hadoop2.7.tgz mv spark-2.3.

Spark專案之環境搭建（單機）四 sqoop-1.4.7.bin__hadoop-2.6.0.tar.gz 安裝

上傳解壓 sqoop-1.4.7.bin__hadoop-2.6.0.tar.gz，重新命名 tar -zxf sqoop-1.4.7.bin__hadoop-2.6.0.tar.gz mv sqoop-1.4.7.bin__hadoop-2.6.0 sqoop 進入sqoop

Spark專案之環境搭建（單機）一 hadoop 2.8.5安裝

我用的hadoop2.8.5 + apache-hive-2.3.3 +sqoop-1.4.7 + jdk1.8 + mysql 5.7 + scala-2.12.7 + spark-2.3.2-bin-hadoop2.7 第一步上傳所需的包：我把所有的包都放在了hom

Spark專案之環境搭建（單機）二 hive-2.3.3安裝

上傳hive架包，然後解壓： tar -zxf apache-hive-2.3.3-bin.tar.gz hive 重新命名 mv apache-hive-2.3.3-bin hive 將mysql的驅動包加入hive的lib檔案下面進入hive目錄下的c

Hadoop2.7.3-HA 叢集搭建（傳智播客）

前期準備 1 修改Linux主機名 2 修改IP 3 修改主機名和IP的對映關係 /etc/hosts 4 關閉防火牆 5 ssh免登陸 6 安裝JDK，配置環境變數等叢集規劃主機名

Spark專案之環境搭建（單機）五配置eclipse的scala環境，並建立spark專案

先安裝scala 環境： eclipse版：spring-tool-suite-3.9.1.RELEASE-e4.7.1a-win32-x86_64 下載地址：https://www.scala-lang.org/download/ 然後配置環境變數，參考以下地址：

kubernetes學習：2.kubernetes叢集搭建（一）架構介紹

kubernetes叢集搭建：架構介紹作為一個容器的編排管理工具，k8s的效能出眾而且社群力量強大，連docker官方也已經預設k8s為容器編排的首選工具。所以我們更有必要去學習和了解它。 k8s的整體架構主要分為兩個部分： master（控制節點）和

centos7下Hadoop2.8.4全分佈搭建之HDFS叢集搭建（一）

1)搭建前的準備注意：（以下操作可以先配置一臺，然後通過scp命令傳送到其他兩臺虛擬機器上傳送到其他機器 scp -r 主機名: 注意:載入環境變數 source /etc/profile

hadoop-2.6.0.tar.gz + spark-1.5.2-bin-hadoop2.6.tgz的叢集搭建（單節點）（Ubuntu系統）

前言關於幾個疑問和幾處心得！ a.用NAT，還是橋接，還是only-host模式？ b.用static的ip，還是dhcp的？答：static c.別認為快照和克隆不重要，小技巧，比別人靈活用，會很節省時間和大大減少錯誤。 d.重用起來指令碼語言的程式設計，如paython

hadoop-2.6.0.tar.gz + spark-1.6.1-bin-hadoop2.6.tgz的叢集搭建（單節點）（CentOS系統）

前言關於幾個疑問和幾處心得！ a.用NAT，還是橋接，還是only-host模式？ b.用static的ip，還是dhcp的？答：static c.別認為快照和克隆不重要，小技巧，比別人靈活用，會很節省時間和大大減少錯誤。 d.重用起來指令碼語言

Redis單機和叢集搭建（筆記）

單機部署 1.下載安裝包 2.解壓安裝 tar -xzvf redis-4.0.1.tar.gz cd redis-4.0.1/ make PREFIX=/usr/local/redis/ install 如果是一般使用者，前面加sudo 3.拷貝配置檔

VirtualBox5.0.18+CentOS7.2+Hadoop2.7.2配置與開發（2）用YARN完成WordCount作業

執行WordCount作業步驟：進入hadoop目錄，刪除input目錄和output目錄（如果有）；啟動hdfs系統，ResourceManager和NodeManager。 $cd /usr/hadoop-2.7.2 $sbin/start-dfs.sh $s

Docker之Hadoop普通叢集搭建（五）

2017-01-08 03:36:29,815 FATAL org.apache.hadoop.hdfs.server.datanode.DataNode: Exception in secureMain java.net.UnknownHostException: 26b72653d296: 26b7265

轉載：monkeyrunner之eclipse中運行monkeyrunner腳本之環境搭建（四）

導包 rep 是把 body tle cnblogs 9.png 解決方法 align 轉載自：lynnLi 的monkeyrunner之eclipse中運行monkeyrunner腳本之環境搭建（四） monkeyrunner腳本使用Python語法編寫，但它實際上是通

CentOS7.5Kubernets(k8s)1.12.2之安裝Helm（二）

K8s安裝Helm注：charts倉庫如果用google的必須設定代理（比如squid）,不需要的話可以用阿里的charts倉庫1、下載helmHelm命令下載地址：https://github.com/helm/helm/releases連結：https://pan.baidu.com/s/15Je7HwU

linux 核心模組程式設計之環境搭建（一）

這裡介紹些關於Tiny6410開發板核心的編譯，為後期驅動開發做前期的準備。開發環境：64位的Ubuntu 14.01虛擬機器目標機:友善之臂Tiny6410開發板核心：linux-2.6.38-20110325.tar.gz 核心原始碼下載地址 htt

hadoop叢集搭建（docker）

背景　　　　目前在一家快遞公司工作，因專案需要，對大資料平臺做個深入的瞭解。工欲利其器必先利其器，在網上找了許多教程，然後自己搭建一個本地的環境並記錄下來，增加一些印象。環境搭建 1）Ubuntu docker pull ubuntu:16.04 docker images&nb

Hadoop2.7.2之叢集搭建（單機）

下載安裝Hadoop

配置啟動Hadoop

配置啟動YARN

執行一個簡單的MP程式

相關推薦