Hadoop偽分佈模式的搭建

阿新 • • 發佈：2018-12-02

準備工作：

1、成功安裝Linux（CentOS）系統。

安裝CentOS 7詳見：https://blog.csdn.net/zxdspaopao/article/details/83277479

2、成功安裝jdk。

安裝jdk詳見：https://blog.csdn.net/zxdspaopao/article/details/83278090

3、成功安裝hadoop。

安裝hadoop詳見：https://blog.csdn.net/zxdspaopao/article/details/83278859

安裝過程：

1、配置ssh（免密登陸）；

2、配置hdfs-site.xml；

3、配置core-site.xml；

4、配置mapred-site.xml；

5、配置yarn-site.xml；

6、格式化NameNode；

7、啟動；

8、訪問；

9、執行單詞計數程式例項。

1、配置ssh

$ssh-keygen -t rsa

$ll ~/.ssh/

$ssh cmaster

2、配置hdfs-site.xml

#cd /usr/local/hadoop-2.8.4/etc/hadoop

#vi hdfs-site.xml

在<configuration>和</configuration>之間輸入以下內容：

<!--配置HDFS的冗餘度-->
<property>
<name>dfs.replication</name>
<value>1</value>
</property>

<!--配置是否檢查許可權-->
<property>
<name>dfs.permissions</name>
<value>false</value>
</property>

3、配置core-site.xml

#vi core-site.xml

在<configuration>和</configuration>之間輸入以下內容：

<!--配置HDFS的NameNode-->
<property>
<name>fs.defaultFS</name>
<value>hdfs://192.168.245.11:9000</value>
</property>

<!--配置DataNode儲存資料的位置-->
<property>mv
<name>hadoop.tmp.dir</name>
<value>/usr/local/hadoop-2.8.4/tmp</value>
</property>

4、配置mapred-site.xml

#cp mapred-site.xml.template mapred-site.xml
#vi mapred-site.xml

在<configuration>和</configuration>之間輸入以下內容：

<!--配置MR執行的框架-->
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>

5、配置yarn-site.xml

#vi yarn-site.xml

在<configuration>和</configuration>之間輸入以下內容：

 <!--配置ResourceManager的地址-->
<property>    
<name>yarn.resourcemanager.hostname</name>
<value>192.168.245.11</value>
</property>

<!--配置NodeManager執行任務的方式-->
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>

6、格式化NameNode

#hdfs namenode -format

出現日誌：Storage directory /usr/local/hadoop-2.4.1/tmp/dfs/name has been successfully formatted.

即為成功。

通過檢視啟動日誌分析啟動失敗原因

有時 Hadoop 無法正確啟動，如 NameNode 程序沒有順利啟動，這時可以檢視啟動日誌來排查原因，注意幾點：

啟動時會提示形如 “cmaster: starting namenode, logging to /usr/local/hadoop/logs/hadoop-hadoop-namenode-cmaster.out”，其中 cmaster 對應你的主機名，但啟動的日誌資訊是記錄在 /usr/local/hadoop-2.8.4/logs/hadoop-hadoop-namenode-cmaster.log 中，所以應該檢視這個字尾為 .log 的檔案；
每一次的啟動日誌都是追加在日誌檔案之後，所以得拉到最後面看，看下記錄的時間就知道了。
一般出錯的提示在最後面，也就是寫著 Fatal、Error 或者 Java Exception 的地方。

7、啟動

#start.all.sh

(*) HDFS: 儲存資料
(*) Yarn：執行計算

進行免密碼配置則不需要重複輸入密碼。

8、訪問

(1）命令列:jps

(2）Java API
(3）Web Console：
HDFS：http://192.168.245.11:50070

Yarn：http://192.168.245.11:8088

9、執行單詞計數程式例項

(1)進入bin目錄下：

#cd /usr/local/hadoop-2.8.4/bin

(2)偽分散式讀取的則是 HDFS 上的資料。要使用 HDFS，首先需要在 HDFS 中建立使用者目錄：

#hdfs dfs -mkdir /input

(3)向txt文字寫入資料：

#vi wfb.txt

(4)將寫好的文字上傳至HDFS建立的input目錄下

#hdfs dfs -put wfb.txt /input

(5)在HDFS上建立一個輸出目錄

#hdfs dfs -mkdir /outpur

(6)執行程式

#hadoop jar /usr/local/hadoop-2.8.4/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.8.4.jar wordcount /input/wfb.txt /outpur/wc

(7)檢視執行結果

#hdfs dfs -ls /outpur/wc

如圖：檢視part-r-00000檔案

#hdfs dfs -cat /outpur/wc/part-r-00000

在執行的同時在Web yarn介面上可以檢視到正在執行的程式：

至此，Hadoop偽分佈部署成功，同時程式也執行成功。

在部署過程中真的需要步步為營，我也不是一遍做出來的，望大家不要忽略每一個細節。

有小夥伴不懂的地方可在下方留言。

hadoop 偽分佈模式搭建（上）

轉載請標明出處： http://blog.csdn.net/zwto1/article/details/44002083；本文出自:【zhang_way的部落格專欄】軟體： hadoop1.1.

Hadoop偽分佈模式的搭建

準備工作： 1、成功安裝Linux（CentOS）系統。安裝CentOS 7詳見：https://blog.csdn.net/zxdspaopao/article/details/83277479 2、成功安裝jdk。安裝jdk詳見：https://blog.csdn.net/z

Hadoop實踐 | VMware搭建Hadoop偽分佈模式

環境：物理機Win10 VMware14 虛擬機器Ubuntu16.04LTS 準備工作建立三臺虛擬機器，使用者名稱需要相同（本文使用的jackherrick），主機名推薦master slave1 slave2 安裝VMware Tool

Hadoop偽分佈環境搭建——Hadoop安裝與配置

我們需要從官網下載hadoop 點選開啟連結我自己下載的是最新的版本 hadoop 2.7.1。下載完成後就開始安裝了：使用 sudo tar xzf hadoo

Hadoop偽分佈環境搭建——Linux環境配置

hadoop最近可以說是相當火，也勾起了我的興趣，所以打算學習一下。想要學習hadoop肯定要先學會在自己的電腦上搭建一個hadoop偽分佈環境。偽分佈模式安裝步驟的第一步就是要配置Linux環境。我自己的Linux是Ubuntu系統，不過只要是Linux系統，都大同

Ubuntu16.04安裝hadoop(偽分佈模式)

主要參考的文章為: https://blog.csdn.net/wangjia55/article/details/53160679 https://www.cnblogs.com/87hbteo/p/7606012.html 安裝版本： &

（二）hadoop偽分佈模式安裝

本文以偽分散式模式搭建hadoop 1、三種安裝模式：單機模式：無法使用HDFS,只能使用MapReduce，主要目的是在本機測試mapreduce程式碼偽分散式模式：使用一臺機器，使用多個執行緒模擬多臺真實機器，模擬真實的分散式環境完全分散式模式：用多臺機器（虛

Mac環境下安裝Hadoop偽分佈模式

Hadoop是一個由Apache基金會所開發的分散式系統基礎架構。這裡講述在Mac上安裝Hadoop偽分佈模式的過程。環境：Mac OS X 10.11 + Hadoop-2.6.5 1 下載官網下載Hadoop(下載連結)，選擇binary檔案下載，

Linux下部署Hadoop偽分佈模式

Hadoop版本為1.2.1 Distribution為Fedora19並使用hadoop賬號安裝第一步：配置ssh本地登入證書（雖然為偽分佈模式，Hadoop依然會使用SSH進行通訊） [[email protected] ~]$ which ssh /usr

hadoop偽分佈模式配置

1. 偽分佈配置實驗條件：1臺ubuntu伺服器，jdk版本1.8.X，Hadoop 版本1.2.X 1.1 ssh localohost 如果不輸入口令就無法用ssh登陸localhost，即ssh免密登陸，則執行下面的命令，產生公私鑰對，將私鑰放入authorized_keys $ ssh-keyge

hadoop偽分佈環境快速搭建

1.首先下載一個完成已經進行簡單配置好的映象檔案（hadoop，HBASE，eclipse,jdk環境已經搭建好，tomcat為7.0版本，建議更改為tomcat8.5版本，執行比較穩定）。 2安裝VMware虛擬機器 3.開啟下載好的映象檔案 4.修改root的

Hadoop單機和偽分佈環境搭建

Hadoop環境搭建與運維 Hadoop概述： Hadoop是一個由Apache基金會所開發的分散式系統基礎架構。使用者可以在不瞭解分散式底層細節的情況下，開發分散式程式。充分利用叢集的威力進行高速運算和儲存。 Hadoop實現了一個分散式檔案系統（Hadoop Distrib

Hadoop 安裝及偽分佈模式配置

安裝下載 jdk x64版本 tar -xzvf jdk-8u191-linux-x64.tar.gz /usr/soft解壓檔案到/usr/soft目錄下配置環境變數開啟environment : sudo vi /etc/environm

Hadoop從入門到精通系列之--2.本地模式和偽分佈模式

目錄一 Hadoop本地模式和偽分散式模式概述二 Hadoop偽分散式環境搭建 2.1步驟分析 2.2配置叢集 2.3啟動叢集 2.4 配置YARN 2.5啟動叢集（帶YARN） 2.6檢視YARN 三在叢集上執行第一個程式 3.1 準備

阿里雲搭建大資料平臺（3）：安裝JDK和Hadoop偽分佈環境

一、安裝jdk 1.解除安裝Linux自帶的JDK rpm -qa|grep jdk #查詢原始JDK yum -y remove <舊JDK> 2.解壓縮 tar -zxvf /opt/softwares/jdk-8u151-linux-x64.t

Hadoop-2.8.0實踐——單機模式和偽分佈模式

一、安裝 1.1 環境系統：Ubuntu 16.04 LTS 軟體： Java 1.7及以上 ssh 和 sshd 安裝ssh: $ sudo apt-get install ssh $ sudo apt-get install rsync 1.2

linux 安裝hadoop 的四大執行模式——偽分佈模式（版本2.9.1）

hadoop偽分佈模式：hadoop的守護程序在同一臺伺服器上（具體定義請自行查詢）前提：請在閱讀《linux 安裝hadoop 的四大執行模式——本地模式》的基礎上進行閱讀 1、將本地模式的配置檔案複製出來建立軟連線，便於後續方便使用執行命令：$>cp -r &

Hbase本地模式、偽分佈模式、全分佈模式、HA的搭建

一、搭建HBase本地模式解壓： &nb

mac搭建hadoop3.1.1偽分佈模式全網最詳細教程！

最近實習使用到了hadoop，那今天就出一個使用mac搭建hadoop3.1.1的詳細教程。幫助大家避免安裝的坑！首先需要安裝一個mac神器：Homebrew，相信使用mac的童鞋都知道吧！Homebrew是一個包管理器，是Mac上的軟體安裝管理工具，類似於Linux中的apt-get，擁有安

獨立模式、偽分佈模式、hbase和hadoop HA（高可用）完全分散式模式。整合配置

一、獨立模式： 1.下載hbase檔案略 2.tar開略 3.配置環境變數略 4.修改配置檔案在hbase安裝目錄下： //配置jdk路徑 [/conf/hbase-env.sh] export JAVA_HOME=/zdq/jdk //配置hbas

Hadoop偽分佈模式的搭建

準備工作：

1、成功安裝Linux（CentOS）系統。

安裝CentOS 7詳見：https://blog.csdn.net/zxdspaopao/article/details/83277479

2、成功安裝jdk。

安裝jdk詳見：https://blog.csdn.net/zxdspaopao/article/details/83278090

3、成功安裝hadoop。

安裝hadoop詳見：https://blog.csdn.net/zxdspaopao/article/details/83278859

安裝過程：

1、配置ssh（免密登陸）；

2、配置hdfs-site.xml；

3、配置core-site.xml；

4、配置mapred-site.xml；

5、配置yarn-site.xml；

6、格式化NameNode；

7、啟動；

8、訪問；

9、執行單詞計數程式例項。

1、配置ssh

$ssh-keygen -t rsa

$ll ~/.ssh/

$ssh cmaster

2、配置hdfs-site.xml

#cd /usr/local/hadoop-2.8.4/etc/hadoop

#vi hdfs-site.xml

在<configuration>和</configuration>之間輸入以下內容：

3、配置core-site.xml

#vi core-site.xml

在<configuration>和</configuration>之間輸入以下內容：

4、配置mapred-site.xml

#cp mapred-site.xml.template mapred-site.xml #vi mapred-site.xml

在<configuration>和</configuration>之間輸入以下內容：

5、配置yarn-site.xml

#vi yarn-site.xml

在<configuration>和</configuration>之間輸入以下內容：

6、格式化NameNode

#hdfs namenode -format

出現日誌：Storage directory /usr/local/hadoop-2.4.1/tmp/dfs/name has been successfully formatted.

即為成功。

通過檢視啟動日誌分析啟動失敗原因

有時 Hadoop 無法正確啟動，如 NameNode 程序沒有順利啟動，這時可以檢視啟動日誌來排查原因，注意幾點：

每一次的啟動日誌都是追加在日誌檔案之後，所以得拉到最後面看，看下記錄的時間就知道了。

一般出錯的提示在最後面，也就是寫著 Fatal、Error 或者 Java Exception 的地方。

7、啟動

#start.all.sh

8、訪問

(1）命令列:jps

(2）Java API (3）Web Console： HDFS：http://192.168.245.11:50070

Yarn：http://192.168.245.11:8088

9、執行單詞計數程式例項

(1)進入bin目錄下：

#cd /usr/local/hadoop-2.8.4/bin

(2)偽分散式讀取的則是 HDFS 上的資料。要使用 HDFS，首先需要在 HDFS 中建立使用者目錄：

#hdfs dfs -mkdir /input

(3)向txt文字寫入資料：

#vi wfb.txt

(4)將寫好的文字上傳至HDFS建立的input目錄下

#hdfs dfs -put wfb.txt /input

(5)在HDFS上建立一個輸出目錄

#hdfs dfs -mkdir /outpur

(6)執行程式

#hadoop jar /usr/local/hadoop-2.8.4/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.8.4.jar wordcount /input/wfb.txt /outpur/wc

(7)檢視執行結果

#hdfs dfs -ls /outpur/wc

如圖：檢視part-r-00000檔案

#hdfs dfs -cat /outpur/wc/part-r-00000

在執行的同時在Web yarn介面上可以檢視到正在執行的程式：

至此，Hadoop偽分佈部署成功，同時程式也執行成功。

在部署過程中真的需要步步為營，我也不是一遍做出來的，望大家不要忽略每一個細節。

有小夥伴不懂的地方可在下方留言。

相關推薦

#cp mapred-site.xml.template mapred-site.xml
#vi mapred-site.xml

(2）Java API
(3）Web Console：
HDFS：http://192.168.245.11:50070