Hadoop偽分散式叢集搭建過程及避坑指南

阿新 • • 發佈：2019-01-23

一個偶然的機會，讓我進了hadoop這個坑。我不得不說，Google真是個非常厲害的公司。為計算機行業貢獻了很多亮瞎雙眼額技術。初入Hadoop一般都要了解HDFS，YARN，Mapreduce。

現在來總結一下Hadoop分散式叢集的搭建過程。

1.首先準備好相應的安裝包，同時在你的伺服器上配置好jdk。

完成後通過tar -zxvf jdk.tar.gz(檔名)進行解壓
進入jdk 目錄輸入pwd 得到當前路徑拷貝下來。
使用命令vi /etc/profile 命令配置jdk

在檔案的末尾新增上

export JAVA_HOME=/apps/adf/java/jdk版本號
export PATH=$JAVA_HOME/bin:$PATH
export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar

然後使用 source   /etc/profile  使配置檔案生效

輸入java  -version  如果能輸出的配置成功不能輸出成功代表註冊失敗

配置成功後，一方面可以執行 echo $JAVA_HOME 測試一下，看看路徑是否正確。接下來可以將hadoop的壓縮包解壓。然後對其內部一些檔案進行配置。

2.配置

1.配置host：

vi /etc/hosts
192.168.1.221 hadoop
vi /etc/sysconfig/network
NETWORKING=yes

HOSTNAME=hadoop（修改為 ip對應的名字）

重啟一次伺服器

這裡很容易出錯的。

2.配置ssh

sudo yum install ssh
ssh-keygen -t rsa
將公鑰移動到另一個地方
cp ~/.ssh/id_rsa.pub ~/.ssh/authorized_keys

主執行完上述三條命令後可以ssh 自身的hostname 測試

3.修改其餘配置

要修改下面幾個檔案

1.core-site.xml

新增：

<property>
      <name>fs.defaultFS</name>
      <value>hdfs://hadoop:8020</value>
   </property>

2.hdfs-site.xml

<property>
          <name>dfs.replication</name>
          <value>1</value>
     </property>
      <property>
          <name>dfs.name.dir</name>
          <value>/home/hadoop/app/namenode</value>
     </property>
     <property>
          <name>dfs.data.dir</name>
          <value>/home/hadoop/app/datanode</value>
     </property>
     <property>
          <name>dfs.tmp.dir</name>
          <value>/home/hadoop/app/tmp</value>
     </property>

3.mapred-site.xml

<property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
        </property>

4.yarn-site.xml

<property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
</property>
<property>
        <name>yarn.resourcemanager.hostname</name>
        <value>hadoop</value>
</property>

3.啟動

格式化一個新的分散式檔案系統：
$ bin/hadoop namenode -format

啟動Hadoop守護程序：
$ bin/start-all.sh

啟動後，使用jps命令檢視是否啟動 namenode，datanode，secondarynamenode。這三個程序，缺一不可。

	jps
		4230 SecondaryNameNode
		5530 Jps
		5306 DataNode
		3947 NameNode

也可以通過網頁訪問：http://hadoop:50070(這裡的hadoop我是用的是我的阿里雲伺服器的公網)

4.停止hdfs
sbin目錄下 ./stop-dfs.sh

當然這其中肯定會報很多次錯誤。比如，上面的三個程序有時候會缺失，需要你學會去看日誌。

Hadoop偽分散式叢集搭建過程及避坑指南

一個偶然的機會，讓我進了hadoop這個坑。我不得不說，Google真是個非常厲害的公司。為計算機行業貢獻了很多亮瞎雙眼額技術。初入Hadoop一般都要了解HDFS，YARN，Mapreduce。現在來總結一下Hadoop分散式叢集的搭建過程。1.首先準備好相應的安裝包，同時

搭建hadoop偽分散式叢集環境過程中遇見的問題總結

1、網路配置問題：在centos7中配置網路環境後，本機（win10系統）與虛擬機器centos7網路不通（本機可以ping通虛擬機器，但是虛擬機器ping不通本機）；解決方式：方式1：檢視本機win10系統的防火牆是否關閉，若沒有，直接關閉win10系統的防火牆即可；方式2

hadoop偽分散式叢集搭建及配置記錄

如果已經走到了需要搭建hadoop偽分散式的環境了，那說明你至少做好了以下三點建立好了自己的虛擬機器，ip、本機名對映、防火牆、安全子系統都已經配置好了下載jdk1.7及以上版本，並配置好了java環境下載hadoop2.7.0及以上版本，並解壓到、opt/modules（自

大資料之Hadoop學習（環境配置）——Hadoop偽分散式叢集搭建

title: Hadoop偽分散式叢集搭建 date: 2018-11-14 15:17:20 tags: Hadoop categories: 大資料點選檢視我的部落格: Josonlee’s Blog 文章目錄前言準備偽分

Hadoop單機/偽分散式叢集搭建（新手向）

此文已由作者朱笑笑授權網易雲社群釋出。歡迎訪問網易雲社群，瞭解更多網易技術產品運營經驗。本文主要參照官網的安裝步驟實現了Hadoop偽分散式叢集的搭建，希望能夠為初識Hadoop的小夥伴帶來借鑑意義。環境：（1）系統環境：CentOS 7.3.1611 64位（2）J

hadoop偽分散式叢集的搭建

叢集配置： jdk1.8.0_161 hadoop-2.6.1 linux系統環境：Centos6.5 建立普通使用者 dummy Hadoop偽分散式叢集搭建：為普通使用者新增sudo許可權：設定之前必須得安裝sudo，先su 輸入密碼進入root使用者

《Hadoop》之"踽踽獨行"（七）Hadoop的偽分散式叢集搭建

在上一章我給大家介紹了Hadoop的單節點叢集本地模式的搭建，在這一章中，我們來了解一下Hadoop偽分散式叢集的搭建與用途。一、Hadoop偽分散式叢集（pseudo distributed cluster） 1、簡介 hadoop的pseudo distributed&n

Hadoop單機、偽分散式叢集搭建（十分詳細）

原文地址：http://blog.csdn.net/dr_guo/article/details/50886667 下面我就一邊搭建一邊寫怎麼搭建Hadoop偽分佈模式。 1.下載jdk並安裝去官網下就可以了，下完之後把檔案移到/o

hadoop-2.6.5偽分散式叢集搭建

本次搭建的偽分散式hadoop叢集所使用的作業系統是紅帽5，64位系統。所以，需要注意以下幾點： 1、jdk和hadoop安裝包也應該是64位的 2、64位的jdk是從檔名可以直接看出，例如：jdk-8u172-linux-x64.tar.gz 3、而

Hadoop2.7.6搭建偽分散式叢集詳細過程--1.安裝Linux虛擬機器（超詳細）

1 ，準備工作安裝VMware Workstation ；去官網下載Linux映象（這裡選擇的是centos7的DVD ISO） 2 ，開始安裝開啟VMware Workstation 選擇檔案>新建虛擬機器然後按照提示進行安裝需要注意

【HDFS篇】搭建hadoop偽分散式叢集

所謂偽分散式，就是單機模擬多臺伺服器搭建的過程。只是每個角色都是以程序的方式啟動。基本流程如下：一,作業系統環境依賴軟體ssh,jdk 環境的配置 java_home 免金鑰時間同步 hosts,hostname 二,hadoop部署

linux下安裝hadoop偽分散式叢集

1. 在虛擬機器上安裝了centos7，下載hadoop。http://hadoop.apache.org/releases.html 這裡選擇2.7版本而不是3.0版本不選3.0版本的理由，檢視版本更新日誌

Hadoop偽分散式環境搭建之Linux作業系統安裝

Hadoop偽分散式環境搭建之Linux作業系統安裝本篇文章是接上一篇《超詳細hadoop虛擬機器安裝教程（附圖文步驟）》，上一篇有人問怎麼沒寫hadoop安裝。在文章開頭就已經說明了，hadoop安裝會在後面寫到，因為整個系列的文章涉及到每一步的截圖，導致文章整體很長。會分別先對虛擬機器

windows10下 eclipse連線虛擬機器中的Hadoop偽分散式叢集

在windows用eclipse連線hadoop之後，可以便於進行mapreduce開發，非常方便，如果在虛擬機器裡面用eclipse的話，emmmmmm，你會卡到懷疑人生。首先需要去下載eclipse，這個直接官網就ok link

史上最簡單詳細的Hadoop完全分散式叢集搭建

一.安裝虛擬機器環境 Vmware12中文官方版連結：https://pan.baidu.com/s/1IGKVfaOtcFMFXNLHUQp41w 提取碼：6rep 啟用祕鑰：MA491-6NL5Q-AZAM0-ZH0N2-AAJ5A 這個安裝就十分的簡單了，只需要不斷點選下

偽分散式叢集搭建

在B站找的搭建Hadoop的視訊，以下是步驟感覺很簡練，有一篇部落格講的更加詳細 1.準備好jar包和Hadoop包相容情況如下： hadoop版本>=2.7：要求Java 7(openjdk/oracle) hadoop版本<=2.6：要求Java 6(open

Hive on Spark 偽分散式環境搭建過程記錄

進入hive cli是，會有如下提示： Hive-on-MR is deprecated in Hive 2 and may not be available in the future versions. Consider using a different execution engine (i.e. s

redis單機版偽分散式叢集搭建

繼上一篇redis單機伺服器搭建成功之後，按如下方式進行叢集搭建。搭建一個最小的叢集需要6臺機器（由節點投票機制決定至少需要3臺主節點，另外為了高可用每個主節點至少要備一個從節點，所以總共需要6個節點。這裡6個節點全部設在一臺機上，通過埠號來分別。實現偽分散式

Kafka 單機和偽分散式叢集搭建

感覺自己越來越像個運維了，真的是所有的分散式的中介軟體基本都搭建了一遍不得了了。好廢話少說，還是來走Kafka 吧，經歷了Rocket MQ ， Kafka 的搭建真的是簡單的不知道多少倍， RocketMQ 實在是太麻煩了。還是老方

linux hadoop完全分散式叢集搭建圖文詳解

一.前期準備 1.1 Win7官網下載hadoop包本文使用版本hadoop-2.6.5.tar.gz 1.2 配置jdk 1.3 centos7叢集伺服器主機名系統

Hadoop偽分散式叢集搭建過程及避坑指南

相關推薦