Hadoop3.0叢集安裝（包含HDFS HA配置）

阿新 • • 發佈：2019-02-08

hadoop3.0出來了，想嘗試一下新版本的特性及mapreduce效能提升，以下以6臺機器作為hadoop叢集，機器主機名為：hadoop1、hadoop2、hadoop3、hadoop4、hadoop5、hadoop6，其中hadoop1-3作為namenode節點，hadoop4-6作為datanode節點。

一、前提條件

1、6臺機器上都安裝了jdk，並配置好了jdk環境變數（建議安裝jdk1.8）。

2、叢集中安裝好了zookeeper叢集，HDFS HA需要。

我這裡假設zookeeper安裝在：hadoop1、hadoop2、hadoop3這三臺機器上。

3、叢集中6臺機器都相互配置了ssh免密碼登入

二、hadoop3.0安裝步驟

1、下載hadoop3.0

2、解壓檔案

3、修改hadoop-env.sh配置檔案，配置jdk環境變數

export JAVA_HOME=/opt/jdk1.8.0_121

4、修改hdfs-site.xml配置檔案

<configuration>
  <!-- Hadoop 3.0 HA Configuration -->
  <property>
     <name>dfs.nameservices</name>
     <value>hdfscluster</value>
  </property>
  <property>
     <name>dfs.ha.namenodes.hdfscluster</name>
     <value>nn1,nn2,nn3</value>
  </property>
  <property>
     <name>dfs.namenode.rpc-address.hdfscluster.nn1</name>
     <value>hadoop1:9820</value>
  </property>
  <property>
     <name>dfs.namenode.rpc-address.hdfscluster.nn2</name>
     <value>hadoop2:9820</value>
  </property>
  <property>
     <name>dfs.namenode.rpc-address.hdfscluster.nn3</name>
     <value>hadoop3:9820</value>
  </property> 
  <property>
     <name>dfs.namenode.http-address.hdfscluster.nn1</name>
     <value>hadoop1:9870</value>
  </property>
  <property>
     <name>dfs.namenode.http-address.hdfscluster.nn2</name>
     <value>hadoop2:9870</value>
  </property>
  <property>
     <name>dfs.namenode.http-address.hdfscluster.nn3</name>
     <value>hadoop3:9870</value>
  </property> 
  <property>
     <name>dfs.namenode.shared.edits.dir</name>
     <value>qjournal://hadoop1:8485;hadoop2:8485;hadoop3:8485/hdfscluster</value>
  </property>
  <property>
     <name>dfs.client.failover.proxy.provider.hdfscluster</name>
     <value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>
  </property>
  <property>
     <name>dfs.ha.fencing.methods</name>
     <value>sshfence</value>
  </property>
  <property>
     <name>dfs.ha.fencing.ssh.private-key-files</name>
     <value>/home/hadoop/.ssh/id_rsa</value>
  </property>
  <property>
     <name>dfs.journalnode.edits.dir</name>
     <value>/opt/hadoop-3.0.0/datas/journal</value>
  </property>
  <property>
     <name>dfs.ha.automatic-failover.enabled</name>
     <value>true</value>
  </property>
  <property>
     <name>dfs.replication</name>
     <value>3</value>
  </property>
  <property>
     <name>dfs.permissions.enabled</name>
     <value>false</value>
  </property>
  <property>
     <name>dfs.namenode.name.dir</name>  
     <value>/opt/hadoop-3.0.0/datas/namenode</value>  
  </property>  
  <property>  
     <name>dfs.datanode.data.dir</name>  
     <value>/opt/hadoop-3.0.0/datas/datanode</value>  
   </property>  
<property>
    <name>dfs.client.block.write.replace-datanode-on-failure.enable</name>
	<value>false</value>
</property>
<property>
    <name>dfs.client.block.write.replace-datanode-on-failure.policy</name>
    <value>DEFAULT</value>
</property>
<property>
    <name>dfs.support.append</name>
    <value>true</value>	
</property>
</configuration>

5、修改core-site.xml配置檔案

<configuration>
 <property>  
     <name>fs.defaultFS</name>   
     <value>hdfs://hdfscluster</value>  
  </property>       
  <property>  
     <name>hadoop.tmp.dir</name>  
     <value>/opt/hadoop-3.0.0/tmp</value>
  </property>
  <property>
     <name>fs.trash.interval</name>
     <value>1440</value>
  </property>
  <property>  
     <name>ha.zookeeper.quorum</name>
     <value>hadoop1:2181,hadoop2:2181,hadoop3:2181</value>  
  </property>
</configuration>

6、修改yarn-site.xml配置檔案

<configuration>
<!-- Site specific YARN configuration properties -->
<property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
    </property>
      <property>  
        <name>yarn.resourcemanager.address</name>  
        <value>hadoop1:8032</value>  
      </property>  
      <property>  
        <name>yarn.resourcemanager.scheduler.address</name>  
        <value>hadoop1:8030</value>  
      </property>  
      <property>  
        <name>yarn.resourcemanager.resource-tracker.address</name>  
        <value>hadoop1:8031</value>  
      </property>  
      <property>  
        <name>yarn.nodemanager.vmem-check-enabled</name>  
        <value>false</value>  
      </property>  
      <property>  
        <name>yarn.nodemanager.pmem-check-enabled</name>  
        <value>false</value>  
      </property>  
</configuration>

7、修改mapred-site.xml配置檔案

<configuration>
   <property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
    </property>
    <property>
       <name>mapreduce.jobhistory.address</name>
       <value>hadoop1:10020</value>
    </property>
    <property>
       <name>mapreduce.jobhistory.webapp.address</name>
       <value>hadoop1:19888</value>
    </property>
   <property>
    <name>mapreduce.application.classpath</name>
    <value>
        /opt/hadoop-3.0.0/etc/hadoop,
        /opt/hadoop-3.0.0/share/hadoop/common/*,
        /opt/hadoop-3.0.0/share/hadoop/common/lib/*,
        /opt/hadoop-3.0.0/share/hadoop/hdfs/*,
        /opt/hadoop-3.0.0/share/hadoop/hdfs/lib/*,
        /opt/hadoop-3.0.0/share/hadoop/mapreduce/*,
        /opt/hadoop-3.0.0/share/hadoop/mapreduce/lib/*,
        /opt/hadoop-3.0.0/share/hadoop/yarn/*,
        /opt/hadoop-3.0.0/share/hadoop/yarn/lib/*
    </value>
</property>
</configuration>

8、修改workers配置檔案

hadoop4
hadoop5
hadoop6

9、建立相應目錄

mkdir -p /opt/hadoop-3.0.0/datas/journal

mkdir -p /opt/hadoop-3.0.0/datas/namenode

mkdir -p /opt/hadoop-3.0.0/datas/datanode

10、將配置好的hadoop拷貝到其它機器上(hadoop2-6)

scp -r /opt/hadoop-3.0.0 hadoop2:/opt

其它機器執行同樣操作

三、啟動hadoop叢集

注意啟動叢集之前需要做如下步驟

1、格式化zkfc

hdfs zkfc -formatZK

2、啟動journalnode

hadoop-daemon.sh start journalnode

3、在hadoop1上格式化namenode

命令：/opt/hadoop-3.0.0/bin/hadoop namenode -format

4、將hadoop1上格式化後的namenode元資料資訊複製到hadoop2、hadoop3這兩臺namenode上

scp -r /opt/hadoop-3.0.0/datas/namenode/* hadoop2:/op/opt/hadoop-3.0.0/datas/namenode/

scp -r /opt/hadoop-3.0.0/datas/namenode/* hadoop3:/op/opt/hadoop-3.0.0/datas/namenode/

5、執行以上兩步後現在可以啟動hadoop叢集了

在啟動hdfs叢集之前，先關閉之前已經啟動的journalnode

啟動hdfs叢集：/opt/hadoop-3.0.0/sbin/start-dfs.sh

6、驗證hdfs是否啟動成功

分別訪問：

都能訪問說明安裝成功了。需要注意三臺namenode的狀態。

7、注意事項

hadoop3.0的許多埠已經發生了變化，詳細如下：

Namenode 埠:

50470 --> 9871

50070 --> 9870

8020 --> 9820

Secondary NN 埠:

50091 --> 9869

50090 --> 9868

Datanode 埠:

50020 --> 9867

50010 --> 9866

50475 --> 9865

50075 --> 9864

Hadoop3.0叢集安裝（包含HDFS HA配置）

hadoop3.0出來了，想嘗試一下新版本的特性及mapreduce效能提升，以下以6臺機器作為hadoop叢集，機器主機名為：hadoop1、hadoop2、hadoop3、hadoop4、hadoop5、hadoop6，其中hadoop1-3作為namenode節點，ha

大數據【二】HDFS部署及文件讀寫（包含eclipse hadoop配置）

throw 大數據我的電腦 ssh 生效 manager 方法 slave .sh 一　　原理闡述 1‘　　DFS 　　　　分布式文件系統（即DFS，Distributed File System），指文件系統管理的物理存儲資源不一定直接連接在本地節點上，而是通過計算機網

kubernetes1.9用kubeadm安裝（包含calico、dashboard）

基礎環境關閉防火牆 selinux 1 2 $ systemctl stop firewalld && systemctl disable firewalld $ setenforce 0

rabbitMQ叢集安裝（單機器多例項）

一、緣由因為資源的有限等原因，可能無法使用多個機器來搭建叢集，所以需要使用在一臺機器上搭建一個多例項rabbitMQ服務節點。二、操作 1、前期準備

Flink 本地模式安裝配置（包含java環境配置）

一、JDK安裝配置： 1.先從Oracle官網下載JDK。根據自己的系統下載相應版本。我下載的是***.tar.gz 具體忘了 2.建立一個目錄/usr/lib/jvm以便於把下載解壓後的包放到這個目錄下命令：sudo mkdir /usr/

jekins安裝（包含maven和git）

Jenkins安裝及使用（CentOS6.5） 2016年08月20日 10:02:51 閱讀數：14678 前置條件安裝jdk1.7或以上版本安裝git 安裝maven 安裝新增Jenkins庫到yum庫，Jenkins將從這裡下載安裝。 sudo w

Android友盟統計的整合與使用（包含多渠道打包配置）

前言app上線後，一般公司都希望跟蹤app在市場上的使用情況。包括新增使用者、活躍使用者、渠道資訊、錯誤資訊等，還有例如商城類的app，需要跟蹤使用者最喜歡瀏覽哪種型別的店鋪或商品。這些都可以通過整合友盟統計來輕鬆實現。（小提示：由於截的都是大圖，在簡書顯示比較模糊，需要檢視清晰圖片則滑鼠點選圖片放大即可）整

AIX 7安裝11.2.0.4 RAC-（主機名大寫坑）

RAC 主機名大寫報錯在我們安裝Oracle RAC的時候，要求操作系統的主機名都要小寫，8個字符以內，不要使用下劃線，不然我們在配置互信驗證的時候是無法通過的，在配置EMCC的時候也可能有問題。 AIX + 11G RAC 手動配置互信分別在grid用戶和oracle用戶下執行 $ ./sshsetu

Storm-0.10.0叢集安裝

一、環境兩臺虛擬機器，ubuntu-14.04.3 二、關閉防火牆，配置hosts [email protected]:~# cat /etc/hosts 127.0.0.1 localhost 127.0.1.1 ubuntu 192.168.254.130 sto

Elasticsearch5.4.0叢集安裝IK分詞器

1、ik分詞器下載地址：https://github.com/medcl/elasticsearch-analysis-ik/releases?after=v5.5.3 注意：一定要下載和自己es版本匹配的ik分詞器 2、解壓elasticsearch

Spark的低成本安裝（win） and 三節點叢集安裝（linux）

我這裡給出兩種安裝spark的方式，一種是在win上安裝另一種就是在linux叢集上安裝，前一種安裝方式是一種低成本的安裝沒有shell介面，非常適合入過門的小白練習自己對spark的業務處理能力，而且這種安裝方式能對電腦省去一大筆的cpu所以個人比較喜歡，第二種安裝方式就是和之前安裝hadoo

spark-2.2.0 叢集安裝部署以及hadoop叢集部署

Spark在生產環境中，主要部署在安裝Linux系統的叢集中。在linux系統中安裝Spark需要預先安裝JDK、Scala等所需要的依賴。由於Spark是計算框架，所以需要預先在叢集內有搭建好儲存資料的持久化層，如HDFS、Hive、Cassandra等，最後可以通過啟動指令碼執行應用。

Hive 2.1.0叢集安裝

Hive 2.1.0叢集安裝 1.配置伺服器 1個主節點：master(192.168.20.191)，2個（從）子節點， node1(192.168.20.192)， node2(192.168.20.193) 2.將jdbc的jar包放到$HIVE_HOME下 cd

SQL追蹤器phpgjx2.0版本安裝（一）

SQL追蹤器phpgjx2.0版本安裝本文章主要解決在和資料庫打交道時，除錯資料庫成為佔據程式設計師開發時間的累贅，該神奇能夠實時顯示每一步對資料庫的操作，然後發現問題並定位，大量節約程式設計師的開發時間。先上圖感受一下：該程式本質是一個基於php編寫的，

微信小遊戲——MySQL 8.0 資料庫安裝（windows server）

因為做微信小遊戲，需要統計一些玩家資訊，並且需要實現一個排位演算法，思來想去想了一個解決方案。新買了一個伺服器，裡面的環境基本為空，需要安裝資料庫。再資料庫的選擇上，我也是犯了難。首先，node.js是支援很多種資料庫的，我專欄裡也有發教程。

redis3.0.0 叢集安裝與整理總結

叢集搭建 http://blog.csdn.net/xu470438000/article/details/42971091 redis window安裝與使用遠端連線 1) 預設無許可權控制：遠端服務連線： $ redis-cli -h 127.0.0.1

【Spark】Ubuntu16.04 spark 叢集安裝（standalone模式）

一、前言目前 Apache Spark 支援三種分散式部署方式，分別是： standalone spark on mesos spark on YARN 其中，第一種類似於MapReduce 1.0所採用的模式，內部實現了容錯性和資源管理，後兩種則是未來發

redis之 3.0叢集安裝

1. 叢集即使有了主從複製，每個資料庫都要儲存整個叢集中的所有資料，容易形成木桶效應。使用Jedis實現了分片叢集，是由客戶端控制哪些key資料儲存到哪個資料庫中，如果在水平擴容時就必須手動進行資料遷移，而且需要將整個叢集停止服務，這樣做非常不好的。 Red

centos7 hadoop HA高可用叢集搭建（ hadoop2.7 zookeeper3.4 ）

目錄七、總結上篇文章寫了如何用ssh免密登入，當然這些操作都是在hadoop賬號上的操作，包括這篇文章也是一樣三臺主機一、伺服器環境主機名 IP 使用者名稱密碼安裝目錄 node1 192.168.31.

搭建kubernetes叢集詳細步驟（包含所有映象資源）

搭建kubernetes叢集準備工作：搭建k8s叢集之前首先準備好≥3臺的機器並做好免密登陸 ssh-keygen -t rsa ssh-copy-id -i ~/.ssh/id_rsa.pub <各node節點IP> 設定好主機名和時間同步

Hadoop3.0叢集安裝（包含HDFS HA配置）

相關推薦