hadoop叢集搭建（docker）

阿新 • • 發佈：2018-11-09

背景

　　　　目前在一家快遞公司工作，因專案需要，對大資料平臺做個深入的瞭解。工欲利其器必先利其器，在網上找了許多教程，然後自己搭建一個本地的環境並記錄下來，增加一些印象。

環境搭建

1）Ubuntu

docker pull ubuntu:16.04

docker images

docker run -ti ubuntu:16.04

系統執行後，安裝一些小工具

# apt update

//weget

# apt-get install wget

//ifconfig

# apt-get install net-tools

//ping

# apt-get install iputils-ping

//vim

# apt-get install vim

# exit

# docker commit -m “wget net-tools iputils-ping vim install” 864c90fe3ebb ubutun:tools

2）Java

apt-get install software-properties-common python-software-properties

add-apt-repository ppa:webupd8team/java

apt-get install oracle-java8-installer

vim ~/.bashrc

export JAVA_HOME=/usr/lib/jvm/java-8-oracle

# source ~/.bashrc

# java -version

使用docker commit儲存一個副本

3）Hadoop

# cd ~

# mkdir soft

# cd soft

# mkdir apache

# cd apache

# wget https://mirrors.tuna.tsinghua.edu.cn/apache/hadoop/common/hadoop-2.7.6/hadoop-2.7.6.tar.gz

# tar -zxvf hadoop-2.7.6.tar.gz

配置hadoop環境變數

# vim ~/.bashrc

1 export HADOOP_HOME=/root/soft/apache/hadoop/hadoop-2.7.6
2 
3 export HADOOP_CONFIG_HOME=$HADOOP_HOME/etc/hadoop
4 
5 export PATH=$PATH:$HADOOP_HOME/bin
6 
7 export PATH=$PATH:$HADOOP_HOME/bin

建立tmp、NameNode、DataNode目錄

tmp是hadoop的臨時儲存目錄

NameNode是檔案系統的管理節點

DataNode是提供真實檔案資料的儲存服務

# cd $HADOOP_HOME/

# mkdir tmp

# mkdir namenode

# mkdir datanode

# cd $HADOOP_CONFIG_HOME/

# cp mapred-site.xml.template mapred-site.xml

# vim mapred-site.xml

<configuration>

 <property>

        <name>mapred.job.tracker</name>

        <value>master:9001</value>

        <description>The host and port that the MapReduce job tracker runs

        at.  If "local", then jobs are run in-process as a single map

        and reduce task.

        </description>

    </property>

</configuration>

# vim core-site.xml

<configuration>

  <property>

            <name>hadoop.tmp.dir</name>

            <value>/root/soft/apache/hadoop/hadoop-2.7.6/tmp</value>

            <description>A base for other temporary directories.</description>

    </property>

 

    <property>

            <name>fs.default.name</name>

            <value>hdfs://master:9000</value>

            <final>true</final>

            <description>The name of the default file system.  A URI whose

            scheme and authority determine the FileSystem implementation.  The

            uri's scheme determines the config property (fs.SCHEME.impl) naming

            the FileSystem implementation class.  The uri's authority is used to

            determine the host, port, etc. for a filesystem.</description>

    </property>

</configuration>

# vim hdfs-site.xml

<configuration>

 <property>

        <name>dfs.replication</name>

        <value>2</value>

        <final>true</final>

        <description>Default block replication.

        The actual number of replications can be specified when the file is created.

        The default is used if replication is not specified in create time.

        </description>

    </property>

 

    <property>

        <name>dfs.namenode.name.dir</name>

        <value>/root/soft/apache/hadoop/hadoop-2.7.6/namenode</value>

        <final>true</final>

    </property>

 

    <property>

        <name>dfs.datanode.data.dir</name>

        <value>/root/soft/apache/hadoop/hadoop-2.7.6/datanode</value>

        <final>true</final>

    </property>

</configuration>

#vim hadoop-en.sh

export JAVA_HOME=/usr/lib/jvm/java-8-oracle

#exit

docker commit -m “hadoop install” xxxxx ubuntu:hadoop

4）ssh配置

# apt-get install ssh

# cd ~/

# ssh-keygen -t rsa -P ‘’ -f ‘~/.ssh/id-rsa’

# cd .ssh

# cat is-rsa.pub >> authorized_keys

# service ssh start

#ssh localhost

#exit

docker commit -m “hadoop install” xxxxx ubuntu:hadoop

5）啟動配置

配置好環境，接下來開始啟動

master

#docker run -ti -h master -p 50070:50070 -p 8088:8088 ubuntu:hadoop

配置slaves

# cd $HADOOP_CONFIG_HOME/

# vim slaves

slave1
slave2

slave

#docker run -ti -h slave1

#docker run -ti -h slave2

三個節點都啟動好了，利用ifconfig檢視master、slave1、slave2的ip

#vim/etc/hosts

ip(master) master

ip(slave1) slave1

ip(slave2) slave2

一切都準備好了的時候，就可以切換到hadoop/sbin，開啟hadoop叢集啦

#cd $HADOOP_HOME/sbin/

#./start-all.sh

稍等片刻之後，可以通過http://localhost:50070/，檢視hadoop叢集

hadoop叢集搭建（docker）

背景　　　　目前在一家快遞公司工作，因專案需要，對大資料平臺做個深入的瞭解。工欲利其器必先利其器，在網上找了許多教程，然後自己搭建一個本地的環境並記錄下來，增加一些印象。環境搭建 1）Ubuntu docker pull ubuntu:16.04 docker images&nb

hadoop 叢集搭建（詳細）

hadoop 叢集搭建一、前提準備

HDFS環境搭建（單節點配置） hadoop叢集搭建（hdfs）

【參考文章】：hadoop叢集搭建（hdfs） 1. Hadoop下載　　官網下載地址：　　https://hadoop.apache.org/releases.html，進入官網根據自己需要下載具體的安裝包　　清華大學安裝包的映象檔案下載地址：　　https://mirrors.tuna.

Docker之Hadoop普通叢集搭建（五）

2017-01-08 03:36:29,815 FATAL org.apache.hadoop.hdfs.server.datanode.DataNode: Exception in secureMain java.net.UnknownHostException: 26b72653d296: 26b7265

搭建多個節點的hadoop叢集環境（CDH）

提示：如果還不瞭解Hadoop的，可以下檢視這篇文章Hadoop生態系統，通過這篇文章，我們可以首先大致瞭解Hadoop及Hadoop的生態系統中的工具的使用場景。搭建一個分散式的hadoop叢集環境，下面是詳細步驟，使用cdh5 。一、硬體準備

hadoop叢集搭建（超詳細版）

1.準備好需要安裝的軟體虛擬機器VMware12.pro作業系統CentOS 6.5遠端控制虛擬機器的終端SecureCRT8.12.在虛擬機器中安裝CentOS作業系統安裝好虛擬機器，圖形介面如下圖建立新的虛擬機器，選擇自定義（高階），點選下一步虛擬機器硬體相容性預設，瀏覽

Hadoop叢集搭建（三臺電腦）

電腦的作業系統是Ubuntu12.04 32位，ubuntu-12.04.4-desktop-i386.iso。叢集介紹：三臺電腦的使用者名稱都為hadoop 主機名：master 10.10.6.176 服務機：sl

gitlab私人代碼倉庫搭建（docker）

com 後臺環境 start 掛載網頁 etc 通過 log 一、搭建環境虛擬機EXSI6.7：CentOS7IP：192.168.123.111 二、搭建過程 1、創建容器數據存放位置 mkdir -p /data/docker/data/gitlab/{confi

zookeeper叢集搭建（備忘錄）

安裝步驟：提示：要關閉虛擬機器的防火牆，執行：service iptables stop 1.準備虛擬機器，安裝並配置jdk 我用的是1.8 2.上傳zookeeper的安裝包 3.4.7版本 3.解壓安裝 tar -xvf ………… 4.配置zookeeper。

巡風系統搭建（docker）

docker方式安裝巡風系統【基於CentOS7.6】 # yum update # curl -sSL https://get.docker.com/ | sh # yum install git # cd /usr/local/src # git clone https://github.com/ysr

YARN 高可用（HA）叢集搭建（CDH）

HDFS 高可用叢集安裝完成之後，緊接著快速搞定YARN的叢集搭建。 1.修改YARN配置檔案 1.1修改yarn-site.xml <configuration> <property> <name>yarn.resourcem

centos7下Hadoop2.8.4全分佈搭建之HDFS叢集搭建（一）

1)搭建前的準備注意：（以下操作可以先配置一臺，然後通過scp命令傳送到其他兩臺虛擬機器上傳送到其他機器 scp -r 主機名: 注意:載入環境變數 source /etc/profile

Redis的分散式叢集搭建（windows）----RedisCluster叢集

今天研究了一下redis的叢集搭建,終於成功了，拿來給大家分享一下，希望對大家有幫助。如果需要原始碼和安裝包可以私我。下載redis.進入redis資料夾呢如果沒有redis.conf檔案，就新建一個，並在裡面寫上配置引數：

Redis單機和叢集搭建（筆記）

單機部署 1.下載安裝包 2.解壓安裝 tar -xzvf redis-4.0.1.tar.gz cd redis-4.0.1/ make PREFIX=/usr/local/redis/ install 如果是一般使用者，前面加sudo 3.拷貝配置檔

Linux環境redis叢集搭建（二）叢集維護

叢集維護： 1>叢集新增節點 1、建立兩個redis服務7006和7007，配置檔案與前述一致，注意埠號即可 2、啟動兩個節點，並且檢查redis服務 [[email protected] r7007]# chmod 775 redis-server [[

kubernetes學習：2.kubernetes叢集搭建（一）架構介紹

kubernetes叢集搭建：架構介紹作為一個容器的編排管理工具，k8s的效能出眾而且社群力量強大，連docker官方也已經預設k8s為容器編排的首選工具。所以我們更有必要去學習和了解它。 k8s的整體架構主要分為兩個部分： master（控制節點）和

ZooKeeper叢集搭建（一）：準備工作以及搭建叢集的具體操作

為什麼要做ZooKeeper叢集？ ZooKeeper在Dubbo框架中起著發現服務，服務登出/註冊(動態伸縮)的功能，假如僅有的一臺Zookeeper宕機了，將會造成整個應用的服務呼叫失敗，服務停擺期間所造成的損失不可想象同時Zookeeper也是很

Hadoop2.7.2之叢集搭建（單機）

下載安裝Hadoop 1、下載地址 http://hadoop.apache.org/releases.html 我下載的是2.7.2，官網在2.5之後預設提供的就是64位的，這裡直接下載下來用即可 2、安裝Hadoop tar -

SpringCloud服務註冊中心叢集搭建（二）

springcloud學習總結 2、服務註冊中心叢集搭建一、新建服務註冊中心eureka7002模組，拷貝eureka7001模組的pom以及yml 修改yml檔案 server: port: 7002 eureka: instance: hos

kafka入門：簡介、使用場景、設計原理、主要配置及叢集搭建（轉）

問題導讀： 1.zookeeper在kafka的作用是什麼？ 2.kafka中幾乎不允許對訊息進行“隨機讀寫”的原因是什麼？ 3.kafka叢集consumer和producer狀態資訊是如何儲存的？ 4.partitions設計的目的的根本原因是什麼？一、入門 1、簡介

hadoop叢集搭建（docker）

背景

環境搭建

1）Ubuntu

2）Java

3）Hadoop

4）ssh配置

5）啟動配置

相關推薦