用虛擬機器簡單搭建一個hadoop叢集（Linux）

阿新 • • 發佈：2018-12-17

一，前提

1. 安裝好一臺Linux的虛擬機器（我用的純粹的黑框框）
2. 修改好IP地址並安裝jdk (我這裡安裝的是1.8版本的)
- vi /etc/sysconfig/network-scripts/ifcfg-eth0
- 重啟網路生效
  service network restart
- jdk的安裝參考網上記得改環境配置
- vi /etc/profile
  export JAVA_HOME=/usr/local/jdkxxx...
  export PATH=$PATH:$JAVA_HOME/bin
3. 克隆2--3臺虛擬機器
4.修改虛擬機器的名字以及ip 地址
- ip地址 vi /etc/sysconfig/network-scripts/ifcfg-eth0
- 以及 vi /etc/udev/rules.d/70----n
- 刪除eth0 將eth1修改為eth0
- 虛擬機器名字：永久的修改 vi /etc/hosts/（reboot後才有效)
5.ssh
- ssh客戶端 yum install openssh-clients
  
  ssh登陸，scp傳送檔案
  scp -r /etc/hosts bigdata3803:/etc/
- (不懂請上網查ssh)

二，正式安裝

1.關閉防火牆
2hosts對映

windows和linux都4需要做

Windows: C/windows/system32/drvers/etc

Linux :vi/etc/hosts

鵬哥寫的ssh的指令碼

安裝hadoop

上傳HADOOP安裝包
規劃安裝目錄 /usr/local/hadoop-2.8.3
解壓安裝包
修改配置檔案 $HADOOP_HOME/etc/hadoop/

最簡化配置如下：（）

注意下面的路徑和虛擬機器名稱是否與正式一直（一定要多檢查）

vi hadoop-env.sh

# The java implementation to use.

export JAVA_HOME=/usr/local/jdk1.8.0_102

vi core-site.xml

Namenode在哪裡，臨時檔案儲存在哪裡

<name>fs.defaultFS</name>

<value>hdfs://hadoop3801:9000</value>

</property>

<name>hadoop.tmp.dir</name>

<value>/usr/local/hadoop-2.7.3/tmp</value>

</property>

</configuration>

vi hdfs-site.xml

<name>dfs.namenode.name.dir</name>

<value>/usr/local/hadoop-2.7.3/data/name</value>

</property>

<name>dfs.datanode.data.dir</name>

<value>/usr/local/hadoop-2.7.3/data/data</value>

</property>

<name>dfs.replication</name>

</property>

<name>dfs.secondary.http.address</name>

<value>hadoop3801:50090</value>

</property>

</configuration>

cp mapred-site.xml.tmp* mapred-site.xml

mapred-site.xml.template

vi mapred-site.xml

<name>mapreduce.framework.name</name>

</property>

</configuration>

vi yarn-site.xml

<name>yarn.resourcemanager.hostname</name>

<value>hadoop3801</value>

</property>

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

</configuration>

vi slaves （把原來的localhost刪掉小心翻車）

Hadoop02

Hadoop03

Hadoop的path（hadoop的環境變數）（注意sbin的配置）

export JAVA_HOME=/usr/local/jdk1.8.0_102
export PATH=$PATH:$JAVA_HOME/bin
export HADOOP_HOME=/usr/local/hadoop-2.7.3
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

把第一臺安裝好的jdk和hadoop以及配置檔案傳送給另外兩臺

hosts檔案

jdk安裝後的資料夾

Hadoop安裝後的資料夾

/etc/profile 檔案

eg:scp -r /usr/local/jdk1.8.0_102 hadoop02:/usr/local/

初始化HDFS(在hadoop01進行操作)（操作一次就ok）

bin/hadoop namenode -format

啟動HDFS

sbin/start-dfs.sh

啟動YARN

sbin/start-yarn.sh

三 .通過網路檢視

用虛擬機器簡單搭建一個hadoop叢集（Linux）

一，前提 1. 安裝好一臺Linux的虛擬機器（我用的純粹的黑框框） 2. 修改好IP地址並安裝jdk (我這裡安裝的是1.8版本的) vi /etc/sysconfig/network-scripts/ifcfg-eth0 重啟網路生效 s

VirtualBox 虛擬機器配置centos6.4 spark叢集（1）--- 環境搭建以及所遇問題

一、前言最近學習spark，就把一些經歷在這裡總結總結。二、所需軟體 VirtualBox 5.1.22 作業系統：centos6.4 CentOS-6.4-x86_64-minimal.iso 一共需要3

從零搭建生產Hadoop叢集（七）——關鍵伺服器雙網絡卡配置

一、概述 Hadoop叢集中，有許多伺服器部署著關鍵例項，如NameNode、ResourceManager、Zookeeper等，這些服務的穩定執行對叢集健康具有重要意義。雖然這些服務基本上都會做多例項高可用部署，但是若連線的是同個交換機，萬一交換機發生故障

從零搭建生產Hadoop叢集（八）——上線與下線資料節點流程

一、概述 Hadoop叢集中，經常需要在不重啟叢集的前提下，動態地上線與下線資料節點，而使用Cloudera Manager管理的叢集，可以很方便地做到這一點，本文將介紹其相關流程。二、節點上線流程 1. 伺服器初始化新節點的硬體配置最好能夠跟原叢集伺服器

從零搭建生產Hadoop叢集（三）——CDH叢集搭建

一、概述繼本系列前兩篇文章講到的離線安裝YUM源搭建及規劃與環境準備，本文開始講述CDH叢集的搭建步驟及注意要點。本文基於CentOS7進行部署，Cloudera Manager版本選擇5.8.1，CDH版本5.8.0。二、硬體檢查與系統配置 1.硬體檢查

用Docker在一臺膝上型電腦上搭建一個具有10個節點7種角色的Hadoop叢集（下）-搭建Hadoop叢集

上篇介紹了快速上手Docker部分，下面接著介紹搭建Hadoop叢集部分。六、搭建Hadoop偽分佈模式我們先用前面建立的這個容器來搭建Hadoop偽分佈模式做測試，測試成功後再搭建完全分散式叢集。1.SSH這個centos容器可以看做是一個非常精簡的系統，很多功能沒有，需要自己安裝。Hado

用Docker在一臺膝上型電腦上搭建一個具有10個節點7種角色的Hadoop叢集（上）-快速上手Docker

如果想在一臺電腦上搭建一個多節點的Hadoop叢集，傳統的方式是使用多個虛擬機器。但這種方式佔用的資源比較多，一臺筆記本能同時執行的虛擬機器的數量是很有限的。這個時候我們可以使用Docker。Docker可以看做是一種輕量級的虛擬機器，佔用資源少，用起來和傳統的虛擬機器很像，使用的時候可以類比VMware或V

Linux虛擬機器上安裝Hadoop叢集（初學）

測試已成功完成安裝的版本 hbase-1.2.6-bin.tar.gz hadoop-2.7.5.tar.gz ubuntu-16.04.3-server-amd64.ios jdk-8u161-linux-x64.tar.gz zookeeper-3

虛擬機器安裝Oracle WebCenter Sites 12c （一）搭建安裝環境，安裝虛擬機器

因為工作原因需要我在虛擬機器上安裝 Oracle Webcenter 12C ，百度上找了很多資料，自己第一次研究安裝，安裝過程中有很多麻煩，為了防止自己以後忘記，也能為了幫助別人，特意記錄下來，希望能有所幫助，記得點贊。安裝 Oracle

《HADOOP實戰（第二版中文》電子書附下載連結+30個總結JVM虛擬機器的技術文排版好（收藏版）

技術書閱讀方法論一.速讀一遍（最好在1~2天內完成）人的大腦記憶力有限，在一天內快速看完一本書會在大腦裡留下深刻印象，對於之後複習以及總結都會有特別好的作用。對於每一章的知識，先閱讀標題，弄懂大概講的是什麼主題，再去快速看一遍，不懂也沒有關係，但是一定要在不懂的

從零搭建Hadoop叢集（一）——離線安裝YUM源搭建

概述 Cloudera版本（Cloudera’s Distribution Including Apache Hadoop，簡稱“CDH”），基於Web的使用者管理介面，支援大部分Hadoop元件，包括HDFS、YARN、Hive、 Hbase、Zookeep

造輪子：搭建一個簡單的nodejs伺服器，從零開始搭建一個自用網站（0）

伺服器用的是阿里雲最早期的伺服器低配版本1Gcpu，512M記憶體，20G硬碟，1M頻寬，平常只是用來做測試，目前只處理業務邏輯，網站的設計上儘量避免佔用太多的頻寬，靜態檔案的儲存用的是阿里雲oss，100G空間，夠放視訊，圖片什麼的， html/js/c

AWS上搭建Hadoop叢集（一）——單機安裝Hadoop

課堂專案中實現了在AWS上搭建Hadoop叢集進行資料分析，過程中間不免遇到眾多問題，在此總結以供各位參考。建立EC2例項亞馬遜AWS服務想必大家都有所瞭解，這裡略過註冊過程（為了拿student credit還是花了一番功夫）。在EC2的介面上，

用java搭建一個分散式伺服器（一）

本專欄主要介紹如何用java實現一個小型分散式（單機多程序模式）伺服器，希望能給剛開始學分散式的朋友一些幫助。講得不對的地方歡迎在評論區指出。用到的主要技術棧： netty 網路傳輸框架 spring-boot java網路程式設計 Java多執行緒

用Vue搭建一個應用盒子（二）：datetime-picker

接著上次的進度，我們已經實現了一個todo-list。它已經具備了基本的功能，可以新建、編輯、刪除任務。但是美中不足的是，它的時間設定上只能通過輸入一段字串來設定，很不社會。我們應該完成的效果是一個time-picker，日期選擇器。本來打算

阿里雲ECS伺服器部署HADOOP叢集（一）：Hadoop完全分散式叢集環境搭建

準備：兩臺配置CentOS 7.3的阿里雲ECS伺服器； hadoop-2.7.3.tar.gz安裝包； jdk-8u77-linux-x64.tar.gz安裝包； hostname及IP的配置：更改主機名：由於系統為CentOS 7，可以直接使用‘hostnamectl set-hostname 主機

如何搭建一個web網站（一）

團隊合作是的轉換們的 web服務 ons lang 用戶域名前言：由於新生軍訓結束，作為學生會的一個技術部的老油條，這時候得幫幫他們了。大多數新生都是奔著能做一些小東西，能夠被大家，被其他人用，為目的進入了技術部，部門主要負責做院系微信運營，順帶做開發。前兩任

java虛擬機器(第二版) 第二章總結（三）-手工復現java虛擬機器記憶體溢位(OutOfMemoryError異常)

文章概述的java虛擬機器記憶體溢位的簡要概述，復現堆記憶體，棧記憶體，方法區的執行時常量池記憶體等區域的溢位情況，以及上述區域發生記憶體溢位的判斷方式和解決思路。 1，概述： IDE為eclipse，需要在執

java虛擬機器(第二版) 第二章總結（二）

本文總結下java虛擬機器的第二章的第三小節 1、（原文2.3）HotSpot虛擬機器物件探祕文中以HotSpot虛擬機器為例，講述了java物件的建立以及訪問。當我們寫的new關鍵字被虛擬機器執行時： <

java虛擬機器(第二版) 第二章總結（一）

本文主要是up主閱讀java虛擬機器(第二版) 第二章總結的總結，因為第一章主要講了java體系的過去和展望，故就暫時總結了，感興趣的可以閱讀原書。另外推薦看原書，原書對我總結的知識有更細緻的解讀。眾所周知，java虛擬機器對記憶體的自動管理，讓java程式設計師少了好多手動管理記憶

用虛擬機器簡單搭建一個hadoop叢集（Linux）

二，正式安裝

1.關閉防火牆

2hosts對映

安裝hadoop

注意下面的路徑和虛擬機器名稱是否與正式一直 （一定要多檢查）

相關推薦

注意下面的路徑和虛擬機器名稱是否與正式一直（一定要多檢查）