Hadoop虛擬機器叢集搭建及配置詳解

阿新 • • 發佈：2018-12-31

配置步驟

1.新建Linux虛擬機器
2.安裝jdk，獲得root許可權
3.安裝成功後複製兩個虛擬機器，分別分別命名master、slave1、slave2
4.將三個虛擬機器相互連通，配置SSH無金鑰登入
5.在master中配置Hadoop環境，配置好將配置好的hadoop檔案複製到slave1、slave2中
6.啟動叢集並輸入jps檢視叢集情況

Hadoop配置檔案詳解

hadoop-env.sh

新增jdk的路徑，設定java主目錄

yarn-env.sh

設定不同的日誌檔案位置

Mapred-env.sh

設定用於各種守護程序的jvm選項

core-site.xml

common屬性配置

hadoop-tmp-dir

設定其他所有臨時目錄的根目錄，如果hdfs-site.xml中不配置namenode和datanode的存放位置，預設就放在這個路徑中

<property>
        <name>hadoop.tmp.dir</name>
        <value>/home/wxx/hadoop/tmp</value>
</property>

fs.default.name

 這是一個描述叢集中NameNode結點的URI(包括協議、主機名稱、埠號)，叢集裡面的每一臺機器都需要知道NameNode的地址。DataNode結點會先在NameNode上註冊，這樣它們的資料才可以被使用。獨立的客戶端程式通過這個URI跟DataNode互動，以取得檔案的塊列表。

<property>
        <name>fs.default.name</name>
        <value>hdfs://master:9000</value>
        <final>true</final>
    </property>

hdfs-site.xml

HDFS屬性配置

dfs.namenode.name.dir

NameNode持久儲存名字空間及事務日誌的本地檔案系統路徑

<property>
   <name>dfs.namenode.name.dir</name 
>
   <value>file:/home/wxx/hadoop/dfs/name</value>
   <final>true</final>
</property>

dfs.datanode.data.dir

DataNode存放塊資料的本地檔案系統路徑

<property>
   <name>dfs.datanode.data.dir</name>
   <value>file:/home/wxx/hadoop/dfs/data</value>
   <final>true</final>
</property>

dfs.replication

資料需要備份的數量，預設是3，如果此數大於叢集的機器數會出錯。

<property>
   <name>dfs.replication</name>
   <value>2</value>
</property>

mapred-site.xml

MapReduce屬性配置

mapreduce.framework.name

決定MapReduce作業是交到YARN叢集還是使用本地作業執行器來執行，合法值為yarn或local

mapreduce.jobhistory.address

job歷史檔案儲存路徑

mapreduce.jobhistory.webapp.address

job歷史檔案webapp儲存路徑

<property>
    <name>mapreduce.framework.name</name>
    <value>yarn</value>
</property>
<property>
    <name>mapreduce.jobhistory.address</name>
    <value>master:10020</value>
</property>
<property>
    <name>mapreduce.jobhistory.webapp.address</name>
    <value>master:19888</value>
</property>

masters

設定主從

master

slaves

master
slave1
slave2

Hadoop虛擬機器叢集搭建及配置詳解

配置步驟 1.新建Linux虛擬機器 2.安裝jdk，獲得root許可權 3.安裝成功後複製兩個虛擬機器，分別分別命名master、slave1、slave2 4.將三個虛擬機器相互連通，配置SSH無金鑰登入 5.在master中配置Hadoop環境，配置

[Kafka] Apache Kafka 簡介、叢集搭建及配置詳解

前言 kafka是一種高吞吐量的分散式釋出訂閱訊息系統，它可以處理消費者規模的網站中的所有動作流資料。這種動作（網頁瀏覽，搜尋和其他使用者的行動）是在現代網路上的許多社會功能的一個關鍵因素。這些資料通常是由於吞吐量的要求而通過處理日誌和日誌聚合來解決。 Kafk

hadoop偽分散式叢集搭建及配置記錄

如果已經走到了需要搭建hadoop偽分散式的環境了，那說明你至少做好了以下三點建立好了自己的虛擬機器，ip、本機名對映、防火牆、安全子系統都已經配置好了下載jdk1.7及以上版本，並配置好了java環境下載hadoop2.7.0及以上版本，並解壓到、opt/modules（自

JAVA虛擬機器動態連線及分派詳解

為什麼要將動態連線和分派放在一起講？大家看完後面的內容這個問題迎刃而解了。動態連線概括定義每個棧幀都儲存了一個可以指向當前方法所在類的執行時常量池，目的是當方法中需要呼叫其它方法的時候能夠從執行時常量池中找到對應的符號引用, 然後將符號引用轉換為直接引

Zookeeper叢集搭建（配置詳解）

軟體環境準備: Linux伺服器一臺、三臺、五臺（2*n+1臺）；Java jdk 1.7；zookeeper 3.4.6版；軟體安裝：解壓jdk、zookeeper檔案到指定目錄，執行命令tar -zvxf xxxx.tar.gz -C /usr/local/pro

零基礎配置Hadoop叢集——Ambari安裝及配置詳解

1. 準備工作 1.1. 系統環境主機列表： IP地址 HostName 描述 192.168.610.153 ambari.server Ambari伺服器 192.168.10.152 hadoop.namenode Hadoop NameN

Redis-Cluster叢集搭建及配置

前言在上一篇文章中隊redis進行了簡單的介紹和安裝,在這一篇文章中進行一個redis-Cluster的叢集搭建。 Redis-Cluster介紹 redis-cluster架構設計架構細節: (1)所有的redis節點彼此互聯(PIN

虛擬機器的安裝及配置等

下載vmware 移除無用的安裝前要檢查橋接模式是否使用的是正確的驅動、安裝啟動要開啟網路連線安裝成功後配置靜態固定IP 橋接模式網路配置 1、配置ip地址等資訊在/etc/sy

hadoop的三種執行模式區別及配置詳解

基於hadoop進行開發時，有時候，會被hadoop的三種執行模式搞混，也會被hadoop叢集有哪些配置弄得暈頭轉向，因為看不同的文件有不同的配置方法。所以要先弄明白hadoop的執行模

【Spring】Spring MVC原理及配置詳解

進行 return sub sca scrip uil 線程安全松耦合必須 1.Spring MVC概述： Spring MVC是Spring提供的一個強大而靈活的web框架。借助於註解，Spring MVC提供了幾乎是POJO的開發模式，使得控制器的開發和測試更加簡

緩存varnish的管理及配置詳解

啟動一個 hint 單位 quad spec int rom try 一工作原理在當前主流的Web服務架構體系中，Cache擔任著越來越重要的作用。常見的基於瀏覽器的C/S架構，Web Cache更是節約服務器資源的關鍵。而最近幾年由FreeBSD創始人之一Kamp開

web緩存服務器varnish-4.1.6的部署及配置詳解

是否次數 tool 至少 hits 檢查 rep nat list web緩存服務器varnish-4.1.6的部署及配置詳解 1.安裝varnish4.1.6安裝依賴 yum install -y autoconf automake jemalloc-devel li

CentOS 6.x上搭建vSFTPD服務器搭建與配置詳解

服務器故障排查運維 vsftpd 摘要：手把手教你搭建vsftpd服務器，實現了基於db文件和MySQL數據庫文件進行虛擬用戶認證，當然了也本文章也包含搭建過程中問題的排查啦，哈哈哈。另外，我在CentOS 7.x上也進行了搭建測試，步驟一致，個別命令會有不

高性能Mysql主從架構的復制原理及配置詳解

應用場景難點要點一行 tar distrib 控制成功實時性 1 復制概述 Mysql內建的復制功能是構建大型，高性能應用程序的基礎。將Mysql的數據分布到多個系統上去，這種分布的機制，是通過將Mysql的某一臺主機的數據復制到其它主機（slaves

Spring MVC原理及配置詳解

對象 classpath oca entity attribute nco conf nal spring Spring MVC原理及配置 1.Spring MVC概述： Spring MVC是Spring提供的一個強大而靈活的web框架。借助於註解，Spring MVC提

日誌組件slf4j介紹及配置詳解

utf 字段 als itl -- owa 輸出結果 apt 查找 1 基本介紹每一個Java程序員都知道日誌對於任何一個Java應用程序尤其是服務端程序是至關重要的，而很多程序員也已經熟悉各種不同的日誌庫，如java.util.logging、Apache log4j、

Linux安裝vsftpd及配置詳解

技術第一個 config vpd b2c 大端工具端口修改系統 1 安裝vsftpd組件安裝完後，有/etc/vsftpd/vsftpd.conf 文件，是vsftp的配置文件。[root@bogon ~]# yum -y install vsftpd 2、FTP

正向代理/反向代理理解、Nginx概述、安裝及配置詳解

隊列選擇 pat 傳輸 name 每天介紹 ade access 一、Nginx概述　　nginx是一款自由的、開源的、高性能的HTTP服務器和反向代理服務器；同時也是一個IMAP、POP3、SMTP代理服務器；nginx可以作為一個HTTP服務器進行網站的發布處理，

Nginx安裝及配置詳解包括windows環境

conn windows系統 toolbar param node rev spa fault 證書 nginx概述 nginx是一款自由的、開源的、高性能的HTTP服務器和反向代理服務器；同時也是一個IMAP、POP3、SMTP代理服務器；nginx可以作為一個HTTP服

Linux 內核編譯步驟及配置詳解

crc校驗內存管理 tools 內核空間 -m 2.6 系統腳本查看 linux 系統體系結構： linux kernel體系結構：arm有7種工作模式，x86也實現了4個不同級別RING0-RING3,RING0級別最高，這樣linux用戶代碼運行在RING3

Hadoop虛擬機器叢集搭建及配置詳解

配置步驟

Hadoop配置檔案詳解

hadoop-env.sh

yarn-env.sh

Mapred-env.sh

core-site.xml

hadoop-tmp-dir

fs.default.name

hdfs-site.xml

dfs.namenode.name.dir

dfs.datanode.data.dir

dfs.replication

mapred-site.xml

mapreduce.framework.name

mapreduce.jobhistory.address

mapreduce.jobhistory.webapp.address

masters

slaves

相關推薦