Centos 7 安裝Hadoop 3.0.0-alpha1

阿新 • • 發佈：2019-02-03

簡介:

本文主要介紹如何安裝和配置單節點Hadoop，運用Hadoop MapReduce和Hadoop分散式檔案系統（HDFS）執行一些簡單的操作。算是一個入門級的文件吧。hadoop 安裝三種模式
1. 單機
2. 偽分散式
3. 分散式

前提

支援的平臺

GNU / Linux的支援作為開發和應用的平臺。Hadoop已經證明在GNU / Linux叢集中可以支援2000個節點。

Windows 平臺不做介紹。

依賴的軟體

1. JDK
2. ssh

作業系統: CentOS-7-x86_64
使用者 : root

安裝JDK

將安裝包解壓到/usr/java/latest目錄下面，設定環境變數

vi ~/.bash_profile
export JAVA_HOME=/usr/java/latest/jdk1.8.0_101
export PATH=$JAVA_HOME/bin:$PATH

配置ssh免密碼登入

  $ yum install ssh
  $ ssh-keygen -t rsa -P '' -f ~/.ssh/id_rsa
  $ cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys
  $ chmod 0600 ~/.ssh/authorized_keys

安裝hadoop-3.0.0-alpha1

將安裝包解壓到 /root/hadoop目錄下

tar -xzvf hadoop-3.0.0-alpha1.tar.gz

設定環境變數

export HADOOP_HOME=/root/hadoop/hadoop-3.0.0-alpha1
PATH=$JAVA_HOME/bin:$PATH:$HOME/bin:$HADOOP_HOME/bin

使環境變數生效. ~/.bash_profile

Standalone Operation

預設情況下，Hadoop常常配置為偽分散式模式，作為一個單獨的java程式來除錯。下面的示例是將開啟conf目錄使用作為輸入，然後查詢並顯示每一個匹配正則表示式的檔案。

  $ mkdir input
  $ cp etc/hadoop/*.xml input
  $ bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-3.0.0-alpha1.jar grep input output 'dfs[a-z.]+'
  $ cat output/*

Pseudo-Distributed Operation 偽分散式操作

Hadoop可以執行在一個偽分佈模式，每個Hadoop守護程序執行在一個單獨的java程式的一個節點。

etc/hadoop/core-site.xml:

<configuration>
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://localhost:9000</value>
    </property>
</configuration>

etc/hadoop/hdfs-site.xml:

<configuration>
    <property>
        <name>dfs.replication</name>
    <value>1</value>
    </property>
</configuration>

YARN on a Single Node 單節點Yarn

etc/hadoop/mapred-site.xml:

<configuration>
    <property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
    </property>
    <property>
        <name>mapreduce.admin.user.env</name>
        <value>HADOOP_MAPRED_HOME=$HADOOP_COMMON_HOME</value>
    </property>
    <property>
        <name>yarn.app.mapreduce.am.env</name>
        <value>HADOOP_MAPRED_HOME=$HADOOP_COMMON_HOME</value>
    </property>
</configuration>

etc/hadoop/yarn-site.xml:

<configuration>
    <property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
    </property>
</configuration>

啟動停止Hadoop

1. Format the filesystem:
 $ bin/hdfs namenode -format
2. Start NameNode daemon and DataNode daemon:
 $ sbin/start-dfs.sh
3. Browse the web interface for the NameNode; by default it is available at:
    NameNode - http://localhost:9870/
4. Start ResourceManager daemon and NodeManager daemon:
    $ sbin/start-yarn.sh
5. Browse the web interface for the ResourceManager; by default it is available at:
    ResourceManager - http://localhost:8088/

  停止hadoop
  $ sbin/stop-dfs.sh
  $ sbin/stop-yarn.sh

 檢視程序命令
 jps

這裡寫圖片描述

參考文件：

Centos 7 安裝Hadoop 3.0.0-alpha1

簡介: 本文主要介紹如何安裝和配置單節點Hadoop，運用Hadoop MapReduce和Hadoop分散式檔案系統（HDFS）執行一些簡單的操作。算是一個入門級的文件吧。hadoop 安裝三種模式 1. 單機 2. 偽分散式 3. 分散式前提

CentOS 7安裝Hadoop 3.0.0

new eno oot 更新 ron 去掉網上服務器 keyword 最近在學習大數據，需要安裝Hadoop，自己弄了好久，最後終於弄好了。網上也有很多文章關於安裝Hadoop的，但總會遇到一些問題，所以把在CentOS 7安裝Hadoop 3.0.0的整個過程記錄下來

CentOS 7部署Hive 3.1.0

一、環境軟體版本 Hadoop 3.1.1 Hive 3.1.0 MySQL 8.0.11 JDK 1.8 二、安裝Hive Hive只要在一臺Hadoop叢集的伺服器上安裝即可，安裝到/usr/local/hive目錄下。

Centos單機安裝hadoop-2.6.0-cdh5.8.5 jdk1.8.0_131

一，安裝JDK 安裝JDK1.6或者以上版本。這裡安裝jdk1.6.0_45。下載地址：http://www.oracle.com/technetwork/java/javase/downloads/index.html 1，下載jdk1.6.0_45-linux-

CentOS 7 安裝 Oracle 11.2.0.4

一、安裝環境 CentOS Linux release 7.2.1511 (Core) Oracle Database 11g Release 2 (11.2.0.4) 二、安裝前準備 2.1 修改主機名修改/etc/sysconfig/network配置檔案中的HOSTNAME變數 [[e

centos 7 安裝rabbitmq 3.6.12

c-c ble ack 1.0 web span bin targe erl 1 安裝erlang （1）更新erlang倉庫 wget http://packages.erlang-solutions.com/erlang-solutions-1.0-1

CentOS 7 安裝zabbix 3.4

oss 51cto process lin water zab web har utf 說明 zabbix是一個開源的監控工具，能實現對硬件，系統，應用，網絡等的監控；為什麽要監控在需要的時刻，提前提醒我們服務器出問題了當出問題之後，可以找到問題的根源網站/服務器的

CentOS 7安裝Zabbix 3.4

mysql 參數 pos war res cat 原則比例圖片 gda Zabbix 3.4 支持Centos 7。貌似不支持6.9. 更多詳細內容請參考官方說明文檔，詳細的安裝要求不貼出來了。 https://www.zabbix.com/documentation/

Centos 7安裝RabbitMQ 3.7.8版本(單機版)

RabbitMQ是目前非常熱門的訊息中介軟體，憑藉其高可靠、高擴充套件、高可用及豐富的功能特性：TTL、死信佇列、延遲佇列、優先順序佇列、訊息持久化、映象佇列。訊息中介軟體是指利用高效可靠的訊息傳遞機制進行與平臺無關的資料交流，並基於資料通訊來進行分散式系統的整合，能在不同平臺之間進行通訊，常

VirtualBox centos 7 安裝hadoop

首先確保ssh已安裝，如果沒有安裝執行yum install ssh 然後執行ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa生成祕鑰這裡用的hadoop2.8.5，下載.tar.gz檔案上傳到虛擬機器上，如何將主機檔案上傳到VritualBox已經有了充分的說

Centos 7 安裝Hadoop叢集

Hadoop學習筆記 1. 準備工作 1.1 虛擬機器安裝jdk 準備3臺centos7的虛擬機器配置jdk 按照連結裡安裝的虛擬機器為最小虛擬機器,裡面並未安裝jdk 安裝jdk yum install java-1.8.0-openjdk*

RabbitMQ 3.6.1 升級至 3.7.9 版本(Windows 升級至Centos) centos安裝RabbitMQ 3.7.9 (使用RPM) Centos 7安裝RabbitMQ 3.7.8版本(單機版)-不使用RPM

隨著公司業務量的增加，原本部署在Windows伺服器的RabbitMQ叢集(3.6.1)總是出現莫名其妙的問題,經查詢官方Issue，確認是RabbitMQ 3.6.1 版本的bug。檢視從3.6.1 版本至 3.7.9 版本的變更日誌，可以發現RabbitMQ官方修復了不少bug

CentOS 7 安裝 Python 3.6

CentOS7系統自帶的Python版本是Python2.7，如需使用Python3.6，需要自行安裝Python3.6。 CentOS7安裝Python3.6有兩種方式：使用Yum源安裝Python3.6 1.安裝IUS軟體源 #安裝EPEL依賴 sudo yum

01.centos 7 安裝 python 3.7.1

make download orm gdbm python2 usr b- ncurses 查看 centos 7 安裝 python 3.7.1 https://www.python.org/downloads/source/ 在官網上下載 Python-3.7.1.ta

CentOS 7安裝 Redis 3.2.x(單機)

一、準備操作： 1、先安裝虛擬機器，這裡已安裝VmWare14.x； 2、安裝Linux作業系統，這裡安裝了CentOS7，另：確認已安裝rz/sz命令，如果沒有，執行：yum install lrzsz 即可； 3、下載Redis，在官網下載，這裡用的是Redis3.

CentOS 7 安裝python 3

centos7預設安裝的是Python2，而且這個Python2不能被刪除，因為有很多系統命令，比如yum都要用到。 1. 檢視當前python版本輸入Python命令，可以得知是Python2.7.5版本 [[email protec

centos 7安裝glusterfs 3.10

對第2個硬碟進行分割槽，只建立1個主分割槽： fdisk /dev/sdb 建立檔案系統： mkfs.xfs -i size=512 -n size=8192 /dev/sdb1 掛載檔案系統： mkdir -p /export/sdb1 && mount /dev/sdb1 /export/

CentOS 7安裝OpenVPN，新版本easy-rsa 3.0配置

一、安裝openvpn 1.更新軟體包 yum -y update 2.安裝openvpn和easy-rsa yum -y install openvpn easy-rsa 3.複製easy-rsa檔案 [[email protected]

vmware + centos 7安裝vmtools時提示The path "" is not a valid path to the 3.10.0-327.el7.x86_64 kernel h

Searching for a valid kernel header path... The path "" is not a valid path to the 3.10.0-327.el7.x86

centos 7 安裝Oracle Database 11g Release 2 (11.2.0.4)

network 永久 oinstall ima play arc glibc lpad tails 參考文章： http://www.cnblogs.com/lightnear/archive/2012/10/07/2714247.html http://www.cnblo

Centos 7 安裝Hadoop 3.0.0-alpha1

簡介:

前提

安裝JDK

配置ssh免密碼登入

安裝hadoop-3.0.0-alpha1

Standalone Operation

Pseudo-Distributed Operation 偽分散式操作

YARN on a Single Node 單節點Yarn

啟動停止Hadoop

參考文件：

相關推薦