hadoop-hive本地和偽分散式模式的安裝

阿新 • • 發佈：2019-01-20

前言：關於虛擬機器安裝hive,hadoop的資料林林總總,對於初學者很難甄別;

如下是按照官方doc,一步步經過實踐的一種方法,思路比我搜到網上的帖子更清晰；

初學，難免有錯誤的地方，敬請指正。

一、虛擬機器hadoop的安裝

1.虛擬機器安裝linux-redhat作業系統，虛擬機器網路型別設定為網橋模式，保證虛擬機器可以訪問Internet外網

2.安裝jdk：

解壓jdk檔案（我的jdk是jdk1.8.0_05）至某個目錄：如/software下面

#add by clark,20160525

export JAVA_HOME=/software/jdk1.8.0_05

export CLASS_PATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar

export PATH=$PATH:$JAVA_HOME/bin:$JAVA_HOME/jre/bin

3.下載hadoop-2.7.3

[1]安裝wget

Yum install wget

注：yum的配置：

[1]將redhat的安裝ISO映象檔案掛載或者複製到/iso目錄下面

[2]配置yum源,建立ios.repo檔案

[[email protected] yum.repos.d]# vi /etc/yum.repos.d/ios.repo

[ios]

name=ios

baseurl=file:///ios

enabled=1

gpgcheck=0

gpgkey=file:///etc/pki/rpm-gpg/RPM-GPG-KEY-redhat-release

[2]下載hadoop-2.7.3

[3]解壓安裝包

tar -zxvf hadoop-2.7.3.tar.gz 解壓到當前目錄或者其他目錄下面

[4]配置環境變數

echo ‘export HADOOP_HOME=/software/hadoop-2.7.3’ >>/etc/profile

echo ‘export PATH=$PATH:$HADOOP_HOME/bin’>>/etc/profile

4.使用本地模式

[2]測試：

[[email protected] hadoop-2.7.3]# mkdir input

[[email protected] hadoop-2.7.3]# cp etc/hadoop/*.xml input

[[email protected] hadoop-2.7.3]#

bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.3.jar grep input output 'dfs[a-z.]+'

[[email protected] hadoop-2.7.3]# cat output/*

1 dfsadmin

5.使用偽分散式模式

[1]修改etc/hadoop/core-site.xml

[[email protected] hadoop-2.7.3]# tail -n 6 etc/hadoop/core-site.xml

<name>fs.defaultFS</name>

<value>hdfs://localhost:9000</value>

</property>

</configuration>

[2]修改 etc/hadoop/hdfs-site.xml

[[email protected] hadoop-2.7.3]# tail -n 6 etc/hadoop/hdfs-site.xml

<name>dfs.replication</name>

</property>

</configuration>

[3]修改 etc/hadoop/hadoop-env.sh 增加JAVA_HOME

[[email protected] hadoop-2.7.3]# find -name hadoop-env.sh

./etc/hadoop/hadoop-env.sh

[[email protected] hadoop-2.7.3]#

echo "export JAVA_HOME=/software/jdk1.8.0_05" >>etc/hadoop/hadoop-env.sh

注：

如果不配置JAVA_HOME,則執行sbin/start-dfs.sh報錯

Starting namenodes on [localhost]

localhost: Error: JAVA_HOME is not set and could not be found.

[4]配置本身的ssh互信

[[email protected] hadoop-2.7.3]# ssh-keygen -t rsa -P '' -f ~/.ssh/id_rsa

Generating public/private rsa key pair.

Your identification has been saved in /root/.ssh/id_rsa.

Your public key has been saved in /root/.ssh/id_rsa.pub.

The key fingerprint is:

82:c9:b0:f9:3a:0b:e0:4a:ee:e8:ea:df:e4:ee:3d:c4 [email protected]

The key's randomart image is:

+--[ RSA 2048]----+

| |

| . |

| = o |

|. o + o S |

|o . E |

|.o ... |

|=...+ .. |

|O=++o= .. |

+-----------------+

[[email protected] hadoop-2.7.3]# cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys

[[email protected] hadoop-2.7.3]# chmod 0600 ~/.ssh/authorized_keys

[[email protected] hadoop-2.7.3]# ssh localhost

Last login: Sat Oct 15 22:48:35 2016 from localhost

[5]namenode format

[[email protected] hadoop-2.7.3]# hdfs namenode -format

16/10/15 22:52:48 INFO namenode.NameNode: STARTUP_MSG:

/************************************************************

STARTUP_MSG: Starting NameNode

STARTUP_MSG: host = m01/192.168.1.6

STARTUP_MSG: args = [-format]

STARTUP_MSG: version = 2.7.3

[6]啟動hdfs

[[email protected] hadoop-2.7.3]# sbin/start-dfs.sh

Starting namenodes on [localhost]

localhost: starting namenode, logging to /software/hadoop-2.7.3/logs/hadoop-root-namenode-m01.out

localhost: starting datanode, logging to /software/hadoop-2.7.3/logs/hadoop-root-datanode-m01.out

./start-dfs.sh

Starting secondary namenodes [0.0.0.0]

0.0.0.0: starting secondarynamenode, logging to /software/hadoop-2.7.3/logs/hadoop-root-secondarynamenode-m01.out

注：事先修改etc/hadoop/hadoop-env.sh 配置JAVA_HOME環境變數

6.網路瀏覽器檢視hdfs執行情況：

截圖如下：

二、虛擬機器HIVE的安裝

1.首先在虛擬機器上安裝部署好hadoop

2.下載hive:

[[email protected] software]# wget http://mirrors.cnnic.cn/apache/hive/hive-2.1.0/apache-hive-2.1.0-bin.tar.gz

--2016-10-15 23:24:29-- http://mirrors.cnnic.cn/apache/hive/hive-2.1.0/apache-hive-2.1.0-bin.tar.gz

Resolving mirrors.cnnic.cn... 218.241.113.17

Connecting to mirrors.cnnic.cn|218.241.113.17|:80... connected.

HTTP request sent, awaiting response... 200 OK

Length: 149599799 (143M) [application/octet-stream]

Saving to: “apache-hive-2.1.0-bin.tar.gz”

100%[======================================================================================================================>] 149,599,799 2.97M/s in 50s

2016-10-15 23:25:19 (2.87 MB/s) - “apache-hive-2.1.0-bin.tar.gz” saved [149599799/149599799]

3.解壓（假設在/software目錄下面）

[[email protected] software]# tar -zxvf apache-hive-2.1.0-bin.tar.gz

4.配置環境變數

[[email protected] apache-hive-2.1.0-bin]# echo "export HIVE_HOME=`pwd`" >> /etc/profile

[[email protected] apache-hive-2.1.0-bin]# echo ‘export PATH=$HIVE_HOME/bin:$PATH’>>/etc/profile

[[email protected] apache-hive-2.1.0-bin]# source /etc/profile

5.建立HIVE的工作目錄

[[email protected] software]# hadoop fs -mkdir /tmp

[[email protected] software]# hadoop fs -mkdir /user/hive/warehouse

mkdir: `/user/hive/warehouse': No such file or directory

[[email protected] software]# hadoop fs -mkdir /user

mkdir: `/user': File exists

[[email protected] software]# hadoop fs -mkdir /user/hive

[[email protected] software]# hadoop fs -mkdir /user/hive/warehouse

[[email protected] software]# hadoop fs -chmod g+w /tmp

[[email protected] software]# hadoop fs -chmod g+w /user/hive/warehouse

6.設定hive metadata

注：

Starting from Hive 2.1, we need to run the schematool command below as an initialization step. For example, we can use "derby" as db type.

$ $HIVE_HOME/bin/schematool -dbType <db type> -initSchema

預設使用derby資料庫作為元資料資料庫

[[email protected] lib]# schematool -dbType derby -initSchema

which:no hbase in (/software/apache-hive-2.1.0-bin/bin:/usr/local/sbin:/usr/local/bin:/sbin:/bin:/usr/sbin:/usr/bin:/software/jdk1.8.0_05/bin:/software/jdk1.8.0_05/jre/bin:/root/bin:/software/jdk1.8.0_05/bin:/software/jdk1.8.0_05/jre/bin:/software/hadoop-2.7.3/bin:/software/jdk1.8.0_05/bin:/software/jdk1.8.0_05/jre/bin:/software/hadoop-2.7.3/bin)

SLF4J: Class path contains multiple SLF4J bindings.

SLF4J: Found binding in [jar:file:/software/apache-hive-2.1.0-bin/lib/log4j-slf4j-impl-2.4.1.jar!/org/slf4j/impl/StaticLoggerBinder.class]

SLF4J: Found binding in [jar:file:/software/hadoop-2.7.3/share/hadoop/common/lib/slf4j-log4j12-1.7.10.jar!/org/slf4j/impl/StaticLoggerBinder.class]

SLF4J: See http://www.slf4j.org/codes.html#multiple_bindings for an explanation.

SLF4J: Actual binding is of type [org.apache.logging.slf4j.Log4jLoggerFactory]

Metastore connection URL: jdbc:derby:;databaseName=metastore_db;create=true

Metastore Connection Driver : org.apache.derby.jdbc.EmbeddedDriver

Metastore connection User: APP

Starting metastore schema initialization to 2.1.0

Initialization script hive-schema-2.1.0.derby.sql

Initialization script completed

schemaTool completed

7.開始使用hive

[[email protected] lib]# hive

which: no hbase in (/software/apache-hive-2.1.0-bin/bin:/usr/local/sbin:/usr/local/bin:/sbin:/bin:/usr/sbin:/usr/bin:/software/jdk1.8.0_05/bin:/software/jdk1.8.0_05/jre/bin:/root/bin:/software/jdk1.8.0_05/bin:/software/jdk1.8.0_05/jre/bin:/software/hadoop-2.7.3/bin:/software/jdk1.8.0_05/bin:/software/jdk1.8.0_05/jre/bin:/software/hadoop-2.7.3/bin)

SLF4J: Class path contains multiple SLF4J bindings.

SLF4J: Found binding in [jar:file:/software/apache-hive-2.1.0-bin/lib/log4j-slf4j-impl-2.4.1.jar!/org/slf4j/impl/StaticLoggerBinder.class]

SLF4J: Found binding in [jar:file:/software/hadoop-2.7.3/share/hadoop/common/lib/slf4j-log4j12-1.7.10.jar!/org/slf4j/impl/StaticLoggerBinder.class]

SLF4J: See http://www.slf4j.org/codes.html#multiple_bindings for an explanation.

SLF4J: Actual binding is of type [org.apache.logging.slf4j.Log4jLoggerFactory]

Logging initialized using configuration in jar:file:/software/apache-hive-2.1.0-bin/lib/hive-common-2.1.0.jar!/hive-log4j2.properties Async: true

Hive-on-MR is deprecated in Hive 2 and may not be available in the future versions. Consider using a different execution engine (i.e. spark, tez) or using Hive 1.X releases.

hive>

****************************************************************************

** 歡迎轉發，註明原文：blog.csdn.net/clark_xu 徐長亮的專欄

** 謝謝您的支援，歡迎關注微信公眾號：clark_blog

****************************************************************************

hadoop-hive本地和偽分散式模式的安裝

一、虛擬機器hadoop的安裝

二、虛擬機器HIVE的安裝

hadoop-hive本地和偽分散式模式的安裝

Windows 下 Zookeeper 單機模式和偽分散式模式安裝

Hadoop 3.1.1偽分散式模式安裝

Hadoop偽分散式模式安裝

【分散式】hadoop安裝篇（4）Hadoop 2.x的偽分佈模式安裝

hadoop單機版和偽分散式搭建

zookeeper執行環境2、3：單節點安裝和偽分散式叢集安裝

【HBase基礎教程】1、HBase之單機模式與偽分散式模式安裝

Hadoop3-偽分散式模式安裝

Hadoop本地模式、偽分散式和全分散式叢集安裝與部署

Hadoop-2.9.2單機版安裝（偽分散式模式）

Hadoop從入門到精通系列之--2.本地模式和偽分佈模式

Hadoop：Hadoop單機偽分散式的安裝和配置

Hadoop CDH5 手動安裝偽分散式模式

【分散式】hadoop安裝篇（7）Hadoop 3的偽分佈模式安裝

cdh版本的hadoop安裝及配置(偽分散式模式) MapReduce配置 yarn配置

安裝Hadoop及配置偽分散式模式的Hadoop

linux搭建單機版和偽分散式hadoop

Hadoop的偽分散式的安裝及部署

hadoop 偽分散式模式學習筆記

hadoop-hive本地和偽分散式模式的安裝

一、虛擬機器hadoop的安裝

二、虛擬機器HIVE的安裝

相關推薦