Hadoop + HBase + Hive 完全分散式部署筆記

阿新 • • 發佈：2019-01-28

完全分散式Hadoop + HBase + Hive 部署過程的的一些問題。

NameNode: 192.168.229.132

DataNode: 192.168.229.133/192.168.229.134

--------------------------------------------------------------------------------

配置 Hadoop

無密碼SSH

首先是NameNode需要通過ssh來訪問DataNode，配置一個無密碼的ssh

NameNode上生成公鑰私鑰

$ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa

把公鑰放到tmp目錄，並且scp到每一個DataNode

$cp ~/.ssh/id_dsa.pub /tmp

在NameNode和DataNode都執行這個，完成配置

$cat /tmp/id_dsa.pub >> ~/.ssh/authorized_keys

配置檔案 (其中涉及到的目錄會自動建立)

conf/hadoop-env.sh

# The java implementation to use. Required.
export JAVA_HOME=/usr/jdk1.6.0_25

conf/core-site.xml (如果要使用HIVE，就需要把紅色的IP改成主機名，否則會有Wrong FS錯誤)

<configuration>
<property>
    
    <name>fs.default.name</name>
    <value>hdfs://192.168.229.132

:9000</value>
</property>
   
<property>
    <name>hadoop.logfile.size</name>
    <value>10</value>
</property>
</configuration>

conf/hdfs-site.xml

conf/mapred-site.xml

<configuration>
<property>
    
    <name>mapred.job.tracker</name>
    <value>192.168.229.132:9001</value>
</property>
<property>
    
    <name>mapred.system.dir</name>
    <value>/u01/app/data/mapred.system.dir</value>
</property>
<property>
    
    <name>mapred.local.dir</name>
    <value>/u01/app/data/mapred.local.dir</value>
</property>
</configuration>

主從配置

conf/masters

192.168.229.132

conf/slaves

192.168.229.133

192.168.229.134

在NameNode進行了所有的配置之後，通過scp把hadoop安裝目錄同步到DataNode。然後在NameNode進行格式化和啟動。

--------------------------------------------------------------------------------

配置 HBase

$vi /etc/hosts （HBase使用機器名稱，在hosts裡面必須配置叢集裡面的機器）
127.0.0.1    localhost
192.168.229.132    ubuntu02
192.168.229.133    ubuntu03
192.168.229.134    ubuntu04

conf/hbase-env.sh (這裡)

# The java implementation to use. Java 1.6 required.
export JAVA_HOME=/usr/jdk1.6.0_25

# Extra Java CLASSPATH elements. Optional.
export HBASE_CLASSPATH=/u01/app/hadoop/conf

# Tell HBase whether it should manage it's own instance of Zookeeper or not.
export HBASE_MANAGES_ZK=true

conf/hbase-site.xml (紅色部分必須使用主機名稱，其他部分可以使用IP)

<configuration>
<property>
    <name>hbase.rootdir</name>
    <value>hdfs://ubuntu02:9000/u01/app/data/hbase</value>
</property>
<property>
    <name>hbase.cluster.distributed</name>
    <value>true</value>
</property>
<property>
    <name>hbase.master</name>
    <value>hdfs://192.168.229.132:60000</value>
</property>
<property>
    <name>hbase.zookeeper.quorum</name>
    <value>192.168.229.132, 192.168.229.133, 192.168.229.134</value>
</property>
</configuration>

conf/regionservers （和Hadoop的slaves檔案一致）
192.168.229.133
192.168.229.134

通過scp把hbase安裝目錄同步到DataNode

----------------------------------------------------------------------------------------------

配置 Hive

MySQL儲存元資料 （安裝過程見這裡）

建立資料庫的時候，必須使用latin1作為字符集，否則會有錯誤資訊Specified key was too long; max key length is 767 bytes

mysql> create database hivedb default character set latin1;
mysql> create user 'hive'@'localhost' identified by 'hive';
mysql> grant all on hivedb.* to 'hive'@'localhost';

Hive 配置資訊（Hive僅需要在Master節點安裝配置即可）

bin/hive-config.sh （可以設定 .profile 檔案來略過這步）
export JAVA_HOME=/usr/jdk1.6.0_25
export HIVE_HOME=/u01/app/hive
export HADOOP_HOME=/u01/app/hadoop

conf/hive-site.xml
<property>
<name>javax.jdo.option.ConnectionURL</name>
<value>jdbc:mysql://localhost:3306/hivedb?createDatabaseIfNotExist=true</value>
<description>JDBC connect string FOR a JDBC metastore</description>
</property>
<property>
<name>javax.jdo.option.ConnectionDriverName</name>
<value>com.mysql.jdbc.Driver</value>
<description>Driver class name FOR a JDBC metastore</description> </property>
<property>
<name>javax.jdo.option.ConnectionUserName</name>
<value>hive</value>
<description>username TOUSE against metastore database</description>
</property>
<property>
<name>javax.jdo.option.ConnectionPassword</name>
<value>hive</value>
<description>password TOUSE against metastore database</description>
</property>

MySQL 驅動包

下載mysql-connector-java-5.1.18-bin.jar檔案，並放到$HIVE_HOME/lib目錄下

測試

[email protected]:/u01/app/hive$ bin/hive
Logging initialized using configuration in jar:file:/u01/app/hive-0.8.1-bin/lib/hive-common-0.8.1.jar!/hive-log4j.properties
Hive history file=/tmp/hadoop/hive_job_log_hadoop_201203201733_2122821776.txt
hive> show tables;
OK
tb
Time taken: 2.458 seconds
hive>

Hadoop + HBase + Hive 完全分散式部署筆記

Hadoop + HBase + Hive 完全分散式部署筆記

最詳細的Hadoop+Hbase+Hive完全分散式環境搭建教程（二）

搭建3個節點的hadoop叢集（完全分散式部署）--2安裝mysql及hive

搭建3個節點的hadoop叢集（完全分散式部署）--1 安裝虛擬機器及hadoop元件

hive完全分散式部署

cdh版本的hue安裝配置部署以及集成hadoop hbase hive mysql等權威指南

Hadoop執行模式之完全分散式部署Hadoop

大資料技術學習筆記之Hadoop框架基礎1-Hadoop介紹及偽分散式部署

完全分散式部署Hadoop叢集準備(一)

三十、完全分散式部署Hadoop

完全分散式部署 Hadoop

Hadoop完全分散式部署

完全分散式部署Hadoop叢集(三)完成基本搭建

maven hadoop ,hbase,hive依賴

Hadoop之搭建完全分散式執行模式

搭建hadoop+Hbase+Zookeeper偽分散式完整過程

SpringCloud從入門到進階（四）——生產環境下Eureka的完全分散式部署

hadoop搭建（完全分散式）

Hadoop系列之完全分散式環境搭建及測試驗證

hadoop +hbase +zookeeper 完全分佈搭建 (版本一)

Hadoop + HBase + Hive 完全分散式部署筆記

相關推薦