Hadoop學習（三）Hive安裝

阿新 • • 發佈：2019-02-13

下載hive包上傳到linux主機上並解壓這裡使用 apache-hive-2.1.1-bin.tar.gz

安裝配置 MySQL

CentOS7安裝mysql提示：No package mysql-server available.

輸入下面兩部

第二步安裝mysql源: rpm -ivh mysql-community-release-el7-5.noarch.rpm

經過以上兩個步驟後再次執行：

yum install mysql-server
yum install mysql
yum install mysql-devel

命令就可以成功安裝了。

啟動mysql

systemctl start mysqld

檢視mysql 的狀態

systemctl status mysqld

配置 Hive
進入 hive 安裝目錄下的配置目錄，然後修改配置檔案

cd /home/chs/apache-hive-2.1.1-bin/conf

然後再該目錄下建立一個新檔案 hive-site.xml
將下面的內容新增到 hive-site.xml 檔案中.

<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration 
>
<property>
<name>hive.metastore.local</name>
<value>true</value>
</property>
<property>
<name>javax.jdo.option.ConnectionURL</name>
#IP 地址是指安裝 MySQL 的節點的 IP
<value>jdbc:mysql://192.168.190.147:3306/hive?characterEncoding=UTF-8</value>
</property 
>
<property>
<name>javax.jdo.option.ConnectionDriverName</name>
<value>com.mysql.jdbc.Driver</value>
</property>
<property>
<name>javax.jdo.option.ConnectionUserName</name>
<value>hadoop</value>
</property>
<property>
<name>javax.jdo.option.ConnectionPassword</name>
<value>hadoop</value>
</property>
</configuration>

mv mysql-connector-java-5.1.27/mysql-connector-java-5.1.27-bin.jar
~/apache-hive-2.1.1-bin/lib/

配置環境變數
vim /etc/profile

export HIVE_HOME=/home/chs/apache-hive-2.1.1-bin
export PATH=$PATH:$HIVE_HOME/bin

配置完之後使配置檔案生效 source /etc/profile

修改hive-env.sh

cp hive-env.sh.template  hive-env.sh
HADOOP_HOME=/home/chs/hadoop-2.7.3

然後就可以啟動hive了

啟動錯誤：org.apache.hadoop.hive.ql.metadata.HiveException: java.lang.RuntimeException: Unable to instantiate org.apache.hadoop.hive.ql.metadata.SessionHiveMetaStoreClient
原因：hive 2.0以上版本，安裝配置完成之後需要先初始化元資料庫
解決方法：
執行 schematool -dbType mysql -initSchema
之後就可以正常啟動hive

上面使用的是本地的mysql，生產環境中一般使用遠端的mysql儲存，配置如下

    <configuration>
<property>
        <name>hive.metastore.uris</name>
        <value>thrift://master:9083</value>
    </property>
    <property>
        <name>hive.server2.thrift.port</name>
        <value>10000</value>
    </property>
    <property>
        <name>javax.jdo.option.ConnectionURL</name>
        <value>jdbc:mysql://master/metastore?createDatabaseIfNotExist=true</value>
    </property>
    <property>
        <name>javax.jdo.option.ConnectionDriverName</name>
        <value>com.mysql.jdbc.Driver</value>
    </property>
    <property>
        <name>javax.jdo.option.ConnectionUserName</name>
        <value>hadoop</value>
    </property>
    <property>
        <name>javax.jdo.option.ConnectionPassword</name>
        <value>hadoop</value>
    </property>
    <property>
        <name>hive.metastore.schema.verification</name>
        <value>false</value>
    </property>
    <property>
        <name>hive.metastore.warehouse.dir</name>
        <value>/warehouse</value>
    </property>
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://master:9000</value>
    </property>
    <property>
        <name>datanucleus.autoCreateSchema</name>
        <value>true</value>
    </property>
    <property>
        <name>datanucleus.autoStartMechanism</name> 
        <value>SchemaTable</value>
    </property>
    <property>
        <name>datanucleus.schema.autoCreateTables</name>
        <value>true</value>
    </property>

    <property>
        <name>beeline.hs2.connection.user</name>
        <value>hadoop</value>
        </property>
     <property>
        <name>beeline.hs2.connection.password</name>
        <value>hadoop</value>
     </property>
</configuration>

hive.metastore.uris中的“master“含義為metastore server所在的機器
javax.jdo.option.ConnectionURL中的“master”為mysql安裝機器的hostname
javax.jdo.option.ConnectionUserName和javax.jdo.option.ConnectionPassword分別為mysql的訪問使用者和密碼
fs.defaultFS為HDFS的namenode啟動的機器地址
beeline.hs2.connection.user和beeline.hs2.connection.password是beeline方式訪問的使用者名稱和密碼，可任意指定，但在beeline訪問時要寫入你指定的這個

啟動metastore

nohup hive --service metastore >> /home/chs/apache-hive-2.1.1-bin/metastore.log 2>&1  &

啟動hive server

nohup hive --service hiveserver2 >> /home/chs/apache-hive-2.1.1-bin/hiveserver.log 2>&1 &

檢視是否啟動成功

ps aux | grep hive

可以看到檢視到下面結果，有兩個程序HiveMetaStore和HiveServer2

 [[email protected] ~]$ ps aux | grep hive
chs        2479 99.7 18.0 2327632 367752 pts/0  Sl   16:15   0:19 /home/chs/java/jdk1.8.0_172/bin/java -Xmx256m -Djava.net.preferIPv4Stack=true -Dhadoop.log.dir=/home/chs/hadoop-2.7.3/logs -Dhadoop.log.file=hadoop.log -Dhadoop.home.dir=/home/chs/hadoop-2.7.3 -Dhadoop.id.str=chs -Dhadoop.root.logger=INFO,console -Djava.library.path=/home/chs/hadoop-2.7.3/lib/native -Dhadoop.policy.file=hadoop-policy.xml -Djava.net.preferIPv4Stack=true -Xmx512m -Dlog4j.configurationFile=hive-log4j2.properties -Djava.util.logging.config.file=/home/chs/apache-hive-2.1.1-bin/conf/parquet-logging.properties -Dhadoop.security.logger=INFO,NullAppender org.apache.hadoop.util.RunJar /home/chs/apache-hive-2.1.1-bin/lib/hive-metastore-2.1.1.jar org.apache.hadoop.hive.metastore.HiveMetaStore
chs        2662  136 14.5 2302352 295540 pts/0  Sl   16:15   0:10 /home/chs/java/jdk1.8.0_172/bin/java -Xmx256m -Djava.net.preferIPv4Stack=true -Dhadoop.log.dir=/home/chs/hadoop-2.7.3/logs -Dhadoop.log.file=hadoop.log -Dhadoop.home.dir=/home/chs/hadoop-2.7.3 -Dhadoop.id.str=chs -Dhadoop.root.logger=INFO,console -Djava.library.path=/home/chs/hadoop-2.7.3/lib/native -Dhadoop.policy.file=hadoop-policy.xml -Djava.net.preferIPv4Stack=true -Xmx512m -Dlog4j.configurationFile=hive-log4j2.properties -Djava.util.logging.config.file=/home/chs/apache-hive-2.1.1-bin/conf/parquet-logging.properties -Dhadoop.security.logger=INFO,NullAppender org.apache.hadoop.util.RunJar /home/chs/apache-hive-2.1.1-bin/lib/hive-service-2.1.1.jar org.apache.hive.service.server.HiveServer2
chs        2854  0.0  0.0 112660   972 pts/0    S+   16:15   0:00 grep --color=auto hive

啟動客戶端可以使用hive命令也可以使用beeline命令。推薦使用beeline
OK 使用beeline啟動客戶端,之後輸入下面的命令發起一個連線

!connect jdbc:hive2://master:10000/default  hadoop hadoop

其中hadoop和hadoop分別是在hive-site.xml配置檔案中由beeline.hs2.connection.user和beeline.hs2.connection.password設定的。
如果出現下面的錯誤

Could not open connection to the HS2 server. Please check the server URI and if the URI is correct, then ask the administrator to check the server status.
Error: Could not open client transport with JDBC Uri: jdbc:hive2://master:10000/default: java.net.ConnectException: Connection refused (Connection refused) (state=08S01,code=0)

需在hadoop的配置檔案core-site.xml中加入以下配置並重啟hiveserver2， hive metastore，HDFS和YARN：

<property>
 <name>hadoop.proxyuser.chs.groups</name>
 <value>*</value>
</property>

<property>
 <name>hadoop.proxyuser.chs.hosts</name>
 <value>*</value>
</property>

其中的chs是你登陸linux虛擬機器的使用者名稱
在連線就成功了顯示如下

beeline> !connect jdbc:hive2://master:10000/default  hadoop hadoop
Connecting to jdbc:hive2://master:10000/default
Connected to: Apache Hive (version 2.1.1)
Driver: Hive JDBC (version 2.1.1)
18/07/02 16:37:03 [main]: WARN jdbc.HiveConnection: Request to set autoCommit to false; Hive does not support autoCommit=false.
Transaction isolation: TRANSACTION_REPEATABLE_READ
0: jdbc:hive2://master:10000/default>

OK遠端連線成功

Hadoop學習（三）Hive安裝

Hadoop學習（三）Hive安裝

Hive學習（三）Hive的連線三種連線方式

hadoop 學習（三）配置啟動 yarn

docker學習（三） Windows 10 安裝Docker

Hive學習之路（二）Hive安裝

Hive學習之路（三）Hive元數據信息對應MySQL數據庫表

Hadoop建設工具Ambari的安裝部署及完整使用（三）——部署安裝

Elasticsearch學習（三）在windows上安裝和啟動Elasticseach

ElasticSearch學習 - （三）windows下安裝ElasticSearch6.X head外掛

TensorFlow學習筆記（三）—— linux安裝TensorFlow

大資料基礎知識學習-----Hive學習筆記（二）Hive安裝環境準備

Hadoop權威指南學習（三）——MapReduce應用開發

Elasticsearch2.4學習（三）------Elasticsearch2.4外掛安裝詳解

ROS學習（三）：ROS安裝不能本地化問題

自己的HADOOP平臺（三）：Mysql+hive遠端模式+Spark on Yarn

hadoop 學習（一）安裝hadoop環境

MySQL學習（一）ODBC 安裝

爬蟲庫之BeautifulSoup學習（三）

Java學習（三）JSP學習1

java學習（三）類

Hadoop學習（三）Hive安裝

相關推薦