apache-hive-1.2.1-bin 安裝

阿新 • • 發佈：2018-12-26

apache-hive-1.2.1-bin 安裝

更多資源:https://github.com/opensourceteams

技能標籤

下載apache hive 安裝包
進行apache-hive-1.2.1-bin.tar.gz安裝
配置mysql儲存元資料
配置HDFS儲存 /user/hive/warehouse
該Hive版本1.2.1預設整合在(Spark1.6 到 Spark2.4)

下載

下載安裝包apache-hive-1.2.1-bin.tar.gz: https://archive.apache.org/dist/hive/hive-1.2.1
由於spark-2.4.0-bin-hadoop2.7 預編譯好的捆綁hive版本為hive-1.2.1,為了方便所以選用版本apache-hive-1.2.1-bin
如果spark支援其它版本的hive,需要重新手動編譯spark原始碼也可以實現

安裝

解壓安裝包

tar -zxvf apache-hive-1.2.1-bin.tar.gz -C /opt/module/bigdata/

配置環境變數

export HIVE_HOME=/opt/module/bigdata/apache-hive-1.2.1-bin
export PATH=$HIVE_HOME/lib:#PATH

HDFS新建目錄

bin/hadoop fs -mkdir -p  /user/hive/warehouse #建立目錄
bin/hadoop fs -chmod -R 777 /user/hive/warehouse #新建的目錄賦予讀寫許可權
bin/hadoop fs -mkdir -p /tmp/hive/#新建/tmp/hive/目錄
bin/hadoop fs -chmod -R 777 /tmp/hive #目錄賦予讀寫許可權
#用以下命令檢查目錄是否建立成功
bin/hadoop fs -ls /user/hive
bin/hadoop fs -ls /tmp/hive

連線mysql資料庫

複製jdbc連線驅動

cp mysql-connector-java-8.0.13.jar  $HIVE_HOME/lib/

新建hive-site.xml資料庫相關的配置

touch hive-site.xml檔案

<?xml version="1.0" encoding="UTF-8" standalone="no"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

<configuration>
	 <property>
    <name>hive.metastore.warehouse.dir</name>
    <value>/user/hive/warehouse</value>  
  </property>
  
  <property>
    <name>hive.exec.scratchdir</name>
    <value>/tmp/hive</value>  
  </property>
  
  <property>
    <name>javax.jdo.option.ConnectionURL</name> 
    <value>jdbc:mysql://macbookmysql.com:3306/hive?createDatabaseIfNotExist=true</value>
    <description>JDBC connect string for a JDBC metastore</description>
  </property>
  <property>
    <name>javax.jdo.option.ConnectionDriverName</name>
    <value>com.mysql.cj.jdbc.Driver</value>
    <description>Driver class name for a JDBC metastore</description>
  </property>
  <property>
    <name>javax.jdo.option.ConnectionUserName</name>
    <value>admin</value>
    <description>username to use against metastore database</description>
  </property>
  <property>
    <name>javax.jdo.option.ConnectionPassword</name>
    <value>000000</value>
    <description>password to use against metastore database</description>
  </property>


</configuration>

新建hive-env.sh

cp hive-env.sh.template

# Licensed to the Apache Software Foundation (ASF) under one
# or more contributor license agreements.  See the NOTICE file
# distributed with this work for additional information
# regarding copyright ownership.  The ASF licenses this file
# to you under the Apache License, Version 2.0 (the
# "License"); you may not use this file except in compliance
# with the License.  You may obtain a copy of the License at
#
#     http://www.apache.org/licenses/LICENSE-2.0
#
# Unless required by applicable law or agreed to in writing, software
# distributed under the License is distributed on an "AS IS" BASIS,
# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
# See the License for the specific language governing permissions and
# limitations under the License.

# Set Hive and Hadoop environment variables here. These variables can be used
# to control the execution of Hive. It should be used by admins to configure
# the Hive installation (so that users do not have to set environment variables
# or set command line parameters to get correct behavior).
#
# The hive service being invoked (CLI/HWI etc.) is available via the environment
# variable SERVICE


# Hive Client memory usage can be an issue if a large number of clients
# are running at the same time. The flags below have been useful in 
# reducing memory usage:
#
# if [ "$SERVICE" = "cli" ]; then
#   if [ -z "$DEBUG" ]; then
#     export HADOOP_OPTS="$HADOOP_OPTS -XX:NewRatio=12 -Xms10m -XX:MaxHeapFreeRatio=40 -XX:MinHeapFreeRatio=15 -XX:+UseParNewGC -XX:-UseGCOverheadLimit"
#   else
#     export HADOOP_OPTS="$HADOOP_OPTS -XX:NewRatio=12 -Xms10m -XX:MaxHeapFreeRatio=40 -XX:MinHeapFreeRatio=15 -XX:-UseGCOverheadLimit"
#   fi
# fi

# The heap size of the jvm stared by hive shell script can be controlled via:
#
# export HADOOP_HEAPSIZE=1024
#
# Larger heap size may be required when running queries over large number of files or partitions. 
# By default hive shell scripts use a heap size of 256 (MB).  Larger heap size would also be 
# appropriate for hive server (hwi etc).


# Set HADOOP_HOME to point to a specific hadoop install directory
# HADOOP_HOME=${bin}/../../hadoop

# Hive Configuration Directory can be controlled by:
# export HIVE_CONF_DIR=

# Folder containing extra ibraries required for hive compilation/execution can be controlled by:
# export HIVE_AUX_JARS_PATH=




HADOOP_HOME=/opt/module/bigdata/hadoop-2.9.2
export HIVE_CONF_DIR=/opt/module/bigdata/apache-hive-1.2.1-bin/conf
export HIVE_AUX_JARS_PATH=/opt/module/bigdata/apache-hive-1.2.1-bin/lib

初使化元資料資料庫

schematool -initSchema -dbType mysql

啟動hive

hive

hive啟動說明

啟動hive metastore服務

啟動該服務會開一個 9083埠
netstat -ntlup 可以檢視服務端佔用的埠

hive --service metastore &

停止hive metastore服務

ps -ef|grep hive

kill -9 pid

啟動hiveserver服務 (該服務可以不啟動)

hive --service hiveserver2 &

操作

啟動 hive

hive

退出 hive命令

exit;

建立database

create database;

顯示所有的database

show databases;

顯示所有的表

show tables;

建立表

CREATE TABLE IF NOT EXISTS employee (  name String, salary String) COMMENT 'Employee details' ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t' LINES TERMINATED BY '\n' STORED AS TEXTFILE;

插入資料

資料檔案 employee.txt

小明    100000
小王    50000
小李    60000

插入資料檔案到hive上

LOAD DATA LOCAL INPATH '/home/liuwen/temp/employee.txt' OVERWRITE INTO TABLE employee;

查看錶資料

 select * from employee;

問題處理

無法訪問spark-assembly-*.jar


[[email protected] lib]$ schematool -initSchema -dbType mysql
ls: 無法訪問/opt/module/bigdata/spark-2.4.0-bin-without-hadoop/lib/spark-assembly-*.jar: 沒有那個檔案或目錄
Metastore connection URL:        jdbc:mysql://macbookmysql.com:3306/hive?createDatabaseIfNotExist=true
Metastore Connection Driver :    com.mysql.cj.jdbc.Driver
Metastore connection User:       admin
Starting metastore schema initialization to 1.2.0
Initialization script hive-schema-1.2.0.mysql.sql
Error: Duplicate key name 'PCS_STATS_IDX' (state=42000,code=1061)
org.apache.hadoop.hive.metastore.HiveMetaException: Schema initialization FAILED! Metastore state would be inconsistent !!
*** schemaTool failed ***

處理方法
處理$HIVE_HOME/bin/hive

  #sparkAssemblyPath=`ls ${SPARK_HOME}/lib/spark-assembly-*.jar`
  sparkAssemblyPath=`ls ${SPARK_HOME}/jars/*.jar`

end

apache-hive-1.2.1-bin 安裝

apache-hive-1.2.1-bin 安裝更多資源:https://github.com/opensourceteams 技能標籤下載apache hive 安裝包進行apache-hive-1.2.1-bin.tar.gz安裝配置mysql儲存

-hbase分散式安裝和基本命令使用,hbase-1.2.3-bin.tar.gz

版本：hbase-1.2.3-bin.tar.gz 網址：hbase.apache.org 版本：hbase-1.2.3.tar.gz 修改hbase-env.sh，需要修改三個地方配置JAVA_HOME 配置CLASSPAT

Hive 1.2.1安裝部署

java.sql.SQLException: Unable to open a test connection to the given database. J

原生 Hive 1.2.1 的安裝

1、下載hive 1.2.1 $HADOOP_HOME/bin/hadoop fs -mkdir /tmp $HADOOP_HOME/bin/hadoop fs -mkdir /user/hi

Hive-1.2.1遠端模式的安裝和配置

準備工作 1.搭建好的Hadoop分散式系統 2.apache-hive-1.2.1-bin.tar.gz和mysql-connerctor-java-5.1.43-bin.jar 在mysql資料庫上建立hive資料庫用於儲存hive元資料

Hive 1.2.1 安裝測試

1 安裝MySQL 安裝伺服器： sudo apt-get install mysql-server (注意：期間需要設定root使用者的密碼喲) 安裝客戶端: sudo apt-get install mysql-client sud

Hive之 hive-1.2.1 + hadoop 2.7.4 叢集安裝

一、相關概念Hive Metastore有三種配置方式，分別是：Embedded Metastore Database (Derby) 內嵌模式Local Metastore Server 本地元儲存Remote Metastore Server 遠端元儲存1.1 Meta

apache-hive-1.2.1和hbase-1.2.2的整合(偽分散式)

我的機器環境： hadoop2.6.0 的偽分散式 Hbase偽分散式環境參考：hbase權威指南P240 1.啟動hadoop和hbase 2.下載apache-hive-1.2.1 3.修改hive中conf下的hive-env.sh # Set HADOOP_H

Git-2.15.1.2-64-bit安裝

roc 目錄 oss 點擊新版本根據 bit log 我們 1、在百度搜索git，然後在git的官網上找到git的下載頁面，如下圖所示。在首頁在Downloads處選擇下載Windows版本，當然您可以根據需求下載其他版本的安裝文件。 2、點擊下載版本便可以直接下載，此

基於CM搭建的CDH叢集之hive元件升級過程（hive0.13.1升級到hive-1.2.1且確保納入CM管理）

1、在hive0.13.1版本下建立lib121目錄 cd /opt/cloudera/parcels/CDH/lib/hive;mkdir lib121 2、下載hive1.2.1版本,並將該版本lib下所有檔案拷貝到lib121中 3、修改/opt/cloudera/par

1.1-1.2 python的安裝

edit edits rpm entos n-2 最新版本 fault 之間實現 python是跨平臺的，centos6以及高版本系統自帶python2.7 linux windowsmac 使用rpm -q python 查詢python包是否安裝python -V(大

1.1 為什麼學習python 1.2 python的安裝 1.3 python的檔案型別 1.4 python的變數

1.1 為什麼學習python 掌握一門開發語言是高速運維工程師的必備技能，維護成百上千臺伺服器是需要會開發語言來開發一些自動化運維工具，而python很適合運維人員來做這些。 1.2 python的安裝建議直接yum安裝python（我使用的Centos& 自帶python2

[KairosDB] CentOS7 安裝KairosDB-1.2.1

1. 系統環境： OS：CentOS7.3 Java：JDK8 Cassandra：cassandra-3.10 2. 安裝KairosDB 2.1 下載解壓 [[email

CDH 5.3.9(parcels)叢集中hive0.13.0升級到hive-1.2.1步驟全，升級hive元資料庫，資料不丟失

2.將安裝包傳到叢集所有節點上 3.所有節點root使用者下 cd /opt/cloudera/parcels/CDH/lib/hive mkdir lib121 5.所有節點將解壓出來hive/lib下所有檔案拷貝到lib121 6.Coudera 介面

Spark 2.4.0 整合Hive 1.2.1

Spark 2.4.0 整合Hive 1.2.1 更多資源 github: https://github.com/opensourceteams/spark-scala-maven-2.4.0 apache-hive-1.2.1-bin 安裝: https://gith

測試hadoop-1.2.1是否成功安裝和配置

本文說明hadoop安裝之後驗證安裝和配置的方法，hadoop-1.2.1安裝方法參考：hadoop安裝成功之後，要簡單驗證是否成功安裝和配置，在hadoop-1.2.1安裝方法詳解教程中，已經通過jps命令簡單的驗證，這裡通過執行MapReduce作業統計單詞來進一步驗證

presto-0.147+postgresql-9.5.3+msql-5.0.7+hadoop-2.5.2+hive-1.2.1環境構築以及測試

背景每個支援SQL的資料庫，都有一個強大的SQL引擎。而對於SQL引擎，基本都是大同小異的，負責SQL文法解析，語意分析，指定查詢樹，優化查詢樹，再到最終的執行，客戶端返回結果。而presto的也跟一般的是一樣的。架構如下：準備 1.postgresql-9.5

centos7 + hadoop 1.2.1基本安裝配置

本節所講的hadoop基本安裝配置主要包含三部分內容：單機偽分佈全分佈本次實驗環境所用的作業系統為centos7，在進行安裝之前，我們首先要做以下準備工作: 1.建立hadoop使用者為方便操作我們建立一個名為hadoop的使用者來執行程式，這樣可以使得不同使用者

kettle 5.1.0 連線 Hadoop hive 2 (hive 1.2.1)

1. 配置HiveServer2，在hive-site.xml中新增如下的屬性 <property> <name>hive.server2.thrift.bind.host</name> <value>192.

Ubuntu 16.04下安裝Cuda 8.0, Anaconda 4.4.0和TensorFlow 1.2.1

原文連結：http://blog.csdn.net/jinzhuojun/article/details/77140806 Cuda 如果配了Nvidia卡的，可以考慮安裝Cuda，這樣之後可以用GPU加速。之前寫過一篇在Ubuntu 14.04上裝Cuda 7.5的文章(

apache-hive-1.2.1-bin 安裝

apache-hive-1.2.1-bin 安裝

更多資源:https://github.com/opensourceteams

技能標籤

下載

安裝

解壓安裝包

配置環境變數

HDFS新建目錄

連線mysql資料庫

新建hive-site.xml資料庫相關的配置

初使化元資料資料庫

啟動hive

啟動hive metastore服務

停止hive metastore服務

啟動hiveserver服務 (該服務可以不啟動)

操作

啟動 hive

退出 hive命令

建立database

顯示所有的database

顯示所有的表

建立表

插入資料

查看錶資料

問題處理

無法訪問spark-assembly-*.jar

相關推薦