大資料求索(4)：Hive安裝和使用

阿新 • • 發佈：2018-11-21

Hive安裝和使用

Hive環境搭建

Hive下載

wget https://archive.cloudera.com/cdh5/cdh/5/hive-1.1.0-cdh5.7.0.tar.gz
解壓

tar -zxvf hive-1.1.00cdh5.7.0.tar.gz -C ~/APP/Hadoop
環境配置

系統環境變數配置(vim ~/.bash_profile)

export HIVE_HOME=/home/hadoop/APP/Hadoop/hive-1.1.0-cdh5.7.0

export PATH=$HIVE_HOME/bin:$PATH

檔案配置

因為資料存放在關係型資料庫裡，所以需要安裝一個mysql

hive-env.sh

修改$HADOOP_HOME目錄

hive-site.xml

<property>
	<name>javax.jdo.option.ConnectionURL</name>
	<value>jdbc:mysql://localhost:3306/sparksql?createDatabaseIfNotExist=true</value>
</property>

<property>
	<name>javax.jdo.option.ConnectionDriverName</name 
>
    <value>com.mysql.jdbc.Driver</value>
</property>

<property>
	<name>javax.jdo.option.ConnectionUserName</name>
	<value>root</value>
</property>

<property>
	<name>javax.jdo.option.ConnectionPassword</name>
	<value>root</ 
value>
</property>

拷貝mysql驅動到$HIVE_HOME/lib

這個可以到maven倉庫去下載下來拷貝過去即可
啟動hive
$HIME_HOME/bin/hive

$bin/hive (需先啟動叢集)

啟動以後，進入hive shell
可以去檢視mysql資料庫，發現裡面已經多了剛才配置檔案裡面寫的sparksql資料庫，show tables可以發現多了很多表，這些表是hive啟動幫助建立的

Hive 使用

建立表
```
create table hive_wordcount(context string);
show tables;
```
可以發現多了一張表

切換到mysql資料庫裡面，查看錶TBLS（原本是空的），
```
select * from TBLS;
```
可以發現多了一行資料，包括ID、建立時間、擁有者、表名等資訊

查看錶COLUMNS_V2，可以看到欄位資訊
```
select * from COLUMNS_V2;
```

載入資料到hive表

可以從本地或者HDFS載入

load data local(如果從HDFS去掉local) inpath '/home/hadoop/data/data.txt' into table hive_wordcount;

select * from hive_wordcount;

可以看到資料已經載入到表裡了。

hive進行詞頻統計

這裡需要用到一個函式 :

load view explode(): 把每行記錄按照指定分隔符進行拆解
```
select word, count(1) from hive_wordcount lateral view explode(split(context, ' ')) wc as word group by word;
```
可以看到結果如下：

如果我們這時候去重新整理yarn的web介面，可以看到hive提交了mr job到平臺去執行，相當於幫助我們把sql語句轉換成了mr任務，並在yarn執行

但是hive更加簡單，只要會使用sql即可

大資料求索(4)：Hive安裝和使用

Hive安裝和使用 Hive環境搭建 Hive下載 wget https://archive.cloudera.com/cdh5/cdh/5/hive-1.1.0-cdh5.7.0.tar.gz 解壓 tar -zxvf hive-1.1.00cdh5.7.0

大資料求索(1)：HDFS安裝指南

大資料求索(1)：HDFS安裝指南背景 HDFS是分散式檔案系統，是Hadoop的基礎，本章主要介紹如何安裝HDFS。環境引數 centos 6.5 hadoop2.6.0-cdh5.7.0 jdk8 偽分散式安裝一、JDK安裝

# 大資料求索(7)： Kafka的重要原理和概念二與實戰

大資料求索(7)： Kafka的重要原理和概念二大資料最好的學習資料是官方文件。 Kafka官方文件地址：http://kafka.apache.org/ 四、Kafka高效性相關設計 4.1 訊息的持久化 Kafka高度依賴檔案系統來儲存和快取訊息

大資料求索(7)： Kafka的重要原理和概念一

大資料求索(7)： Kafka的重要原理和概念一大資料最好的學習資料是官方文件。 Kafka官方文件地址：http://kafka.apache.org/ 一、Kakfa簡介 Apache kafka 是一個分散式的基於push-subscribe的訊息

大資料求索(5)：Windows下使用IDEA開發Kafka程式和伺服器通訊失敗問題

問題描述在windows下使用IDEA開發完生產者程式以後，在伺服器端開啟消費者程序，發現傳送失敗，無法進行通訊，報錯如下： kafka .FailedToSendMessageException: Failed to send messages after 3 tries

大資料初學者福利：Hive基本使用教程

蜂房資料型別蜂房基礎資料型別蜂巢是用的Java開發的，蜂巢的裡基本資料型別和Java的的基本資料型別也是一一對應的，除了字串型別有符號的整數型別：TINYINT，SMALLINT，INT和BIGINT分別等價於Java的位元組的，短型，整型和長原子型別，它們分別為1位元組，2位元組，4位

大資料準備-虛擬機器系統安裝和網路配置(2)

接上一篇：建立虛擬機器二部分，系統安裝 1，建立好的虛擬機器，右鍵，設定 2，使用ISO印象檔案—瀏覽找到自己的ISO檔案確定 3，開啟虛擬機器 4，選擇，預設第一個 5，選擇 6，選擇 7，選擇，簡體中文，下一步 8，鍵盤選擇，美式英語，下一步 9，選

大資料系列4：Yarn以及MapReduce 2

系列文章： [大資料系列：一文初識Hdfs](https://mp.weixin.qq.com/s/t145iTxDwKjmu4rfqHkDRQ) [大資料系列2：Hdfs的讀寫操作](https://mp.weixin.qq.com/s/c7aqP82wlnOZ6Kn96xlpEQ) [大資料謝

大資料開發面試：Impala和hive的比較（最全版）

Impala和hive的比較 Impala是Cloudera公司主導開發的新型查詢系統，它提供SQL語義，能查詢儲存在Hadoop的HDFS和HBase中的PB級大資料。已有的Hive系統雖然也提供了SQL語義，但由於Hive底層執行使用的是MapReduce引擎，仍然是一

大資料求索（10）：解決ElasticSearch中文搜尋無結果------ik分詞器的安裝與使用

大資料求索（10）：解決ElasticSearch中文搜尋無結果-----IK中文分詞器的安裝與使用問題所在在中文情況下，ES預設分詞器會將漢字切分為一個一個的漢字，所以當搜尋詞語的時候，會發現無法找到結果。解決辦法有很多其他的分詞器外掛可以替代，這裡使用最常用

大資料求索（4）：配置Spark History Server

大資料求索（4）：配置Spark History Server 修改配置檔案修改conf/spark-default.conf cp spark-default.conf.template spark-default.conf vim spark-defau

大資料的簡介及Hadoop單機和分散式安裝方法1

hadoop：開源軟體，可靠的、分散式、可伸縮的大資料軟體（是一個生態體系包括但不限於：hive、spark、MR、persto、kylin）國家提出去IOE戰略： IBM &nb

大資料求索(12): 從傳統ACID到分散式系統中的CAP和BASE

大資料求索(12): 從ACID到CAP和BASE 一、關於ACID 關係型資料庫最強大的功能之一就是事務，能夠保證資料的強一致性。事務有如下幾個特性： 1.1 A(Atomicity) 原子性原子性很容易理解，也就是說**事務裡的所有操作要麼全部做完，要麼都不做，事務

大資料基礎知識學習-----Hive學習筆記（二）Hive安裝環境準備

Hive安裝環境準備 Hive安裝地址 Hive安裝部署 Hive安裝及配置把apache-hive-1.2.1-bin.tar.gz上傳到linux的/opt/software目錄下解壓apache-hive-1.2.

大資料框架對比：Hadoop、Storm、Samza、Spark和Flink

今天看到一篇講得比較清晰的框架對比，這幾個框架的選擇對於初學分散式運算的人來說確實有點迷茫，相信看完這篇文章之後應該能有所收穫。簡介大資料是收集、整理、處理大容量資料集，並從中獲得見解所需的非傳統戰略和技術的總稱。雖然處理資料所需的計算能力或儲存容量早已超過一臺計算機的上限，

大資料環境基礎之Centos安裝Haoop叢集（4）ssh免密碼登入

ssh免密碼登入的配置需要在當前使用者下的根目錄下用命令ssh-keygen -t rsa生成公鑰和祕鑰用命令ls -a檢視.ssh檔案進入.ssh資料夾裡面，用命令ls檢視公鑰和祕鑰將公鑰儲存在authorized_keys檔案中修改authorized

大資料時代的技術hive：hive介紹

　　我最近研究了hive的相關技術，有點心得，這裡和大家分享下。　　首先我們要知道hive到底是做什麼的。下面這幾段文字很好的描述了hive的特性：　　1.hive是基於Hadoop的一個數據倉庫工具，可以將結構化的資料檔案對映為一張資料庫表，並提供完整的sql查詢功能，可以將sql語句轉換為MapRe

資料倉庫元件：Hive環境搭建和基礎用法

本文原始碼：[GitHub](https://github.com/cicadasmile/big-data-parent) || [GitEE](https://gitee.com/cicadasmile/big-data-parent) # 一、Hive基礎簡介 **1、基礎描述** Hive是基

mysql5.7：mysql安裝和基於SSL加密的主從復制（詳細剖析）

mysql ssl db 數據加密傳輸小生博客：http://xsboke.blog.51cto.com 小生 Q Q：1770058260 -------謝謝您的參考，如有疑問，歡迎交流目錄：--------my

hive 安裝和部署

def 環境 version etc odi onu base hive環境變量 tool 1.先安裝好hdfs和mapreduce 2.下載hive的安裝包, 下載地址:https://cwiki.apache.org/confluence/display/Hive/G

大資料求索(4)：Hive安裝和使用

Hive安裝和使用

Hive環境搭建

Hive 使用

相關推薦