Hive實戰（2）Hive安裝教程

阿新 • • 發佈：2019-02-17

選擇Hadoop發行版本

這裡寫圖片描述

安裝java

$  /usr/java/latest/bin/java -version 
java version "1.6.0_23" 
Java(TM) SE Runtime Environment (build 1.6.0_23-b05) 
Java HotSpot(TM) 64-Bit Server VM (build 19.0-b09, mixed mode) 
$ sudo echo "export JAVA_HOME=/usr/java/latest" > /etc/profile. d/java. sh $ sudo echo "PATH= $ PATH: $ JAVA_HOME/bin" 
 » /etc/profile. d/java. sh 
$ . /etc/profile 
$ echo $ JAVA一HOME 
/usr/java/latest

安裝Hadoop

$ wget \ 
http://www.us.apache.org/dist/hadoop/common/hadoop-0.20.2/hadoop-0.20. 2.tar.gz 
$ tar -xzf hadoop-0.20.2.tar.gz 
$ sudo echo "export HADOOP_HOME=$PWD/hadoop-0.20.2" > /etc/profile.d/ hadoop.sh 
$ sudo echo "PATH=$PATH: $HADOOP_HOME/bin" 
 » /etc/profile.d/hadoop.sh 
$ . /etc/profile

選擇本地模式並測試Hadoop

$ mkdir wc-in 
$ echo "bla bla" > wc-in/a.txt 
$ echo "bla wa wa " > wc-in/b.txt
$ hadoop jar $HADOOP_HOME/hadoop-0.20.2-examples.jar wordcount wc-in 
wc-out
$ ls wc-out/*
$ cat wc-out/*
$ hadoop dfs -cat wc-out/*

安裝Hive

$ curl -o http: 
//archive.apache.org/dist/hive/hive-0.9.0/hive-0.9.0-bin. tar.gz 
$ tar -xzf hive-0.9.0.tar.gz 
$ sudo mkdir -p /user/hive/warehouse 
$ sudo chmod a+rwx /user/hive/warehouse

Hive檔案說明

$HIVE_HOME/lib 目錄下可以發現有眾多的JAR 檔案 
$HIVE_HOME/bin目錄下包含可以執行各種各樣Hive服務的可執行檔案
$HIVE_HOME/conf目錄下存放了配置Hive的配置檔案

Thrift服務提供了可遠端訪問其他程序的功能，也提供使用 JDBC和ODBC訪問Hive的功能。
metastoreservice (元資料服務），Hive使用這個服務來 儲存表模式資訊和其他元資料資訊。

啟動Hive

$ Cd $ HIVE_HOME 
$ bin/hive 
Hive history file=/tmp/myname/hive_job_log_myname_201201271126_1992326118. txt 

hive> CREATE TABLE x (a INT); 

hive> SELECT * FROM x; 

hive> SELECT * FROM x; 

hive> DROP TABLE x; 

hive> exit;

hadoop本地模式配置

這裡寫圖片描述

例2-1 本地模式下的hive-site, xml配置檔案。 
<?xml version="l.0"?> 
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?> 
<configuration> 
<property> 
<name>hive.metastore.warehouse.dir</name> 
<value>/home/me/hive/warehouse</value> 
〈description〉 
Local or HDFS directory where Hive keeps table contents. 
〈/description〉 
</property> 
<property> 
<name>hive.metastore.local</name> 
<value>true</value> 
〈description〉 
Use false if a production metastore server is used. 
〈/description〉 
</property> 
<property> 
<name>j avax.jdo.option.ConnectionURL</name> 
<value>jdbc:derby:;databaseName=/home/me/hive/metastore_db;create=tru e</value> 
〈description〉
The JDBC connection URL. 
</description〉 
</property> 
〈/configuration〉

hadoop偽分散式，叢集模式

這裡寫圖片描述

JDBC連線metastore元資料配置

例2-2 hive-site.xml中的元資料儲存資料庫配置。 
<?xml version="l.0"?> 
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?> 
〈configuration〉 
<property> 
<name>javax.jdo.option.ConnectionURL</name> 
<value>j dbc:mysql://dbl.mydomain.pvt/hive_db?createDatabaseIfNotExist =true</value> 
</property> 
<property> 
<name>javax.jdo.option.ConnectionDriverName</name> 
<value>com.mysql.jdbc.Driver</value> 
</property> 
<property> 
<name>j avax.jdo.option.ConnectionUserName</name> 
<value>database_user</value> 
</property> 
<property>
<name>j avax.jdo.option.ConnectionPassword</name> 
<value>database_pass</value> 
</property> 
〈/configuration〉

Hive命令

$ bin/hive --help

這裡寫圖片描述

Hive命令列介面

hive --help --service cli

$ hive -e "SELECT * FROM mytable LIMIT 3"；
#執行結束後hive CLI立 即退出

$ cat /path/to/file/withqueries.hql 
SELECT x.* FROM src x; 
$ hive 
hive> source /path/to/file/withqueries.hql;
#從檔案中執行查詢

$ echo "one row" > /tmp/myfile 
$ hive -e "LOAD DATA LOCAL INPATH '/tmp/myfile1 INTO TABLE src;
#至少有一行的資料在源表裡面

#使用Tab鍵自動補全

hive> ! pwd; 
/home/me/hiveplay
#使用！和；開頭結尾來切換bash shell指令碼


hive> dfs -ls / ;
#執行Hadoop的dfs命令，只需要將hadoop命令中的關鍵字 hadoop去掉，然後以分號結尾就可以了

--開頭的字串來表示註釋

#顯示欄位名稱
hive> set hive.cli.print.header=true; 
hive> SELECT * FROM system—logs LIMIT 3;

這裡寫圖片描述

Hive實戰（2）Hive安裝教程

選擇Hadoop發行版本安裝java $ /usr/java/latest/bin/java -version java version "1.6.0_23" Java(TM) SE R

hadoop 大資料實戰（2）mongodb安裝

mongodb-win32-x86_64-2008plus-ssl-4.0.3.zip 1、下載地址： https://www.mongodb.com/download-center 2、配置 1.建立路徑，C:\mongodb 2.在C:\mongodb下減壓下載的zip檔案，然後在C

大數據環境搭建（2）- hive客戶端安裝

where ecif tro 結構化 AR JD serve HERE lec 一、簡介 hive是基於hadoop的一種數據倉庫工具，可以將結構化的文件映射成為數據庫的一張表，並提供簡單sql查詢功能，底層實現是轉化為MapReduce任務計算。二、安裝（1）下載從

Hive總結（一）Hive 2.1.0本地模式搭建教程

零．前言 Apache Hive是基於Hadoop的一個數據倉庫工具，可以將結構化的資料檔案對映為一張資料庫表，並提供簡單的SQL查詢功能，可以將SQL語句轉換為MapReduce任務進行執行。其優點是學習成本低，可以通過類SQL語句快速實現簡單的MapRe

Hive入門（2）

1.Hive DDL 1.1 database DDL （1）建立資料庫 CREATE (DATABASE|SCHEMA) [IF NOT EXISTS] database_name //生產中if not exists都帶上 [COMMENT d

Hive總結（七）Hive四種數據導入方式

hive src ive log 技術 mage cnblogs images 四種 Hive總結（七）Hive四種數據導入方式

ceph分布式存儲實戰（2）——從0開始創建第一個ceph集群

moni name exceptio swap nor 都是 -c 監視 defined 一、在每臺節點的/etc/hosts文件中增加如下內容 192.168.89.101 ceph-node1 192.168.89.102 ceph-node2 192.168.89.1

Redis學習（2）-redis安裝

註意編譯依賴 redis啟動依賴環境 code 技術分享 c-c++ spa 安裝redis需要先從官網下載的源碼進行編譯，編譯依賴GCC環境，如果沒有GCC環境，需要安裝GCC。 yum install gcc-c++ 步驟1：上傳將Win

Asp.Net Core 2.0 項目實戰（2）NCMVC一個基於Net Core2.0搭建的角色權限管理開發框架

ML 用戶解密 https redis json uil AI 不足本文目錄 1. 摘要 2. 框架介紹 3. 權限管理之多一點說明 4. 總結 1. 摘要　　NCMVC角色權限管理框架是由最近練習Net Core時抽時間整理的

爬蟲兇猛：爬支付寶、爬微信、竊取數據/編程實戰（2）：爬蟲架構

txt spi 實戰 base 如果 raw 爬取文件 alt 大家如果有什麽好的想法請多留言，多提意見。語言&環境語言：彈藥充足，Python沖鋒！一個迷你框架下面以比較典型的通用爬蟲為例，分析其工程要點，設計並實

靈活強大的MySQL代理中間件ProxySQL應用實戰（2）

磁盤這一作者系統架構師 fault 日誌分析 save use ria 一、ProxySQL的運行機制 ProxySQL有一個完備的配置系統，配置ProxySQL是基於sql命令的方式完成的。ProxySQL支持配置修改之後的在線保存、應用，不需要重啟即可生效。整個配

Java詳解（2）--JDK安裝與環境變數配置

JDK安裝與環境變數配置 --------------------- 作者：文動天下來源：CSDN 連結：https://blog.csdn.net/li_yi_kun?t=1 版權宣告：本文為博主原創文章，轉載請附上博文連結！ 1、JDK&nb

機器學習實戰（2）-決策樹

構建決策樹最重要的是分裂屬性的選取,重要的是每個屬性在節點的位置，比如說第一個節點屬性為什麼是A而不是B。分裂屬性就是在某個節點處按照某一特徵屬性的不同劃分構造不同的分支，其目標是讓各個分裂子集更加的純，所謂的純是指儘量讓一個分裂子集中待分類項屬於同一類別。判斷純的方法有ID3，C4.5，CART演算法。&n

第三天（2）docker 安裝詳細手工版（yum）

應用 docker環境部署 1 主機環境需求 uname -a 主要檢視核心是否符合Docker的需求 2 部署docker 我們從網路環境、安全配置、主機名規劃、軟體源配置、基礎軟體安裝、docker安裝六個方面來學習網路環境：關閉NetworkManag

牛客網—資料庫SQL實戰（2）

11. 獲取所有員工當前的manager 獲取所有員工當前的manager，如果當前的manager是自己的話結果不顯示，當前表示to_date='9999-01-01'。結果第一列給出當前員工的emp_no,第二列給出其manager對應的manager_no。 CRE

小白的資料結構程式碼實戰（2）----雙向連結串列的各種操作

//Author:張佳琪 #include <stdio.h> #include <stdlib.h> typedef int ElemType; typedef struct Node { ElemType data; struct

深度學習之PyTorch實戰（2）——神經網路模型搭建和引數優化

　　上一篇部落格先搭建了基礎環境，並熟悉了基礎知識，本節基於此，再進行深一步的學習。　　接下來看看如何基於PyTorch深度學習框架用簡單快捷的方式搭建出複雜的神經網路模型，同時讓模型引數的優化方法趨於高效。如同使用PyTorch中的自動梯度方法一樣，在搭建複雜的神經網路模型的時候，我們也可以使用PyTor

Deeplearning4j 實戰（2）：Deeplearning4j 手寫體數字識別Spark實現

在前兩天的部落格中，我們用Deeplearning4j做了Mnist資料集的分類。算是第一個深度學習的應用。像Mnist資料集這樣圖片尺寸不大，而且是黑白的開源圖片集在本地完成訓練是可以的，畢竟我們用了Lenet這樣相對簡單的網路結構，而且本地的機器配置也有8G左右的記憶體。但實際生產中，圖片的數量

機器學習實戰（2）—— k-近鄰演算法

老闆：來了，老弟！我：來了來了。老闆：今天你要去看看KNN了，然後我給你安排一個工作！我：好嘞！就是第二章嗎？老闆：對！去吧！可惡的老闆又給我安排任務了！《機器學習實戰》這本書中的第二章為我們介紹了K-近鄰演算法，這是本書中第一個機器學習演算法，它非常有效而且易於

Scala 專案開發實戰（2）

今天是學習王家林老師大資料的第二天，今天主要講的是Scala的基礎語法知識，下面開始Scala的開發之旅。 Tuple 使用列印輸出 triple 中的內容 Arra

Hive實戰（2）Hive安裝教程

選擇Hadoop發行版本

安裝java

安裝Hadoop

選擇本地模式 並測試Hadoop

安裝Hive

Hive檔案說明

啟動Hive

hadoop本地模式配置

hadoop偽分散式，叢集模式

JDBC連線metastore元資料配置

Hive命令

Hive命令列介面

相關推薦

選擇本地模式並測試Hadoop