Hive之——Hive表操作

阿新 • • 發佈：2019-01-08

一、Hive基本使用——資料型別

1、基本資料型別

tinyint, smallint, int, bigint, boolean, float, double, string, binary, timestamp, decimal, char, varchar, date

2、集合型別

array: array型別是由一系列相同資料型別的元素組成，這些元素可以通過下標來訪問，例array[i]
map: map包含key->value鍵值對，可以通過key訪問元素，例map['key']
struct: 可以包含不同資料型別的元素，這些元素可以是通過"點語法"方式獲得，裡struct.key1

二、Hive表操作

顯示所有表

show tables;

顯示錶的表述資訊

desc [extended, formatted] tablename;

顯示建表語句

show create table tablename;

刪除表

drop table tablename;

三、相關注意項

1、關閉Hadoop的安全模式

hadoop dfsadmin -safemode leave

2、hive命令列顯示當前所在的資料庫

set hive.cli.print.current.db=true;

3、hive命令列顯示查詢的列表

set hive.cli.print.header=true;

四、建表例項

#建立資料表
drop table testtable;
create table if not exists testtable (
name string comment 'name value',
address string comment 'address value'
)
row format delimited fields terminated by '\t' lines terminated by '\n' stored as textfile;

#檢視資料表描述資訊
desc testtable;
desc extended testtable;
desc formatted testtable;

#從本地檔案載入資料並覆蓋掉原表中的資料
load data local inpath '/usr/local/src/data' overwrite into table testtable;
從本地檔案載入資料，不覆蓋原表中的資料
load data local inpath '/usr/local/src/data' into table testtable;

#建立一個外部表
drop table if exists employees;
create external table if not exists employees(
name string,
salary float,
subordinates array<string>,
deductions map<string, float>,
address struct<street:string, city:string, state:string, zip:int>
)
row format delimited fields terminated by '\t'
collection items terminated by ','
map keys terminated by ':'
lines terminated by '\n'
stored as textfile
location '/data/';

#插入employees中的資料格式
liuyazhuang	123	a1,a2,a3	k1:1,k2:2,k3:3	s1,s2,s3,9

提示

不通過MR查詢的情況：
1、select * from 表 [limit count]
2、通過分割槽表的分割槽條件查詢

五、Hive建表的其他操作

1、由一個表建立另一個表

create table lyz1 like lyz;

2、從其他表查詢建立表

create table lyz1 as select name, addr from lyz;

六、Hive不同檔案讀取對比

1、stored as textfile

直接檢視檔案

hadoop fs -text

2、stored as sequencefile

hadoop fs -text

3、stored as rcfile

hive -service rcfilecat path

4、stored as inputformat 'class' outformat 'class'

七、Hive使用SerDe

SerDe是"Serializer"和"Deserializer"的簡寫
Hive使用SerDe(和FileFormat)來讀、寫表的行
讀寫資料的順序如下：

HDFS檔案->InputFileFormat-><key, value>->Deserializer->row物件
Row物件->Serializer-><key, value>->OutputFileFormat->HDFS

八、Hive分割槽表

1、分割槽

在Hive select查詢中一般會掃描整個表內容，會消耗很多時間做沒必要的工作
分割槽表指的是在建立時指定partition的分割槽空間

2、分割槽語法

create table tablename(
name string
)
partitioned by (key type, ...)

3、建立一個分割槽表

drop table if exists employees;
create table if not exists employees(
name string,
salary float,
subordinates array<string>,
deductions map<string, float>,
address struct<street:string, city:string, state:string, zip:int>
)
partitioned by (st string, type string)
row format delimited
fields terminated by '\t'
collection items terminated by ','
map keys terminated by ':'
lines terminated by '\n'
stored as textfile;

4、Hive分割槽表操作

1) 增加分割槽

alter table tablename add if not exists partition(country='xxx'[, state='yyy']);

2) 刪除分割槽

alter table tablename drop if exists partition(country='xxx'[,state='yyyy']);

3) 查看錶中的分割槽

show partitions tablename;

九、Hive分桶

1、分桶

對於每一個表(table)或者分割槽，Hive可以進一步組成桶，也就是說桶是更為系列度的資料範圍劃分。
Hive是針對某一列進行分桶。
Hive採用對列值雜湊，然後除以桶的個數求餘的方式決定該條記錄存放在哪個桶中。

2、好處

獲得更高的查詢處理效率
使取樣更高效

3、分桶例項

drop table if exists bucketed_user;
create table if not exists bucketed_user(
id int,
name string
)
clustered by(id) sorted by(name) into 4 buckets
row format delimited fields terminated by '\t'
sorted as textfile;

set hive.enforce.bucketing=true;

insert overwrite table bucketed_user select addr, name from testtext;

Hive之——Hive表操作

一、Hive基本使用——資料型別1、基本資料型別tinyint, smallint, int, bigint, boolean, float, double, string, binary, timestamp, decimal, char, varchar, date2、集

Hive 之 Java API 操作

Java 想要訪問Hive，需要通過beeline的方式連線Hive，hiveserver2提供了一個新的命令列工具beeline，hiveserver2 對之前的hive做了升級，功能更加強大，它增加了許可權控制，要使用beeline需要先啟動hiverse

Hive之管理表外部表分割槽表

一Hive 建立表的三種方式 1.1普通建立 1.2查詢語句建立 CREATETABLE IF NOT EXISTS ext_1 AS SELECT deptno,dname,loc FROMdep

Mysql之庫表操作(胖胖老師)

modify ctu for desc 命名規則 var 系統取數據增刪改 SQL概念:結構化查詢語言(SQL = Structured Query Language),也是一種編程語言(數據庫查詢和程序設計語言),可以用於數據的存取及查詢,更新,管理關系型數據庫系統p

Hive之 hive與hadoop的聯系

ack create 交互 table ima ask str 數據信息 where Hive與Hadoop調用圖解析：

MySQL之多表操作

cnblogs lec 外連接自然連接中軟 outer esc convert not in 前言：之前已經針對數據庫的單表查詢進行了詳細的介紹：MySQL之增刪改查，然而實際開發中業務邏輯較為復雜，需要對多張表進行操作，現在對多表操作進行介紹。前提：為方便後面的操作

ORM之連表操作

span 技術數據 import alt AD apt 分享增加　　ORM之連表操作　　UserInfo和UserType兩個表關聯，UserInfo的外鍵連UserType的主鍵。拿到UserInfo的所有信息，就可以拿與UserInfo相關聯的UserType的

數據結構之鏈表操作

index stat nbsp ID prev set append his 改進對鏈表的增刪改查簡單實現 public class LinkedList<E> { private class Node{ public Node

django之單表操作

1.查詢方法:<1> all(): 查詢所有結果 <2> filter(**kwargs): 它包含了與所給篩選條件相匹配的物件 <3> get(**kwargs): 返回與所給篩選條件相匹配

Django—ORM之單表操作

一單表操作建立表 1 建立模型建立名為book的app，在book下的models.py中建立模型： from django.db import models # Create your models here. class Book(models.M

Django 模型層之多表操作

一.建立模型例項: 作者表: 擁有欄位:姓名(name),性別(sex),該表與書籍表之間為多對多的關係作者詳情表: 擁有欄位:地址(addr),手機號(phone),該表與作者表之間為一對一的關係出版社表: 擁有欄位:名字(name),地址(addr),該表與書籍表之間為一

模型層之多表操作

一:建立模型 1 例項：我們來假定下面這些概念，欄位和關係作者模型：一個作者有姓名和年齡。作者詳細模型：把作者的詳情放到詳情表，包含生日，手機號，家庭住址等資訊。作者詳情模型和作者模型之間是一對一的關係（one-to-one）出

Django模型層之多表操作

一、建立多表模型例項：作者表: 擁有欄位:姓名(name),性別(sex),該表與書籍表之間為多對多的關係作者詳情表: 擁有欄位:地址(addr),手機號(phone),該表與作者表之間為一對一的關係出版社表: 擁有欄位:名字(name),地址(addr),該表與書籍

Django模型層之單表操作

MVC或者MVC框架中包括一個重要的部分，就是ORM，它實現了資料模型與資料庫的解耦，即資料模型的設計不需要依賴於特定的資料庫，通過簡單的配置就可以輕鬆更換資料庫。ORM是“物件-關係-對映”的簡稱。 sql中的表 # 建立表 create TABLE employee(

MySQL之庫表操作詳述

一、庫操作建立庫create database 庫名（charset utf8 對庫的編碼進行設定，不寫就用預設值）庫名可以由字母、數字、下劃線、特殊字元，要區分大小寫，唯一性，不能使用關鍵字，不能用數字開頭，最長128位檢視資料庫注意：在cmd中輸入指令是不區分大小寫的show databases;&n

大資料hive之hive連線mysql並啟動，出現SSL警告，如何解決？

文章目錄 1. 問題 2. 如何解決？ 2.1 設定useSSL=false 2.2 設定useSSL = true 1. 問題 Hive能正常執行任務，但出現“WARN: E

線性表之順序表操作（已完結）

考研408資料結構線性表複習；有任何問題私我#include<iostream> #include<algorithm> const int initlength = 100; ///順序表的初始長度 using namespace std

day055&056Django之多表操作，多表查詢

本節內容： 1、回顧一對一、一對多、多對多的表結構關係 2、建立模型 3、新增表記錄 4、基於物件的跨表查詢 5、基於雙下劃線的跨表查詢 6、聚合查詢與分組查詢 7、F查詢與Q查詢一、回顧一

Memcached原始碼分析之Hash表操作

Memcached的Hash表用來提高資料訪問效能，通過連結法來解決Hash衝突，當Hash表中資料多餘Hash表容量的1.5倍時，Hash表就會擴容，Memcached的Hash表操作沒什麼特別的，我們這裡簡單介紹下Memcached裡面的Hash表操作。 //hash表

Hive之 hive架構

Hive架構圖主要分為以下幾個部分：使用者介面，包括命令列CLI，Client，Web介面WUI，JDBC/ODBC介面等中介軟體：包

Hive之——Hive表操作

一、Hive基本使用——資料型別

1、基本資料型別

2、集合型別

二、Hive表操作

三、相關注意項

1、關閉Hadoop的安全模式

2、hive命令列顯示當前所在的資料庫

3、hive命令列顯示查詢的列表

四、建表例項

五、Hive建表的其他操作

1、由一個表建立另一個表

2、從其他表查詢建立表

六、Hive不同檔案讀取對比

1、stored as textfile

2、stored as sequencefile

3、stored as rcfile

4、stored as inputformat 'class' outformat 'class'

七、Hive使用SerDe

八、Hive分割槽表

1、分割槽

2、分割槽語法

3、建立一個分割槽表

4、Hive分割槽表操作

九、Hive分桶

1、分桶

2、好處

3、分桶例項

相關推薦