Hive表的增刪改、混合操作

阿新 • • 發佈：2018-11-14

增

Hive表增加資料有兩種方式（目前我知道的），分別為load及傳統意義上的insert。

通過load載入資料

命令格式

    LOAD DATA [LOCAL] INPATH 'filepath' [OVERWRITE] INTO TABLE tablename [PARTITION (partcol1=val1, partcol2=val2 ...)]

    LOAD DATA [LOCAL] INPATH 'filepath' [OVERWRITE] INTO TABLE tablename [PARTITION (partcol1=val1, partcol2=val2 ... 
)] [INPUTFORMAT 'inputformat' SERDE 'serde'] (3.0 or later)

語句說明
- LOCAL：是否是本地檔案。語句中加入該關鍵字時表示filepath的路徑使用的是本地檔案系統路徑，而非HDFS路徑。適用於從本地匯入資料至表中。
- filepath：檔案路徑。可以是相對路徑，絕對路徑，檔案系統url連結。該路徑若指向一個檔案，該檔案將被移動(move)至表所在目錄，若指向一個目錄，則該目錄下所有檔案將會被移動(move)至表所在目錄，該目錄不可以包含子目錄（Hive 3.0及以後版本可以包含子目錄）。其中表所在目錄可在建表時指定。
  注：當路徑為相對路徑時，若LOCAL未指定，則Hive會自動在該相對路徑前加上/user/<username>/
  
  。若LOCAL未給出時，原始檔系統必須與表所在的檔案系統相同。
- OVERWRITE：是否覆寫。字面意思。
- PARTITION ：關於分割槽，以後補充。
使用例子

// 將a.txt從本地移動表student中
LOAD DATA LOCAL INPATH 'a.txt' OVERWRITE INTO TABLE student;

// 將 hdfs:///zhaopy/test/hive/b.txt 載入到表student中，執行完後，/zhaopy//test/hive/ 下 b.txt會被移動到表所在目錄。
LOAD DATA INPATH '/zhaopy/test/hive/b.txt' 
 OVERWRITE INTO TABLE student;

通過insert query插入資料

每insert一條記錄都會產生一次mapreduce任務，效能較差，推薦使用load

命令格式

Standard syntax:    // 標準版，基於查詢的插入
INSERT OVERWRITE TABLE tablename1 [PARTITION (partcol1=val1, partcol2=val2 ...) [IF NOT EXISTS]] select_statement1 FROM from_statement;
INSERT INTO TABLE tablename1 [PARTITION (partcol1=val1, partcol2=val2 ...)] select_statement1 FROM from_statement;

Hive extension (multiple inserts):  // hive擴充套件版本，基於查詢的插入
FROM from_statement
INSERT OVERWRITE TABLE tablename1 [PARTITION (partcol1=val1, partcol2=val2 ...) [IF NOT EXISTS]] select_statement1
[INSERT OVERWRITE TABLE tablename2 [PARTITION ... [IF NOT EXISTS]] select_statement2]
[INSERT INTO TABLE tablename2 [PARTITION ...] select_statement2] ...;
FROM from_statement
INSERT INTO TABLE tablename1 [PARTITION (partcol1=val1, partcol2=val2 ...)] select_statement1
[INSERT INTO TABLE tablename2 [PARTITION ...] select_statement2]
[INSERT OVERWRITE TABLE tablename2 [PARTITION ... [IF NOT EXISTS]] select_statement2] ...;

Hive extension (dynamic partition inserts): // hive擴充套件版本，基於查詢的動態分割槽插入
INSERT OVERWRITE TABLE tablename PARTITION (partcol1[=val1], partcol2[=val2] ...) select_statement FROM from_statement;
INSERT INTO TABLE tablename PARTITION (partcol1[=val1], partcol2[=val2] ...) select_statement FROM from_statement;

語句說明
- OVERWRITE ：覆蓋掉原來的資料。
- Hive0.13.0以後版本，一個表可以通過設定表元資料（預設為false）"immutable"="true"為不可變表。對於非空的不可變表的插入對丟擲異常。但是對於空的不可變表則可以插入，同時覆蓋操作也不受此屬性影響。（允許覆蓋）
- partition，插入分割槽表以後補充。
使用例子

hive> select * from student;
OK
10      zhao
12      NULL
Time taken: 0.125 seconds, Fetched: 2 row(s)
hive> select * from teacher;
OK
Time taken: 0.108 seconds
hive> INSERT OVERWRITE TABLE teacher select id,null from student where student.name='zhao';
---------------------------------省略一堆輸出--------------------------------------------
hive> select * from teacher;
OK
10      NULL
Time taken: 0.125 seconds, Fetched: 1 row(s)

// 可以看出通過insert 以及 select from where配合將指定的格式插入到目標表中。

通過insert 將查詢結果寫入檔案中

命令格式

Standard syntax:
INSERT OVERWRITE [LOCAL] DIRECTORY directory1
  [ROW FORMAT row_format] [STORED AS file_format] (Note: Only available starting with Hive 0.11.0)
  SELECT ... FROM ...

Hive extension (multiple inserts):
FROM from_statement
INSERT OVERWRITE [LOCAL] DIRECTORY directory1 select_statement1
[INSERT OVERWRITE [LOCAL] DIRECTORY directory2 select_statement2] ...


row_format
  : DELIMITED [FIELDS TERMINATED BY char [ESCAPED BY char]] [COLLECTION ITEMS TERMINATED BY char]
        [MAP KEYS TERMINATED BY char] [LINES TERMINATED BY char]
        [NULL DEFINED AS char] (Note: Only available starting with Hive 0.13)

語句說明
- row_type、file_format說明見： Hive表的定義，刪除、修改
使用例子

hive> select * from student;
OK
10      zhao
12      NULL
Time taken: 0.134 seconds, Fetched: 2 row(s)
INSERT OVERWRITE local directory '/hadoop/asiainfo/zhaopy/hivetest' select * from student;
------------------------省略一堆輸出------------------
[ochadoop@server7 hivetest]$ ls
000000_0.snappy  000001_0.snappy
[ochadoop@server7 hivetest]$ cat 000000_0.snappy 
10zhao
[ochadoop@server7 hivetest]$ cat 000001_0.snappy 
12\N

通過insert values插入資料

命令格式

Standard Syntax:
INSERT INTO TABLE tablename [PARTITION (partcol1[=val1], partcol2[=val2] ...)] VALUES values_row [, values_row ...]

Where values_row is:
( value [, value ...] )
where a value is either null or any valid SQL literal

語句說明
- 不同於標準SQL，此處不支援插入部分列，即，所有的列都需要插入。缺失的列需要用null代替。
- 分割槽：以後補充。
使用例子

hive> select * from student;
OK
10      zhao
12      NULL
Time taken: 0.137 seconds, Fetched: 2 row(s)
hive> insert into table student values (50, null);
----------------省略一堆輸出
hive> select * from student;
OK
10      zhao
12      NULL
50      NULL
Time taken: 0.126 seconds, Fetched: 3 row(s)

刪

命令格式

Standard Syntax:
DELETE FROM tablename [WHERE expression]

語句說明
- 該語句在hive0.14之後可用，只能用於支援ACID的表中。
使用例子
與普通SQL相同。

改

命令格式

Standard Syntax:
UPDATE tablename SET column = value [, column = value ...] [WHERE expression]

語句說明
- 該語句只能用於支援ACID的表中
- Bucketing 列和Partitioning 列無法被更新。
- 該語句可用在hive0.14版本。
使用例子
與普通SQL相同。

混合操作

所謂混合操作，就是將以上語句寫入一個語句中，加入條件進行操作

語句格式

Standard Syntax:
MERGE INTO <target table> AS T USING <source expression/table> AS S
ON <boolean expression1>
WHEN MATCHED [AND <boolean expression2>] THEN UPDATE SET <set clause list>
WHEN MATCHED [AND <boolean expression3>] THEN DELETE
WHEN NOT MATCHED [AND <boolean expression4>] THEN INSERT VALUES<value list>

語句說明
- 該語句只能用於支援ACID的表中
- Bucketing 列和Partitioning 列無法被更新。
- 該語句可用在hive 2.2版本。
使用例子

MERGE INTO merge_data.transactions AS T 
USING merge_data.merge_source AS S
ON T.ID = S.ID and T.tran_date = S.tran_date
WHEN MATCHED AND (T.TranValue != S.TranValue AND S.TranValue IS NOT NULL) THEN UPDATE SET TranValue = S.TranValue, last_update_user = 'merge_update'
WHEN MATCHED AND S.TranValue IS NULL THEN DELETE
WHEN NOT MATCHED THEN INSERT VALUES (S.ID, S.TranValue, 'merge_insert', S.tran_date);

Hive表的增刪改、混合操作

增 Hive表增加資料有兩種方式（目前我知道的），分別為load及傳統意義上的insert。通過load載入資料命令格式 LOAD DATA [LOCAL] INPATH 'filepath' [OVERWRITE] INTO TA

Hive 表增刪改查CRUD操作

建表操作建立外部表 CREATE EXTERNAL TABLE dg_devicetoken_day ( id bigint, user_id bigint, de

數據庫表--增刪改查的操作實例

數字電路查看 varchar 數學 sna 成績同學 part 及其一、設置數據庫包括四個表：學生表（Student）、課程表（Course）、成績表（Score）以及教師信息表（Teacher）。四個表的結構分別如表1-1的表（一）~表（四）所示，數據如表1-2的

MyBatis 學習總結 02 對表執行增刪改查(CRUD)操作 OLD

去除 dev ins tlist 只需要獲取 exception ref ssi 　　可以對上一節中使用mybatis打開一次session的業務邏輯進行封裝，封裝的成工具類命名為： MyBatisUtil package com.mybatis.util;

一、mybaitis的增刪改查簡單操作

1、匯入jar包 mysql-connector-java-5.1.7-bin.jar mybatis-3.2.7.jar 2、db.propertiese jdbc.driver=com.mysql.jdbc.Driver jdbc.url=jdbc:mysql://localho

Hive分割槽表增刪改查

1 分割槽表分割槽表實際上就是對應一個HDFS檔案系統上的獨立的資料夾，該資料夾下是該分割槽所有的資料檔案。Hive中的分割槽就是分目錄，把一個大的資料集根據業務需要分割成小的資料集。在查詢時通過WHERE子句中的表示式選擇查詢所需要的指定的分割槽，這樣的查詢效率會提高很多。 1.1 分割

MySQL基本操作--庫表增刪改查

change har str ccf 行記錄 base clas 字符集切換庫的增刪改查增: create database db1; 刪: drop database db1; 改: alter database db1 charset utf8; 修改庫的字符

oracle.資料的增刪改、事務、建立表、修改表、刪除表

一、資料的增刪改 1、備份表（01）全表備份 CREATE TABLE 新表名 AS 子查詢; ---將emp表全表備份 CREATE TABLE emp_bak AS SELECT * FROM emp; SELECT * FROM emp_bak; (02）只備份

關於利用PHP訪問MySql數據庫的邏輯操作以及增刪改查實例操作

自增刪除 nbsp bsp 增刪 sso 成員執行 ech PHP訪問MySql數據庫 <?php //造連接對象$db = new MySQLi("localhost","root","","0710_test");//寫SQL語句$sql = "select

Django之數據表增刪改查

shortcuts add hid true 代碼 django app 的人 [0 Django數據增刪改查：上課代碼 from django.shortcuts import render,HttpResponse # Create your views here

Django 【第五篇】ORM單表增刪改查

contains 字典 exc 單表 pytho name屬性作者包括刪除數據一、添加表記錄對於單表有兩種方式 # 添加數據的兩種方式 # 方式一：實例化對象就是一條表記錄 Frank_obj = models.Student(name ="海

hive 表的創建的操作與測試

大數據 hadoop hive Hive 中創建表的三種方式，應用場景說明及練習截圖內部表和外部表的區別，練習截圖分區表的功能、創建，如何向分區表中加載數據、如何檢索分區表中的數據，練習截圖一：hive HQL 的表操作： 1.1.1創建數據庫： hive> create

數據庫 - 表 - 增刪改查

數據類型 ica 逗號 charset prim odi rds inf sql 表得增刪改查： 1.表介紹： id,name,age,sex稱為字段，其余的，一行內容稱為一條記錄。

python實現員工信息表增刪改查

python實現員工信息表增刪改查 python實現員工信息表員工信息表增刪改查增刪改查程序說明：模擬實現sql語句的增刪改查關鍵是怎麽去實現這個事情，從哪兒下手，網上的代碼挺多的，這個比較好，最好自己畫一個流程圖，這樣寫起來就比較方便，自己寫了一遍代碼，有問題的可以聯系，剛開始學習py

數據庫---表---增刪改與權限

val columns pri microsoft 設置 revoke 查看 color mes 一、表的增刪改分類插入數據 insert 更新數據 update 刪除數據 delete 1.插入數據 1. 插入完整數據（順序插入）語法一： IN

搭建MyBatis工作環境以及增刪改查基本操作

read generated artifact this close sco del url eal 數據庫準備創建一個數據庫為mybatus-test,表為user CREATE TABLE `user` ( `id` int(11) NOT NULL AUTO_I

Mybatis實現部門表增刪改查以及排序

tis hide 映射類型 f2c cep interface mes sele 廢話不說,直接開門見山! 需要在WebContent下的lib下導入兩個包 mybatis-3.2.5.jar ojdbc6.jar 1 package com.xdl.entit

mysql增刪改、查語句

into () sta center update 增刪改運算符 num 定義增： INSERT 語句中指定所有字段名語法：INSERT INTO 表名（字段名1，字段名2，…）VALUES（值1，值2，…）； 1.1.2 INSERT語句中不指定字段名

XML模塊增刪改查基本操作

讀取 try element utf-8 文檔 ldo nco nbsp 基本增：新建一個xml文件，把數據寫進去 # 怎麽生成一個xml文件？ # 1，導入模塊 import xml.etree.ElementTree as et # 2, 定義節點 root =

Python字典中增刪改查的操作

增：字典中的增加鍵值對與列表相差無幾，例：dic = {'name1':'tom'} 實現增加的操作：dic['name2'] = 'Jack' 注意不要忘記加''(上引號) 刪：三種方法，dic.pop('key')，可

Hive表的增刪改、混合操作

增

通過load載入資料

通過insert query插入資料

通過insert 將查詢結果寫入檔案中

通過insert values插入資料

刪

改

混合操作

相關推薦