HIVE基礎操作（命令，表，資料匯出匯入等）--持續更新

阿新 • • 發佈：2019-01-14

1.show databases;
2.show tables;
3.show tables in 資料庫名;(不在對應資料庫下可查到想要的表名)
4.show tables in hive 'tom*'; 查詢在hive資料庫下，tom開頭的表名。
5.desc extended tablename; 
可以查看錶詳細資訊，其中tableType=MANAGED_TABLE或EXTENDED_TATBLE 看出是內部表還是外部表
6.資料庫的增刪改
(1)建立
create database if not exists hive;
使用if not exists 可以避免丟擲錯誤資訊。
(2)刪除資料庫
drop database if exists hive;
if exists 是可選的，如果加了這個子句，避免hive不存在丟擲的異常。

預設情況，hive是不允許刪除一個帶有表的資料庫的。使用者可以先清空資料庫表，再刪除庫，或者使用關鍵字cascade：
drop database if exists hive cascade;

(3)修改資料庫
可以修改資料庫的dbproperties,設定鍵值對屬性值，但是其他元資料資訊是不能修改的。如：
alter database hive set dbproperties(‘edited-by’=’wang’);
alter database mytest set dbproperties('creator'='wangdd');

7.建立表
(1)基本語法
CREATE [TEMPORARY（臨時表）] [EXTERNAL（外部表，如果不加該關鍵字就是建立內部表）] TABLE [IF NOT EXISTS] [db_name.]table_name   
[(col_name data_type [COMMENT col_comment]（列的註釋）, ... [constraint_specification])]
[COMMENT table_comment]（表的註釋）

  [PARTITIONED BY （分割槽）(col_name data_type [COMMENT col_comment], ...)]
  [CLUSTERED BY（分佈） (col_name, col_name, ...) [SORTED BY (col_name [ASC|DESC], ...)] INTO num_buckets BUCKETS（分桶）]
  [SKEWED BY (col_name, col_name, ...) -- (Note: Available in Hive 0.10.0 and later)]
     ON ((col_value, col_value, ...), (col_value, col_value, ...), ...)
     [STORED AS DIRECTORIES]
  [
   [ROW FORMAT row_format] 分隔符的指定
   [STORED AS file_format] 資料儲存格式
     | STORED BY 'storage.handler.class.name' [WITH SERDEPROPERTIES (...)]  -- (Note: Available in Hive 0.6.0 and later)
  ]
  [LOCATION hdfs_path]真實資料存放的位置
  [TBLPROPERTIES (property_name=property_value, ...)]   -- (Note: Available in Hive 0.6.0 and later)
  [AS select_statement];   -- (Note: Available in Hive 0.5.0 and later; not supported for external tables) 


create table hive.person(
id int,
name string,
likes array<string>,
desc map<string,string>
desc struct<city:string,area:string,streetID:int>

)
ROW FORMAT  DELIMITED FIELDS TERMINATED BY ','
COLLECTION ITEMS TERMINATED BY '-'
LINES TERMINATED BY '\n'
NULL DEFINED AS '@' --在顯示的時候就是null了
STORED AS TEXTFILE;

(2)複製一個表結構（不包含資料）
CREATE [TEMPORARY] [EXTERNAL] TABLE [IF NOT EXISTS] [db_name.]table_name
  LIKE existing_table_or_view_name
  [LOCATION hdfs_path];
  CREATE TABLE like_student LIKE student;
(3)通過查詢來建立另外一張表
CREATE TABLE new_key_value_store
   ROW FORMAT SERDE "org.apache.hadoop.hive.serde2.columnar.ColumnarSerDe"
   STORED AS RCFile
   AS
SELECT (key % 1024) new_key, concat(key, value) key_value_pair
FROM key_value_store
SORT BY new_key, key_value_pair;

  CREATE TABLE s_person1
  ROW FORMAT DELIMITED FIELDS TERMINATED BY '#'
  COLLECTION ITEMS TERMINATED BY '^'
  MAP KEYS TERMINATED BY '_'
  NULL DEFINED AS '@'
  AS SELECT * FROM person1;

（4）分割槽表
create table hive.tomcat_log(
id string,
page string,
status int,
traffic int
)
partitioned by (year string,month string,day string)
ROW FORMAT  DELIMITED FIELDS TERMINATED BY ',' 
STORED AS TEXTFILE; 

（5）分桶表
create table clus2(
cc int)
CLUSTERED BY (cc)
SORTED by (cc)
into 3 buckets; 

8.資料的匯入
(1)LOAD DATA 
LOAD DATA [LOCAL] INPATH 'filepath' [OVERWRITE]（覆蓋，不寫就是追加） INTO TABLE tablename [PARTITION (partcol1=val1, partcol2=val2 ...)]

在本地匯入（Linux系統下）複製的過程
load data local inpath '/home/wangfutai/a/1.txt'  INTO TABLE hive.union_test;

在hdfs匯入（hdfs系統下）剪下的過程，原來目錄資料沒了
追加：
load data inpath '/user/wangfutai/hive/warehouse/hive.db/st/st.txt'  INTO TABLE hive.union_test;
覆蓋：
load data inpath '/user/wangfutai/hive/warehouse/hive.db/st/1.txt' OVERWRITE INTO TABLE hive.union_test;
(2)分割槽表的匯入
靜態模式：
load data local inpath '/home/wangfutai/a/2.txt' OVERWRITE  INTO TABLE hive.tomcat_log PARTITION(year='2017',month='11',day='5');

load data  inpath '/user/wangfutai/mr/ETLOutPut16/part-r-00001' OVERWRITE  INTO TABLE hive.tomcatelog PARTITION(days='20170531');

動態模式：
覆蓋模式：只會覆蓋相同分割槽資料,其他分割槽不受影響·
INSERT OVERWRITE TABLE tablename1 [PARTITION (partcol1=val1, partcol2=val2 ...) [IF NOT EXISTS]] select_statement1 FROM from_statement;
追加模式：
INSERT INTO TABLE tablename1 [PARTITION (partcol1=val1, partcol2=val2 ...)] select_statement1 FROM from_statement;
例子：
INSERT OVERWRITE TABLE  dynamic_human2 PARTITION (sexs) select * from human1;

以下插入，需要human3的列比dynamic_human3 少一列
INSERT OVERWRITE TABLE  dynamic_human3 PARTITION (sexs=‘nan’) select * from human3;


9.資料的匯出
(1)通過建表的方式
CREATE TABLE new_key_value_store
   ROW FORMAT SERDE "org.apache.hadoop.hive.serde2.columnar.ColumnarSerDe"
   STORED AS RCFile
   AS
SELECT (key % 1024) new_key, concat(key, value) key_value_pair
FROM key_value_store
SORT BY new_key, key_value_pair;

CREATE TABLE s_person1
ROW FORMAT DELIMITED FIELDS TERMINATED BY '#'
COLLECTION ITEMS TERMINATED BY '^'
MAP KEYS TERMINATED BY '_'
NULL DEFINED AS '@'
AS SELECT * FROM person1;

(2)通過insert 
INSERT OVERWRITE [LOCAL] DIRECTORY directory1
[ROW FORMAT row_format] [STORED AS file_format] 
SELECT ... FROM ...
  儲存到本地
  INSERT OVERWRITE LOCAL DIRECTORY
'/home/wangfutai/a/partition_data'
  ROW FORMAT DELIMITED FIELDS TERMINATED BY '#'
  NULL DEFINED AS '@'
  SELECT * FROM st;

 儲存到hdfs中  會覆蓋掉原來目錄
  INSERT OVERWRITE  DIRECTORY
 '/user/candle/hive_data/person1_data'
  ROW FORMAT DELIMITED FIELDS TERMINATED BY '#'
  COLLECTION ITEMS TERMINATED BY '^'
  MAP KEYS TERMINATED BY '_'
  NULL DEFINED AS '@'
  SELECT * FROM person1;

（3）通過查詢插入表中，指定列作為分割槽
覆蓋模式：只會覆蓋相同分割槽資料,其他分割槽不受影響·
INSERT OVERWRITE TABLE tablename1 [PARTITION (partcol1=val1, partcol2=val2 ...) [IF NOT EXISTS]] select_statement1 FROM from_statement;
追加模式：
INSERT INTO TABLE tablename1 [PARTITION (partcol1=val1, partcol2=val2 ...)] select_statement1 FROM from_statement;
覆蓋：
INSERT OVERWRITE TABLE dynamic_human1 PARTITION(sex) SELECT * FROM human1;
追加:
INSERT INTO TABLE dynamic_human1 PARTITION(sex) SELECT * FROM human2;

也可以在插入的時候 指定分割槽列名,但是指定了分割槽列名,那麼human3就必須沒有sex這列，因為sex分割槽已經指定了

INSERT OVERWRITE TABLE dynamic_human1 PARTITION(sex='aaa') SELECT * FROM human1;

HIVE基礎操作（命令，表，資料匯出匯入等）--持續更新

1.show databases; 2.show tables; 3.show tables in 資料庫名;(不在對應資料庫下可查到想要的表名) 4.show tables in hive 'tom*'; 查詢在hive資料庫下，tom開頭的表名。 5.desc extended tablenam

SparkStreaming部分的學習（包括：sparkStreaming與storm的區別， Sparkstreaming處理資料的過程等）【業務邏輯圖及文字說明】

sparkStreaming與storm的區別： Sparkstreaming處理資料的過程： sparkstreaming：資料是一段時間處理的，是一個微批處理，這個時間是由自己人為設定的。sparkstreaming的吞吐量高。 Storm：是純實時處理資料的，

Lightning Experience 基本操作（創建app 修改filter page layout等）

uicontrol auto fig PC refresh AD upload mic filter 1，Lightning Experience app管理打開setup 在setup中輸入app manager如下圖所示可以進行新建app 等操作 app

MySQL（1）基本操作（MySQL的啟動，表的建立，查詢表的結構和表的欄位的修改）

MySQL啟動流程 1 啟動伺服器 2 使用者名稱登入到MySQL資料庫中 3 檢視有哪些資料庫 4 使用其中的資料庫 5 檢視該資料庫中已有哪些表，沒有就新建 mysql

java 連帶操作（兩張表關聯，一張表插入一條新資料，另外一張表也跟著插入一條新資料）

以角色許可權模組中增加功能為例子：a) 概念：連帶操作：首先先在Role表中插入一條資料，接著拿到rid，往Role-Acl表中插入一條資料b)資料庫設計：Role表：Role-Acl表：c) 程式碼實現：RoleMap:/** * * @Description: 新增

html基礎之（內容列表元素，內容嵌套元素。。。。。）完結

html1.內容列表元素有序列表，無序列表，自定義列表無序列表<ul><li></li></ul>有序列表<ol><li</li>></ol> 可以加start="" 在ol裏面加自定義列表<dl>&l

JS入門筆記+基本操作（剛接觸JS，很多筆記就是看到啥寫啥的，希望多多包涵）。

外部 friend mage fff pen scrip 表示 num 很好 1.註釋： html的註釋: CSS的註釋:/*我是註釋*/ JS的註釋://我是註釋 2.變量：變量要先聲明再賦值，如下： var mychar; myc

訓練中的基礎技巧（數據處理，驗證集設置，參數處理）

ref 比較可能隨機 style 參加避免不知道區域訓練中的基礎技巧（數據處理，驗證集設置，參數處理）首先，對於數據我們需要統一其量綱。通用的做法是數據標準化。就是讓一個樣本內的均值為0，不同樣本類內方差盡量一致然後就是為標簽做one-hot e

python字符串的操作（去掉空格strip()，切片，查找，連接join()，分割split()，轉換首字母大寫，轉換字母大小寫...）

spa sele pos 方式第一個 color name 找不到 lac #可變變量：list, 字典#不可變變量：元祖，字符串字符串的操作（去掉空格，切片，查找，連接，分割，轉換首字母大寫，轉換字母大小寫，判斷是否是數字字母，成員運算符（in / no

【BZOJ2333】棘手的操作（左偏樹，STL）

ise 最大 pre mat line online continue inline lld 【BZOJ2333】棘手的操作（左偏樹，STL）題面 BZOJ上看把。。。題解正如這題的題號我只能$2333$ 神TM棘手的題目。。。前面的單點/聯通塊操作很顯然是

mysql修改編碼（數據庫，表，字段）

char park true ID mysql nbsp pan gbk 所有查看各個編碼 //查看字段編碼 SHOW FULL COLUMNS from park_car_user; //查看數據庫字段SHOW CREATE DATABASE db_nam

java 測試開發基礎知識（類加載，JVM等）

常量表達式對數前端 .cn 都是新的 ron 技術分享區域寫在開頭：面試的時候別人很可能會問你的java原理，.class load 原理， jvm機制，這些都是Java的底層知識，特整理如下： 1. 首先，編寫一個java程序，大家會用ide編寫一個例

事務處理是將多個操作或者命令一起執行，所有命令全

事務處理用於有效記錄某機構感興趣的業務活動（稱為事務）的資料處理（例如銷售、供貨的定購或貨幣傳輸）。通常，聯機事務處理 (OLTP) 系統執行大量的相對較小的事務。——百度百科事務處理是將多個操作或者命令一起

基於GDAL庫，讀取.nc文件（以海洋表溫數據為例）

調試 cfi 主函數 != mes stdstring 微軟 detail back 　　對於做海洋數據處理的同學，會經常遇到nc格式的文件，nc文件的格式全稱是NetCDF，具體的詳細解釋請查詢官網【https://www.unidata.ucar.edu/softwar

C語言一些例子（九九乘法表，楊輝三角形，九宮演算法）

分享一下我老師大神的人工智慧教程！零基礎，通俗易懂！http://blog.csdn.net/jiangjunshow 也歡迎大家轉載本篇文章。分享知識，造福人民，實現我們中華民族偉大復興！

初學：資料庫操作（個能記錄，生成唯一標識的方法）

關於sql server 的資料操作（生成唯一標示ID） 1.SQL 操作語句 http://www.w3school.com.cn/sql/sql_in.asp 2.生成一個唯一標示 IDNEWID() 插入一條： insert into W_1(id,account,pas

單鏈表的基礎操作（頭插法、尾插法、插入和刪除）

一、連結串列的建立（頭插法和尾插法） 1、頭插法：把後建立的結點插在頭部。用這種方法建立起來的連結串列的實際順序與輸入順序剛好向反，輸出時為倒序！下面附上程式碼： struct node *headcreat() { struct node *p,*q,*head;

Axios傳參的兩種方式，表單資料和json字串（Form Data和Request Payload）

第一種方式：Form Data Axios引數配置： 1、引入 import Qs from 'qs' 2、 return request({ headers: { 'Content-Type': 'application/x-www-form-

for迴圈簡單例項（列印乘法表，列印菱形）

關於for迴圈的簡單應用：回顧了一下for迴圈的巢狀： for迴圈巢狀簡單來講就是一個外圈的for程式裡面一個套著一個小的for程式，如果在範圍內就來回執行計算，超出了就跳出等待下面程式為列印九九乘法表： #include <stdio.h> int main() {

第一次使用樹莓派會用到的操作（修改國內源，中文輸入法，鍵盤佈局，時區，掛載行動硬碟等）

1.將樹莓派官方源修改為國內快速源修改配置檔案 [email protected] ~ $ vi /etc/apt/sources.list eb http://mirrors.tuna.tsinghua.edu.cn/raspbian/raspbian/ wheezy

HIVE基礎操作（命令，表，資料匯出匯入等）--持續更新

相關推薦