大資料（二十）：hive分割槽表、修改表語句與資料的匯入匯出

阿新 • • 發佈：2018-11-10

一、分割槽表

分割槽表實際上就是對應一個HDFS檔案系統上的一個獨立的資料夾，該資料夾下是該分割槽所有的資料檔案，hive中的分割槽就是分目錄，把一個大的資料集更具業務需求分割成小的資料集。在查詢時通過where子句中的表示式選擇查詢所需要的指定分割槽，這樣查詢效率會提高很多。

1.建立分割槽表

create table dept_partition(
deptno int,
dname string,
loc string
)
partitioned by (month string)
row format delimited fields terminated by '\t';

2.匯入資料

load data local inpath '/opt/datas/dept.txt' into table dept_partition partition (month ='201809')

3.選擇分割槽查詢

select * from dept_partition where month='201809';

4.多分割槽聯合查詢

select * from dept_partition where month='201809'
union
select * from dept_partition where month='201808';

5.新增分割槽

alter table dept_partition add partition(month='201810');

6同時增加多個分割槽（兩個之間只有空格，沒有任何連線符）

alter table dept_partition add partition(month='201811') partition(month='201812');

7.刪除分割槽

alter table dept_partition drop partition(month='201812');

8.同時刪除多個分割槽（中間有逗號分隔，與增加不同）

alter table dept partition drop partition(month='201811'),partition(month='201810');

9.檢視有多少分割槽

show partition dept_partition;

10.檢視分割槽表結構

desc formatted dept_partition;

11.建立二級分割槽

create table dept_partition2(
deptno int,
dname string,
loc string
)
partitioned by(month string,day string)
row format delimited fields terminated by '\t';

12.二級分割槽匯入資料

load data local inpath '/opt/datas/dept.txt' into table dept_partition partition (month ='201809',day='123');

二、分割槽資料關聯的三種方式

1.正常的載入資料

load data local inpath '/opt/datas/dept.txt' into table dept_partition partition(month='201809',day='123');

2.上傳資料後修復

建立目錄和上傳資料（hive客戶端）

dfs -mkdir -p /user/hive/warehouse/dept_partition2/month=201810/day=12;
dfs -put /user/hive/warehouse/dept_partition2/month=201810/day=12;

執行修復命令

msck repair table dept_partition2;

3.上傳資料後新增分割槽

dfs -mkdir -p /user/hive/warehouse/dept_partition2/month=201810/day=12;
dfs -put /user/hive/warehouse/dept_partition2/month=201810/day=12;

新增分割槽

alter table dept_partition2 add partition(month='201810',day='12');

三、修改表

1.修改表名

ALTER TABLE table_name RENAME TO new_table_name

2.更新列

ALTER TABLE table_name CHANGE [COLUMN] col_old_name column_type [COMMENT col_comment][FIRST|AFTER colummn_name]

3.增加和替換列

ALTER TABLE table_name ADD|REPLACE COLUMNS(col_name data_type[COMMENT col_comment],...)

注：ADD是代表增加一欄位，欄位位置在所有列後面（partition列前），REPLACE則是表示替換表中所有欄位。

四、資料匯入

1.向表中裝載資料

load data [local] inpath '/opt/datas/student.txt' [overwrite] into table student [partition(partcol1=val1,...)];

load data:表示載入資料
local:表示從本地載入資料到hive表；否則從HDFS載入資料到hive
inpath：表示載入資料的路徑
overwrite：表示覆蓋表中已有資料，否則表示追加
into table：表示載入到哪張表
student：具體的表名
partition：表示上傳的指定分割槽

2.通過查詢語句插入資料

基本插入資料

insert into table student partition(month='201809') values('1001','wangwu');

基本模式插入（根據單張表查詢結果插入）

insert overwrite table student partition(month='201809')select id,name from student where month='201808';

3.Import匯入資料到指定Hive表中（必須是用export匯出的資料）

import table student2 partition (month='201809') from '/opt/datas/export/student'

五、資料匯出

1.將查詢結果匯出到本地

insert overwrite local directory '/opt/export/student' select * from student;

2.將查詢的結果格式化匯出到本地

insert overwrite local directory '/opt/export/student1' ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t' COLLECTION ITEMS TERMINATED BY '\n' select * from student;

3.將查詢的結果匯出到HDFS上（去掉local就行了）

insert overwrite directory '/opt/export/student1' ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t' COLLECTION ITEMS TERMINATED BY '\n' select * from student;

4.通過hadoop命令匯出到本地

dfs -get /suer/hive/warehouse/student/month=201809/000000_0 /opt/datas/export/student.txt

5.Export匯出到HDFS上

export table default student to '/opt/datas/export/student';

六、清除表中資料

truncate table student;

注意：只能刪除管理表中的資料，無法刪除外部表中的資料

大資料（二十）：hive分割槽表、修改表語句與資料的匯入匯出

一、分割槽表分割槽表實際上就是對應一個HDFS檔案系統上的一個獨立的資料夾，該資料夾下是該分割槽所有的資料檔案，hive中的分割槽就是分目錄，把一個大的資料集更具業務需求分割成小的資料集。在查詢時通過where子句中的

大資料（二十三）：hive優化、表優化

一、Fetch抓取 Fetch抓取是指，Hive中對某些情況的查詢可以不必使用MapReduce計算。例如，select * from employees;在這種情況下，Hive可以簡單讀取employee對應的儲存目錄

大資料（三十）：zookeeper叢集與kafka叢集部署

一、安裝Zookeeper 1.叢集規劃在hadoop102、hadoop103和hadoop104三個節點上部署Zookeeper。 2.解壓安裝 1.解壓zookeeper安裝包到/usr/local/目錄下 tar -zxvf zookeepe

python學習筆記（二十）：異常處理

錯誤 fetchall nbsp 如果 info blog months api root 1 def calc(a,b): 2 res=a/b 3 return res 4 def main(): 5 money=input(‘輸入多少

Android項目實戰（二十）：淺談ListView懸浮頭部展現效果

save Coding 布局相同 mar state clas pla stat 原文:Android項目實戰（二十）：淺談ListView懸浮頭部展現效果　　先看下效果：需求是滑動列表，其中一部分視圖（粉絲數，關註數這一部分）在滑動到頂端的時候不消失，而是停留在整個

java基礎學習總結（二十）：多執行緒上下文切換

什麼是上下文切換即使是單核CPU也支援多執行緒執行程式碼，CPU通過給每個執行緒分配CPU時間片來實現這個機制。時間片是CPU分配給各個執行緒的時間，因為時間片非常短，所以CPU通過不停地切換執行緒執行，讓我們感覺多個執行緒時同時執行的，時

Spring Boot + Spring Cloud 實現許可權管理系統後端篇（二十）：服務熔斷（Hystrix、Turbine）

線上演示演示地址：http://139.196.87.48:9002/kitty 使用者名稱：admin 密碼：admin 雪崩效應在微服務架構中，由於服務眾多，通常會涉及多個服務層級的呼叫，而一旦基礎服務發生故障，很可能會導致級聯故障，進而造成整個系統不可用，這種現象被稱為服務雪崩效應。服務雪崩

通證經濟大局觀（二十）：價值生產率與供給、需求

價值是個主觀的東西，一個東西對你有效用，你才覺得有價值。對應於供給和需求來說，那就是有人用，也就是有需求的供給才是有價值的供給。傳統經濟裡的物品和勞務大多帶有“原子”屬性，你用了別人就沒法用，或者是你用的時候別人就沒辦法用，比如一個蘋果，你吃了別人就沒辦法吃；一個座位你坐了，別人就沒辦法坐。所

演算法題（二十）：機器人的活動範圍問題

題目描述地上有一個m行和n列的方格。一個機器人從座標0,0的格子開始移動，每一次只能向左，右，上，下四個方向移動一格，但是不能進入行座標和列座標的數位之和大於k的格子。例如，當k為18時，機器人能夠進入方格（35,37），因為3+5+3+7 = 18。但是，它不能進入方格（35,38），

機器學習筆記（二十）：TensorFlow實戰十二（TensorBoard視覺化）

1 - 引言前面已經介紹到TensorFlow可以實現許多非常常用的神經網路結構，有的網路結構十分複雜，裡面的引數關係更是難以管理。因此，TensorFlow提供了一個視覺化工具TensorBoard。可以有效的展示執行過程中的計算圖、各種指標隨著時間的變化趨勢以及訓練中使用到的影象等

opencv學習（二十）：直線檢測

霍夫直線檢測原理： 1、對於直角座標系中的任意一點A(x0,y0)，經過點A的直線滿足Y0=k*X0+b.(k是斜率，b是截距) 2、那麼在X-Y平面過點A(x0,y0)的直線簇可以用Y0=k*X0+b表示，但對於垂直於X軸的直線斜率是無窮大的則無法表示。因此將直角座標系轉換到極座標系就能解

eos原始碼賞析（二十）：EOS智慧合約之push_transaction的天龍八“步”

很久沒談《天龍八部》了。 eosio整個系統中，transaction佔據著十分重要的位置。我們在區塊鏈上的任何有效操作，都代表著有transaction被執行了。在執行的過程中，push_transaction是不可以被忽略的。例如我們建立賬戶的時候，會通過p

linux基礎篇（二十）：Redhat7系統中的高階網路配置

Bond 一、簡介鏈路聚合主動備份網絡卡，當一個網絡卡介面故障時，另一個會接替他的工作，不中斷。bond是將多塊網絡卡虛擬連結成一塊網絡卡的技術，通過bond技術讓多塊網絡卡看起來是一個單獨的乙太網介面裝置並具有相同的ip地址。bond預設情況下支援兩塊網絡卡

Spring Security（二十）：6.2.3 Form and Basic Login Options

You might be wondering where the login form came from when you were prompted to log in, since we made no mention of any HTML files or JSPs. In fact, since

C#程式設計師整理的Unity 3D筆記（二十）：2D Toolkit之官方教程《Whack a Mole》

在上篇部落格中，簡單整理了一下Unity Native 2D功能：《C#程式設計師整理的Unity 3D筆記（十九）：Unity 3D的Native 2D》. 本文開始學習2D商用比較廣泛的2D Toolkit外掛. 2D Toolkit外掛在2D中的地位，猶如UI中N

Unity3D學習筆記（二十）：Rect、Canvas、Toggle、Slider、ScrollBar

png 批量添加事件 func 快捷鍵 resource engine 選中創建 Rect Transform（錨點）：圖片中心的四個點，界面以雪花形式顯示當四個點在一起的時候組成錨點，當四個點分開的時候組成錨框（合則錨點，分則錨框） Anchors： ---

Java併發（二十）：執行緒本地變數ThreadLocal

ThreadLocal是一個本地執行緒副本變數工具類。主要用於將私有執行緒和該執行緒存放的副本物件做一個對映，各個執行緒之間的變數互不干擾，在高併發場景下，可以實現無狀態的呼叫，特別適用於各個執行緒依賴不同的變數值完成操作的場景。一、ThreadLocal的核心機制每個Thread執行緒內部都有一個Ma

我的openwrt學習筆記（二十）：WIFI 無線傳輸速率測試-iperf

Iperf是一個TCP/IP和UDP/IP的效能測量工具，能夠提供網路吞吐率資訊，以及震動、丟包率、最大段和最大傳輸單元大小等統計資訊；從而能夠幫助我們測試網路效能，定位網路瓶頸。現在ubuntu單虛擬機器不同終端以及不同虛擬機器之間的測試為例說明如何安裝以及使用，然後提

程式設計漫談（二十）：如何自學程式設計及Java、上手真實開發及轉行程式設計師的建議

> 前路漫漫，吾將上下而求索！最近有時在知乎上逛逛，發現很多人對自學程式設計及轉行程式設計師有困惑。我是在25歲讀研時轉程式設計師，正趕上好時候（中國雲端計算剛剛起步及移動網際網路正紅的階段），同時又走了不少彎路，因此，基於自己的開發經歷及思考認識（目前有八年 Java 開發經驗），希望能夠給後來者一些建

初識Leetcode----學習（二十）【顛倒二進位制位、位1的個數】

①顛倒二進位制位顛倒給定的 32 位無符號整數的二進位制位。示例: 輸入: 43261596 輸出: 964176192 解釋: 43261596 的二進位制表示形式為 00000010100101000001111010011100 ，返回 964176192

大資料（二十）：hive分割槽表、修改表語句與資料的匯入匯出

相關推薦