1. 程式人生 > >Hive-DDL資料定義

Hive-DDL資料定義

1、建立資料庫

1)建立一個數據庫,資料庫在 HDFS 上的預設儲存路徑是/user/hive/warehouse/*.db。

2)建立一個數據庫,指定資料庫在 HDFS 上存放的位置。

2、修改資料庫

使用者可以使用 ALTER DATABASE 命令為某個資料庫的 DBPROPERTIES 設定鍵-值對 屬性值,來描述這個資料庫的屬性資訊。資料庫的其他元資料資訊都是不可更改的,包括數 據庫名和資料庫所在的目錄位置。

3、查詢資料庫

4、刪除資料庫

如果資料庫不為空,可以採用 cascade 命令,強制刪除:

5、建立表

建表語法:

5.1、管理表

預設建立的表都是所謂的管理表,有時也被稱為內部表。因為這種表,Hive 會(或多 或少地)控制著資料的生命週期。Hive 預設情況下會將這些表的資料儲存在由配置項 hive.metastore.warehouse.dir(例如,/user/hive/warehouse)所定義的目錄的子目錄下。當我們 刪除一個管理表時,Hive 也會刪除這個表中資料。管理表不適合和其他工具共享資料。

5.2、外部表

因為表是外部表,所有 Hive 並非認為其完全擁有這份資料。刪除該表並不會刪除掉這 份資料,不過描述表的元資料資訊會被刪除掉

6、分割槽表

分割槽表實際上就是對應一個 HDFS 檔案系統上的獨立的資料夾

,該資料夾下是該分割槽 所有的資料檔案。Hive 中的分割槽就是分目錄,把一個大的資料集根據業務需要分割成小的 資料集。在查詢時通過 WHERE 子句中的表示式選擇查詢所需要的指定的分割槽,這樣的查 詢效率會提高很多

6.1、分割槽表基本操作

(1)、建立分割槽表語法

(2)、載入資料到分割槽表中

(3)、查詢分割槽表中資料

多分割槽聯合查詢

(4)、增加分割槽

(5)、刪除分割槽

(6)、檢視分割槽表有多少分割槽

(7)、檢視分割槽表結構

7、修改表

7.1、重命名錶

7.2、更新列、新增和替換列

8、刪除表

hive (default)> drop table dept_partition;