1. 程式人生 > >Hive資料儲存

Hive資料儲存

1、Hive中所有的資料包儲存在HDFS中,沒有專門的資料儲存格式(可支援Text,SequenceFile,ParquetFile,RCFile等)

2、只需要在建立表的時候告訴Hive 資料中的列分隔符和行分隔符,Hive就可以解析資料。(不懂hive中資料分割符的可以看我的這一篇:https://blog.csdn.net/S_Running_snail/article/details/84258162

3、Hive中包含以下資料模型: DB,Table, External Table,Partition,Bucket.     

  • db:在hdfs中表現為S(hive metastore warehouse.dir)目錄下一個資料夾
  • table:在hdfs中表現所屬db目錄下一個資料夾
  • extermal rable:與table類似,不過其資料存放位置可以在任意指定路徑
  • partition在hdfs中表現為table目錄下的子目錄
  • bucket:在hdfs中表現為同一個表目錄下根據hash雜湊之後的多個檔案