初識Hive:3張圖了解Hive的數據類型、架構圖!
阿新 • • 發佈:2017-10-18
hive數據類型
Hive是一個構建在Hadoop上的數據倉庫框架,可以將結構化的數據文件,映射為一張數據庫表,並提供完整的sql查詢功能。可以將sql語句,轉換為MapReduce任務進行運行。
Hive選擇Hadoop來存儲和處理數據,因為Hadoop有較好的性價比。Hive設計的目標是讓精通SQL技能(Java較弱的)分析師,能夠從存放在HDFS的大規模數據集上,運行查詢。
Hive 一般在工作站上運行,將SQL查詢轉換為一系列MapReducejob,在Hadoopcluster上運行。
表模式等元數據存放在名為metastore的數據庫中。默認的metastore在本地運行。此時創建的Hive表在本地上,無法與其它用戶共享。
Hive優點
Hive學習成本低,可以通過類SQL語句快速實現簡單的MapReduce統計,不必開發專門的MapReduce應用,十分適合數據倉庫的統計分析。
安裝和啟動Hive
解壓縮:
$ tar xvzfhive-1.X.X-dev.tar.gz
配置路徑:
export HIVE_INSTALL=/home/hadoop-2.X/hive
export PATH=$PATH:$HIVE_INSTALL/bin
啟動Hive shell:
$ hive
hive>
Hive數據類型
SQL和HiveQL的概要比較
Hive客戶端
如果以服務器方式運行:
hive –service hiveserver2
可以在應用程序中,以不同機制連接到服務器:
nmaplocalhost
ufwdisable
Hive架構
本文出自 “中科院計算所培訓” 博客,謝絕轉載!
初識Hive:3張圖了解Hive的數據類型、架構圖!