1. 程式人生 > >初識Hive:3張圖了解Hive的數據類型、架構圖!

初識Hive:3張圖了解Hive的數據類型、架構圖!

hive數據類型

Hive是一個構建在Hadoop上的數據倉庫框架,可以將結構化的數據文件,映射為一張數據庫表,並提供完整的sql查詢功能。可以將sql語句,轉換為MapReduce任務進行運行。


Hive選擇Hadoop來存儲和處理數據,因為Hadoop有較好的性價比。Hive設計的目標是讓精通SQL技能(Java較弱的)分析師,能夠從存放在HDFS的大規模數據集上,運行查詢。


Hive 一般在工作站上運行,將SQL查詢轉換為一系列MapReducejob,在Hadoopcluster上運行。


表模式等元數據存放在名為metastore的數據庫中。默認的metastore在本地運行。此時創建的Hive表在本地上,無法與其它用戶共享。


Hive優點


Hive學習成本低,可以通過類SQL語句快速實現簡單的MapReduce統計,不必開發專門的MapReduce應用,十分適合數據倉庫的統計分析。


安裝和啟動Hive


解壓縮:

$ tar xvzfhive-1.X.X-dev.tar.gz


配置路徑:

export HIVE_INSTALL=/home/hadoop-2.X/hive

export PATH=$PATH:$HIVE_INSTALL/bin


啟動Hive shell:

$ hive

hive>


Hive數據類型

技術分享


SQL和HiveQL的概要比較

技術分享


Hive客戶端


如果以服務器方式運行:

hive –service hiveserver2


可以在應用程序中,以不同機制連接到服務器:

nmaplocalhost

ufwdisable


Hive架構

技術分享


本文出自 “中科院計算所培訓” 博客,謝絕轉載!

初識Hive:3張圖了解Hive的數據類型、架構圖!