1. 程式人生 > >CentOS 下安裝CDH及CM記錄4

CentOS 下安裝CDH及CM記錄4

比較 hdf imp 代碼 targe 查詢 query 的人 容易

前面已經學習了如何將數據從關系型數據庫導入到Hive/HDFS,並且在Windows客戶端查詢導入的數據,接下來繼續學習CDH,知識點:

1、Hue環境中DB Query如何使用,DB Query這個功能是在Hue這個Web界面可以直接查詢其他關系型數據庫的數據,Hue在默認裝完後是無法直接使用DB Query的,需要配置,詳細可參照http://www.cnblogs.com/qingyunzong/p/9487952.html

2、Impapa,又一個新名詞,百度了一下其實這個還比較易學,只是Cloudera公司主導開發的新型查詢系統而已,語法同SQL類似,可以直接直接Hive數據庫中的數據,由於是和Hive共享元數據,因此需要同步元數據。

3、Pig,光說Pig會讓人誤會是小豬,還是叫全稱吧-Apache Pig,Pig有一個Latin語言,使用該語言可以很容易實現MapReduce任務,簡而言之,Pig的出現也是想讓更多的人無需寫代碼就可以快速實現MapReduce。

CentOS 下安裝CDH及CM記錄4