kettle 5.1.0 連線 Hadoop hive 2 (hive 1.2.1)

阿新 • • 發佈：2019-01-06

1. 配置HiveServer2，在hive-site.xml中新增如下的屬性
<property>
<name>hive.server2.thrift.bind.host</name>
<value>192.168.56.101</value>
<description>Bind host on which to run the HiveServer2 Thrift service.</description>
</property>
<property>
<name>hive.server2.thrift.port</name>
<value>10001</value>
<description>Port number of HiveServer2 Thrift interface when hive.server2.transport.mode is 'binary'.</description>
</property>
<property>
<name>hive.server2.thrift.min.worker.threads</name>
<value>5</value>
<description>Minimum number of Thrift worker threads</description>
</property>
<property>
<name>hive.server2.thrift.max.worker.threads</name>
<value>500</value>
<description>Maximum number of Thrift worker threads</description>
</property>

2. 啟動HiveServer2

$HIVE_HOME/bin/hiveserver2

3. 修改kettle的配置檔案
%KETTLE_HOME%/plugins/pentaho-big-data-plugin/plugin.properties
修改成下面的值
active.hadoop.configuration=hdp20

4. 啟動kettle，配置資料庫連線，如圖1所示

圖1

5. 測試
（1）在hive中建立測試表和資料
CREATE DATABASE test;
USE test;
CREATE TABLE a(a int,b int) ROW FORMAT DELIMITED FIELDS TERMINATED BY ',';
LOAD DATA LOCAL INPATH '/home/grid/a.txt' INTO TABLE a;
SELECT * FROM a;
查詢結果如圖2所示

圖2

（2）在kettle建立表輸入步驟，結果如圖3所示

圖3

注意：這裡需要加上庫名test，否則查詢的是default庫。

（3）點選預覽，顯示的資料如圖4所示

圖4

參考：
https://cwiki.apache.org/confluence/display/Hive/Setting+up+HiveServer2
http://stackoverflow.com/questions/25625088/pentaho-data-integration-with-hive-connection
http://blog.csdn.net/victor_ww/article/details/40041589

kettle 5.1.0 連線 Hadoop hive 2 (hive 1.2.1)

1. 配置HiveServer2，在hive-site.xml中新增如下的屬性 <property> <name>hive.server2.thrift.bind.host</name> <value>192.

oracle11.2.0.1.0 連線 python3.5.1

1. cx_Oracle:cx_Oracle-6.0rc2-cp35-cp35m-win_amd64.whl 下載網址：https://pypi.python.org/pypi/cx_Oracle/5.3 2.

Apache spark2.1.0編譯hadoop-2.6-cdh5.11.2的對應版本

Apache spark2.1.0 編譯 hadoop-2.6-cdh5.11.2 的對應版本搞了兩天，終於把spark編譯成功了，把編譯過程記錄一下編譯失敗的坑：　　1）linux記憶體不足，maven編譯過程中記憶體溢位　　2）找不到cloudera倉庫　　3）報各種錯誤考慮到ma

從 hadoop 1.0 到 hadoop 2.0 的演化

1. 概述在 Google 三篇大資料論文發表之後，Cloudera 公司在這幾篇論文的基礎上，開發出了現在的 Hadoop 。但 Hadoop 開發出來也並非一帆風順的，Hadoop 1.0 版本有諸多侷限。在後續的不斷實踐之中， Hadoop 2.0 橫空出世，而後 Hadoop 2.0 逐漸成為主流

hive1.1.0 啟動報錯Missing Hive Execution Jar:lib/hive-exec-*.jar

hive啟動時報下面的錯誤資訊 [[email protected] bin]# hive Missing Hive Execution Jar: /data0/hive/hive1.2.1/lib/hive-exec-*.jar 解決： 1、檢查/etc/profile檔

kettle 5.3.0 找不到mysql驅動（JDBC jar）的解決辦法

使用kettle 5.3.0建立和mysql的連線時，提示找不到jar包，把mysql的jdbc jar包放入data-integration\lib或者data-integration\libswt\win64下，再重新執行Spoon.bat即可OK，不重啟的話不生效，切

【學以致用】android功能實現5---android8.0 Launcher獲取快捷方式原始碼分析（1）

從其他應用往桌面建立快捷方式，android8.0統一採用requestPinShortcut的方式。對於桌面而言，是怎麼從requestPinShortcut獲取快捷方式資訊在桌面建立快捷方式呢？ Android8.0的快捷方式引數不再通過廣播傳送，而是存放在系統當中

presto-0.147+postgresql-9.5.3+msql-5.0.7+hadoop-2.5.2+hive-1.2.1環境構築以及測試

背景每個支援SQL的資料庫，都有一個強大的SQL引擎。而對於SQL引擎，基本都是大同小異的，負責SQL文法解析，語意分析，指定查詢樹，優化查詢樹，再到最終的執行，客戶端返回結果。而presto的也跟一般的是一樣的。架構如下：準備 1.postgresql-9.5

Hadoop-2.6.0+Zookeeper-3.4.6+Spark-1.5.0+Hbase-1.1.2+Hive-1.2.0叢集搭建

前言本部落格目的在於跟大家分享大資料平臺搭建過程，是筆者半年的結晶。在大資料搭建過程中,希望能給大家提過一些幫助，這也是本部落格的

zeppelin-0.5.6+Hadoop-2.5.2+Hive-1.2.1環境構築及測試

背景沒有用什麼高大上的BI工具，一直在控制檯操作，遂想看看作為分析師以及使用者的話，什麼樣的結果展現形式比較明瞭。選了之前接觸過的zeppelin. 角色分工 +------------------------------------------+-----------

Hive-0.13.1本地獨立模式安裝元資料儲存到MariaDB-10.1.0 Hadoop-2.4.0

tar -zxvf apache-hive-0.13.1-bin.tar.gz 解壓後,編輯java.sh(java.sh為自己建立的指令碼): vim /etc/profile.d/java.sh export HIVE_HOME=/opt/modules/hive/apache-hive-0.13.1

【Hadoop】Hadoop2.7.3安裝Hive 2.1.0

第一步：下載最新的hive，直接去apache 裡面找hive2.1.0下載就行。第二步，解壓到伺服器 tar zxvf apache-hive-2.0.0-bin.tar.gz mv apache-hive-2.0.0-bin /hom

0.1 使用w查看系統負載 - 10.2 vmstat命令 - 10.3 top命令 - 10.4 sar命令 - 10.5 nload命令

使用查看系統負載 - 10.1 使用w查看系統負載 - 10.2 vmstat命令 - 10.3 top命令 - 10.4 sar命令 - 10.5 nload命令 # 10.1 使用w查看系統負載 ![mark](http://oqxf7c508.bkt.clouddn.com/blo

安裝Oozie4.1.0-cdh5.5.2

hadoop oozie安裝oozie經歷了好長的時間，先是源碼包，但是放棄了。。。然後就是安裝的這個CDH版本的，弄了好久，經常報各種錯誤。最後整理出來這篇。先對文件進行下載：這裏使用的是CDH版本的，免編譯，看著編譯的過程就夠了。下載地址：http://archive.cloudera.com/cdh5/

面試題3：在一個長度為n的數組裏的所有數字都在0到n-1的範圍內。數組中某些數字是重復的，但不知道有幾個數字是重復的。也不知道每個數字重復幾次。請找出數組中任意一個重復的數字。例如，如果輸入長度為7的數組{2,3,1,0,2,5,3}，那麽對應的輸出是第一個重復的數字2。

length value 如果 while 返回 sys public ret || package siweifasan_6_5; /** * @Description:在一個長度為n的數組裏的所有數字都在0到n-1的範圍內。 * 數組中某些數字是重復的，

kettle 5.1.0 連線 Hadoop hive 2 (hive 1.2.1)

kettle 5.1.0 連線 Hadoop hive 2 (hive 1.2.1)

oracle11.2.0.1.0 連線 python3.5.1

Apache spark2.1.0編譯hadoop-2.6-cdh5.11.2的對應版本

從 hadoop 1.0 到 hadoop 2.0 的演化

hive1.1.0 啟動報錯Missing Hive Execution Jar:lib/hive-exec-*.jar

kettle 5.3.0 找不到mysql驅動（JDBC jar）的解決辦法

【學以致用】android功能實現5---android8.0 Launcher獲取快捷方式原始碼分析（1）

presto-0.147+postgresql-9.5.3+msql-5.0.7+hadoop-2.5.2+hive-1.2.1環境構築以及測試

Hadoop-2.6.0+Zookeeper-3.4.6+Spark-1.5.0+Hbase-1.1.2+Hive-1.2.0叢集搭建

zeppelin-0.5.6+Hadoop-2.5.2+Hive-1.2.1環境構築及測試

Hive-0.13.1本地獨立模式安裝元資料儲存到MariaDB-10.1.0 Hadoop-2.4.0

【Hadoop】Hadoop2.7.3安裝Hive 2.1.0

0.1 使用w查看系統負載 - 10.2 vmstat命令 - 10.3 top命令 - 10.4 sar命令 - 10.5 nload命令

安裝Oozie4.1.0-cdh5.5.2

Hadoop-1.2.1/1.0.1 install on Ubuntu

Hive 2.1.0叢集安裝

Hadoop-0.20.2原始碼學習（1）——原始碼初窺

在myeclipse上連線hadoop-2.8.0 執行mapreduce程式

用Verilog實現接受0.5元，1元的可樂售賣機，單價2.5元，考慮找零和出貨。

kettle 5.1.0 連線 Hadoop hive 2 (hive 1.2.1)

相關推薦