1. 程式人生 > >Kettle 將Oracle資料匯入HBase的注意事項

Kettle 將Oracle資料匯入HBase的注意事項

      使用Kettle採集Oracle資料,匯入到HBase。

Kettle是一個比較好用的ETL工具,個人感覺Kettle比Sqoop還要好用,主要是因為Kettle通過視覺化,元件式拖拉配置就可以實現資料提取,轉換、寫入。而Sqoop 的shell 命令列真是不好用,而且Sqoop 2還不支援將關係型資料庫的資料匯入到HBase中,現在只支援匯入到Hadoop。

Kettle將關係型資料庫(這裡指Oracle)的資料匯入到HBase,有一些需要注意的事項:

1)通過SQL語句檢索資料時,需要在SQL中處理好日期格式,因為Kettle預設的時間格式為:2016/11/01 06:43:21.000;

      2)做資料對映時,都要將欄位的型別轉換為String,在這一點上,我吃過虧,由於我保留了原來的資料型別,比如Long,結果儲存到HBase中,值變為16進位制的資料,在取得資料後進行型別轉換時報錯:java.lang.IllegalArgumentException: offset (0) + length (4) exceed the capacity of the array: 1

,所以這一點,比較重要。

相關推薦

Kettle Oracle資料匯入HBase注意事項

      使用Kettle採集Oracle資料,匯入到HBase。 Kettle是一個比較好用的ETL工具,個人感覺Kettle比Sqoop還要好用,主要是因為Kettle通過視覺化,元件式拖拉配置

用sqooporacle資料匯入Hbase 使用筆記

網上已經有很多關於這方面的資料,但是我在使用過程中也遇見了不少問題 1. sqoop 的環境我沒有自己搭建  直接用的公司的 2. oracle 小白怕把公司環境弄壞了,自己用容器搭建了一個 docker pull docker.io/wnameless/oracle-xe

使用navicat工具oracle資料匯入到mysql

將Oracle資料中資料匯入到mysql有很多方式,sql、文字檔案等,都可以完成,使用navicat的ODBC更快、更方便 1)建立資料來源 開啟控制面板、管理工具、資料來源(ODBC),點選新增 配置:資料來源名自已定義、TNS可使用IP:PORT/SID(也可以使用

使用sqooporacle資料匯入hdfs叢集

叢集環境:     hadoop1.0.0     hbase0.92.1     zookeeper3.4.3     hive0.8.1     sqoop-1.4.1-incubating__hadoop-1.0.0.tar 首先,當然前提是hadoop叢集環境已經

利用sqoophive資料匯入Oracle中(踩的坑)

教程很多,這裡只說踩過的坑 1.下載sqoop時,還得下一個bin的包,拿到sqoop-1.4.6.jar 的包,放到hadoop的lib目錄下 2.匯入oracle,執行程式碼時,使用者名稱和表名必須大寫!且資料庫建表時表名必須大寫!  示例程式碼: sqoop expo

利用sqoophive資料匯入Oracle

首先: 如oracle則執行sqoop list-databases --connect jdbc:oracle:thin:@//192.168.27.235:1521/ORCL --username DATACENTER -P 來測試是否能正確連線資料庫  如mysql則執行sq

shp資料匯入oracle

這裡使用一個叫shp2sdo.exe的外掛 將外掛拷貝到指定目錄下,這裡我使用的目錄是d:\osm 開啟cmd命令,進入指定目錄 然後輸入以下命令列 shp2sdo osmline osmline -i OBJECTID -g shape sqlplus system/[ema

sqlserver的資料匯入hbase

將sqlserver的資料匯入hbase中 1.解壓sqoop-sqlserver-1.0.tar.gz,並改名(可以不改)          tar  -zxvf  sqoop- sql

flume資料匯入hbase

1 將hbase的lib目錄下jar拷貝到flume的lib目錄下;2 在hbase中建立儲存資料的表hbase(main):002:0> create 'test_idoall_org','uid','name'3 建立flume配置檔案 vi.confa1.sour

通過sqoopMySQL資料庫中的資料匯入Hbase

從接觸到大資料到成功的實現一個功能期間走了不少彎路也踩了不少坑,這裡作為我的學習筆記也可以作為小白們的前車之鑑,少走彎路,有不正確之處,望指出 環境準備: hadoop、hbase、sqoop、mys

Hdfs資料Hbase表中匯入

package Hbase; import java.io.IOException; import java.text.SimpleDateFormat; import java.util.Date; import org.apache.hadoop.c

MapReduceHDFS文字資料匯入HBase

HBase本身提供了很多種資料匯入的方式,通常有兩種常用方式: 使用HBase提供的TableOutputFormat,原理是通過一個Mapreduce作業將資料匯入HBase 另一種方式就是使用HBase原生Client API 本文就是示範如何通過M

hive over hbase方式文字庫資料匯入hbase

1,建立hbase表Corpus >> create 'Corpus','CF' 2,建立hive->hbase外表logic_Corpus,並對應hbase中的Corpus表 >> CREATE EXTERNAL TABLE logic_Co

使用sqoop命令把oracle資料匯入hdfs/hbase/hive

(一)匯入HDFS建立Job#!/bin/bash #Oracle的連線字串,其中包含了Oracle的地址,SID,和埠號 CONNECTURL=jdbc:oracle:thin:@10.122.5.2:1521:db #使用的使用者名稱 ORACLENAME=db #使用的

使用neo4j圖資料庫的import工具匯入資料 -方法和注意事項

背景 最近我在嘗試儲存知識圖譜的過程中,接觸到了Neo4j圖資料庫,這裡我摘取了一段Neo4j的簡介: Neo4j是一個高效能的,NOSQL圖形資料庫,它將結構化資料儲存在網路上而不是表中。它是一個嵌入式的、基於磁碟的、具備完全的事務特性的Java持

HBase Shell 操作命令&&使用Sqoop資料匯入HBase

一、HBase Shell 操作命令實驗 要求: HBase叢集正常啟動,且可以執行正常 進入客戶端 [[email protected] ~]$ cd /home/zkpk/hbase-0

excel資料匯入到mysql資料庫

框架用的是thinkphp3.2框架 //將Excel匯入到資料庫的思想是:先將Excel中的資料轉為php陣列,然後執行addAll操作 public function upload() { ini_set('memory_limit', '1024M'); if (!empty(

【轉載】oracle 資料匯入匯出

oracle 資料匯入匯出   一、oracle中copy from的用法     1.語法及使用說明   1.1 語法   下面我們來看一下SQL*Copy Command的語法及使用說明。   在解釋SQ

使用sqoopmysql 資料匯入hdfs時各種報錯

資訊 18/06/29 10:45:08 ERROR sqoop.Sqoop: Got exception running Sqoop: java.lang.RuntimeException: java.lang.RuntimeException: java.sql.SQLExcepti

java實現excle資料匯入到web頁面

1.Service實現類 @Override public List<ListExcle> loadScoreInfo(String xlsPath) throws IOException { List<ListExcle> temp =