1. 程式人生 > >hive over hbase方式將文字庫資料匯入hbase

hive over hbase方式將文字庫資料匯入hbase

1,建立hbase表Corpus >> create 'Corpus','CF' 2,建立hive->hbase外表logic_Corpus,並對應hbase中的Corpus >> CREATE EXTERNAL TABLE logic_Corpus ( rowkey string, Text string) STORED BY 'org.apache.hadoop.hive.hbase.HBaseStorageHandler' WITH SERDEPROPERTIES ("hbase.columns.mapping" = ":key, CF:Text") TBLPROPERTIES("hbase.table.name" = "Corpus
");  //建立目錄 hadoop fs -mkdir -p  /user/maoxiao/2015/aud/weiboUserData/input //上傳檔案 hadoop fs -put weiboUserData.txt /user/maoxiao/2015/aud/weiboUserData/input 建立外部表 CREATE EXTERNAL TABLE data_Corpus ( Text string ) ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t'  LOCATION '/user/cloudera/input';

相關推薦

hive over hbase方式文字資料匯入hbase

1,建立hbase表Corpus >> create 'Corpus','CF' 2,建立hive->hbase外表logic_Corpus,並對應hbase中的Corpus表 >> CREATE EXTERNAL TABLE logic_Co

sqlserver的資料匯入hbase

將sqlserver的資料匯入hbase中 1.解壓sqoop-sqlserver-1.0.tar.gz,並改名(可以不改)          tar  -zxvf  sqoop- sql

MapReduceHDFS文字資料匯入HBase

HBase本身提供了很多種資料匯入的方式,通常有兩種常用方式: 使用HBase提供的TableOutputFormat,原理是通過一個Mapreduce作業將資料匯入HBase 另一種方式就是使用HBase原生Client API 本文就是示範如何通過M

Hive 實戰練習(一)—按照日期每天的資料匯入Hive表中

需求:         每天會產生很多的日誌檔案資料,有這麼一種需求:需要將每天產生的日誌資料在晚上12點鐘過後定時執行操作,匯入到Hive表中供第二天資料分析使用。要求建立分割槽表,並按照日期分割槽。資料檔案命名是以當天日期命名的,如2015-01-09.txt一、建立分割

用sqoopmysql的資料匯入hive表中,原理分析

Sqoop 將 Mysql 的資料匯入到 Hive 中 準備Mysql 資料 如圖所示,準備一張表,資料隨便造一些,當然我這裡的資料很簡單。 編寫命令 編寫引數檔案 個人習慣問題,我喜歡把引數寫到檔案裡,然後再命令列引用。 vim mysql-info, #

flume多列資料寫入HBase的配置

只列出sink部分的配置如下: a1.sinks.k1.type = hbase  #名稱空間和表名a1.sinks.k1.table = ns1:t10  #列族a1.sinks.k1.columnFamily = f1a1.sinks.k1.serializer = o

flume資料匯入hbase

1 將hbase的lib目錄下jar拷貝到flume的lib目錄下;2 在hbase中建立儲存資料的表hbase(main):002:0> create 'test_idoall_org','uid','name'3 建立flume配置檔案 vi.confa1.sour

通過sqoopMySQL資料庫中的資料匯入Hbase

從接觸到大資料到成功的實現一個功能期間走了不少彎路也踩了不少坑,這裡作為我的學習筆記也可以作為小白們的前車之鑑,少走彎路,有不正確之處,望指出 環境準備: hadoop、hbase、sqoop、mys

用sqoopmysql的資料匯入hive表中

用sqoop將mysql的資料匯入到hive表中 1:先將mysql一張表的資料用sqoop匯入到hdfs中 準備一張表    需求 將 bbs_product 表中的前100條資料導 匯出來  只要id  brand_id和 na

用sqooporacle資料匯入Hbase 使用筆記

網上已經有很多關於這方面的資料,但是我在使用過程中也遇見了不少問題 1. sqoop 的環境我沒有自己搭建  直接用的公司的 2. oracle 小白怕把公司環境弄壞了,自己用容器搭建了一個 docker pull docker.io/wnameless/oracle-xe

Kettle Oracle資料匯入HBase的注意事項

      使用Kettle採集Oracle資料,匯入到HBase。 Kettle是一個比較好用的ETL工具,個人感覺Kettle比Sqoop還要好用,主要是因為Kettle通過視覺化,元件式拖拉配置

HBase Shell 操作命令&&使用Sqoop資料匯入HBase

一、HBase Shell 操作命令實驗 要求: HBase叢集正常啟動,且可以執行正常 進入客戶端 [[email protected] ~]$ cd /home/zkpk/hbase-0

文字資料匯入HBASE

在將有定界符文字檔案匯入HBASE庫中,需要將後面的定界符去掉,否則將匯入失敗。如下所示:[[email protected] bin]$ cat /tmp/emp.txt1,A,201304,2,B,201305,3,C,201306,4,D,201307,這個

通過管道傳輸快速MySQL的資料匯入Redis(自己做過測試)

通過管道傳輸快速將MySQL的資料匯入Redis 通過管道傳輸pipe將MySQL資料批量匯入Redis       自Redis 2.6以上版本起,Redis支援快速大批量匯入資料,即官網的Redis Mass Insertion,即

oracle的資料匯入到mysql的四種方法

一.Navicat Premium中的資料遷移工具 為了生產庫釋放部分資源,需要將API模組遷移到MySQL中,及需要導資料。 嘗試了Oracle to mysql工具,遷移時報錯不說,這麼大的資料量,用這種簡陋的工具不大可靠。 意外發現平時用的資料庫檢視工具

MySQL中資料匯入到MongoDB中

第一步: 將user表從MySQL中匯出,右鍵,點選匯出嚮導,選擇格式為xlsx。 第二步: 匯出完成後,雙擊開啟user.xlsx,將user.xlsx另存為csv格式的檔案。(切記不可直接修改後綴名,會導致亂碼,無法匯入到MongoDB中,血的教訓) 第三步:

Mysql 資料匯入 Hbase

目錄 一、前言 一、前言 在大資料專案中需要做資料遷移時,我們第一時間總會想到sqoop。sqoop是apache 旗下一款“Hadoop 和關係資料庫伺服器之間傳送資料”的工具,

如何不同型別資料匯入Elaticsearch中?

題記 Elaticsearch的原理明白了以後,手頭有很多不同型別的資料,如: 1)單條資料,如程式中自己構造的JSON格式資料; 2)符合Elasticsearch索引規範的批量資料; 3)日誌檔案,格式*.log; 4)結構化資料,儲存在mysql

Excel的資料匯入SqlServer的表中

記錄一下最近從Excel匯入大量資料到SqlServer表中的步驟。 在將Excel資料準備好以後。 1、右鍵SQL Server中需要匯入資料的庫名,選擇【任務】—【匯入資料】如圖: 2、彈

【VBA】 通過VBA指令碼EXCEL的資料匯入 ORACLE

作者:lianghc 描述:最近在使用infamatica 將excel  的資料匯入oracle時,遇到意外終止錯誤,無法將資料匯入。於是採用VBA將資料匯入資料庫,是辦公人員一鍵同步excel的資料導資料庫中,這種做法的前提是提供標準的模板。下面是解決問題過程中收集的連