JAVA類實現從hdfs匯入資料到hive表中

阿新 • • 發佈：2019-01-28

// 需要引入 hadoop & hive jar

import java.sql.Connection;
import java.sql.DriverManager;
import java.sql.ResultSet;
import java.sql.Statement;
/**
* 演示了通過java jdbc 操作hive ，一般企業環境不會這麼做，hive 目的是去java 程式設計能力
* 京東等企業是通過shell or python 封裝 hive -e sql 命令進行資料操作
* 需要在hive 節點啟動 hive –service hiveserver2&
**/

public class HiveApp {

private static String driver = "org.apache.hive.jdbc.HiveDriver";
private static String url = "jdbc:hive2://Master:10000/default";
private static String user = "root"; //一般情況下可以使用匿名的方式，在這裡使用了root是因為整個Hive的所有安裝等操作都是root
private static String password = "";

public static void main(String[] args) {
    ResultSet res = null;

    try {
        /**
         * 第一步：把JDBC驅動通過反射的方式載入進來
         */
        Class.forName(driver);

        /**
         * 第二步：通過JDBC建立和Hive的聯結器，預設埠是10000，預設使用者名稱和密碼都為空
         */
        Connection conn = DriverManager.getConnection(url, user, password); 

        /**
         * 第三步：建立Statement控制代碼，基於該控制代碼進行SQL的各種操作；
         */
        Statement stmt = conn.createStatement();

        /**
         * 接下來就是SQL的各種操作；
         * 第4.1步驟：建表Table,如果已經存在的話就要首先刪除；
         */
        String tableName = "testHiveDriverTable";
        stmt.execute("drop table if exists " + tableName );


        stmt.execute("create table " + tableName + " (id int, name string)" + "ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t' LINES TERMINATED BY '\n'");
        /**
         *  第4.2步驟：查詢建立的Table；
         */
        String sql = "show tables '" + tableName + "'";
        System.out.println("Running: " + sql);
        res = stmt.executeQuery(sql);
        if (res.next()) {
          System.out.println(res.getString(1));
        }
        /**
         *  第4.3步驟：查詢建立的Table的schema；
         */
        sql = "describe " + tableName;
        System.out.println("Running: " + sql);
        res = stmt.executeQuery(sql);
        while (res.next()) {
          System.out.println(res.getString(1) + "\t" + res.getString(2));
        }

        /**
         *  第4.4步驟：載入資料進入Hive中的Table；
         */
        String filepath = "/root/Documents/data/sql/testHiveDriver.txt";
        sql = "load data local inpath '" + filepath + "' into table " + tableName;
        System.out.println("Running: " + sql);
        stmt.execute(sql);

        /**
         *  第4.5步驟：查詢進入Hive中的Table的資料；
         */
        sql = "select * from " + tableName;
        System.out.println("Running: " + sql);
        res = stmt.executeQuery(sql);
        while (res.next()) {
          System.out.println(String.valueOf(res.getInt(1)) + "\t" + res.getString(2));
        }

        /**
         *  第4.6步驟：Hive中的對Table進行統計操作；
         */
        sql = "select count(1) from " + tableName;   //在執行select count(*) 時候會生成mapreduce 操作  ，那麼需要啟動資源管理器 yarn  ： start-yarn.sh 
        System.out.println("Running: " + sql);
        res = stmt.executeQuery(sql);

        while (res.next()) {
          System.out.println("Total lines :" + res.getString(1));
        }    

    } catch (Exception e) {
        // TODO Auto-generated catch block
        e.printStackTrace();
    }   



}

}

JAVA類實現從hdfs匯入資料到hive表中

// 需要引入 hadoop & hive jar import java.sql.Connection; import java.sql.DriverManager; import java.sql.ResultSet; import ja

使用shell將hdfs上的資料匯入到hive表中

days=($(seq 20150515 20150517)) hours=() for (( i=0; i<=23;++i)) do if [ $i -lt 10 ]; then

用sqoop將mysql的資料匯入到hive表中，原理分析

Sqoop 將 Mysql 的資料匯入到 Hive 中準備Mysql 資料如圖所示，準備一張表，資料隨便造一些，當然我這裡的資料很簡單。編寫命令編寫引數檔案個人習慣問題，我喜歡把引數寫到檔案裡，然後再命令列引用。 vim mysql-info， #

用sqoop將mysql的資料匯入到hive表中

用sqoop將mysql的資料匯入到hive表中 1：先將mysql一張表的資料用sqoop匯入到hdfs中準備一張表需求將 bbs_product 表中的前100條資料導匯出來只要id brand_id和 na

解決sqoop從mysql匯入到hive表的多分割槽問題

參考：http://blog.csdn.net/liweiwei71/article/details/23434189 對於分割槽表 drop table track_log; create table track_log ( id

android開發在JNI函式中引用Java類，將cxx複雜資料轉換成jobjectArray，實現從JNI到Java的資料傳輸

引言： JNI是Java可以呼叫高效的c++程式碼，但是在JNI函式中傳遞複雜資料型別十分的繁瑣，一般情況下需要jobject作為中轉，一維陣列int[],float[]以及二維陣列String[]可以實現方便的引數傳入/傳出。其他複雜的二、三維陣列理論上可以

利用sqoop指定列指定條件的方式將資料從mysql中增量匯入hive表中

========1、sqoop增量（指定列指定條件的方式增量匯入hive表中）匯入hive指令碼======= #!/bin/bash #Set the RDBMS connection params rdbms_ip=$1 rdbms_connect="jdbc:mysq

Java實現Excel批量匯入資料

Excel的批量匯入是很常見的功能，這裡採用 Jxl實現，資料量或樣式要求較高可以採用 poi 框架環境：Spring + SpringMvc（註解實現）首先匯入依賴jar包 <dependency> <groupId>ne

學習筆記:從0開始學習大資料-28. solr儲存資料在hdfs並從mysql匯入資料

環境 centos7 hadoop2.6.0 solr-7.5.0 一、建立hdfs為儲存的core 1.在hdfs建立索引資料目錄 [[email protected] bin]# hadoop fs -mkdir /user/solr/ [[email&

資料從mysql中匯入hive表中異常解決：

將資料從mysql中匯入hive表中，出現異常ERROR hive.HiveConfig: Could not load org.apache.hadoop.hive.conf.HiveConf.

Hadoop Mapper 階段將資料直接從 HDFS 匯入 Hbase

資料來源格式如下： 20130512 1 -1 -1 13802 1 2013-05-12 07:26:22 20130512 1 -1 -1 13802 1 2013-05-12 11:18:24我們期待的結果是資料直接從 h

java類實現序列化的方法

bject 反序都在 ava 我們 pri 密碼輸入 tro Java中實現序列化的兩種方式 Serializable 接口和 Externalizable接口對象的序列化就是將對象寫入輸出流中。反序列化就是從輸入流中將對象讀取出來。用來實現序列化的類都在jav

Struts2基礎-1- 簡單java類實現Action控制器

tex rep 初始 font 實例 fig 一個返回結果 action Strut2中，Action可以不繼承任何特殊的類或不實現任何特殊的接口，可以只編寫一個普通的Java類作為Action類，只要該類含有一個返回字符串的無參的public方法即可！實際開發中，通常繼

Oracle 使用SQL Loader 從外部匯入資料

在專案中經常會有一些基礎資料需要從Excel或其他檔案中匯入。大部分的格式都是樹結構。如果是這樣，我們對資料稍加整理，即可使用Oracle的資料匯入工具SQL Loader匯入我們所需要的資料到指定的表中。SQL Loader的詳細用法，可自己查詢相關詳細的文件，這裡只做簡單的使用介紹。 1

python實現Phoenix批量匯入資料

官網文件： Phoenix provides two methods for bulk loading data into Phoenix tables: Single-threaded client loading tool for CSV formatted data

大資料之hbase（五） --- 匯出Hbase的表文件到HDFS，Hbase Bulk Load Hbase，MySQL資料通過MR匯入到Hbase表中

一、匯出Hbase的表文件到HDFS -------------------------------------------------------------------------- 1.複製hbase的jar檔案和metrices-core-xxx.jar檔案到

Hive 實戰練習（一）—按照日期將每天的資料匯入Hive表中

需求：每天會產生很多的日誌檔案資料，有這麼一種需求：需要將每天產生的日誌資料在晚上12點鐘過後定時執行操作，匯入到Hive表中供第二天資料分析使用。要求建立分割槽表，並按照日期分割槽。資料檔案命名是以當天日期命名的，如2015-01-09.txt一、建立分割

Java+HttpClient實現Request Payload Post資料

最近由於業務需要Java語言（HttpClient包）實現“Request Payload”Post請求，在網上查詢了一些資料，未能實現。後分析“Request Payload”的實現原理，發現很簡單就是使用json的方式post資料，網上的有些作者可能也不太理解吧，會誤

java中，一個類實現某個介面，必須重寫介面中的所有方法嗎？拓展介面而不重寫相當於抽象類

不一定，關鍵要看子類是否是抽象類。如果子類是非抽象類，則必須實現介面中的所有方法；如果子類是抽象類，則可以不實現介面中的所有方法，因為抽象類中允許有抽象方法的存在！ 1、抽象類定義抽象類往往用來表徵對問題領域進行分析、設計中得出的抽象概念，是對一系列看上去不同，但

一個小例子集合xlrd，matplotlib，numpy，scipy使用方法（從Excel匯入資料）

最近因為一篇論文的原因，要從Excel中取得部分資料平作圖，但是得到的圖都是點陣圖，不是太好插入到論文中，因此，決定使用Python畫圖來解決此問題（不使用MATLAB的原因在於它畫出的圖是在是不好看呀）首先使用的庫是xlrd庫，此庫的作用是從讀取Exc

JAVA類實現從hdfs匯入資料到hive表中

相關推薦