spark+phoenix 通過jdbc讀取表中的資料

阿新 • • 發佈：2019-01-29

廢話不說，直接程式碼，解決燃煤之急

新增maven配置

<dependency>
   <groupId>org.apache.phoenix</groupId>
   <artifactId>phoenix-core</artifactId>
   <version>${phoenix.version}</version>
</dependency>

<dependency>
  <groupId>org.apache.phoenix</groupId>
  <artifactId> 
phoenix-spark</artifactId>
  <version>${phoenix.version}</version>
</dependency>

spark讀取phoenix中的資料

package com.cctsoft.spark.offline;

import org.apache.spark.sql.AnalysisException;
import org.apache.spark.sql.Dataset;
import org.apache.spark.sql.Row;
import org.apache.spark.sql.SparkSession;

/**
* Created with IntelliJ IDEA.
* User: Kevin Liu
* CreateDate: 2018/6/8 10:32
* Description: 讀取phoenix表中資料
*/
public class FaceCrashImsiJob {
    public static void main(String[] args) throws AnalysisException {
        // $example on:init_session$
        SparkSession spark = SparkSession
                .builder()
                .appName("Java Spark SQL basic example")
                .config("spark.some.config.option", "some-value")
                .master("local")
                .getOrCreate();
        // $example off:init_session$

        runBasicDataFrameExample(spark);

        spark.stop();
    }

    private static void runBasicDataFrameExample(SparkSession spark) throws AnalysisException {



   /**
   * 獲取4G資料
   * String tableName= "(select * from LTE_DATA where to_char(cap_time) >= '"+imsiDataStartTime+"' and to_char(cap_time) < '"+imsiDataEndTime+"') as LTE_DATA_FILTER";
   */
   String imsiTableName = "(select * from LTE_DATA where to_char(cap_time) >= '"+imsiDataStartTime+"' and to_char(cap_time) < '"+imsiDataEndTime+"') as LTE_DATA_FILTER";
   logger.info("imsiTableName:"+imsiTableName);
   Dataset<Row> df = spark.read().format("jdbc")
           .option("driver","org.apache.phoenix.jdbc.PhoenixDriver")
           .option("url","jdbc:phoenix:"+zookeeper+":2181")
           .option("dbtable",imsiTableName)
           .load();
   df.registerTempTable("lte_data_tmp");
   Dataset<Row> lteDataAll = spark.sql("select lte_dev_code,cap_time,imsi from lte_data_tmp order by cap_time desc");
   lteDataAll.show();

    }

}

通過spark寫入資料到phoenix

package com.cctsoft.spark.offline
import org.apache.spark.api.java.JavaRDD
import org.apache.spark.sql.Row

/**
  * Created with IntelliJ IDEA.
  * User: Kevin Liu
  * CreateDate: 2018/6/15 12:32
  * Description: 寫入phoenix表資料
  */
object TestMain {
  def main(args: Array[String]): Unit  
= {
    batchSaveFaceImsi(null)
  }


  def batchSaveFaceImsi(imsiRdd: JavaRDD[Row]): Unit ={
    import org.apache.phoenix.spark._

    val rdd = imsiRdd.rdd.map(x=>{
      (x.get(0).toString+":"+x.get(1).toString,x.get(0).toString,x.get(1).toString)
    }).filter(f=>f._3.toString!=null && f._3.toString!="")

    rdd.foreach(println)

    rdd.saveToPhoenix(
        "RESIDENT_TMP",
Seq("ID","DEVICE_MAC","IMSI"),
zkUrl = Some("jdbc:phoenix:abigdataclient1:2181")
    )



  }

}

spark+phoenix 通過jdbc讀取表中的資料

spark+phoenix 通過jdbc讀取表中的資料

access vba 用recordset讀取表中資料的簡單方法

vB程式設計VB原始碼 VB讀取EXCEL工作薄某個表中資料 ADODB.Recordset

利用poi將excel表中資料讀取存入mysql資料庫（資料量比較大）

map端join的實現，用來解決小表中資料的讀取

spark 讀取elasticsearch中資料不完整問題

C#.Net 4 通過對映讀取DbDataReader中的資料

spark流式讀取hdfs中資料

spark streaming 通過zookeeper讀取kafka上的資料

Oracle刪除表中資料的時候應該注意的問題 Oracle與MySql他們一些表之間的區別

Hive Shell 命令之二（表中資料的操作，出自Hive程式設計指南）

JDBC插入表中一個數據返回其自增主鍵

Java將資料庫表中資料匯出至Excel表格

SQL SERVER匯出表中資料的sql指令碼形式

如何實現一個表字段資料變化，另一張表中資料隨著變化

倒置線性表中資料的順序（c++）

如何對比mysql資料表的資料與excel表中資料是否重複？

Oracle 表，表中資料不小心刪除找回的方法

python讀取表中的json再重新寫入會出現中文變成unicode碼

mysql在把子查詢結果作為刪除表中資料的條件，mysql不允許在子查詢的同時刪除原表資料

spark+phoenix 通過jdbc讀取表中的資料

相關推薦