Spark-Sql整合hive，在spark-sql命令和spark-shell命令下執行sql命令和整合呼叫hive

阿新 • • 發佈：2018-11-15

分享一下我老師大神的人工智慧教程！零基礎，通俗易懂！http://blog.csdn.net/jiangjunshow

也歡迎大家轉載本篇文章。分享知識，造福人民，實現我們中華民族偉大復興！

1.安裝hive
如果想建立一個數據庫使用者，並且為資料庫賦值許可權，可以參考：http://blog.csdn.net/tototuzuoquan/article/details/52785504

2.將配置好的hive-site.xml、core-site.xml、hdfs-site.xml放入$SPARK_HOME/conf目錄下

[root@hadoop1 conf]# cd /home/tuzq/software/hive/apache-hive-1.2.1-bin[root@hadoop1 conf]# cp hive-site.xml $SPARK_HOME/conf[root@hadoop1 spark-1.6.2-bin-hadoop2.6]# cd $HADOOP_HOME[root@hadoop1 hadoop]# cp core-site.xml $SPARK_HOME/conf 
[root@hadoop1 hadoop]# cp hdfs-site.xml $SPARK_HOME/conf同步spark叢集中的conf中的配置[root@hadoop1 conf]# scp -r * root@hadoop2:$PWD[root@hadoop1 conf]# scp -r * root@hadoop3:$PWD[root@hadoop1 conf]# scp -r * root@hadoop4:$PWD[root@hadoop1 conf]# scp -r * root@hadoop5:$PWD
   
    1
    2
    3
    4
    5
    6
 

    7
    8
    9
    10
    11

放入進去之後，注意重新啟動Spark叢集，關於叢集啟動和停止，可以參考：

http://blog.csdn.net/tototuzuoquan/article/details/74481570
   
    1

修改spark的log4j列印輸出的日誌錯誤級別為Error。修改內容為：
這裡寫圖片描述

3.啟動spark-shell時指定mysql連線驅動位置

bin/spark-shell --master spark://hadoop1:7077,hadoop2:7077 --executor-memory 1g --total-executor-cores 2 --driver-class-path /home/tuzq/software/spark-1.6.2-bin-hadoop2.6/lib/mysql-connector-java-5.1.38.jar
   
    1

如果啟動的過程中報如下錯：
這裡寫圖片描述

可以按照上面的紅框下的url進行檢查:
https://wiki.apache.org/hadoop/ConnectionRefused
這裡寫圖片描述

4.使用sqlContext.sql呼叫HQL
在使用之前先要啟動hive，建立person表：

hive> create table person(id bigint,name string,age int) row format delimited fields terminated by " " ;OKTime taken: 2.152 secondshive> show tables;OKfuncpersonwypTime taken: 0.269 seconds, Fetched: 3 row(s)hive>
   
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10

檢視hdfs中person的內容：

[root@hadoop3 ~]# hdfs dfs -cat /person.txt1 zhangsan 192 lisi 203 wangwu 284 zhaoliu 265 tianqi 246 chengnong 557 zhouxingchi 588 mayun 509 yangliying 3010 lilianjie 5111 zhanghuimei 3512 lian 5313 zhangyimou 54[root@hadoop3 ~]# hdfs dfs -cat hdfs://mycluster/person.txt1 zhangsan 192 lisi 203 wangwu 284 zhaoliu 265 tianqi 246 chengnong 557 zhouxingchi 588 mayun 509 yangliying 3010 lilianjie 5111 zhanghuimei 3512 lian 5313 zhangyimou 54
   
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28

load資料到person表中：

hive> load data inpath '/person.txt' into table person;Loading data to table default.personTable default.person stats: [numFiles=1, totalSize=193]OKTime taken: 1.634 secondshive> select * from person;OK1   zhangsan    192   lisi    203   wangwu  284   zhaoliu 265   tianqi  246   chengnong   557   zhouxingchi 588   mayun   509   yangliying  3010  lilianjie   5111  zhanghuimei 3512  lian    5313  zhangyimou  54Time taken: 0.164 seconds, Fetched: 13 row(s)hive>
   
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22

如果是spark-2.1.1-bin-hadoop2.7,它沒有sqlContext，所以要先執行：val sqlContext = new org.apache.spark.sql.SQLContext(sc)如果是spark-1.6.2-bin-hadoop2.6，不用執行：val sqlContext = new org.apache.spark.sql.SQLContext(sc)scala> sqlContext.sql("select * from person limit 2")+---+--------+---+| id|    name|age|+---+--------+---+|  1|zhangsan| 19||  2|    lisi| 20|+---+--------+---+scala>
   
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11

或使用org.apache.spark.sql.hive.HiveContext （同樣是在spark-sql這個shell命令下）

scala> import org.apache.spark.sql.hive.HiveContextimport org.apache.spark.sql.hive.HiveContextscala> val hiveContext = new HiveContext(sc)Wed Jul 12 12:43:36 CST 2017 WARN: Establishing SSL connection without server's identity verification is not recommended. According to MySQL 5.5.45+, 5.6.26+ and 5.7.6+ requirements SSL connection must be established by default if explicit option isn't set. For compliance with existing applications not using SSL the verifyServerCertificate property is set to 'false'. You need either to explicitly disable SSL by setting useSSL=false, or set useSSL=true and provide truststore for server certificate verification.Wed Jul 12 12:43:36 CST 2017 WARN: Establishing SSL connection without server's identity verification is not recommended. According to MySQL 5.5.45+, 5.6.26+ and 5.7.6+ requirements SSL connection must be established by default if explicit option isn't set. For compliance with existing applications not using SSL the verifyServerCertificate property is set to 'false'. You need either to explicitly disable SSL by setting useSSL=false, or set useSSL=true and provide truststore for server certificate verification.hiveContext: org.apache.spark.sql.hive.HiveContext = [email protected]6d9a46d7scala> hiveContext.sql("select * from person")res2: org.apache.spark.sql.DataFrame = [id: bigint, name: string, age: int]scala> hiveContext.sql("select * from person").show+---+-----------+---+| id|       name|age|+---+-----------+---+|  1|   zhangsan| 19||  2|       lisi| 20||  3|     wangwu| 28||  4|    zhaoliu| 26||  5|     tianqi| 24||  6|  chengnong| 55||  7|zhouxingchi| 58||  8|      mayun| 50||  9| yangliying| 30|| 10|  lilianjie| 51|| 11|zhanghuimei| 35|| 12|       lian| 53|| 13| zhangyimou| 54|+---+-----------+---+scala>
   
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32

bin/spark-sql \
–master spark://hadoop1:7077,hadoop2:7077 \
–executor-memory 1g \
–total-executor-cores 2 \
–driver-class-path /home/tuzq/software/spark-1.6.2-bin-hadoop2.6/lib/mysql-connector-java-5.1.38.jar

5、啟動spark-shell時指定mysql連線驅動位置

bin/spark-shell --master spark://hadoop1:7077,hadoop2:7077 --executor-memory 1g --total-executor-cores 2 --driver-class-path /home/tuzq/software/spark-1.6.2-bin-hadoop2.6/lib/mysql-connector-java-5.1.38.jar
   
    1

5.1.使用sqlContext.sql呼叫HQL(這裡是在spark-shell中執行的命令)

scala> sqlContext.sql("select * from person limit 2")res0: org.apache.spark.sql.DataFrame = [id: bigint, name: string, age: int]scala> sqlContext.sql("select * from person limit 2").show+---+--------+---+| id|    name|age|+---+--------+---+|  1|zhangsan| 19||  2|    lisi| 20|+---+--------+---+scala>
   
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13

或使用org.apache.spark.sql.hive.HiveContext

scala> import org.apache.spark.sql.hive.HiveContextimport org.apache.spark.sql.hive.HiveContextscala> val hiveContext = new HiveContext(sc)這裡是日誌，略去scala> hiveContext.sql("select * from person")res2: org.apache.spark.sql.DataFrame = [id: bigint, name: string, age: int]scala> hiveContext.sql("select * from person").show+---+-----------+---+| id|       name|age|+---+-----------+---+|  1|   zhangsan| 19||  2|       lisi| 20||  3|     wangwu| 28||  4|    zhaoliu| 26||  5|     tianqi| 24||  6|  chengnong| 55||  7|zhouxingchi| 58||  8|      mayun| 50||  9| yangliying| 30|| 10|  lilianjie| 51|| 11|zhanghuimei| 35|| 12|       lian| 53|| 13| zhangyimou| 54|+---+-----------+---+scala> 
   
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28

給我老師的人工智慧教程打call！http://blog.csdn.net/jiangjunshow

Spark-Sql整合hive，在spark-sql命令和spark-shell命令下執行sql命令和整合調用hive

type with hql lac 命令 val driver spark集群 string 1.安裝Hive 如果想創建一個數據庫用戶，並且為數據庫賦值權限，可以參考：http://blog.csdn.net/tototuzuoquan/article/details/5

Spark-Sql整合hive，在spark-sql命令和spark-shell命令下執行sql命令和整合呼叫hive

分享一下我老師大神的人工智慧教程！零基礎，通俗易懂！http://blog.csdn.net/jiangjunshow 也歡迎大家轉載本篇文章。分享知識，造福人民，實現我們中華民族偉大復興！

shell script中執行sql語句，返回結果中文亂碼問題——在企業開發中的解決方案

問題描述有一個需求，需要編寫一個指令碼向遠端資料庫拉取資料並生成一個檔案。在編寫完成並執行後，發現檔案中的中文為亂碼。指令碼中的查詢命令如下所示： QUERY_CMD="mysql -h${HOST} -u${USER} -p${PWD} -sBN " SQL="SELECT

shell script中執行sql語句，返回結果中文亂碼問題

問題描述有一個需求，需要編寫一個指令碼向遠端資料庫拉取資料並生成一個檔案。在編寫完成並執行後，發現檔案中的中文為亂碼。指令碼中的查詢命令如下所示： QUERY_CMD="mysql -h${HOST} -u${USER} -p${PWD} -sBN " SQ

oracle：使用cmd命令在遠端oracle伺服器上執行sql語句

在自動化測試過程中有時候我們需要自動跑一些sql指令碼來維護自動化測試資料庫，那麼這時候我們可以選擇批處理命令來執行sql語句。環境準備：執行sql伺服器需要安裝有oracle客戶端。步驟如下： 1、新建一個sql檔案，檔案內容為一個select查詢語句： sel

Linux下通過shell進MySQL執行SQL或匯入指令碼

這條命令表示通過使用者名稱和密碼執行shell然後在shell裡面執行一個建表語句： USER="root" PASS="root" mysql -u $USER -p$PASS <<EOF 2> /dev/null CREATE DATABASE um; EOF 下面的命令在登陸My

Java JDBC下執行SQL的不同方式

ret 中間 c程序關系 oid ... ins 數據庫連接 tst Java JDBC簡介 ? 數據庫驅動程序是JDBC程序和數據庫之間的轉換層，數據庫驅動程序負責將JDBC調用映射成特定的數據庫調用，使用Java JDBC API進行編程，可以為多種關系數據

android 極光推送快速自動整合及，自定義通知樣式及雙指下拉通知欄顯示全部內容

一，整合步驟： 1.極光推送官網，註冊，登入，建立應用，用專案包名獲取AppKey：注：包名必須與專案的包名一致 2.在 module 的 gradle 中新增依賴和支援： android { ...... defaultConfig {

FireBird資料庫和管理工具IBExpert及執行sql語句

第一次接觸FireBird資料庫，今天下午測試連線了一下午都沒有連線上，每次用IBExpert登記一個數據庫的時候都沒登記上，提示firebird.msg沒有找到和Your user name and password are not defined. Ask your

java下執行DOS命令，讀取輸出

最近在學習DOS命令，覺得應該做一個客戶端來執行DOS命令，恰好學習過java，就使用java執行DOS命令，在網上查找了許久，發現大同小異，不過還是要感謝大家的分享。關於怎麼運用，我總結了一下幾點：關鍵點 1.java下怎麼執行DOS命令 Process pro

Shell指令碼中執行sql語句操作mysql

--演示環境 [[email protected] ~]# more /etc/issue CentOS release 5.9 (Final) Kernel \r on an \m [email protected][(none)]> show variab

shell 下執行mysql 命令

copyto boa 不能存在 ppa fault 很多 values cli 在shell開發中，很多時候我們需要操作mysql數據庫（比如：查詢數據、導出數據等），但是我們又無法進入mysql命令行的環境，就需要在shell環境中模擬mysql的環境，使用mysql相

Windows環境下執行hadoop命令出現Error: JAVA_HOME is incorrectly set Please update D:SoftWarehadoop-2.6.0confhadoop-env.cmd錯誤的解決辦法（圖文詳解）

scala software ksum cal .com from 問題 jdk sun 　　　　不多說，直接上幹貨！導讀　　win下安裝hadoop　　大家，別小看win下的安裝大數據組件和使用　　玩過dubbo和disc

Spark-Sql整合hive，在spark-sql命令和spark-shell命令下執行sql命令和整合呼叫hive

給我老師的人工智慧教程打call！http://blog.csdn.net/jiangjunshow

Spark-Sql整合hive，在spark-sql命令和spark-shell命令下執行sql命令和整合調用hive

Spark-Sql整合hive，在spark-sql命令和spark-shell命令下執行sql命令和整合呼叫hive

shell script中執行sql語句，返回結果中文亂碼問題——在企業開發中的解決方案

shell script中執行sql語句，返回結果中文亂碼問題

oracle：使用cmd命令在遠端oracle伺服器上執行sql語句

Linux下通過shell進MySQL執行SQL或匯入指令碼

Java JDBC下執行SQL的不同方式

android 極光推送快速自動整合及，自定義通知樣式及雙指下拉通知欄顯示全部內容

FireBird資料庫和管理工具IBExpert及執行sql語句

java下執行DOS命令，讀取輸出

Shell指令碼中執行sql語句操作mysql

shell 下執行mysql 命令

Windows環境下執行hadoop命令出現Error: JAVA_HOME is incorrectly set Please update D:SoftWarehadoop-2.6.0confhadoop-env.cmd錯誤的解決辦法（圖文詳解）

windows批處理指令碼bat命令解析【10】如何執行cmd命令

【坑】【maven】在PowerShell視窗下執行maven命令列報錯：Unknown lifecycle phase ".test.skip=true".

Linux Shell環境下用jq命令處理json檔案

如何在mysql客戶端即mysql提示符下執行作業系統命令

linux中利用shell指令碼條件執行linux命令

dos下執行pybot 命令執行指令碼

Windows下執行Linux命令

Spark-Sql整合hive，在spark-sql命令和spark-shell命令下執行sql命令和整合呼叫hive

給我老師的人工智慧教程打call！http://blog.csdn.net/jiangjunshow

相關推薦