CDH5.5.0中配置執行Spark SQL的Thrift Server

阿新 • • 發佈：2018-12-27

CDH5.5.0裡面閹割了spark-sql和sparkR，目錄裡面都沒有start-thriftserver.sh，哪怕是spark Standalone部署。

前面帖子講到，CDH5.5.0 spark-sql沒有的情況下，在一個節點部署外面社群版的spark1.5.2，spark on yarn後，spark-sql shell的方式可以查詢了。
但是問題來了，jdbc如何使用spark-sql？
Hive的配置裡面有HiveServer2是開著的，如下：
插圖：

很好，metastore也開著，beeline測試一下
beeline -u jdbc:hive2://192.168.100.11:10000/default -n hive

可以連線上。但是執行的sql，用的是MR，有木有搞錯？

插圖：

那麼我要用spark-sql咋辦？

CDH5.3.2中配置執行Spark SQL的Thrift Server
http://blog.csdn.net/freedomboy319/article/details/46332009

這位仁兄給的辦法不適用我的場景，但是啟動thriftserver的方法是可以借鑑的。

為避免埠衝突，停掉Hive裡面的 HiveServer2，或者在一臺沒有HiveServer2的節點上新開任務。
我是選擇新的機器來測試，懶得搞hive-stie的配置了。

######################## --master yarn
cd $SPARK_HOME/sbin
./start-thriftserver.sh --master yarn

然後在視窗觀察：4040埠和10000埠（預設配置10000埠）
插圖：

然後用瀏覽器登入：ip:4040埠，自動跳轉到yarn的Application UI上，觀察：
插圖：

走兩步看看：
插圖：

######################## --master local
cd $SPARK_HOME/sbin
./start-thriftserver.sh --master local

看到區別了，Executor只有Driver，yarn有好幾個。

CDH5.5.0中配置執行Spark SQL的Thrift Server

CDH5.5.0中配置執行Spark SQL的Thrift Server

CDH5.12.0 中擴容增加計算節點

vSphere 5.5.0 U1配置問題：主機的快速統計信息不是最新的

5.0中redis-cli的集群管理測試

如何解決Android 5.0中出現的警告：Service Intent must be explicit

在Android 5 0中使用JobScheduler

win10下Anaconda3在虛擬環境python_version=3.5.3 中配置pyspark

WordPress 5.0中的新功能（功能和截圖）

《Netty官方文件》5.0中的變化和注意點

在Jenkins中配置執行遠端shell命令

淺析Android 5.0中多媒體相關的新特性

在Spring Security4.0 中配置自定義的login頁面

在 Laravel 5.5+ 應用中配置使用阿里雲提供的簡訊服務及檔案儲存服務（OSS）

在Spring Framework 5.0中引入Kotlin支援

solr5.5.0安裝配置

Android整合xUtils3(3.5.0)環境配置

Hadoop2.2.0中配置SecondaryNameNode

ArcGIS Runtime SDK for .NET 100.0中如何執行.gpk（二）

VC6.0中配置使用Sqlite3

Android 5.0中使用JobScheduler 排程作業

CDH5.5.0中配置執行Spark SQL的Thrift Server

相關推薦