十三.Spark SQL之通過Zeppelin進行統計資料的展示

阿新 • • 發佈：2018-12-17

Spark SQL學習有一段時間了,因此花了一些時間寫了一個日誌清洗的專案,專案已經上傳到github上了, 專案地址感興趣的可以拉下來看看。

在這裡我不講關於專案的實現過程,清洗之後的結果進行資料展示的時候,除了echarts框架,還發現了另外一種資料展示工具Zeppelin。下面就介紹一下: Apache Zeppelin 是一個讓互動式資料分析變得可行的基於網頁的開源框架。Zeppelin提供了資料分析、資料視覺化等功能。 Zeppelin 是一個提供互動資料分析且基於Web的筆記本。方便你做出可資料驅動的、可互動且可協作的精美文件，並且支援多種語言，包括 Scala(使用 Apache Spark)、Python(Apache Spark)、SparkSQL、 Hive、 Markdown、Shell等等,下面就開始實際操作。

第一步.下載Zeppelin的二進位制原始碼包

wget http://mirror.bit.edu.cn/apache/zeppelin/zeppelin-0.8.0/zeppelin-0.8.0-bin-all.tgz

大約有七百多兆,然後解壓:

tar -zxvf zeppelin-0.8.0-bin-all.tgz -C ~/app/

進入到解壓之後的目錄中的bin目錄下,進行啟動:

./zeppelin-daemon.sh start

然後可以通過jps命令進行檢視: 在這裡插入圖片描述然後就可以在瀏覽器中輸入一下命令開始進行操作:

http://伺服器ip:8080

會顯示以下圖形化介面: 在這裡插入圖片描述

第二步.連線配置

在瀏覽器介面的右上角,有下圖所示的可操作按鈕,點選interpreter: 在這裡插入圖片描述

在出現的介面中搜索jdbc,然後點選右側有一個edit的按鈕進行連線jdbc的引數的修改: 在這裡插入圖片描述

修改完成之後在下面進行儲存,接下來就開始進行操作了.在Notebook中建立一個新的note:

隨便填入Note的名字.Default Interpreter要選擇jdbc,因為此次是為了獲取存在mysql中清洗之後的結果. 在這裡插入圖片描述

開啟之後可以進行sql語句的處理了: 在這裡插入圖片描述

然後就開始看他的強大之處了,就是可以根據查到的資料自動進行圖形化的展示,其中有表的形式進行展示,著柱狀圖的形式,餅圖的形式: 在這裡插入圖片描述

點選柱狀圖按鈕: 在這裡插入圖片描述點選餅圖按鈕:

至此就完成了Zeppelin的使用,想要了解更多可以參考官網進行學習。

Zeppelin官網

十三.Spark SQL之通過Zeppelin進行統計資料的展示

十三.Spark SQL之通過Zeppelin進行統計資料的展示

十六.Spark SQL之讀取複雜的json資料

Spark-Sql之DataFrame實戰詳解

Spark SQL 之 Join 實現

11.spark sql之RDD轉換DataSet

12.spark sql之讀寫數據

10.spark sql之快速入門

sql之分區域分段統計

Spark Streaming整合Spark SQL之wordcount案例

通過spark-sql快速讀取hive中的資料

Spark-SQL之DataFrame操作大全

Spark修煉之道（高階篇）——Spark原始碼閱讀：第十三節 Spark SQL之SQLContext（一)

Spark SQL之外部資料來源

Spark商業案例與效能調優實戰100課》第3課：商業案例之通過RDD分析大資料電影點評系各種型別的最喜愛電影TopN及效能優化技巧

Spark SQL之Join優化

《深入理解Spark》之通過自定義分割槽器解決資料傾斜問題

spark從入門到放棄三十三:Spark Sql(6)hive sql 案例查詢分數大於80分的同學

《深入理解Spark》之通過sample運算元找出導致資料傾斜的key

Spark 系列（八）—— Spark SQL 之 DataFrame 和 Dataset

Spark 系列（九）—— Spark SQL 之 Structured API

十三.Spark SQL之通過Zeppelin進行統計資料的展示

相關推薦