1. 程式人生 > >煉數成金-Spark大資料平臺

煉數成金-Spark大資料平臺

1:Spark生態和安裝部署
什麼是Spark
Spark有什麼
安裝部署
  Spark安裝簡介
  Spark的原始碼編譯
  Spark Standalone安裝
  Spark Standalone HA安裝  
Spark工具
  Spark互動式工具spark-shell
  Spark應用程式部署工具spark-submit

2:Spark程式設計模型和解析
Spark的程式設計模型  
  RDD的特點、操作、依賴關係
  快取策略
  廣播變數和累加器
Spark程式設計環境搭建
Spark程式設計例項

3:Spark執行架構和解析
Spark的執行架構
  基本術語
  執行架構(DAGScheduler、TaskSeduler、Task、容錯性、推測機制、資料本地性)
  Spark on Standalone執行過程
  Spark on YARN 執行過程
Spark例項演示
  Spark on Standalone例項演示
  Spark on YARN例項演示
 
4:不得不說的hive
hive的執行架構
hive的安裝
hive的例項演示
shark的簡介

5:SparkSQL原理和實踐
Spark的執行架構
  Catalyst
  sqlontext
  hiveContext
ThriftServer和CLI
  ThriftServer
  CLI
SparkSQL的例項演示和程式設計
  spark-shell例項演示
  spark-sql例項演示
  SparkSQL的程式設計

6:SparkStreaming原理和實踐
SparkStreaming原理
  SparkStreaming的原理
  SparkStreaming的執行方式  
  DStream的特點和操作
SparkStreaming例項演示
  網路資料演示
  文字例項演示
  Window操作演示  
 
7:MLlib入門
什麼是機器學習
MLlib的架構
Mllib例項演示
  聚類演算法演示
  推薦系統演示    

8:GraphX入門
圖論基礎
GraphX的架構
GraphX例項演示
  圖的基本操作
  PageRank演示

9:Spark運維(上)
Spark On YARN
Spark On Docker

10:Spark運維(下)
Spark配置
history server
job server
Spark的監控
  Spark UI監控
  Ganglia 監控

11:Spark調優
序化
壓縮
資料傾斜等等
例項演示

12:scala on Spark
spark常用的scala基礎
如何閱讀spark原始碼
如何構建spark專案

13:Spark程式設計
RDD的程式設計
Spark綜合例項(SparkSQL+sparkMlib+redis+R)

14:Spark原始碼研讀
Spark原始碼總體介紹
SparkCore原始碼細解  
Spark Examples介紹

15:雜談
Spark相關專案
  BlinkDB簡介
  SparkR的安裝和例項
  Techyon