1. 程式人生 > >spark-core 和spark-sql的區別

spark-core 和spark-sql的區別

轉自:
http://www.cnblogs.com/zlslch/p/6685679.html
Spark SQL構建在Spark Core之上,專門用來處理結構化資料(不僅僅是SQL)。即Spark SQL是Spark Core封裝而來的!
  Spark SQL在Spark Core的基礎上針對結構化資料處理進行很多優化和改進,
  簡單來講:
    Spark SQL 支援很多種結構化資料來源,可以讓你跳過複雜的讀取過程,輕鬆從各種資料來源中讀取資料。
    當你使用SQL查詢這些資料來源中的資料並且只用到了一部分欄位時,SparkSQL可以智慧地只掃描這些用到的欄位,而不是像SparkContext.hadoopFile中那樣簡單粗暴地掃描全部資料。

可見,Spark Core與Spark SQL的資料結構是不一樣的!
   在這裡插入圖片描述