《Spark快速大資料分析》pdf格式下載電子書免費下載
阿新 • • 發佈:2019-01-05
內容簡介
本書由 Spark 開發者及核心成員共同打造,講解了網路大資料時代應運而生的、能高效迅捷地分析處理資料的工具——Spark,它帶領讀者快速掌握用 Spark 收集、計算、簡化和儲存海量資料的方法,學會互動、迭代和增量式分析,解決分割槽、資料本地化和自定義序列化等問題。
作者介紹
Holden Karau是Databricks的軟體開發工程師,活躍於開源社群。她還著有《Spark快速資料處理》。
Andy Konwinski是Databricks聯合創始人,Apache Spark專案技術專家,還是Apache Mesos專案的聯合發起人。
Patrick Wendell是Databricks聯合創始人,也是Apache Spark專案技術專家。他還負責維護Spark核心引擎的幾個子系統。
Matei Zaharia是Databricks的CTO,同時也是Apache Spark專案發起人以及Apache基金會副主席。
目錄
O'Reilly Media, Inc. 介紹
推薦序
譯者序
序
前言
第 1 章 Spark 資料分析導論
第 2 章 Spark 下載與入門
第 3 章 RDD 程式設計
第 4 章 鍵值對操作
第 5 章 資料讀取與儲存
第 6 章 Spark 程式設計進階
第 7 章 在叢集上執行 Spark
第 8 章 Spark 調優與除錯
第 9 章 Spark SQL
第 10 章 Spark Streaming
第 11 章 基於 MLlib 的機器學習
作者簡介和封面介紹