1. 程式人生 > >《Spark快速大資料分析》pdf格式下載電子書免費下載

《Spark快速大資料分析》pdf格式下載電子書免費下載

內容簡介

本書由 Spark 開發者及核心成員共同打造,講解了網路大資料時代應運而生的、能高效迅捷地分析處理資料的工具——Spark,它帶領讀者快速掌握用 Spark 收集、計算、簡化和儲存海量資料的方法,學會互動、迭代和增量式分析,解決分割槽、資料本地化和自定義序列化等問題。

作者介紹
Holden Karau是Databricks的軟體開發工程師,活躍於開源社群。她還著有《Spark快速資料處理》。
Andy Konwinski是Databricks聯合創始人,Apache Spark專案技術專家,還是Apache Mesos專案的聯合發起人。
Patrick Wendell是Databricks聯合創始人,也是Apache Spark專案技術專家。他還負責維護Spark核心引擎的幾個子系統。
Matei Zaharia是Databricks的CTO,同時也是Apache Spark專案發起人以及Apache基金會副主席。

目錄

O'Reilly Media, Inc. 介紹

推薦序

譯者序

前言

第 1 章 Spark 資料分析導論

第 2 章 Spark 下載與入門  

第 3 章 RDD 程式設計  

第 4 章 鍵值對操作  

第 5 章 資料讀取與儲存  

第 6 章 Spark 程式設計進階  

第 7 章 在叢集上執行 Spark  

第 8 章 Spark 調優與除錯  

第 9 章 Spark SQL  

第 10 章 Spark Streaming  

第 11 章 基於 MLlib 的機器學習  

作者簡介和封面介紹