1. 程式人生 > >Beginning Data Exploration and Analysis with Apache Spark 使用Apache Spark開始資料探索和分析 中文字幕

Beginning Data Exploration and Analysis with Apache Spark 使用Apache Spark開始資料探索和分析 中文字幕

使用Apache Spark開始資料探索和分析 中文字幕

Beginning Data Exploration and Analysis with Apache Spark
Alt
無論您是想要探索資料還是開發複雜的機器學習模型,資料準備都是任何資料專業人士的主要任務
Spark是一種引擎,它以非常直觀的方式幫助實現這一目標,使用功能結構將使用者從使用大型資料集的所有混亂中抽象出來
在本課程中,使用Apache Spark開始資料探索和分析,您將逐步完成探索性資料分析和Spark資料整理
首先,您將探索RDD和功能構造,使Spark中的處理非常直觀
接下來,您將瞭解如何轉換和清理非結構化資料
最後,您將學習如何沿著維度彙總資料以及如何建立關係以建立共現網路
在本課程結束時,您將能夠使用Spark以您想要的任何方式轉換資料

Alt
Alt
Alt
Alt
Alt
嗨,大家好。
我的名字是Swetha Kolalapudi,歡迎來到我的課程,使用Apache Spark開始資料探索和分析。
我是一家名為Loonycorn的創業公司的聯合創始人。
清理,轉換和準備資料是任何資料專業人員的主要任務,無論他們只是想探索資料並使用它,還是開發複雜的機器學習模型。
Spark是一種引擎,可以幫助我們以非常直觀的方式執行此操作,使用功能構造將使用者從使用大型資料集的所有混亂中抽象出來。
本課程的主要內容是使用Spark和彈性分散式資料集來處理複雜的資料。
當你完成時,你會習慣使用像filter,map和reduce這樣的函式結構來轉換資料,並使用RDD和Pair RDD來彙總和合並資料集。
我們將討論的一些主要議題包括轉換和清理非結構化資料,沿維度彙總資料以及建立關係以建立共現網路。
在本課程結束時,您將能夠使用Spark以您喜歡的任何方式轉換資料。
在開始本課程之前,您應該熟悉基礎級別的Python。
我希望你能和我一起在Pluralsight上用Apache Spark學習開始資料探索和分析。
本課程視訊下載地址:

使用Apache Spark開始資料探索和分析