Beginning Data Exploration and Analysis with Apache Spark 使用Apache Spark開始資料探索和分析 中文字幕
使用Apache Spark開始資料探索和分析 中文字幕
Beginning Data Exploration and Analysis with Apache Spark
無論您是想要探索資料還是開發複雜的機器學習模型,資料準備都是任何資料專業人士的主要任務
Spark是一種引擎,它以非常直觀的方式幫助實現這一目標,使用功能結構將使用者從使用大型資料集的所有混亂中抽象出來
在本課程中,使用Apache Spark開始資料探索和分析,您將逐步完成探索性資料分析和Spark資料整理
首先,您將探索RDD和功能構造,使Spark中的處理非常直觀
接下來,您將瞭解如何轉換和清理非結構化資料
最後,您將學習如何沿著維度彙總資料以及如何建立關係以建立共現網路
在本課程結束時,您將能夠使用Spark以您想要的任何方式轉換資料
嗨,大家好。
我的名字是Swetha Kolalapudi,歡迎來到我的課程,使用Apache Spark開始資料探索和分析。
我是一家名為Loonycorn的創業公司的聯合創始人。
清理,轉換和準備資料是任何資料專業人員的主要任務,無論他們只是想探索資料並使用它,還是開發複雜的機器學習模型。
Spark是一種引擎,可以幫助我們以非常直觀的方式執行此操作,使用功能構造將使用者從使用大型資料集的所有混亂中抽象出來。
本課程的主要內容是使用Spark和彈性分散式資料集來處理複雜的資料。
當你完成時,你會習慣使用像filter,map和reduce這樣的函式結構來轉換資料,並使用RDD和Pair RDD來彙總和合並資料集。
我們將討論的一些主要議題包括轉換和清理非結構化資料,沿維度彙總資料以及建立關係以建立共現網路。
在本課程結束時,您將能夠使用Spark以您喜歡的任何方式轉換資料。
在開始本課程之前,您應該熟悉基礎級別的Python。
我希望你能和我一起在Pluralsight上用Apache Spark學習開始資料探索和分析。
本課程視訊下載地址: