1. 程式人生 > >微博資料探勘

微博資料探勘

選取微博關於比特幣的話題,從爬蟲,清洗,到分析一體化的資料解決方案,從混亂的資料到隱晦的資訊,最後成為金字塔頂端的知識,是如何華麗轉身?從比特幣暴漲,到迅速下跌,在到觸底不反彈,這個過程人們最愛討論寫什麼呢?人們的心態又如何?回顧歷史,我們又能學到些什麼?這一切都在資料礦山中,我們一起去挖掘。

本次 Chat 您將學會以下小技巧:

  1. 簡單的社會媒體爬蟲;
  2. 對中文文字進行分詞處理;
  3. 過濾通用詞並統計詞頻;
  4. 分析詞頻繪製統計圖和炫酷雲圖;
  5. 規範化時間序列並進行重取樣分析。

最後說明,本場 Chat 程式碼完整,執行流暢,資料齊全,門檻較低,適合小白入門資料行業的首選。

閱讀全文: http://gitbook.cn/gitchat/activity/5c394dcb21da07194d35c1e8

一場場看太麻煩?成為 GitChat 會員,暢享 1000+ 場 Chat !點選檢視