1. 程式人生 > >機器學習資源和路線圖

機器學習資源和路線圖

機器學習資料:

上面這幾個視訊課程都是名氣比較大的,喜歡視訊課程的人可以看看。不過本人比較喜歡看書,遇到好的書看起來比較視訊課程快很多。

一些比較有名的書籍,如:
4. 周志華的西瓜書<<機器學習>>
https://book.douban.com/subject/26708119/
已讀完一半,廣度不錯,基本機器學習的各方面都覆蓋到了,不過都是概述性的介紹,事先沒有一點基礎會比較難讀懂,只讀這些遠遠不夠的。

5. 李航 <<統計學習方法>>
https://book.douban.com/subject/10590856/
讀了幾章就沒往下看了,感覺不好,不是很推薦。倒不是懼怕數學,對數學書籍,本人比較喜歡有數學思想貫穿的書籍,而不只是羅列一堆公式和沒有靈感的生硬推導,讀起來累,讀完後也很容易忘。可能本人的概率論與數理統計、貝葉斯統計的知識還需要加強。
一般計算機的工科生有比較好的微積分、線性代數、概率論與數理統計的知識,再加上一點泛函、抽代、優化理論等現代數學知識就更好了(這塊不需要獨立地去補,找好一點的機器學習書籍就會有介紹)。不過本人學習下來感覺機器學習領域需要很強的統計學知識和統計推斷思想,這塊需要補。

其他一些有名的書籍就不列了(美國、加拿大、英國那些有名的CS名校 ,都有比較好的書籍)。

下面推薦一些不常見,卻非常好的資料,理論與實踐有很好的結合。(我的學習方式:比較喜歡網上找資料學習。對於書籍,如果是非理論性的,一般是跟不上IT的發展速度的)

7. 機器學習演算法效果演示:playground tensorflow
http://playground.tensorflow.org/
已玩,推薦。Google基於TensorFlow的作品,可以實際感受一下機器學習的效果。

8. Deeplearning4j學習文件
https://deeplearning4j.org/cn/index


已讀,推薦,文件結構和邏輯都很清晰。可以下載example程式碼實際玩一玩。DL4j是基於Java的深度學習實現庫。很多人可能會推薦TensorFlow(基於Python)或Caffe2(基於C++),不過以國內的網際網路公司現狀和本人工程實踐來說,還是更喜歡看Java的實現,可以結合大資料處理框架Spark/Flink。Java領域的2個經典實現庫DL4j和apache mahout,可以重點學習。以後有時間再去看Python的實現 :)

最後推薦2本經典的大部頭著作,能啃完這兩本,那差不多可以去做研究了:)。