1. 程式人生 > >《機器學習》(西瓜書) 隨筆

《機器學習》(西瓜書) 隨筆

       ML大牛請繞道請無視。       
       那天噹噹有滿減活動,實驗室一學弟說他想買《機器學習》,我問是哪本,答曰南大周志華那本“西瓜書”,說其同學向他推薦的。我表示不屑,咋從沒聽過?機器學習不是要看《PRML》麼?於是上亞馬孫看了下,是今年1月份的新書,然而銷量已到計算機類第一了,下邊評價也是不錯。於是從不屑到決定下單,也就幾分鐘的事情= =
       自從研究生入學以來,就發現機器學習(ML, Mechine Learning)實在是太火了。電信學院都有不少老師不搞通訊不搞訊號處理轉行搞這個了,關注科技新聞也發現ML的新聞滿天飛,所以我也蠻好奇的。但由於太懶,一直沒入門,直到這回碰巧買了這本風評不錯的書,於是決心看完,而不是買回來蒙塵。

       本書正文400頁左右(不計附錄,簡潔的附錄也蠻良心的,一定要看!),共16章,覆蓋的專題比較全面,前3章是基礎,餘下13章是各自獨立的專題,有基本的也有進階的,分別是:4決策樹,5神經網路,6支援向量機,7貝葉斯分類器,8整合學習,9聚類,10降維與度量學習,11特徵選擇與稀疏學習,12計算學習理論,13半監督學習,14概率圖模型,15規則學習,16強化學習。 每章的篇幅差不多,約20頁,點到為止。前後用了近兩個月的時間過了一遍,基本上是課餘時間看的,有一半以上是晚上回到宿舍後看的,對此還是比較滿意的。
       看完的總體感覺就是,設計那些經典演算法的電腦科學家真是太厲害了,整本書彙集了多少人類智慧的結晶吶。讚歎之餘,也感謝周教授寫了這麼一本入門的好書,他在後記裡說道:且以頂級的態度,出一本入得方家法眼之書。作者真乃業界良心吶。因為本書“淺嘗輒止”,不像國外經典大部頭那樣令入門者(如我)望而生畏,但也絕不是小白書。如果能把書裡那些演算法都弄明白其原理並程式設計實現的話,我相信你一定可以碾壓大部分人。而且,每章後面的十道習題,感覺有些開掛了= =另外,之前是誰說搞機器學習不需要數學的,只要調調引數就行了,我還信以為真了,同學你其實是在逗我的吧?!我發現裡面涉及的數學工具高階多了,主要是概率、數理統計、凸優化和矩陣分析的,我覺得比我看的那些無線通訊的論文涉及到的還要難。尤其是第12章,我覺得是最變態的。於是,我在看的過程中,其實只是學了一些名詞,瞭解了一些概念。“不求甚解”地一路看過來,絕大部分推導是看不懂的,演算法也沒有程式設計實現,但並沒阻礙我繼續看下去,因為我發現這些演算法真是太了不起了,而且我也是真的有興趣去了解它們,若是輕鬆就能理解這些演算法的話,那它們也就沒那麼了不起了。所以先粗略過一遍,我相信我還會再看第二遍的。
       剛好上週有澳洲的華人教授過來開短期課程,我過去聽了,他是用《PRML》那本來講的,真心完全聽不懂。數學是硬傷啊,所以不能沉下心來好好啃演算法的話,根本沒資格說學過ML吧。 希望以後有時間來慢慢啃,雖然很難,但在這個挑戰的過程中應該是痛並快樂著的,我有過這種感覺,沉浸其中的話其實還是很幸福的。特別是最後弄懂了那種成就感是無法言喻的。
       此書之所以外號“西瓜書”,後記裡有寫。原因是因為作者弄了個西瓜資料集,並用各種ML演算法根據西瓜的各種特徵來推斷是否是好瓜,蠻好玩的。所以如果你有興趣瞭解機器學習的話,真心推薦這一本良心之作。
唯一不爽的一點是這本書是方的,放在桌面一排書中顯得好突兀,好方。李航那本《統計學習方法》評價也不錯,但我沒看過,不過我翻過目錄,其覆蓋的專題比較少。當然進階的直接《PRML》吧。
       最後,這年頭不學點ML,你好意思說自己是理工科的麼= =#