1. 程式人生 > >從零開始機器學習比賽經驗(bird分享)

從零開始機器學習比賽經驗(bird分享)

競爭力 aca 新的 ast 成績 ats span boosting https

視頻地址:https://pan.baidu.com/s/1b25yNG

機器學習比賽入門條件

1.過的去的code能力:Leetcode平臺

leetcode平臺可以幫助我們提高基本的算法實現能力,比如寫一個冒泡排序方法,寫出來的代碼簡潔高效

2.參與比賽:Data Fountain,Kaggle,biendata,Data castle

經常發布一些比賽,可以挑一些感興趣的參加

3.關註公眾號:閱讀代碼(高手的分享)或者論文; 推薦兩個@[email protected]愛可可

4.朋友和圈子(大腿),各種群

機器學習比賽流程

技術分享

這裏推薦的網址其實是一個博主的博客:http://blog.csdn.net/sinat_22594309/article/details/68951145

在這個博主的博客中談到了很多有關於機器學習的經驗,加關註,以後可以讀

1.特征工程這個地方就是數據分析能力,有些人其實就是可以能夠很好的將數據變化得到的新的特征,比如說將數據從低維空間映射到核空間或者高維空間就可以將原本無法分類的數據分開,這就是很好的新特征,我們不能把所有的數據多懟到模型上,比如神經網絡還是隨機森林,因為這些數據有可能量很大,或者很復雜,模型很難直接吃下這些數據得到很好的結果,所以需要我們先進行特征工程這一步,構造出合適的特征餵給我們的模型,從而得到更好的結果,這個就是很考驗想法的一個環節,每拿到一個題目,你能根據場景分析到什麽樣的idea可以很好的構造特征解決這個問題。有的人光是考規則懟就能拿到很好的數據競賽成績 比如天池比賽的規則大神 桑榆 天音。總之,特征工程是核心競爭力,有經驗的人講數據進行log對數變化啊這種

2.模型選用:大數據比賽中常用的模型就是各種nn模型(cnn,rnn),隨機森林,boost,等等

3.模型融合,就是利用叠代,boosting的方式訓練模型,這種就是真的在比賽中才會用到的技巧,一點都不學術

技術分享

從零開始機器學習比賽經驗(bird分享)