1. 程式人生 > >機器學習-5:DeepLN之CNN權重更新(筆記)

機器學習-5:DeepLN之CNN權重更新(筆記)

你要的答案或許都在這裡小鵬的部落格目錄

我想說:

學習dl不去深層的扒扒,沒有理論的支撐是不行的,今天分享一篇筆記,另加讀者的心得,很棒。

讀者分享資料探勘心得:

我跟你講一下在實際專案中我們是怎麼做資料探勘的。1:定義業務問題,很多人認為機器學習越高大上的演算法越厲害,其實不是這樣的,每類演算法都有特定的業務場景。機器學習主要分為有監督無監督和半監督,當拿到業務問題時,要看業務場景下哪類演算法比較好。比如做風控我們會用決策樹,做點選率預估我們會用LR。這裡你要清楚每個演算法的優缺點,比如為什麼我要用決策樹不用隨機森林,為什麼用LR不用SVM 2:根據模型做資料的收集和整合(比如爬蟲,建立資料倉庫,使用者畫像,使用spark做資料統計和清洗等等) 3:拿到資料以後,怎麼建立有效的特徵 因為資料不可能都是完整的,會有缺失值和異常值 這個時候需要根據業務做一些業務場景下的替代,比如用平均值代替缺失值,用中值代替異常值  4:資料特徵的向量化表示 比如LR,LR這個模型要求輸入的資料必須是0到1之間的,但是我們的資料不可能都是0到1之間的,這個時候就需要對資料進行向量化表示(比如離散化也叫做one hot encoding,歸一化)文字資料使用(tf-idf word2vec)等等  5:建立有效的損失函式 把資料跑到LR中,需要一種方法來迭代資料的誤差,比如Logloss function 我們的目的就是不斷迭代求出誤差的最小值 6:怎麼快速求出模型 這裡比如離線資料下我們會使用梯度下降演算法迭代模型 實時資料下我們會使用ftrl演算法迭代模型 7:模型的評估 比如使用AUC  8:模型的調整 比如過擬合我們會使用正則項,pca降維 這裡比如會用交叉驗證算出正則向的係數 其實大部分資料探勘場景下都是這個套路。

下面是cnn權重更新詳解:






還可以參考:

1. 反向傳播和它的直觀理解:http://blog.csdn.net/u014365862/article/details/54728707

2. UFLDL教程:http://deeplearning.stanford.edu/wiki/index.php/UFLDL教程

3. http://www.moonshile.com/post/juan-ji-shen-jing-wang-luo-quan-mian-jie-xi#toc_11

推薦閱讀: