深度學習——訓練trick

阿新 • • 發佈：2019-02-20

1、資料預處理
資料必須進行預處理以使其zero-mean。
影象處理中有兩種方式中心化：減去均值影象（32，32，3）；減去每通道均值（3個值）。

2、梯度檢查
使用中心形式：
使用雙精度：使用單精度浮點數時，可能會出現即使梯度實現是正確的，也會得到比較大的相對誤差（比如1e-2），應該使用雙精度資料型別。
step大小：不是越小越好，當h過小時會出現數值精確度問題。一般在1e-4到1e-6之間修改h。
計算相對誤差：網路越深，誤差越大。所以當對一個深度達10層的神經網路進行梯度檢查時，即使相對誤差為1e-2可能也是可以的。

3、檢查初始損失是否合理
由於引數是隨機的，所以softmax得到的每個類別的結果是1/class_num，由此可以估計出初始的loss值。檢查程式輸出的loss值是否和期望的一致，如果不一致，那麼可能損失函式計算錯誤。

4、確保可以在很少的資料集上過擬合
選擇大概20個數據來訓練網路，那麼損失值應該隨著訓練epoch不斷減小並收斂到0。

5、引數初始化

6、學習率
損失值為nan時幾乎總意味著學習率過大。

深度學習——訓練trick

參考

深度學習——訓練trick

深度學習訓練技巧---權重初始化

深度學習訓練評價指標

深度學習訓練中關於資料處理方式--原始樣本採集以及資料增廣

深度學習訓練的常用名詞

如何解決機器學習深度學習訓練集樣本不均衡的問題！

深度學習(訓練/開發/測試集)的劃分技巧

G2P(單詞到音素)的深度學習訓練測試

Caffe的深度學習訓練全過程

深度學習訓練資料python程式碼——資料增廣（二）

深度學習小trick收集

設定可見GPU，進行多顯示卡深度學習訓練

VggNet10模型的cifar10深度學習訓練

深度學習訓練的小技巧，調參經驗。總結與記錄。

斯坦福DAWNBench：華為雲ModelArts深度學習訓練全球最快

如何將深度學習訓練速度提升一百倍？PAISoar 來了

深度學習---煉丹trick之正確使用BN（訓練和測試/預測時怎麼用）

基於深度學習的病毒檢測技術無需沙箱環境，直接將樣本文件轉換為二維圖片，進而應用改造後的卷積神經網絡 Inception V4 進行訓練和檢測

使用GOOGLE COLAB訓練深度學習模型

深度學習（十）訓練時的調參技巧

深度學習——訓練trick

參考

相關推薦