機器學習演算法的除錯 —— 梯度檢驗（Gradient Checking）

阿新 • • 發佈：2019-01-11

反向傳播演算法很難除錯得到正確結果，尤其是當實現程式存在很多難於發現的bug 時。舉例來說，索引的缺位錯誤（off-by-one error）會導致只有部分層的權重得到訓練（for(i=1; i<=m; ++i) 被漏寫為 for(i=1; i<m; ++i)），再比如忘記計算偏置項。這些錯誤會使你得到一個看似十分合理的結果（但實際上比正確程式碼的結果要差）。因此，僅從計算結果上來看，我們很難發現程式碼中有什麼東西遺漏了。本節中，我們將介紹一種對求導結果進行數值檢驗的方法，該方法可以驗證求導程式碼是否正確。另外，使用本節所述求導檢驗方法，可以幫助你提升寫正確程式碼的信心。

數學原理

考慮我們想要最小化以 θ 為自變數的目標函式 J(θ)（θ 可以為標量和可以為向量，在 Numpy 的程式設計環境下，處理是一樣的），迭代梯度更新公式為：

θ:=θ−αddθJ(θ)
我們不妨以 Sigmoid 函式為例，也即 f(z)=11+exp(−z)，其導數形式為 f′(z)=g(z)=f(z)(1−f(z))，我們可輕易地程式設計實踐，接著我們便可使用 θ:=θ−αddθJ(θ)來實現梯度下降演算法，那麼我們如何知道 g(z)梯度的正確性呢。

回憶導數的數學定義：

ddθJ=limϵ→0J(θ+ϵ)−J(θ−ϵ)2ϵ

由此我們可得梯度校驗的數值校驗公式：

g(θ

)≈J(θ+ϵ)−J(θ−ϵ)2ϵ

這便是梯度檢驗的原理。在實際應用中，我們常將 ϵ 設為一個很小的常量，比如 10−4 數量級，我們不會將它設得太小，比如 10−20，因為那將導致數值舍入誤差。事實上，上式兩端值的接近程度取決於 J 的具體形式，但在假定 ϵ=10−4 的情況下，通常會發現左右兩端至少有四位有效數字是一致的（或者說精度至少在0.0001一級）。

程式設計實現

import numpy as np

def sigmoid(z):
    return 1./(1+np.exp(-z))
def sigmoid_prime(z):
    return sigmoid(z)*(1 
-sigmoid(z))
def check_gradient(f, x0, epsilon):
    return (f(x0+epsilon) - f(x0-epsilon))/2/epsilon

if __name__ == '__main__':
    x0 = np.array([1, 2, 3])
    epsilon = 1e-4
    print(sigmoid_prime(x0))
            # [ 0.19661193  0.10499359  0.04517666]
    print(check_gradient(sigmoid, x0, epsilon))
            # [ 0.19661193  0.10499359  0.04517666]

機器學習演算法的除錯 —— 梯度檢驗（Gradient Checking）

數學原理

程式設計實現

References

機器學習演算法的除錯 —— 梯度檢驗（Gradient Checking）

機器學習1：梯度下降（Gradient Descent）

【機器學習】筆記--梯度提升（Gradient boosting)

二，機器學習演算法之邏輯迴歸（python實現）

機器學習（十）優化演算法利器之梯度下降（Gradient Descend）

機器學習筆記——梯度下降（Gradient Descent）

機器學習3- 梯度下降（Gradient Descent）

機器學習筆記——梯度下降（Gradient D）

【吳恩達機器學習筆記】005 梯度下降（Gradient Descent）

機器學習——K-均值聚類（K-means）演算法

機器學習演算法簡介和程式碼（P&R語言）

【python與機器學習入門1】KNN（k近鄰）演算法2 手寫識別系統

機器學習演算法：交叉驗證——（監督）學習器效能評估方法 [ sklearn.model_selection.cross_val_score()官方翻譯 ]

機器學習演算法總結之XGBoost（下）實戰與調參

Spark MLlib 機器學習演算法與原始碼解析（網路課程—第一期）

機器學習演算法之隨機森林（1）pyspark.mllib中的RF

Python機器學習演算法實踐——梯度上升演算法

常見面試之機器學習演算法思想簡單梳理（進階版）

機器學習演算法原理與實踐（三）、卡爾曼濾波器演算法淺析及matlab實戰

十大機器學習演算法之決策樹（用於信用風險）

機器學習演算法的除錯 —— 梯度檢驗（Gradient Checking）

數學原理

程式設計實現

References

相關推薦