1. 程式人生 > >神經網路softmax啟用函式的求導過程

神經網路softmax啟用函式的求導過程

在使用softmax函式作為輸出層啟用函式的神經網路中,進行反向傳播時需要計算損耗函式相對於Z的導數,即 \frac{\partial L}{\partial Z}。網上有很多公式推導,但都太“數學”化了,看著比較抽象。所以總結下自己理解的比較簡單的推導過程。

首先,為了直觀理解,我們假設Z為一個3x1的向量,通過soft max函式啟用後的A也為3x1的向量。當Z的維度更大時,其實方法也都是一樣,為了避免繁瑣的表示式,這裡進行了簡化。

具體過程如下圖,由於是臨時手寫,可能會有些地方公式符號有誤,但應該不影響理解: