Deep learning在計算機視覺方面具有廣泛的應用，包括影象分類、目標識別、語義分隔、生成影象描述等各個方面。本系列部落格將分享自己在這些方面的學習和認識，如有問題，歡迎交流。

在使用卷積神經網路進行分類任務時，往往使用以下幾類損失函式：

平方誤差損失
SVM損失
softmax損失

其中，平方誤差損失在分類問題中效果不佳，一般用於迴歸問題。softmax損失函式和SVM(多分類)損失函式在實際應用中非常廣泛。本文將對這兩種損失函式做簡單介紹，包括損失函式的計算、梯度的求解以及python中使用Numpy庫函式進行實現。

SVM多分類

1. 損失函式

i=∑j≠yimax(0,fj−fyi+Δ)

在實際使用中，Δ 的值一般取1，代表間隔。

在神經網路中，由於我們的評分函式是:
f=W∗x
因此，可以將損失函式改寫如下:
Li=∑j≠yimax(0,WTjxi−WTyixi+Δ)

如果考慮整個訓練集合上的平均損失，包括正則項，則公式如下：
L=1N∑i∑j≠yi[max(0,f(xi;W)j−f(xi;W)yi+Δ)]+λ∑k∑lW2k,l

直觀理解:
多類SVM“想要”正確類別的分類分數比其他不正確分類類別的分數要高，而且至少高出delta的邊界值。如果其他分類分數進入了紅色的區域，甚至更高，那麼就開始計算損失。如果沒有這些情況，損失值為0。我們的目標是找到一些權重，它們既能夠讓訓練集中的資料樣例滿足這些限制，也能讓總的損失值儘可能地低。

舉一個具體的例子：

例子來源於 斯坦福CS231n 課件。第一張圖片是貓，神經網路計算得出其三個類別的分值分別為 3.2, 5.1 和 -1.7。很明顯，理想情況下貓的分值應該高與其他兩種類別，但根據計算結果，car的分值最高，因此在當前的權值設定下，該 network 會把這張圖片分類為 car。此時我們可以根據公式計算損失

損失計算如下：(S代表Score，即分值)
Li=max(0,Scar−Scat+Δ)+max(0,Sfrog−Scat+Δ)=2.9+0

這裡寫圖片描述

2. 梯度公式推導

設定以下變數：
- 矩陣 W 代表權值，維度是 D∗C，其中 D 代表特徵的維度，C

代表類別數目。
- 矩陣 X 代表樣本集合，維度是 N∗D，其中 N 代表樣本個數。
- 分值計算公式為 f=X∗W，其維度為 N∗C, 每行代表一個樣本的不同類別的分值。

對於第 i 個樣本的損失函式計算如下:

Li=∑j≠yimax(0,WT:,jxi,:−WT:,yixi,:+Δ)

偏導數計算如下:

∂Li∂W:,yi=−(∑j≠yi1(wT:,jxi,:−wT:,yixi,:+Δ>0))xi,:
∂Li∂W:,j=1(

【深度學習CV】SVM, Softmax損失函式

SVM多分類

1. 損失函式

2. 梯度公式推導

【深度學習CV】SVM, Softmax損失函式

【深度學習原理】交叉熵損失函式的實現

【深度學習系列】用PaddlePaddle和Tensorflow實現經典CNN網絡GoogLeNet

【深度學習系列】用PaddlePaddle和Tensorflow實現GoogLeNet InceptionV2/V3/V4

【深度學習系列】一起來參加百度 PaddlePaddle AI 大賽吧！

【深度學習篇】--神經網絡中的調優

吳恩達【深度學習工程師】 04.卷積神經網絡第三周目標檢測（1）基本的對象檢測算法

【深度學習篇】--Windows 64下tensorflow-gpu安裝到應用

【深度學習篇】---CNN和RNN結合與對比，實例講解

【深度學習基礎】《深度學習》李巨集毅

【機器學習四】SVM

【深度學習系列】CNN模型的視覺化

【深度學習筆記】優化演算法（ Optimization Algorithm）

影象分割綜述【深度學習方法】

【深度學習筆記】關於卷積層、池化層、全連線層簡單的比較

【深度學習系列】卷積神經網路CNN原理詳解(一)——基本原理

吳恩達【深度學習工程師】學習筆記（二）

【深度學習SSD】——深刻解讀SSD tensorflow及原始碼詳解

【深度學習基礎】張量的描述與深度學習常見張量

【深度學習-CNN】CNN中的引數與計算量

【深度學習CV】SVM, Softmax損失函式

SVM多分類

1. 損失函式

2. 梯度公式推導

相關推薦