【深度學習】Softmax迴歸（一）概念和原理

文章目錄

概述
Softmax

Softmox迴歸模型
向量形式
Softmax運算

交叉熵損失函式

真實標籤的變換
平方損失函式
交叉熵損失函式

概述

在前面的三篇文章中：

介紹了線性迴歸的基本原理，自己動手使用Python從0開始做了實現，同時也藉助MXNet深度學習框架進行了實現，並在一個公開資料集和一個模擬資料集上進行了實驗。

在機器學習問題中，我們通常將對連續值處理的模型叫做迴歸模型，對離散值處理的模型叫做分類模型。可以看到，線性迴歸正是適用於輸出為連續值的情況。在某些場景中，模型的輸出可能是諸如瓜的類別、影象類別等的離散值。比如輸入一張包含西瓜或哈密瓜的圖片，我們需要輸出圖片中包含哪種瓜，我們一般使用離散的值來描述這種類別，比如0代表西瓜，1代表哈密瓜。

這時我們可以採用分類模型來進行處理，比如Softmax線性分類模型（也稱Softmax迴歸）。筆者也正通過《動手學深度學習》這本線上書籍學習Softmax模型，藉此將學習筆記和心得記錄與此，希望可以和大家相互交流。

Softmax

Softmox迴歸模型

我們以上文提到的瓜的類別問題為例：

假設輸入圖片的大小為 $2*2$ ，即包含4個畫素，每個畫素是一個特徵；
假設需要判斷圖片中是哪種型別的瓜，以 $y_1=1$ 代表西瓜， $y_2=2$ 代表哈密瓜， $y_3=3$ 代表木瓜；

Softmax和線性迴歸一樣，均對輸入特徵做線性疊加。與線性迴歸不同的是，Softmax輸出值的個數等同於樣本中的類別數，所以我們得到( $o_n$ 表示模型的輸出)：

$\left \{ \begin{array}{c} \ o_1=x_1w_{11}+x_2w_{21}+x_3w_{31}+x_4w_{41}+b_1 \\ \\ \ o_2=x_1w_{12}+x_2w_{22}+x_3w_{32}+x_4w_{42}+b_2 \\ \\ \ o_3=x_1w_{13}+x_2w_{23}+x_3w_{33}+x_4w_{43}+b_3 \end{array} \right.$

Softmax和線性迴歸一樣，也可以看做是單層神經網路，並且輸出層也是全連線層，因為 $o_n$ 依賴於所有的輸入 $x_n$ 。畫出上述模型的神經網路結構如下：

在這裡插入圖片描述

向量形式

為了方便計算，我們將上述模型寫成向量形式。令：
$\boldsymbol x= \begin{bmatrix} x_1 & x_2 & x_3 & x_4 \\ \end{bmatrix} , \boldsymbol W= \begin{bmatrix} w_{11} & w_{12} & w_{13} \\ w_{21} & w_{22} & w_{23} \\ w_{31} & w_{32} & w_{33} \\ w_{41} & w_{42} & w_{43} \\ \end{bmatrix} , \boldsymbol b= \begin{bmatrix} b_1 & b_2 & b_3 \\ \end{bmatrix} , \boldsymbol o= \begin{bmatrix} o_1 & o_2 & o_3 \\ \end{bmatrix}$

【深度學習】Softmax迴歸（一）概念和原理

文章目錄

概述

Softmax

Softmox迴歸模型

向量形式

【深度學習】Softmax迴歸（一）概念和原理

【機器學習】softmax迴歸（一）

【深度學習】線性迴歸（一）原理及python從0開始實現

【機器學習】softmax迴歸（二）

【深度學習】線性迴歸（三）使用MXNet深度學習框架實現線性迴歸

【深度學習】線性迴歸（二）小批量隨機梯度下降及其python實現

【Absible學習】Ansible playbook （一）

深度學習入門logistic迴歸（一）

【Redis學習】Redis筆記（一）——特點、基礎命令和資料結構

【機器學習】神經網路（一）——多類分類問題

【機器學習】人像分類（一）——過程總結

深度學習之softmax函式（一）

深度學習論文翻譯解析（一）：YOLOv3: An Incremental Improvement

【強化學習】MOVE37-Introduction（導論）

深度學習之物體檢測（一）R-CNN

斯坦福CS224N_自然語言處理NLP深度學習DL課程筆記（一）

深度學習分散式訓練實戰（一）

【面試演算法】——連結串列（一）

java深度學習框架Deeplearning4j實戰（一）BP神經網路分類器

【機器學習】人像識別（三）——K-Means聚類

【深度學習】Softmax迴歸（一）概念和原理

文章目錄

概述

Softmax

Softmox迴歸模型

向量形式

相關推薦