斯坦福深度學習課程筆記（二）

阿新 • • 發佈：2018-12-11

損失函式和優化

1 損失函式

損失函式是用來定量地分析我們的模型預測效果有多糟糕的函式。損失函式輸出值越大，代表我們的模型效果越糟糕。

損失函式的通用表示：假設我們的資料集有N個樣本， $\{(x_i,y_i)\}^{N}_{i=1}$ 其中 $x_i$ 是樣本圖片， $y_i$ 是對應的整數標籤；整個資料集的損失就是每個樣本的損失之和。 $L = \frac{1}{N}\sum_iL_i(f(x_i,W),y_i)$

這裡介紹兩種損失函式

1.1 多分類SVM損失

SVM損失的形式是這樣的： $L_i = \sum_{j \ne y_i} \left\{ \begin{aligned} 0 &&if && s_{y_i} \le s_j + 1 \\ s_j + 1 - s_{y_i} && else \\ \end{aligned} \right. = \sum_{j \ne y_i} max(0,s_j + 1 - s_{y_i} )$

L_{i} = j ̸ = y_{i} \sum {0 s_{j} + 1 - s_{y_{i}} i f e l s e s_{y_{i}} \leq s_{j} + 1 = j ̸ = y_{i} \sum m a x (0, s_{j} + 1 - s_{y_{i}})

這裡的

+1

代表一個邊界（margin），即正分類比誤分類大的程度，其實這個是可以自由設定的，但是也要依據問題去考慮。

svm loss

也可以把SVM Loss叫做Hinge Loss，橫軸是 $s_{y_i}$ ，隨著 $s_{y_i}$ 的增大，HInge Loss是逐漸下降的，最終降為0。

在這裡插入圖片描述

在這個問題中，我們的 $s$ 就是模型跑到最後，給每個樣本image的分類的一個分數值。

關於SVM Loss，有幾個問題：

損失的最大/最小值分別是什麼？最小值是0，對應全部分類正確的情況；最大值是無窮大
在初始化階段， $W$ 很小，所以所有的 $s \simeq 0$ ，這個時候的損失是多少？答案是 $c-1$ ， $c$ 代表分類的數量。 $\sum_{j \ne y_i} max(0,s_j + 1 - s_{y_i} ) = \sum_{j \ne y_i} max(0,1) = \\ \sum_{j \ne y_i} 1 = c(c-1)$ ，再求平均值，就是 $c-1$
如果包含 $j = y_i$ 的情況，所有損失的和應該是多少呢？損失的和應該會加上 $c$
如果我們使用平均值而非求和，損失會有怎樣的變化呢？沒什麼變化，只是縮放而已
如果我們使用 $max(0,s_j + 1 - s_{y_i} )^2$ ，會有什麼變化呢？這就形成了一個新的損失函式。
如果我們找到了一個 $W$ ，使得損失為0，那麼損失是惟一的嗎？不是， $2W$ 也能令損失為0。

既然 $W$ 和 $2W$ 都能使損失降為0，那麼我們應該選哪個 $W$ 呢？

這裡我們引入正則

1.2 softmax損失

2 優化

斯坦福深度學習課程筆記（二）

損失函式和優化官網 ppt 1 損失函式損失函式是用來定量地分析我們的模型預測效果有多糟糕的函式。損失函式輸出值越大，代表我們的模型效果越糟糕。損失函式的通用表示：假設我們的資料集有N個樣本，{(xi,yi)}i=1N\{(x_i,y_i)\}^{N}_

斯坦福深度學習課程筆記（一）

影象分類 ppt 1 資料驅動方法人眼和計算機看到的圖片不同，計算機看到的圖片是由很多代表畫素點的數字表示的陣列，所以人眼和計算機的視覺識別存在著Semantic Gap(語義鴻溝)。同時，讓計算機能夠有效地識別圖片中的物體之前，還存在很多挑戰：比如一些

Elam的吳恩達深度學習課程筆記（一）

記憶力是真的差，看過的東西要是一直不用的話就會馬上忘記,於是乎有了寫部落格把學過的東西儲存下來，大概就是所謂的集鞏固，分享，後期查閱與一身的思想吧，下面開始正題深度學習概論什麼是神經網路什麼是神經網路呢，我們就以房價預測為例子來描述一個最簡單的神經網路模型。　　假設有6間

深度學習入門筆記（二）————線性神經網路解決異或問題（程式碼）

首先梳理一下思路輸入為1，0。00異或為0，01異或為1，10異或為1，11異或為0.所以輸出為2類如下圖可知，需要兩條線劃分。 Madaline用間接地辦法解決。多個線性函式進行劃分，然後對各個神經元的輸出做邏輯運算。如圖，用兩條直線實現了異或的劃分。線

TensorFlow深度學習入門筆記（二）基本概念與代碼1

.get ali ant scope 基本有一個關註執行 rbo 關註公眾號“從機器學習到深度學習那些事”獲取更多最新資料寫在前面學習建議：以下學習過程中有不理解可以簡單查找下資料，但不必糾結（比如非得深究某一個函數等），盡量快速的學一遍，不求甚解無妨。因為有些知

神經網路與深度學習課程筆記（第一、二週）

之前結束了吳恩達老師的機器學習的15節課，雖然看得很艱辛，但是也算是對於機器學習的理論有了一個入門，很多的東西需要不斷的思考以及總結。現在開始深度學習的學習，仍然做課程筆記，記錄自己的一些收穫以及思考。第一週 1. ReLU （Rectified

神經網路與深度學習課程筆記（第三、四周）

接著學習吳恩達老師第三、四周的課程。（圖片均來自吳恩達老師課件）第三週 1. 普通的淺層網路

吳恩達Coursera深度學習課程筆記（1-1）神經網路和深度學習-深度學習概論

這系列文章是我在學習吳恩達教授深度學習課程時為了加深自己理解，同時方便後來對內容進行回顧而做的筆記，其中難免有錯誤的理解和不太好的表述方式，歡迎各位大佬指正並提供建議。1、什麼是神經網路在簡單的從房屋面積預測價格時，神經網路可以理解為將輸入的房屋

深度學習筆記——深度學習框架TensorFlow（二）

一. 學習網站：二. 教程：目錄： 1. 面向機器學習初學者的 MNIST 初級教程 2. 面向機器學習專家的 MNIST 高階教程 3. TensorFlow 使用指南（以MNIST為例） 4. 簡單的機器學習with tf.contr

Andrew Ng機器學習課程筆記（四）之神經網絡

Shiro入門視頻課程——筆記（二）

過程需要身份認證 perm () 表示 bcs 搭建環境添加jar包視頻課程鏈接：http://edu.51cto.com/course/14122.html 六、加密 1. 編碼/解碼 ? Shiro 提供了base64和16進制字符串編碼/解碼的API支持

Hibernate框架技術視頻課程——筆記（二）

del dsta prope rri result 參數 session 大小寫員工視頻課程鏈接：http://edu.51cto.com/course/10747.html 一、查詢操作 1. Hibernate支持多種查詢方式 2.分類 ? 主鍵查詢、HQL查詢

機器學習簡要筆記（二）——常見學習任務及算法

bubuko 屬性。 src 沒有數據數量類別降維筆記 1、分類從標識數據中學習分類特征，利用學習的分類特征，識別某個對象屬於哪個類別。 2、回歸預測與對象相關聯的連續性屬性。 3、聚類從沒有標記的數據中發現類似特征的分組，即將對象自動分組。

PHP、MySQL和JavaScript學習手冊筆記（二）

first 超級轉換 his java post ace put lin 第三章賦值運算符： $j*=3; 等價於 $j=$j*3; 字符串的單引號雙引號雙引號中的變量可以解析，單引號就是絕對的字符串。 heredoc長字符串 <?php $au

深度學習基礎系列（二）| 常見的Top-1和Top-5有什麽區別？

ack [1] 隨機排名 array gen spa imp 概率分布　　在深度學習過程中，會經常看見各成熟網絡模型在ImageNet上的Top-1準確率和Top-5準確率的介紹，如下圖所示：　　那Top-1 Accuracy和Top-5 Accuracy是指什

TensorFlow-實戰Google深度學習框架筆記（上）

當我日誌不一定 rain 如何 validate .config 存儲構建 TensorFlow TensorFlow 是一種采用數據流圖（data flow graphs），用於數值計算的開源軟件庫。在 Tensorflow 中，所有不同的變量和運算都是儲存在計算圖

深度學習基礎概念（二）（科普入門）

1、人工智慧（AI）、機器學習（ML）和深度學習（DL）：人工智慧是終極目標，機器學習是實現人工智慧的一種分支，深度學習隸屬於人工神經網路體系，人工神經網路是基於統計的機器學習方法，傳統的神經網路是一種淺層機器學習，深度學習是傳統神經網路發展下的新一代神經網路。深度學習是通

機器學習速成筆記（二）：訓練與損失

訓練模型通過有標籤樣本來學習（確定）所有的權重和偏差的理想值。損失是對槽糕預測的懲罰，損失是一個數值，模型的預測完全正確，則損失為零，反之，模型的預測越槽糕，損失越大。平方損失：一種常見的損失函式，線性迴歸模型就是使用該平方損失均方誤差：每個樣本的平均平方損失，計算均方誤差，要算出

AI聖經-深度學習-讀書筆記（七）-深度學習中的正則化

深度學習中的正則化 0 簡介機器學習中的一個核心問題是設計不僅在訓練資料上表現好，而且能在新輸入上泛化好的演算法。採用顯式減少測試誤差（可能會增加訓練誤差）的策略稱為正則化。在深度學習的背景下，大多數正則化策略都會對估計進行正則化（以偏差的增加換取方差

AI聖經-深度學習-讀書筆記（八）-深度模型中的優化

這一樣整理的內容非常少，以後會補上的。由於水平有限，實在看不懂。目前只是《深度學習》的第一版筆記，以後會以專欄的形式從新整理，不再是簡單的摘錄，更多的加上自己的思考。深度模型中的優化 0 簡介深度學習演算法在很多情況下都涉及優化。本章主要關

斯坦福深度學習課程筆記（二）

損失函式和優化

1 損失函式

1.1 多分類SVM損失

1.2 softmax損失

2 優化

相關推薦