演算法工程師修仙之路:吳恩達機器學習(十五)
阿新 • • 發佈:2018-12-31
吳恩達機器學習筆記及作業程式碼實現中文版
第十章 支援向量機
大間隔分類器的數學原理
-
假設我有兩個二維向量 和 , 也叫做向量 和 之間的內積。
- 向量 在橫軸上取值為某個 ,而在縱軸上,高度是某個 作為 的第二個分量。
- 表示 的範數,即 的長度,即向量 的歐幾里得長度。 ,這是向量 的長度,它是一個實數。
- 現在讓我們回頭來看向量 , 是另一個向量,它的兩個分量 和 是已知的。
- 我們將向量
做一個直角投影到向量
上,接下來度量投影的長度
,或
者說是向量 投影到向量 上的量,因此可以將 。 - 另一個計算公式是: 就是 這個一行兩列的矩陣乘以 。因此可以得到 。
- ,因此如果你將 和 交換位置,將 投影到 上,而不是將 投影到 上,然後做同樣地計算,事實上可以得到同樣的結果。
- 事實上是有符號的,即它可能是正值,也可能是負值。
- 在內積計算中,如果
和
之間的夾角小於 90 度,那麼
是正值。然而如果這個夾角大於 90度,則
將會是負的,兩個向量之間的內積也是負的。
-
支援向量機模型中的目標函式:
- 接下來忽略掉截距,令 ,這樣更容易畫示意圖。我將特徵數n置為2,因此我們僅有兩個特徵 ,當我們僅有兩個特徵時,這個式子可以寫作: 。括號裡面的這一項是向量 的範數,或者說是向量 的長度。
- 因此支援向量機做的全部事情,就是極小化引數向量
範數的平方,或者說長度的平方。
- 我們考察一個單一的訓練樣本,我有用一個叉來表示一個正樣本
,意思是在水平軸上取值為
,在豎直軸上取值為
。
- 我們計算的方式就是將訓練樣本投影到引數向量 ,然後我來看一看這個線段的長度,我將它畫成紅色。我將它稱為 用來表示這是第 個訓練樣本在引數向量 上的投影。
- 將會等於 乘以向量 的長度或範數,即