支援向量機(Support Vector Machine)

以前非常厲害的一個演算法，不過後來遇到了對手——神經網路

這個也是面試的時候經常會問到的非常重要的一個演算法

SVM要解決的問題：什麼樣的決策邊界才是最好的，如下圖中兩堆點怎麼區分
- 不過這裡不是要區分這兩堆點，而是舉個例子，後面會進行支援向量機的推導
那麼我們來討論一下決策邊界

這兩個圖分別用不同的決策邊界
可見，第二個圖的決策邊界更好，與兩邊的距離更寬，區分度越明顯

為了更好理解邊界的劃分過程，我們先推導一下點到平面的距離公式

引用百度百科的一張圖

我們簡化一下：這裡我們設 $\overrightarrow{w}$ 是平面的法向量，則平面可以表示為 $\overrightarrow{w}X+b=0$ ，我們假設空間中一點座標為 $e=(x,y,z)$ 我們推匯出來
$d=\frac{1}{|\overrightarrow{w}|}|\overrightarrow{w}e+b|$

下面再來說說資料標籤的定義，因為後面我們要利用支援向量機對資料進行分析，我們先來熟悉一下資料

先假設資料集 $(X_1,Y_1)(X_2,Y_2)(X_3,Y_3)...(X_n,Y_n)$
其中 $Y$ 是資料的類別，定義如下：
$Y= \begin{cases} +1, & \text {$X$為正例的時候} \\ -1, & \text{$X$為負例的時候} \end{cases}$
- 注意設定的是 $+1$ 和 $-1$ ，而不是 $1$ 和 $0$
那麼，我們利用上面定義好的資料後，就可以定義決策方程了
決策方程的定義：
- 基於上面的距離公式，並且將 $x$ 轉換為函式 $\Phi(x)$ ，有如下公式：
  $y(x)=\overrightarrow{w}\cdot \Phi(x)+b$
  $\Downarrow$
  $y(x_i)>0\Leftrightarrow y_i=+1$
  $y(x_i)<0\Leftrightarrow y_i=-1$
  $\Downarrow$
  $y_i\cdot y(x_i)>0$

有了以上的公式之後，我們就可以確立我們的優化目標了

我們看回去第二個圖，我們就是要找一條直線，離兩邊的點都足夠遠，越遠越好，這樣能最好地區分出兩邊的點
我們先將點到直線的距離都化簡一下：
$Y=\frac{y_i\cdot(\overrightarrow{w}\cdot \Phi(x_i)+b)}{|\overrightarrow{w}|}$
因為 $y_i\cdot y(x_i)>0$ ，因此這裡將分子的絕對值去掉了，其實這個 $y_i$ 純粹是因為加上去讓後面好處理的

通過這個公式，我們可以得出我們的優化目標

$argmax_{w,b}\{\frac{1}{|\overrightarrow{w}|}min_i\{y_i\cdot(\overrightarrow{w}\cdot \Phi(x_i)+b)\}$

上式的意思是首先尋找最小距離，也即 $min_i\{y_i\cdot(\overrightarrow{w}\cdot \Phi(x_i)+b)\}$ 即兩邊的點到你要求的那條分割線的最小距離，然後再給這個最小距離求最大值，也即外面的 $argmax_{w,b}$
但其實我們還是不方便求解這個函式，那麼我們換一個思路，先進行放縮變換試試：
- 對於方程 $Y=y_i\cdot(\overrightarrow{w}\cdot \Phi(x_i)+b)$ ，我們可以嘗試通過放縮使 $|Y|>=1$ ，也即 $y_i\cdot(\overrightarrow{w}\cdot \Phi(x_i)+b)>=1$ （注意，沒通過放縮之前是 $|Y|>=0$ 的）
- 通過放縮之後，我們是不是就可以通過 $y_i\cdot(\overrightarrow{w}\cdot \Phi(x_i)+b)>=1$ 而認為 $min_i\{y_i\cdot(\overrightarrow{w}\cdot \Phi(x_i)+b)\}=1$ 了，因為我們放縮的目的就是想讓最小值變成1，這樣後面直接把 $min_i\{y_i\cdot(\overrightarrow{w}\cdot \Phi(x_i)+b)\}$ 當做是1而忽略掉
- 至此，原優化目標 $argmax_{w,b}\{\frac{1}{|\overrightarrow{w}|}min_i\{y_i\cdot(\overrightarrow{w}\cdot \Phi(x_i)+b)\}$ 簡化為 $argmax_{w,b}\frac{1}{|\overrightarrow{w}|}$

機器學習學習筆記第十七章支援向量機

支援向量機(Support Vector Machine)

以前非常厲害的一個演算法，不過後來遇到了對手——神經網路

這個也是面試的時候經常會問到的非常重要的一個演算法

那麼我們來討論一下決策邊界

為了更好理解邊界的劃分過程，我們先推導一下點到平面的距離公式

下面再來說說資料標籤的定義，因為後面我們要利用支援向量機對資料進行分析，我們先來熟悉一下資料

決策方程的定義：

有了以上的公式之後，我們就可以確立我們的優化目標了

通過這個公式，我們可以得出我們的優化目標

如何求解極大值呢

機器學習學習筆記第十七章支援向量機

《Java編程思想》筆記第十七章容器深入研究

C++Primer Plus筆記——第十七章輸入、輸出和檔案總結及程式清單

C++Primer Plus筆記——第十七章輸入、輸出和檔案課後程式設計練習答案

吳恩達機器學習筆記（十二）-支援向量機

【統計學習方法-李航-筆記總結】七、支援向量機

第七章支援向量機（SVM）

《機器學習》周志華學習筆記第十四章概率圖模型（課後習題）python實現

機器學習學習筆記第十五章貝葉斯演算法

機器學習學習筆記第十六章基於貝葉斯的新聞分類

機器學習學習筆記第十九章聚類演算法-K-MEANS

機器學習學習筆記第十八章 SVM調參並觀察

Introduction to 3D Game Programming with DirectX 12 學習筆記之 --- 第十七章：拾取

我的學習之路_第十七章_JavaUtils

學習筆記第十四章使用CSS3動畫

學習筆記第十五章 JavaScript基礎

學習筆記第十七節課

學習筆記第十七節：斜率優化Dp，四邊形不等式證明決策單調

CLR via C#學習筆記-第十二章-泛型

CLR via C#學習筆記-第十二章-泛型基礎結構

機器學習學習筆記 第十七章 支援向量機

支援向量機(Support Vector Machine)

以前非常厲害的一個演算法，不過後來遇到了對手——神經網路

這個也是面試的時候經常會問到的非常重要的一個演算法

那麼我們來討論一下決策邊界

為了更好理解邊界的劃分過程，我們先推導一下點到平面的距離公式

下面再來說說資料標籤的定義，因為後面我們要利用支援向量機對資料進行分析，我們先來熟悉一下資料

決策方程的定義：

有了以上的公式之後，我們就可以確立我們的優化目標了

通過這個公式，我們可以得出我們的優化目標

如何求解極大值呢

機器學習學習筆記第十七章支援向量機