【機器學習四】SVM

阿新 • • 發佈：2018-11-30

機器學習中一般用的比較多的是整合學習演算法如bagging和boosting，以及SVM。這2個演算法的效果好。且對資料的分佈沒有啥要求。今天要講的是SVM即支援向量機。
SVM的定義
支援向量機(Support Vecor Machine, SVM)本身是一個二元分類演算法，是
對感知器演算法模型的一種擴充套件，現在的SVM演算法支援線性分類和非線性分
類的分類應用，並且也能夠直接將SVM應用於迴歸應用中，同時通過OvR
或者OvO的方式我們也可以將SVM應用在多元分類領域中。在不考慮整合
學習演算法，不考慮特定的資料集的時候，在分類演算法中SVM可以說是特別
優秀的。在這裡插入圖片描述
SVM可以對線性可分資料進行分類，也能對非線性的資料進行分類

。是不是感覺很強大？
對於線性可分資料，演算法可以在資料中找到一個直線（平面或者超平面）讓儘可能多的資料分佈在兩側，從而達到分類的效果，但是這樣的平面可能不止一個。為啥是儘可能多呢？原因很簡單一方面我們找到的一個近似分類比較好的平面，另一方面資料中存在噪音，不可能對噪音都劃分的很好。在這裡插入圖片描述

在這裡插入圖片描述

我們可以找到多個可以分類的超平面將資料分開，並且優化時希望所有的點(預測正確的點)都離超平面儘可能的遠，但是實際上離超平面足夠遠的點基本上都是被正確分類的，所以這個是沒有意義的；反而比較關心那些離超平面很近的點，這些點比較容易分錯。所以說我們只要讓離超平面比較近的點儘可能的遠離這個超平面，那麼我們的模型分類效果應該就會比較不錯嘍。SVM其實就是這個思想。說完了劃分規則，那麼劃分完以後如何來評估這樣的劃分的效果呢？在這裡插入圖片描述

在這裡插入圖片描述

上面說到了我們只關心離超平面近的點，因為超平面離這些點的距離決定了穩定性，容錯性。那麼就有一個概念出來了，對於這些離超平面近的點我們稱之為支援向量。支援向量到超平面上的距離稱之為間隔。距離L:
在這裡插入圖片描述

在這裡插入圖片描述

在這裡插入圖片描述

備註：在SVM中習慣性的將間隔設定為1，這是不影響推導結果的。
每一種模型都會一個衡量指標，我們常稱之為目標函式或者loss。而對於衡量一個SVM的好壞，我們用間隔衡量，間隔越大，則越好即目標是下面的式子在這裡插入圖片描述

在這裡插入圖片描述

對於上面的問題，我們可以進行一個轉換：
在這裡插入圖片描述

在這裡插入圖片描述

即反過來求||W||式子的最小值，從最大值問題轉換成最小值問題，這兩者是等價的。
從而SVM原始函式的損失值為：
在這裡插入圖片描述

在這裡插入圖片描述

因為目標函式和約束函式滿足KKT條件。在這裡插入圖片描述

在這裡插入圖片描述

所以可以將損失函式最終變成：在這裡插入圖片描述

在這裡插入圖片描述

即引入拉格朗日乘子後，優化目標變成：
在這裡插入圖片描述

在這裡插入圖片描述

根據拉格朗日對偶化特性，將該優化目標轉換為等價的對偶問題
來求解，從而優化目標變成：在這裡插入圖片描述

在這裡插入圖片描述

要是還不明白，可以參考下圖：
在這裡插入圖片描述

在這裡插入圖片描述

所以對於該優化函式而言，可以先求優化函式對於w和b的極小
值，然後再求解對於拉格朗日乘子β的極大值。
首先求讓函式L極小化的時候w和b的取值，這個極值可以直接通
過對函式L分別求w和b的偏導數得到：在這裡插入圖片描述

在這裡插入圖片描述

將求解出來的w和b帶入優化函式L中，定義優化之後的函式如下：在這裡插入圖片描述

在這裡插入圖片描述

假設存在最優解β*；根據w、b和β的關係，可以分別計算出對應的
w值和b值(一般使用所有支援向量的計算均值來作為實際的b值)；在這裡插入圖片描述

在這裡插入圖片描述

這裡的(xs,ys)即支援向量，根據KKT條件中的對偶互補條件(鬆弛條
件約束)，支援向量必須滿足一下公式：在這裡插入圖片描述

在這裡插入圖片描述

線性可分SVM演算法流程
在這裡插入圖片描述

在這裡插入圖片描述

以上就是線性可分情況的SVM。對於非線性可分的資料，可以通過核函式求得對應的權重和偏置。這就是本人學習SVM後的總結。

【機器學習四】SVM

機器學習中一般用的比較多的是整合學習演算法如bagging和boosting，以及SVM。這2個演算法的效果好。且對資料的分佈沒有啥要求。今天要講的是SVM即支援向量機。 SVM的定義支援向量機(Support Vecor Machine, SVM)本身是一個二元分類演算法，是對感知器演

【機器學習 sklearn】手寫數字識別 SVM

執行結果： "D:\Program Files\Python27\python.exe" D:/PycharmProjects/sklearn/SVM.py (1797L, 64L) [[ 0. 0. 5. ..., 0. 0. 0.]

【機器學習入門】Andrew NG《Machine Learning》課程筆記之四：分類、邏輯迴歸和過擬合

分類和邏輯迴歸在實際的生活中，會遇到很多二元分類問題(Binary Classification Problem),比如判斷一封郵件是否是垃圾郵件，攝像頭判斷使用者是男是女和一張圖片裡包含的是貓還是狗等等。在有監督的分類問題中，通常使用帶標記(Label

【機器學習系列】libsvm中的svm-toy嘗試

主要內容利用libSVM自帶的簡易工具來演示SVM的兩類分類過程。（以下內容只是利用libSVM自帶的一個簡易的工具供大家更好的理解SVM，如果你對SVM已經有了一定的瞭解，可以直接跳過這部分內容）實驗首先，你要了解的是libSVM只是眾多SVM實現版本中的其中

【機器學習實戰】第6章支援向量機（Support Vector Machine / SVM）

第6章支援向量機 <script type="text/javascript" src="http://cdn.mathjax.org/mathjax/latest/MathJax.js?config=default"></script>

【機器學習實戰】製作五子棋AI之四：基本規則的建立【2】

在上一次，我們建立了棋盤的狀態類GameStatus，用來存取和顯示每一步走完後的棋盤上黑白子的狀態。想一想，為了像真實的五子棋遊戲一樣執行，還缺了遊戲勝負的判定，那麼我們定義一個函式對遊戲勝負進行判斷。 def check_win(black,white

【機器學習筆記】第二章：模型評估與選擇

機器學習 ini ppi 第二章 err cap ner rate rac 2.1 經驗誤差與過擬合 1. error rate/accuracy 2. error: training error/empirical error, generalization error

【機器學習實戰】第13章利用 PCA 來簡化數據

light nan 文本 com axis 均值 ... cati 二維空間第13章利用 PCA 來簡化數據降維技術場景我們正通過電視觀看體育比賽，在電視的顯示器上有一個球。顯示器大概包含了100萬像素點，而球則可能是由較少的像素點組成，例如說一千個像素

【機器學習筆記】自組織映射網絡（SOM）

非線性每一個可能合作空間找到節點視覺網格什麽是自組織映射？一個特別有趣的無監督系統是基於競爭性學習，其中輸出神經元之間競爭激活，結果是在任意時間只有一個神經元被激活。這個激活的神經元被稱為勝者神經元（winner-takes-all neuron）。這種

【機器學習實戰】樸素貝葉斯

一.概述二.理論基礎三.文件分類四.垃圾郵件過濾五.從個人廣告中獲取區域傾向六.程式碼問題總結七.總結一、概述貝葉斯分類是一類分類演算法的總稱，這類演算法均以貝葉斯定理為基礎，故統稱為貝葉斯分類。本章首先介紹貝葉斯分類演算法的基礎——

【機器學習模型】整合學習總結

整合學習一. 同質整合 1. Boosting 2. Bagging 3. Stacking 二. 異質整合 1. 平均法 2. 投票法 3. 學習法（Stacking）

【機器學習八】決策數

剪枝是決策樹學習演算法對付“過擬合”的主要手段。過擬合的原因可能是:為了儘可能的正確分類訓練樣本，結點劃分過程不斷重複，有時會造成決策樹分支過多，這是可能因訓練樣本學的討“太好”了，以至於出現過擬合的情況，因此可以主動的去掉一些分支降低過擬合的風險。通常會採取預剪枝和後剪枝的方法

【機器學習七】利用K-means壓縮圖片

在學習機器的過程中，發現了K-means的一種應用，遂那這個例子，練練手，增加對K-means的理解。 # -- encoding:utf-8 -- """ Create by yexm on 2018/11/24 """ # coding:utf-8 import matplot

【機器學習六】貝葉斯NB

程式碼先貼上，後續總結 from numpy import * # 過濾網站的惡意留言侮辱性：1 非侮辱性：0 # 建立一個實驗樣本 def loadDataSet(): postingList = [['my','dog','has','flea','problems','h

【機器學習五】KNN

程式碼如下，其中資料集trainingDigits可以從我的網盤.上下載，提取碼：cbun 永久有效 #手寫識別 32x32 from numpy import * import operator import time from os import listdir def cla

【機器學習三】梯度下降法K-means優化演算法

K-means演算法延伸對於之前的一篇文章中說過K-means雖然效果可以，但是對給定的K值敏感，簇中心位置敏感以及計算量大。所以針對以上兩點有了一些優化的方法。對於給定的K值偏大或者偏小都將影響聚類效果。而由於對於需要聚類的資料本身沒有一個y值即分類值，這正是需要演算法最後得出的。所以

【機器學習二】梯度下降法KMeans

KMeans聚類的思想: 給定一個有M個物件的資料集，構建一個具有k個簇的模型，其中k<=M。滿足以下條件： • 每個簇至少包含一個物件 • 每個物件屬於且僅屬於一個簇 • 將滿足上述條件的k個簇成為一個合理的聚類劃分 • 基本思想：對於給定的類別數目k，首先給定初始劃分，通過迭代改

【機器學習實戰】FP-growth演算法詳解

Here is code 背景 apriori演算法需要多次掃描資料，I/O 大大降低了時間效率 1. fp-tree資料結構 1> 項頭表記錄所有的1項頻繁集出現的次數，並降序排列 2> fp tree 根據項頭表，構建fp樹 3>

【機器學習123】緒論

under ont 任務做出開始 tex 訓練預測筆記買了周誌華老師的機器學習實體書，集合牛網友的網絡筆記開始一個月的ML學習 https://blog.csdn.net/u011826404/article/details/75577216 雖然研究生也選修過，

【機器學習123】模型評估與選擇 (上)

　　第2章模型評估與選擇 2.1 經驗誤差與過擬合先引出幾個基本概念：誤差(error）：學習器的實際預測輸出與樣本的真實輸出之間的差異。訓練誤差(training error)：學習器在訓練集上的誤差，也稱“經驗誤差”。測試誤差(testing error)：學習器在測試集上的