1. 程式人生 > >機器學習9、10、12/100天-SVM直觀認識

機器學習9、10、12/100天-SVM直觀認識

github: 100DaysOfMLCode

What is SVM:

SVM是一種監督學習演算法,可用於分類問題和迴歸問題,主要用於分類問題。在該演算法中,將資料的每一個特徵看作是n維空間的一個維度,之後對空間中的點進行分類劃分。

How is the data Classified:

分類方法是找到一個超平面,可以將資料劃分在超平面的兩側。

What is a optimal Hyper-Plane?

最佳超平面是劃分的兩類資料點中距超平面距離最近的點到超平面的距離最大。

非線性資料

對非線性資料無法找到一個線形平面進行劃分,則可以採用維度變換,比如二維空間的一個圓,令 z

= x 2 + y 2 z = x^2 + y^2 ,則在三位空間內,對z的劃分可以實現圓內和圓外的劃分。
通常採用核方法處理非線性資料。

調參

1.Kernel

核方法對資料做變換,多項式、指數等核在更高維度計算劃分平面。

2.GAMMA

gamma低表明離分割平面遠的點也參與分割平面計算,gamma高表明離分割平面遠的點參與度低。

3.REGULARIZATION

正則化,超平面的複雜度

4.MARGIN