16 SVM - 程式碼案例三 - 不同SVM核函式效果比較

阿新 • • 發佈：2018-12-07

SVM的章節已經講完，具體內容請參考：《01 SVM - 大綱》

《14 SVM - 程式碼案例一 - 鳶尾花資料SVM分類》
《15 SVM - 程式碼案例二 - 鳶尾花資料不同分類器效果比較》

常規操作：

1、標頭檔案引入SVM相關的包
2、防止中文亂碼
3、讀取資料
4、資料分割訓練集和測試集 6:4

import time
import numpy as np
import pandas as pd
import matplotlib as mpl
import matplotlib.pyplot as plt
from sklearn.svm import SVC
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score

## 設定屬性防止中文亂碼
mpl.rcParams['font.sans-serif'] = [u'SimHei']
mpl.rcParams['axes.unicode_minus'] = False

## 讀取資料
# 'sepal length', 'sepal width', 'petal length', 'petal width'
iris_feature = u'花萼長度', u'花萼寬度', u'花瓣長度', u'花瓣寬度'
path = './datas/iris.data'  # 資料檔案路徑
data = pd.read_csv(path, header=None)
x, y = data[list(range(4))], data[4]
y = pd.Categorical(y).codes
x = x[[0, 1]]

## 資料分割
x_train, x_test, y_train, y_test = train_test_split(x, y, random_state=28, train_size=0.6)

資料SVM分類器構建：

1、線性核；2、高斯核；3、多項式核；4、Sigmoid核函式；
10 SVM - 核函式 - 文末對四種核函式進行了介紹，尤其是高斯核。

svm1 = SVC(C=1, kernel='linear')
svm2 = SVC(C=1, kernel='rbf')
svm3 = SVC(C=1, kernel='poly')
svm4 = SVC(C=1, kernel='sigmoid')

## 模型訓練
t0=time.time()
svm1.fit(x_train, y_train)
t1=time.time()
svm2.fit(x_train, y_train)
t2=time.time()
svm3.fit(x_train, y_train)
t3=time.time()
svm4.fit(x_train, y_train)
t4=time.time()

效果評估：

svm1_score1 = accuracy_score(y_train, svm1.predict(x_train))
svm1_score2 = accuracy_score(y_test, svm1.predict(x_test))

svm2_score1 = accuracy_score(y_train, svm2.predict(x_train))
svm2_score2 = accuracy_score(y_test, svm2.predict(x_test))

svm3_score1 = accuracy_score(y_train, svm3.predict(x_train))
svm3_score2 = accuracy_score(y_test, svm3.predict(x_test))

svm4_score1 = accuracy_score(y_train, svm4.predict(x_train))
svm4_score2 = accuracy_score(y_test, svm4.predict(x_test))

畫圖 - 鳶尾花資料SVM分類器不同核心函式模型比較：

x_tmp = [0,1,2,3]
t_score = [t1 - t0, t2-t1, t3-t2, t4-t3]
y_score1 = [svm1_score1, svm2_score1, svm3_score1, svm4_score1]
y_score2 = [svm1_score2, svm2_score2, svm3_score2, svm4_score2]

plt.figure(facecolor='w', figsize=(12,6))

模型預測準確率比較：

plt.subplot(121)
plt.plot(x_tmp, y_score1, 'r-', lw=2, label=u'訓練集準確率')
plt.plot(x_tmp, y_score2, 'g-', lw=2, label=u'測試集準確率')
plt.xlim(-0.3, 3.3)
plt.ylim(np.min((np.min(y_score1), np.min(y_score2)))*0.9, 
    np.max((np.max(y_score1), np.max(y_score2)))*1.1)
plt.legend(loc = 'lower left')
plt.title(u'模型預測準確率', fontsize=13)
plt.xticks(x_tmp, [u'linear-SVM', u'rbf-SVM', u'poly-SVM', u'sigmoid-SVM'], rotation=0)
plt.grid(b=True)

模型訓練耗時比較:

plt.subplot(122)
plt.plot(x_tmp, t_score, 'b-', lw=2, label=u'模型訓練時間')
plt.title(u'模型訓練耗時', fontsize=13)
plt.xticks(x_tmp, [u'linear-SVM', u'rbf-SVM', u'poly-SVM', u'sigmoid-SVM'], rotation=0)
plt.xlim(-0.3, 3.3)
plt.grid(b=True)

plt.suptitle(u'鳶尾花資料SVM分類器不同核心函式模型比較', fontsize=16)
plt.show()

預測結果畫圖

畫圖比較：

N = 500
x1_min, x2_min = x.min()
x1_max, x2_max = x.max()

t1 = np.linspace(x1_min, x1_max, N)
t2 = np.linspace(x2_min, x2_max, N)
x1, x2 = np.meshgrid(t1, t2)  # 生成網格取樣點
grid_show = np.dstack((x1.flat, x2.flat))[0] # 測試點

獲取各個不同演算法的測試值:

svm1_grid_hat = svm1.predict(grid_show)
svm1_grid_hat = svm1_grid_hat.reshape(x1.shape)  # 使之與輸入的形狀相同

svm2_grid_hat = svm2.predict(grid_show)
svm2_grid_hat = svm2_grid_hat.reshape(x1.shape)  # 使之與輸入的形狀相同

svm3_grid_hat = svm3.predict(grid_show)
svm3_grid_hat = svm3_grid_hat.reshape(x1.shape)  # 使之與輸入的形狀相同

svm4_grid_hat = svm4.predict(grid_show)
svm4_grid_hat = svm4_grid_hat.reshape(x1.shape)  # 使之與輸入的形狀相同

畫圖:

cm_light = mpl.colors.ListedColormap(['#A0FFA0', '#FFA0A0', '#A0A0FF'])
cm_dark = mpl.colors.ListedColormap(['g', 'r', 'b'])
plt.figure(facecolor='w', figsize=(14,7))

1、鳶尾花Linear-SVM特徵分類 (線性核)

plt.subplot(221)
## 區域圖
plt.pcolormesh(x1, x2, svm1_grid_hat, cmap=cm_light)
## 所以樣本點
plt.scatter(x[0], x[1], c=y, edgecolors='k', s=50, cmap=cm_dark)      # 樣本
## 測試資料集
plt.scatter(x_test[0], x_test[1], s=120, facecolors='none', zorder=10)     # 圈中測試集樣本
## lable列表
plt.xlabel(iris_feature[0], fontsize=13)
plt.ylabel(iris_feature[1], fontsize=13)
plt.xlim(x1_min, x1_max)
plt.ylim(x2_min, x2_max)
plt.title(u'鳶尾花Linear-SVM特徵分類', fontsize=16)
plt.grid(b=True, ls=':')
plt.tight_layout(pad=1.5)

2、鳶尾花rbf-SVM特徵分類 (高斯核)

plt.subplot(222)
## 區域圖
plt.pcolormesh(x1, x2, svm2_grid_hat, cmap=cm_light)
## 所以樣本點
plt.scatter(x[0], x[1], c=y, edgecolors='k', s=50, cmap=cm_dark)      # 樣本
## 測試資料集
plt.scatter(x_test[0], x_test[1], s=120, facecolors='none', zorder=10)     # 圈中測試集樣本
## lable列表
plt.xlabel(iris_feature[0], fontsize=13)
plt.ylabel(iris_feature[1], fontsize=13)
plt.xlim(x1_min, x1_max)
plt.ylim(x2_min, x2_max)
plt.title(u'鳶尾花rbf-SVM特徵分類', fontsize=16)
plt.grid(b=True, ls=':')
plt.tight_layout(pad=1.5)

3、鳶尾花poly-SVM特徵分類 (多項式核)

plt.subplot(223)
## 區域圖
plt.pcolormesh(x1, x2, svm3_grid_hat, cmap=cm_light)
## 所以樣本點
plt.scatter(x[0], x[1], c=y, edgecolors='k', s=50, cmap=cm_dark)      # 樣本
## 測試資料集
plt.scatter(x_test[0], x_test[1], s=120, facecolors='none', zorder=10)     # 圈中測試集樣本
## lable列表
plt.xlabel(iris_feature[0], fontsize=13)
plt.ylabel(iris_feature[1], fontsize=13)
plt.xlim(x1_min, x1_max)
plt.ylim(x2_min, x2_max)
plt.title(u'鳶尾花poly-SVM特徵分類', fontsize=16)
plt.grid(b=True, ls=':')
plt.tight_layout(pad=1.5)

4、鳶尾花sigmoid-SVM特徵分類:

plt.subplot(224)
## 區域圖
plt.pcolormesh(x1, x2, svm4_grid_hat, cmap=cm_light)
## 所以樣本點
plt.scatter(x[0], x[1], c=y, edgecolors='k', s=50, cmap=cm_dark)      # 樣本
## 測試資料集
plt.scatter(x_test[0], x_test[1], s=120, facecolors='none', zorder=10)     # 圈中測試集樣本
## lable列表
plt.xlabel(iris_feature[0], fontsize=13)
plt.ylabel(iris_feature[1], fontsize=13)
plt.xlim(x1_min, x1_max)
plt.ylim(x2_min, x2_max)
plt.title(u'鳶尾花sigmoid-SVM特徵分類', fontsize=16)
plt.grid(b=True, ls=':')
plt.tight_layout(pad=1.5)

plt.show()

PS: 還記得講核函式時候說過的話麼？
高斯核 可以近似表示無窮維的擴充套件，效果最好。
sigmoid核 一塌糊塗，不要去用。

17 SVM - 程式碼案例四 - 不同SVM懲罰引數C值不同效果比較

16 SVM - 程式碼案例三 - 不同SVM核函式效果比較

SVM的章節已經講完，具體內容請參考：《01 SVM - 大綱》《14 SVM - 程式碼案例一 - 鳶尾花資料SVM分類》《15 SVM - 程式碼案例二 - 鳶尾花資料不同分類器效果比較》常規操作： 1、標頭檔案引入SVM相關的包2、防止中文亂碼3、讀取資料4、資料分割訓練集和測試集 6:4

17 SVM - 程式碼案例四 - 不同SVM懲罰引數C值不同效果比較

SVM的章節已經講完，具體內容請參考：《01 SVM - 大綱》《14 SVM - 程式碼案例一 - 鳶尾花資料SVM分類》《15 SVM - 程式碼案例二 - 鳶尾花資料不同分類器效果比較》《16 SVM - 程式碼案例三 - 不同SVM核函式效果比較》常規操作： 1、標頭檔案引入SVM相關的包2

15 SVM - 程式碼案例二 - 鳶尾花資料不同分類器效果比較

SVM的章節已經講完，具體內容請參考：《01 SVM - 大綱》《14 SVM - 程式碼案例一 - 鳶尾花資料SVM分類》回顧案例一中的標頭檔案： import numpy as np import pandas as pd import matplotlib as mpl import matp

14 SVM - 程式碼案例一 - 鳶尾花資料SVM分類

SVM的章節已經講完，具體內容請參考：《01 SVM - 大綱》常規操作： 1、標頭檔案引入SVM相關的包2、防止中文亂碼3、去警告4、讀取資料5、資料分割訓練集和測試集 8:2 import numpy as np import pandas as pd import matplotlib as m

使用三種不同的核函式（迴歸）對Boston房價進行預測，同時對測試資料做出預測

from sklearn.datasets import load_boston from sklearn.svm import SVR from sklearn.cross_validation import train_test_split from sklearn.m

SVM---通俗易懂圖解高斯核函式

引言：對於SVM的核函式，許多初學者可能在一開始都不明白核函式到底是怎麼做到從二維空間對映到三維空間（這裡我們特徵空間以二維為例），因此本文主要講解其中一種核函式——-高斯核函式作為介紹，另外感謝Andrew Ng在網易雲課堂深入淺出的講解，不但加深了

支援向量機SVM----學習筆記三（程式碼實踐一高斯核函式）

import numpy as np import matplotlib.pyplot as plt from sklearn import datasets from sklearn.preprocessing import StandardScaler from sklearn.svm import SV

SVM支援向量機系列理論（三）非線性支援向量機與核函式技巧

3.1 核技巧解決非線性SVM 3.1.1 非線性SVM解決思路 3.1.2 核技巧下SVM 3.2 Mercer核

支援向量機SVM（三）：基於核函式的非線性SVM

前言線性分類SVM是一種線性分類非常有效的方法，若分類問題是非線性，需要考慮對資料進行空間變換，將非線性分類問題轉變為線性分類問題，使非線性SVM的學習轉變為線性SVM的學習。若使用對映ϕ\phiϕ將例項從原空間X\mathcal XX（一般為歐式空

SVM《三、核函式、數字識別、影象分類》

有關核函式，不想多介紹，參考：https://blog.csdn.net/v_july_v/article/details/7624837 這裡簡單說明下，以下圖二分類為例子，顯然線性不可分，我們用核函式 F 將特徵向量升維，至三維空間，然後很容易找一個平面將樣本分割開來，如圖2。

多分類SVM的應用核函式的選取及程式碼示例

一、應用SVM的關鍵在於核函式的選用，常用於影象處理的核函式主要有三個：linear（線性核）, rbf(徑向基函式)，polynomial(多項式核)。核函式的選用：針對不同的特徵向量型別選用不同的核函式，簡單選用核函式的方法就是： 1、linear:針對的是高維特徵

支援向量機（SVM）（三）----核函式及正則化

上一節最後我們說到我們根據求得的，可求得，，然後求出決策函式，但是我們知道：是的函式，我們也許不必把帶入上式來求解，我們直接把上式帶入決策函式可有：假如我們已經求得最優的，在

機器學習實戰-之SVM核函式與案例

在現實任務中，原始樣本空間中可能不存在這樣可以將樣本正確分為兩類的超平面，但是我們知道如果原始空間的維數是有限的，也就是說屬性數是有限的，則一定存在一個高維特徵空間能夠將樣本劃分。事實上，在做任務中，我們並不知道什麼樣的核函式是合適的。但是核函式的選擇卻

3. 支援向量機（SVM）核函式

1. 前言之前介紹了SVM的原理和SVM的軟間隔，它們已經可以很好的解決有異常點的線性迴歸問題，但是如果本身是非線性的問題，目前來看SVM還是無法很好的解決的。所以本文介紹SVM的核函式技術，能夠順利的解決非線性的問題。 2. 多項式迴歸在線性迴歸一節中我們有介紹線性迴歸解決非線性的一個方法就是多項

詳解SVM系列（三）：線性可分支援向量機與硬間隔最大化

支援向量機概覽（support vector machines SVM）支援向量機是一種二類分類模型。它的基本模型是定義在特徵空間上的間隔最大（間隔最大區別於感知機）線性分類器（核函式可以用非線性的分類）。支援向量機的學習策略是間隔最大化可形式化為一個求解凸二次規劃的問題。也等

基於sciket-learn實現SVM與核函式

支撐向量機（SVM）既可以用來解決分類問題，也可以解決迴歸問題，較多應用於解決分類問題，SVM嘗試尋找一個最優的角色邊界，距離兩個類別最近的樣本最遠，擁有較好的泛化能力。下面從程式碼的角度一步步的來理解SVM 先引入常用類庫，匯入鳶尾花資料集，取兩個特徵 import numpy as

SVM支援向量機系列理論（五）SVM中幾種核函式的對比

核函式可以代表輸入特徵之間特殊的相似性。 5.1 線性核形式： K(x,x′)=xTx′ K ( x ,

SVM的核函式如何選取？

在我的工作中，最常用的是Linear核與RBF核。 1. Linear核：主要用於線性可分的情形。引數少，速度快，對於一般資料，分類效果已經很理想了。 2. RBF核：主要用於線性不可分的情形。引數多，分類結果非常依賴於引數。有很多人是通過訓練資料的交叉驗證來尋找合適的引數，

svm常用核函式及選擇核函式的方法

SVM核函式的選擇對於其效能的表現有至關重要的作用，尤其是針對那些線性不可分的資料，因此核函式的選擇在SVM演算法中就顯得至關重要。對於核技巧我們知道，其目的是希望通過將輸入空間內線性不可分的資料對映到一個高緯的特徵空間內使得資料在特徵空間內是可分的，我們定義這種對映為ϕ(x

《統計學習方法》學習之三：SVM

一、SVM原理線性可分支援向量機 minαs.t.12∑i=1N∑j=1Nαiαjyiyj(xi⋅xj)−∑i=1Nαi∑i=1Nαiyi=00≤αi,i=1,2,⋯,N(37)(38)(39)(37)minα12∑i=1N∑j=1Nαiαjyiyj

16 SVM - 程式碼案例三 - 不同SVM核函式效果比較

常規操作：

資料SVM分類器構建：

效果評估：

畫圖 - 鳶尾花資料SVM分類器不同核心函式模型比較：

模型預測準確率比較：

模型訓練耗時比較:

預測結果畫圖

畫圖比較：

獲取各個不同演算法的測試值:

畫圖:

1、鳶尾花Linear-SVM特徵分類 (線性核)

2、鳶尾花rbf-SVM特徵分類 (高斯核)

3、鳶尾花poly-SVM特徵分類 (多項式核)

4、鳶尾花sigmoid-SVM特徵分類:

相關推薦