TensorFlow HOWTO 2.1 支援向量分類（軟間隔）

阿新 • • 發佈：2018-11-29

在傳統機器學習方法，支援向量機算是比較厲害的方法，但是計算過程非常複雜。軟間隔支援向量機通過減弱了其約束，使計算變得簡單。

操作步驟

匯入所需的包。

import tensorflow as tf
import numpy as np
import matplotlib as mpl
import matplotlib.pyplot as plt
import sklearn.datasets as ds
import sklearn.model_selection as ms

匯入資料，並進行預處理。我們使用鳶尾花資料集所有樣本，根據萼片長度和花瓣長度預測樣本是不是山鳶尾（第一種）。注意，支援向量機只接受 1 和 -1 的標籤。

iris = ds.load_iris()

x_ = iris.data[:, [0, 2]]
y_ = (iris.target == 0).astype(int)
y_[y_ == 0] = -1
y_ = np.expand_dims(y_ , 1)

x_train, x_test, y_train, y_test = \
    ms.train_test_split(x_, y_, train_size=0.7, test_size=0.3)

定義超引數。

變數	含義
`n_input`	樣本特徵數
`n_epoch`	迭代數
`lr`	學習率
`lam`	L2 正則化項的係數

n_input = 2
n_epoch = 2000
lr = 0.05
lam = 0.05

搭建模型。

變數	含義
`x`	輸入
`y`	真實標籤
`w`	權重
`b`	偏置
`z`	`x`的線性變換

x = tf.placeholder(tf.float64, [None, n_input])
y = tf.placeholder(tf.float64, [None, 1])
w = tf.Variable(np.random.rand(n_input, 1))
b = tf.Variable(np.random.rand(1, 1))
z = x @ w + b

定義損失、優化操作、和準確率度量指標。分類問題有很多指標，這裡只展示一種。

我們使用 Hinge 損失和 L2 損失的組合。Hinge 損失為：

$mean(\max(1 - Z \otimes Y, 0))$

在原始的模型中，約束是樣本必須落在支援邊界之外，也就是 $yz >= 1$ 。我們將這個約束加到損失中，就得到了 Hinge 損失。它的意思是，對於滿足約束的點，它的損失是零，對於不滿足約束的點，它的損失是 $1 - yz$ 。這樣讓樣本儘可能到支援邊界之外。

L2 損失用於最小化支援邊界的幾何距離，也就是 $\frac{2}{\|w\|}$ 。

變數	含義
`hinge_loss`	Hinge 損失
`l2_loss`	L2 損失
`loss`	總損失
`op`	優化操作
`y_hat`	標籤的預測值
`acc`	準確率

hinge_loss = tf.reduce_mean(tf.maximum(1 - y * z, 0))
l2_loss = lam * tf.reduce_sum(w ** 2)
loss = hinge_loss + l2_loss
op = tf.train.AdamOptimizer(lr).minimize(loss)

y_hat = tf.to_double(z > 0) - tf.to_double(z <= 0)
acc = tf.reduce_mean(tf.to_double(tf.equal(y_hat, y)))

使用訓練集訓練模型。

losses = []
accs = []

with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())
    saver = tf.train.Saver(max_to_keep=1)
    
    for e in range(n_epoch):
        _, loss_ = sess.run([op, loss], feed_dict={x: x_train, y: y_train})
        losses.append(loss_)

使用測試集計算準確率。

        acc_ = sess.run(acc, feed_dict={x: x_test, y: y_test})
        accs.append(acc_)

每一百步列印損失和度量值。

        if e % 100 == 0:
            print(f'epoch: {e}, loss: {loss_}, acc: {acc_}')
            saver.save(sess,'logit/logit', global_step=e)

得到決策邊界：

    x_plt = x_[:, 0]
    y_plt = x_[:, 1]
    c_plt = y_.ravel()
    x_min = x_plt.min() - 1
    x_max = x_plt.max() + 1
    y_min = y_plt.min() - 1
    y_max = y_plt.max() + 1
    x_rng = np.arange(x_min, x_max, 0.05)
    y_rng = np.arange(y_min, y_max, 0.05)
    x_rng, y_rng = np.meshgrid(x_rng, y_rng)
    model_input = np.asarray([x_rng.ravel(), y_rng.ravel()]).T
    model_output = sess.run(y_hat, feed_dict={x: model_input}).astype(int)
    c_rng = model_output.reshape(x_rng.shape)

輸出：

epoch: 0, loss: 4.511212919815273, acc: 0.2222222222222222
epoch: 100, loss: 0.0814942611949705, acc: 1.0
epoch: 200, loss: 0.07629443566925993, acc: 1.0
epoch: 300, loss: 0.07146107394130172, acc: 1.0
epoch: 400, loss: 0.06791927215796319, acc: 1.0
epoch: 500, loss: 0.06529065400047798, acc: 1.0
epoch: 600, loss: 0.06335060635876646, acc: 1.0
epoch: 700, loss: 0.061836271593737835, acc: 1.0
epoch: 800, loss: 0.06079800773555345, acc: 1.0
epoch: 900, loss: 0.06042716484730995, acc: 1.0
epoch: 1000, loss: 0.06091475237291386, acc: 1.0
epoch: 1100, loss: 0.06021069445352348, acc: 1.0
epoch: 1200, loss: 0.06019457351257251, acc: 1.0
epoch: 1300, loss: 0.06000348375369489, acc: 1.0
epoch: 1400, loss: 0.060206981088196394, acc: 1.0
epoch: 1500, loss: 0.060210741691625935, acc: 1.0
epoch: 1600, loss: 0.060570783158962985, acc: 1.0
epoch: 1700, loss: 0.06003457018203537, acc: 1.0
epoch: 1800, loss: 0.060203912161627175, acc: 1.0
epoch: 1900, loss: 0.06019910894894441, acc: 1.0

繪製整個資料集以及決策邊界。

plt.figure()
cmap = mpl.colors.ListedColormap(['r', 'b'])
plt.scatter(x_plt, y_plt, c=c_plt, cmap=cmap)
plt.contourf(x_rng, y_rng, c_rng, alpha=0.2, linewidth=5, cmap=cmap)
plt.title('Data and Model')
plt.xlabel('Petal Length (cm)')
plt.ylabel('Sepal Length (cm)')
plt.show()

繪製訓練集上的損失。

plt.figure()
plt.plot(losses)
plt.title('Loss on Training Set')
plt.xlabel('#epoch')
plt.ylabel('Cross Entropy')
plt.show()

繪製測試集上的準確率。

plt.figure()
plt.plot(accs)
plt.title('Accurary on Testing Set')
plt.xlabel('#epoch')
plt.ylabel('Accurary')
plt.show()

擴充套件閱讀

TensorFlow HOWTO 2.1 支援向量分類（軟間隔）

在傳統機器學習方法，支援向量機算是比較厲害的方法，但是計算過程非常複雜。軟間隔支援向量機通過減弱了其約束，使計算變得簡單。操作步驟匯入所需的包。 import tensorflow as tf import numpy as np import matplotlib as

TensorFlow HOWTO 2.3 支援向量分類（高斯核）

遇到非線性可分的資料集時，我們需要使用核方法，但為了使用核方法，我們需要返回到拉格朗日對偶的推導過程，不能簡單地使用 Hinge 損失。操作步驟匯入所需的包。 import tensorflow as tf import numpy as np import matplo

TensorFlow HOWTO 2.2 支援向量迴歸（軟間隔）

將上一節的假設改一改，模型就可以用於迴歸問題。操作步驟匯入所需的包。 import tensorflow as tf import numpy as np import matplotlib.pyplot as plt import sklearn.datasets as

TensorFlow HOWTO 5.1 迴圈神經網路（時間序列）

5.1 迴圈神經網路（時間序列）迴圈神經網路（RNN）用於建模帶有時間關係的資料。它的架構是這樣的。在最基本的 RNN 中，單元（方框）中的操作和全連線層沒什麼區別，都是線性變換和啟用。它完全可以看做多個全連線層的橫向擴充套件。但是運算元量多了之後，就會有梯度消失

林軒田--機器學習技法--SVM筆記2--對偶支援向量機（dual+SVM）

對偶支援向量機咦？怎麼還有關於支援向量機的內容，我們不是在上一講已經將支援向量機解決了麼？怎麼又引入了對偶這個概念？ 1.動機我們在上一講已經講過，可以使用二次規劃來解決支援向量機的問題。如果現在想要解決非線性的支援向量機的問題，也很簡單，如下圖所

機器學習----支援向量機（軟間隔與正則化）

Soft Margin 前面的假設一直都是線性可分，可是如果對所有樣本不能線性可分（比如有noisy）怎麼辦？或者過擬合怎麼辦？緩解該問題的一個方法就是允許支援向量機在一些樣本上出錯，為此引入軟間隔(soft margin)這個概念。即允許在一些樣本

支援向量機2—線性支援向量機與軟間隔最大化

1、線性支援向量機線性可分問題的支援向量機學習方法，對線性不可分訓練資料是不適用的。因為這時上述方法中的不等式約束並不能都成立。這時就需要修改硬間隔最大化，使其成為軟間隔最大化。假設給定一個特徵空間上的訓練資料集T={（x1,y1），（x2,y2），...，（xN,yN）}，

1. 支援向量機（SVM）原理

1. 前言在我沒有學習接觸機器學習之前，我就已經聽說了SVM這個機器學習的方法。SVM自它誕生以來就以優秀的分類效能牢牢佔據了霸主地位。 2. SVM原理支援向量機（Support Vector Machine, SVM）的基本模型是在特徵空間上找到最佳的分離超平面使得訓練集上正負樣本間隔最大。SV

支援向量機（Python實現）

這篇文章是《機器學習實戰》（Machine Learning in Action）第六章支援向量機演算法的Python實現程式碼。 1 參考連結（1）支援向量機通俗導論(理解SVM的三層境界) （2）支援向量機—SMO論文詳解（序列最小最優化演算法） 2 實現程式

《機器學習》周志華學習筆記第六章支援向量機（課後習題）python 實現

一、 1.間隔與支援向量 2.對偶問題 3.核函式 xi與xj在特徵空間的內積等於他們在原始yangben空間中通過函式k(.,.)計算的結果。核矩陣K總是半正定的。 4.軟間隔與正則化軟間隔允許某些samples不滿足約束鬆弛變數 5.支援

2.1 The Python Interpreter（python直譯器）

2.1 The Python Interpreter（Python直譯器） Python是一門解釋性語言。Python的直譯器一次只能執行一個命令。標準的Python直譯器環境可以用通過輸入python進入（在終端輸入python後，就能進入直譯器）： >>>是提示符（prompt）

資料結構實現 2.1：連結串列（C++版）

1. 概念及基本框架連結串列是一種線性結構，而且儲存上屬於鏈式儲存（即記憶體的物理空間是不連續的），是線性表的一種。連結串列結構如下圖所示：下面以一個我實現的一個簡單的連結串列類來進一步理解連結串列。 template <class T&g

詳解SVM系列（四）：線性支援向量機與軟間隔最大化

線性支援向量機線性可分問題的支援向量機學習方法，對線性不可分訓練資料是不適用的，因為這時上述方法的不等式約束並不能都成立。舉2個例子：如果沒有混入異常點，導致不能線性可分，則資料可以按上面的實線來做超平面分離的。這種情況雖然不是不可分的，但是由於其中的一個藍色點不滿足線性

機器學習筆記8-支援向量機（3/3）

機器學習筆記8-支援向量機（3/3） scikit-learn中的SVM函式機器學習庫scikit-learn中也集成了SVM的函式，可以方便的進行呼叫，可用來分類、迴歸和異常點檢測。支援向量機的優點有： i)在高維空間效果很好 ii)當維度數大於樣本點數時，效果仍然不錯 i

資料探勘十大演算法——支援向量機SVM（二）：線性支援向量機的軟間隔最大化模型

首先感謝“劉建平pinard”的淵博知識以及文中詳細準確的推導！！！支援向量機原理SVM系列文章共分為5部分：（一）線性支援向量機（二）線性支援向量機的軟間隔最大化模型（三）線性不可分支援向量機與核函式（四）SMO演算法原理（五）線性支援迴歸

十大經典預測演算法（四）----支援向量機（SVM演算法）

一、概念：SVM思想和線性迴歸很相似，兩個都是尋找一條最佳直線。不同點：最佳直線的定義方法不一樣，線性迴歸要求的是直線到各個點的距離最近，SVM要求的是直線離兩邊的點距離儘量大。 SVM本質，　　距離測度，即把點的座標轉換成點到幾個固定點的距離，從而實現升維。

【機器學習】支援向量機（4）——非線性支援向量機（核函式）

前言當訓練資料集線性可分或者近似線性可分時，前面我們在文一以及文二已經介紹了線性可分支援向量機和線性支援向量機。但是有時訓練資料集是非線性的，這時就可以使用非線性支援向量機。非線性支援向量機的主要特點就是利用了核技巧。非線性分類問題如

機器學習----支援向量機（核函式）

#線性不可分我們的SVM是找到一條分割直線，但是如果線性不可分怎麼辦？如下圖：可以看出，是有一個明顯的分割線的，但是不是直線，這種情況下我們怎麼用SVM呢？我們可以找到一種變化，讓變換後的資料線性可分，用圖形象的表示為：圖中的ϕ就是我們

(3).支援向量機SVM——軟間隔最大化公式手寫詳細推導

線性可分問題的支援向量機學習方法，對線性不可分訓練資料是不適應的，因為這時上一節中不等式約束不能成立，如何擴充套件到線性不可分問題呢？這就需要修改硬間隔最大化，使其成為軟間隔最大化。通常情況下訓練資料中有一些特異的點，將這些特異的點去處後，剩下的樣本組成的集合是線性可分的。線性不可分的意思

SVM支援向量機原理(二) 線性支援向量機的軟間隔最大化模型

在支援向量機原理(一) 線性支援向量機中，我們對線性可分SVM的模型和損失函式優化做了總結。最後我們提到了有時候不能線性可分的原因是線性資料集裡面多了少量的異常點，由於這些異常點導致了資料集不能線性可分，本篇就對線性支援向量機如何處理這些異常點的原理方法做一個總結。 1

TensorFlow HOWTO 2.1 支援向量分類（軟間隔）

操作步驟

擴充套件閱讀

相關推薦