【機器學習實戰】第6章支援向量機

阿新 • • 發佈：2019-02-04

def smoSimple(dataMatIn, classLabels, C, toler, maxIter):
    """smoSimple

    Args:
        dataMatIn    特徵集合
        classLabels  類別標籤
        C   鬆弛變數(常量值)，允許有些資料點可以處於分隔面的錯誤一側。
            控制最大化間隔和保證大部分的函式間隔小於1.0這兩個目標的權重。
            可以通過調節該引數達到不同的結果。
        toler   容錯率（是指在某個體系中能減小一些因素或選擇對某個系統產生不穩定的概率。） 

        maxIter 退出前最大的迴圈次數
    Returns:
        b       模型的常量值
        alphas  拉格朗日乘子
    """
    dataMatrix = mat(dataMatIn)
    # 矩陣轉置 和 .T 一樣的功能
    labelMat = mat(classLabels).transpose()
    m, n = shape(dataMatrix)

    # 初始化 b和alphas(alpha有點類似權重值。)
    b = 0
    alphas = mat(zeros((m, 1)))

    # 
 沒有任何alpha改變的情況下遍歷資料的次數
    iter = 0
    while (iter < maxIter):
        # w = calcWs(alphas, dataMatIn, classLabels)
        # print("w:", w)

        # 記錄alpha是否已經進行優化，每次迴圈時設為0，然後再對整個集合順序遍歷
        alphaPairsChanged = 0
        for i in range(m):
            # print 'alphas=', alphas
            # 
 print 'labelMat=', labelMat
            # print 'multiply(alphas, labelMat)=', multiply(alphas, labelMat)
            # 我們預測的類別 y[i] = w^Tx[i]+b; 其中因為 w = Σ(1~n) a[n]*lable[n]*x[n]
            fXi = float(multiply(alphas, labelMat).T*(dataMatrix*dataMatrix[i, :].T)) + b
            # 預測結果與真實結果比對，計算誤差Ei
            Ei = fXi - float(labelMat[i])

            # 約束條件 (KKT條件是解決最優化問題的時用到的一種方法。我們這裡提到的最優化問題通常是指對於給定的某一函式，求其在指定作用域上的全域性最小值)
            # 0<=alphas[i]<=C，但由於0和C是邊界值，我們無法進行優化，因為需要增加一個alphas和降低一個alphas。
            # 表示發生錯誤的概率：labelMat[i]*Ei 如果超出了 toler， 才需要優化。至於正負號，我們考慮絕對值就對了。
            '''
            # 檢驗訓練樣本(xi, yi)是否滿足KKT條件
            yi*f(i) >= 1 and alpha = 0 (outside the boundary)
            yi*f(i) == 1 and 0<alpha< C (on the boundary)
            yi*f(i) <= 1 and alpha = C (between the boundary)
            '''
            if ((labelMat[i]*Ei < -toler) and (alphas[i] < C)) or ((labelMat[i]*Ei > toler) and (alphas[i] > 0)):

                # 如果滿足優化的條件，我們就隨機選取非i的一個點，進行優化比較
                j = selectJrand(i, m)
                # 預測j的結果
                fXj = float(multiply(alphas, labelMat).T*(dataMatrix*dataMatrix[j, :].T)) + b
                Ej = fXj - float(labelMat[j])
                alphaIold = alphas[i].copy()
                alphaJold = alphas[j].copy()

                # L和H用於將alphas[j]調整到0-C之間。如果L==H，就不做任何改變，直接執行continue語句
                # labelMat[i] != labelMat[j] 表示異側，就相減，否則是同側，就相加。
                if (labelMat[i] != labelMat[j]):
                    L = max(0, alphas[j] - alphas[i])
                    H = min(C, C + alphas[j] - alphas[i])
                else:
                    L = max(0, alphas[j] + alphas[i] - C)
                    H = min(C, alphas[j] + alphas[i])
                # 如果相同，就沒發優化了
                if L == H:
                    print("L==H")
                    continue

                # eta是alphas[j]的最優修改量，如果eta==0，需要退出for迴圈的當前迭代過程
                # 參考《統計學習方法》李航-P125~P128<序列最小最優化演算法>
                eta = 2.0 * dataMatrix[i, :]*dataMatrix[j, :].T - dataMatrix[i, :]*dataMatrix[i, :].T - dataMatrix[j, :]*dataMatrix[j, :].T
                if eta >= 0:
                    print("eta>=0")
                    continue

                # 計算出一個新的alphas[j]值
                alphas[j] -= labelMat[j]*(Ei - Ej)/eta
                # 並使用輔助函式，以及L和H對其進行調整
                alphas[j] = clipAlpha(alphas[j], H, L)
                # 檢查alpha[j]是否只是輕微的改變，如果是的話，就退出for迴圈。
                if (abs(alphas[j] - alphaJold) < 0.00001):
                    print("j not moving enough")
                    continue
                # 然後alphas[i]和alphas[j]同樣進行改變，雖然改變的大小一樣，但是改變的方向正好相反
                alphas[i] += labelMat[j]*labelMat[i]*(alphaJold - alphas[j])
                # 在對alpha[i], alpha[j] 進行優化之後，給這兩個alpha值設定一個常數b。
                # w= Σ[1~n] ai*yi*xi => b = yj- Σ[1~n] ai*yi(xi*xj)
                # 所以：  b1 - b = (y1-y) - Σ[1~n] yi*(a1-a)*(xi*x1)
                # 為什麼減2遍？ 因為是 減去Σ[1~n]，正好2個變數i和j，所以減2遍
                b1 = b - Ei- labelMat[i]*(alphas[i]-alphaIold)*dataMatrix[i, :]*dataMatrix[i, :].T - labelMat[j]*(alphas[j]-alphaJold)*dataMatrix[i, :]*dataMatrix[j, :].T
                b2 = b - Ej- labelMat[i]*(alphas[i]-alphaIold)*dataMatrix[i, :]*dataMatrix[j, :].T - labelMat[j]*(alphas[j]-alphaJold)*dataMatrix[j, :]*dataMatrix[j, :].T
                if (0 < alphas[i]) and (C > alphas[i]):
                    b = b1
                elif (0 < alphas[j]) and (C > alphas[j]):
                    b = b2
                else:
                    b = (b1 + b2)/2.0
                alphaPairsChanged += 1
                print("iter: %d i:%d, pairs changed %d" % (iter, i, alphaPairsChanged))
        # 在for迴圈外，檢查alpha值是否做了更新，如果在更新則將iter設為0後繼續執行程式
        # 知道更新完畢後，iter次迴圈無變化，才推出迴圈。
        if (alphaPairsChanged == 0):
            iter += 1
        else:
            iter = 0
        print("iteration number: %d" % iter)
    return b, alphas

【機器學習實戰】第6章支援向量機（Support Vector Machine / SVM）

第6章支援向量機 <script type="text/javascript" src="http://cdn.mathjax.org/mathjax/latest/MathJax.js?config=default"></script>

【機器學習實戰】第6章支援向量機

def smoSimple(dataMatIn, classLabels, C, toler, maxIter): """smoSimple Args: dataMatIn 特徵集合 classLabels 類別標籤 C 鬆弛變數

《機器學習實戰》第6章支援向量機(程式碼)

'''Created on Nov 4, 2010Chapter 5 source file for Machine Learing in Action@author: Peter'''from numpy import *from time import sleepdef

《機器學習實戰》第六章----支援向量機

支援向量機 SVM(Support Vector Machine)實際上是應用於二分類的一個分類器,其基本模型定義為特徵空間上的間隔最大的線性分類器，其學習策略便是間隔最大化，最終可轉化為一個凸二次規劃問題的求解。這裡不對整個過程進行推導,因為看了很多部落格,有幾篇大佬的部落格寫的非

【機器學習實戰】第13章利用 PCA 來簡化數據

light nan 文本 com axis 均值 ... cati 二維空間第13章利用 PCA 來簡化數據降維技術場景我們正通過電視觀看體育比賽，在電視的顯示器上有一個球。顯示器大概包含了100萬像素點，而球則可能是由較少的像素點組成，例如說一千個像素

【機器學習實戰】第2章 K-近鄰演算法(k-NearestNeighbor，KNN)

第2章 k-近鄰演算法 <script type="text/javascript" src="http://cdn.mathjax.org/mathjax/latest/MathJax.js?config=default"></script>

【機器學習實戰】第3章決策樹

第3章決策樹 <script type="text/javascript" src="http://cdn.mathjax.org/mathjax/latest/MathJax.js?config=default"></script> 決策

【機器學習實戰】第1章機器學習基礎

第1章機器學習基礎機器學習概述機器學習就是把無序的資料轉換成有用的資訊。獲取海量的資料從海量資料中獲取有用的資訊我們會利用計算機來彰顯資料背後的真實含義，這才是機器學習的意義。機器學習場景例如：

【機器學習實戰】第10章 K-Means（K-均值）聚類演算法

第 10章K-Means（K-均值）聚類演算法 K-Means 演算法聚類是一種無監督的學習, 它將相似的物件歸到一個簇中, 將不相似物件歸到不同簇中. 相似這一概念取決於所選擇的相似度計算方法. K-Means 是發現給定資料集的 K 個簇的聚類演算法, 之

【Linux學習筆記】第6章 Linux文件壓縮和打包

linux centos 打包壓縮 tar 6.1壓縮打包介紹Windows壓縮：.rar，.zip，.7zLinux壓縮：.zip，.gz，.bz2，.xz，.tar.gz，.tar.bz2，.tar.xz 6.2gzip壓縮工具gzip FILENAME 壓縮文件，格式gz，壓縮後

《機器學習（周志華）》——第6章支援向量機

1、間隔與支援向量（1）分類學習的最基本思想就是：基於訓練集D在樣本空間中找到一個劃分超平面，將不同類別的樣本分開。（2）在樣本空間中，用線性方程來表示劃分超平面：ωTx + b = 0 ；其中ω = (ω1;ω2; … ; ωd)為法向量，決定超平面內的方向；b

周志華《機器學習》第 6 章支援向量機

本文是周志華《機器學習》系列文章之一，主要介紹支援向量機函式及核函式等概念。第 6 章支援向量機 6.1 間隔與支援向量給定訓練樣本集分類學習最基本的想法就是基於訓練集 D 在樣本空間中找到一個劃分超平面，將不同類別的樣本分開。在樣本

《統計學習方法》第 7 章“支援向量機”導讀

目錄《統計學習方法》第 7 章“支援向量機”導讀學習“支援向量機”的步驟第 1 階段：嚴格線性可分支援向量機第 2 階段：差一點線性可分的支援向量機理解鬆弛變數什麼是懲罰係數 \(C\) ？

【吳恩達機器學習筆記】第三章：線性迴歸回顧

本章是對線性代數的一些簡單回顧，由於之前學過，所以這裡只是簡單的將課程中的一些例子粘過來矩陣表示矩陣加法和標量乘法矩陣向量乘法用矩陣向量乘法來同時計算多個預測值矩陣乘法用矩陣乘法同時計算多個迴歸

【吳恩達機器學習筆記】第五章：多變數線性迴歸

目錄多特徵下的目標函式多元梯度下降法多元梯度下降法中的方法特徵縮放選擇學習率特徵和多項式迴歸正規方程（區別於迭代法的直接解法）正規方程在矩陣不可逆的情況下的解決方法

《機器學習實戰》第7章的一處代碼錯誤

traceback com post cond 解決 elm back document image --------------------------------------------------------------------------- IndexError

《機器學習實戰》第8章書本正文缺少一個函數

copy AR 機器 reg str 代碼 var div mean 在8.4.2 lasso的stageWist函數裏使用到了一個用於標準化的函數regularize，這個函數是需要自定義的，但是書中沒有給出來。在示例代碼中有，是這樣子的： def regularize

【Linux學習筆記】第4章 Linux磁盤管理

linux centos 磁盤格式化 LVM 4.1df命令df 查看文件系統磁盤空間使用情況。文件系統磁盤總大小（kB）已使用可用已用% 掛載點（目錄）Linux磁盤不能直接訪問，必須要有一個掛載點。參數：-h 可根據磁盤大小顯示適當的單位。帶有tmpfs代表臨時的

【Linux學習筆記】第5章 VIM工具

linux centos vim 5.1vim介紹vim是vi的升級版，帶有顏色顯示，先安裝包yum install -y vim-enhancedvim分為三種模式：一般模式、編輯模式、命令模式。 5.2vim顏色顯示和移動光標相同的文件信息在不同目錄下顯示顏色會有差異。相同內容，不同文件名，

【Linux學習筆記】第8章 Linux shell基礎知識

linux centos shell 通配 8.1shell介紹shell是一個命令解釋器，提供人機交互。支持特定語法。每個用戶都可以有自己特定的shell（bash）。CentOS7默認bash（Bourne Agin Shell）。其他還有zsh、ksh等。 8.2命令歷史命令歷史存放於

【機器學習實戰】第6章 支援向量機

相關推薦

【機器學習實戰】第6章支援向量機