《機器學習實戰》--邏輯斯蒂迴歸

阿新 • • 發佈：2019-01-11

梯度下降視覺化

前一篇看完了理論，我們來實戰一下，首先看一下梯度下降的效果
先看程式碼

# 目標函式
def func(x):
    return np.square(x)

# 目標函式一階導數
def dfunc(x):
    return 2 * x

def GD_momentum(x_start, df, epochs, lr, momentum):
    xs = np.zeros(epochs+1)
    x = x_start
    xs[0] = x
    v = 0
    for i in range(epochs):
        dx = df(x)
        v = -dx * lr + momentum * v # 計算w需要更新的值 

        x += v
        xs.append(x)                # 把新的x儲存下來
    return xs

上面的程式碼就是首先定義了一個目標函式，然後定義了目標函式的一階導數，最後我們利用梯度下降演算法更新引數，並把每次新的引數儲存起來，已被畫圖，最終的結果就是如下所示：
梯度下降示意圖
我們可以看到新的引數取值是逐漸趨向於使目標函式最小化。看完了梯度下降，我們來做做一個二分類的小實驗。首先我們看一下資料，
這裡寫圖片描述
前兩列是特徵，第三列是label，每一行就是一個樣本。
首先我們看一下資料的分佈。

import  numpy as np
import 
 matplotlib.pyplot as plt
%matplotlib inline
np.random.seed(1234)

# 載入資料
def loaddata():
    dataMat = []
    labelMat = [] 
    for line in open('./data.txt', 'r'):
        line = line.strip().split()
        dataMat.append([1.0, float(line[0]), float(line[1])])
        labelMat.append(int(line[2]))
    return 
 dataMat, labelMat

# 顯示散點圖
def plotDataSet():
    data, label = loaddata()
    data = np.array(data)
    xcord1 = []
    ycord1 = []
    xcord2 = []
    ycord2 = []
    for i in range(data.shape[0]):
        if int(label[i]) == 1:
            xcord1.append(data[i, 1])
            ycord1.append(data[i, 2])
        else:
            xcord2.append(data[i, 1])
            ycord2.append(data[i, 2])
    fig = plt.figure()
    ax = fig.add_subplot(111)
    ax.scatter(xcord1, ycord1, s = 20, c = 'red', marker='s', alpha = 0.5)
    ax.scatter(xcord2, ycord2, s = 20, c = 'green', alpha = 0.5)
    plt.title('DataSet')
    plt.xlabel('X1')
    plt.ylabel('Y1')
    plt.show()

我們看一下資料的分佈，如圖所示：
這裡寫圖片描述

從圖上可以看出，資料的分佈很明顯，可以很輕鬆的分開。我們需要一個z=w1∗x1+w2∗x2+w3∗x3 來表示這個分割線，三個引數就可以搞定，我們在讀入資料的時候把x0設為1，那w1就相當於b了。我們採用梯度下降演算法來獲得最佳的引數，

def sigmoid(inX):
    return 1.0 / (1 + np.exp(-inX))

def gradAscent(data, label):
    data = np.mat(data)
    label = np.mat(label).transpose()
    alpha = 0.0001
    maxEpoch = 700
    m, n = np.shape(data)
    weights = np.ones((n, 1))
    for i in range(maxEpoch):
        h = sigmoid(data * weights)
        error = -(label - h)
        weights = weights - alpha * data.transpose() * error
    return weights.getA()

# 繪製結果
def plotBestFit(weights):
    dataMat, labelMat = loaddata()                                    
    dataArr = np.array(dataMat)                                            
    n = np.shape(dataMat)[0]                                            
    xcord1 = []; ycord1 = []                                            
    xcord2 = []; ycord2 = []                                            
    for i in range(n):                                                    
        if int(labelMat[i]) == 1:
            xcord1.append(dataArr[i,1]); ycord1.append(dataArr[i,2])    
        else:
            xcord2.append(dataArr[i,1]); ycord2.append(dataArr[i,2])    
    fig = plt.figure()
    ax = fig.add_subplot(111)                                            
    ax.scatter(xcord1, ycord1, s = 20, c = 'red', marker = 's',alpha=.5)
    ax.scatter(xcord2, ycord2, s = 20, c = 'green',alpha=.5)
    x = np.arange(-3.0, 3.0, 0.1)
    y = (-weights[0] - weights[1] * x) / weights[2]
    ax.plot(x, y)
    plt.title('BestFit')                                                         
    plt.xlabel('X1'); plt.ylabel('X2')                                    
    plt.show()

根據我們求出的引數，劃出分割界限：

這裡寫圖片描述

《機器學習實戰》--邏輯斯蒂迴歸

梯度下降視覺化

統計學習方法邏輯斯蒂迴歸

《機器學習實戰》第5章邏輯斯蒂迴歸數學推導

《機器學習實戰》--邏輯斯蒂迴歸

《機器學習實戰》-- 邏輯斯蒂迴歸

機器學習筆記:線性迴歸、邏輯斯蒂迴歸推導

機器學習筆記（一）邏輯斯蒂迴歸LR

【機器學習 sklearn】邏輯斯蒂迴歸模型--Logistics regression

統計學習---邏輯斯蒂迴歸與最大熵模型

《統計學習方法（李航）》邏輯斯蒂迴歸與最大熵模型學習筆記

sklean學習之LogisticRegression（邏輯斯蒂迴歸分類器）【原始碼】

李航·統計學習方法筆記·第6章 logistic regression與最大熵模型（1）·邏輯斯蒂迴歸模型

Hinton Neural Networks課程筆記3c：學習邏輯斯蒂迴歸

《統計學習方法》1——邏輯斯蒂迴歸

機器學習實戰筆記4—Logistic迴歸

機器學習實戰程式碼_Python3.6_Longistic迴歸

邏輯斯蒂迴歸能否解決非線性分類問題？邏輯斯蒂迴歸提出時用來解決線型分類問題，其分離面是一個線型超平面wx+b，如果將這個超平面改成非線性的，如x1^2+x2=0之類的非線性超平面來進行分類，是否也可

機器學習實戰-邏輯回歸

機器學習3 邏輯斯提回歸和梯度下降演算法

邏輯斯蒂迴歸用sigmoid函式的原因？

機器學習實戰——python實現Logistic迴歸

《機器學習實戰》--邏輯斯蒂迴歸

梯度下降視覺化

相關推薦