機器學習實戰-邏輯回歸

阿新 • • 發佈：2018-12-23

one har 改進 lin [] readlines 機器 iter sun

邏輯回歸：簡單的來說，在線性回歸的基礎上加入了Sigmoid函數！

import numpy as np
import matplotlib.pyplot as plt
from matplotlib.font_manager import FontProperties
#加載數據集
def loadData(filename):
    dataMat = []
    labelMat = []
    with open(filename) as f:
        for line in f.readlines():
            line = line.strip().split()
            dataMat.append([ 
1,float(line[0]),float(line[1])])
            labelMat.append(int(line[2]))
        return dataMat,labelMat

#繪制數據集
def plot(dataMat,labelMat):
    x0cord1 = []
    x0cord2 = []
    x1cord1 = []
    x1cord2 = []
    n = len(labelMat)
    for i in range(n):
        if labelMat[i] == 1:
            x0cord1.append(dataMat[i][ 
1])
            x0cord2.append(dataMat[i][2])
        else:
            x1cord1.append(dataMat[i][1])
            x1cord2.append(dataMat[i][2])
    plt.scatter(x0cord1,x0cord2,c=‘red‘,s=20,alpha=0.5,marker=‘s‘)
    plt.scatter(x1cord1,x1cord2,c=‘green‘,s=20,alpha=0.5)
    plt.title(‘DataSet‘)
    plt.xlabel( 
‘x1‘)
    plt.ylabel(‘x2‘)
    plt.show()

#隨機梯度上升進行LR訓練
def stogradAscent(dataMat,labelMat,num_iter=150):
    dataMat = np.array(dataMat)
    m,n = np.shape(dataMat)      #矩陣有多少列 m=100 n=3
    weights = np.ones(n)        #即待優化的參數[1,1,1]
    weights_array = np.array([])
    for j in range(num_iter):
        dataIndex = list(range(m))
        for i in range(m):
            alpha = 1 / (i+j+1.0) + 0.001
            rangeIndex = int(np.random.uniform(0,len(dataIndex)))
            error = labelMat[rangeIndex] - sigmoid(sum(dataMat[rangeIndex] * weights))  # 一個數
            weights = weights + alpha * dataMat[rangeIndex] * error
            weights_array = np.append(weights_array,weights,axis=0)
            del(dataIndex[rangeIndex])
    weights_array = weights_array.reshape(num_iter*m,n)
    return weights,weights_array

#批量梯度上升進行LR訓練
def gradAscent(dataMat,labelMat):
    dataMartix = np.mat(dataMat)
    labelMartix = np.mat(labelMat).transpose()
    n = np.shape(dataMartix)[1]       #矩陣有多少列
    weights = np.ones((n,1))        #即待優化的參數
    alpha = 0.001
    maxiter = 500
    weights_array = np.array([])
    for i in range(maxiter):
        error = labelMartix - sigmoid(dataMartix * weights)  # 100×1
        weights = weights + alpha * dataMartix.transpose() * error
        weights_array = np.append(weights_array, weights)
    weights_array = weights_array.reshape(maxiter,n)
    return np.asarray(weights),weights_array

def sigmoid(x):
    return 1 / (1 + np.exp(-x))

def plotWeights(weights_array1,weights_array2):
    #設置漢字格式
    font = FontProperties(fname=r"C:\Windows\Fonts\simsun.ttc", size=14)
    #將fig畫布分隔成1行1列,不共享x軸和y軸,fig畫布的大小為(13,8)
    #當nrow=3,nclos=2時,代表fig畫布被分為六個區域,axs[0][0]表示第一行第一列
    fig, axs = plt.subplots(nrows=3, ncols=2,sharex=False, sharey=False, figsize=(20,10))
    x1 = np.arange(0, len(weights_array1), 1)
    #繪制w0與叠代次數的關系
    axs[0][0].plot(x1,weights_array1[:,0])
    axs0_title_text = axs[0][0].set_title(u‘梯度上升算法：回歸系數與叠代次數關系‘,FontProperties=font)
    axs0_ylabel_text = axs[0][0].set_ylabel(u‘W0‘,FontProperties=font)
    plt.setp(axs0_title_text, size=20, weight=‘bold‘, color=‘black‘)
    plt.setp(axs0_ylabel_text, size=20, weight=‘bold‘, color=‘black‘)
    #繪制w1與叠代次數的關系
    axs[1][0].plot(x1,weights_array1[:,1])
    axs1_ylabel_text = axs[1][0].set_ylabel(u‘W1‘,FontProperties=font)
    plt.setp(axs1_ylabel_text, size=20, weight=‘bold‘, color=‘black‘)
    #繪制w2與叠代次數的關系
    axs[2][0].plot(x1,weights_array1[:,2])
    axs2_xlabel_text = axs[2][0].set_xlabel(u‘叠代次數‘,FontProperties=font)
    axs2_ylabel_text = axs[2][0].set_ylabel(u‘W1‘,FontProperties=font)
    plt.setp(axs2_xlabel_text, size=20, weight=‘bold‘, color=‘black‘)
    plt.setp(axs2_ylabel_text, size=20, weight=‘bold‘, color=‘black‘)


    x2 = np.arange(0, len(weights_array2), 1)
    #繪制w0與叠代次數的關系
    axs[0][1].plot(x2,weights_array2[:,0])
    axs0_title_text = axs[0][1].set_title(u‘改進的隨機梯度上升算法：回歸系數與叠代次數關系‘,FontProperties=font)
    axs0_ylabel_text = axs[0][1].set_ylabel(u‘W0‘,FontProperties=font)
    plt.setp(axs0_title_text, size=20, weight=‘bold‘, color=‘black‘)
    plt.setp(axs0_ylabel_text, size=20, weight=‘bold‘, color=‘black‘)
    #繪制w1與叠代次數的關系
    axs[1][1].plot(x2,weights_array2[:,1])
    axs1_ylabel_text = axs[1][1].set_ylabel(u‘W1‘,FontProperties=font)
    plt.setp(axs1_ylabel_text, size=20, weight=‘bold‘, color=‘black‘)
    #繪制w2與叠代次數的關系
    axs[2][1].plot(x2,weights_array2[:,2])
    axs2_xlabel_text = axs[2][1].set_xlabel(u‘叠代次數‘,FontProperties=font)
    axs2_ylabel_text = axs[2][1].set_ylabel(u‘W1‘,FontProperties=font)
    plt.setp(axs2_xlabel_text, size=20, weight=‘bold‘, color=‘black‘)
    plt.setp(axs2_ylabel_text, size=20, weight=‘bold‘, color=‘black‘)

    plt.show()
def plotBestFit(weights,dataMat,labelMat):
    x0cord1 = []
    x0cord2 = []
    x1cord1 = []
    x1cord2 = []
    n = len(labelMat)
    for i in range(n):
        if labelMat[i] == 1:
            x0cord1.append(dataMat[i][1])
            x0cord2.append(dataMat[i][2])
        else:
            x1cord1.append(dataMat[i][1])
            x1cord2.append(dataMat[i][2])
    fig = plt.figure()
    ax = fig.add_subplot(111)
    ax.scatter(x0cord1,x0cord2,c=‘red‘,s=20,alpha=0.5,marker=‘s‘)
    ax.scatter(x1cord1,x1cord2,c=‘green‘,s=20,alpha=0.5)
    # plt.title(‘DataSet‘)
    # plt.xlabel(‘x1‘)
    # plt.ylabel(‘x2‘)
    # plt.show()

    w = - weights[1] / weights[2]
    b = -weights[0] / weights[2]
    x = np.arange(-3,3,0.1)
    y = w * x + b
    ax.plot(x,y)
    plt.show()


if __name__==‘__main__‘:
    dataMat,labelMat = loadData(‘testSet.txt‘)
    # print(dataMat)
    # plot(dataMat,labelMat)
    weights,weights_array1 = stogradAscent(dataMat,labelMat)
    plotBestFit(weights,dataMat,labelMat)
    print(weights)


    weights2,weights_array2 = gradAscent(dataMat,labelMat)
    # print(weights2)
    plotWeights(weights_array2, weights_array1)

機器學習實戰-邏輯回歸

one har 改進 lin [] readlines 機器 iter sun 邏輯回歸：簡單的來說，在線性回歸的基礎上加入了Sigmoid函數！ import numpy as np import matplotlib.pyplot as plt from matp

[機器學習實戰] Logistic回歸

.... log 運算 blog 死亡率在線實戰批處理參數更新 1. Logistic回歸：　　1）優點：計算代價不高，易於理解和實現；　　2）缺點：容易欠擬合，分類精度可能不高；　　3）適用數據類型：數值型和標稱型數據； 2. 分類思想：　　根據現有數

機器學習之邏輯回歸

反向 margin -1 mil 局部最優一個數簡單 line 滿足給定一張圖片，如何讓計算機幫助我們識別它是不是一張貓的圖片，這個問題可以看成一個簡單的分類問題。如下圖所示，平面上有兩種不同顏色（黑色，紅色）的點，我們要做到就是要找到類似與那條直線那樣的界限。當某個

機器學習：邏輯回歸（損失函數）

梯度模型分享圖片 com info 而且機器學習邏輯分類 # # 由於邏輯回歸解決的是分類問題，而且是二分類，因此定義損失函數時也要有兩類　　# 1）如果 y = 1（p ≥ 0.5），p 越小，損失函數越大；　　# 2）如果 y = 0（p ≤ 0.5），

機器學習python實戰----邏輯回歸

多次 python實戰 ron and 代碼實現技術訓練集錯誤常數　　當看到這部分內容的時候我是激動的，因為它終於能跟我之前學習的理論內容聯系起來了，這部分內容就是對之前邏輯回歸理論部分的代碼實現，所以如果有不甚理解的內容可以返回對照著理論部分來理解，下面我們進入

機器學習之 Logistic 回歸(邏輯回歸)

準備 eight 後者 sel sigmoid sts 公式兩種回歸算法目錄 Logistic回歸博客園地址：https://www.cnblogs.com/chenyoude/ git 地址：https://github.com/nickcyd/machine_

從零單排入門機器學習：線性回歸（linear regression）實踐篇

class rom enter instr function ont 線性 gin 向量線性回歸（linear regression）實踐篇之前一段時間在coursera看了Andrew ng的機器學習的課程，感覺還不錯，算是入門了。這次打算以該課程的作業

機器學習中的回歸理解

機器學習中的線性模型理解機器學習中的類別均衡問題？分為類別平衡問題和類別不平衡問題類別平衡問題：可以采用回歸類別不平衡問題：可以采用在縮放針對類別的回歸問題有線性回歸：非線性回本文出自 “簡答生活” 博客，謝絕轉載！機器學習中的回歸理解

第四篇[機器學習] 機器學習，線性回歸的優化

images .html span mod 來看 itl sso linear 我們當我們的數據存在多重共線性時，即其中的一個自變量可以用其他一個或幾個自變量的線性表達式進行表示，你會發現，擬合之後的方差會特別大一般說來當解釋變量的容忍度(TOLERANCE)小於0.1

20171028機器學習之線性回歸過擬合問題的解決方案

ces 函數彈性 alpha mach rom 定性 ast cep 在函數中加入一個正則項：三種方式：一、Ridge回歸（嶺回歸）：　　優點：具有較高的準確性、魯棒性以及穩定性　　缺點：求解速度慢二、Lasso回歸：　　優點：求解速度快（原理降維計算

關於機器學習中LASSO回歸的相關補充

lasso回歸軟閾收縮算子 fist算法在之前的相關文章中筆者給出了一般回歸的補充，即嶺回歸和LASSO回歸，它們都是為了解決在回歸過程中的過擬合問題，其具體解決方案就分別是在目標函數後增加2範數和1範數以限定參數的表現，對於嶺回歸而言，由於2使用範數的原因，這個目標函數仍是可導的，但對於LASSO回

機器學習之Logistic 回歸算法

簡單生成選擇效率 split max 坐標 opened 似然函數 1 Logistic 回歸算法的原理 1.1 需要的數學基礎我在看機器學習實戰時對其中的代碼非常費解，說好的利用偏導數求最值怎麽代碼中沒有體現啊，就一個簡單的式子：θ= θ - α Σ [( hθ(

【機器學習】--線性回歸中L1正則和L2正則

last clas nbsp post pan red font 推廣 http 一、前述 L1正則，L2正則的出現原因是為了推廣模型的泛化能力。相當於一個懲罰系數。二、原理 L1正則：Lasso Regression L2正則：Ridge Regression

機器學習1-關於回歸問題的準確性評價

均方誤差定性完美 absolute post div red ria var 網址https://book.douban.com/reading/46607817/ 建立回歸器後，需要建立評價回歸器擬合效果的指標模型。平均誤差(mean absolute error)

機器學習_線性回歸

ray 線性回歸麻煩小時數據集 nal best lin rand() 線性回歸人工智能是機器學習的父類；機器學習是深度學習的父類 1. 怎麽做線性回歸？ 2. 理解回歸 -- 最大似然函數 3. 應用正態分布概率密度函數 -- 對數總似然 4

機器學習：線性回歸——理論與代碼實現（基於正規方程與梯度下降）

overfit 返回 pen ear 隨機梯度是否很大的建模回歸一線性模型給定由n個屬性描述的列向量\(f(\mathbf{x})={(x^{(1)};x^{(2)};...;x^{(n)})}\)，其中 \(x^{(j)}\)是\(\textbf{x}\)

機器學習之線性回歸

read 權重矩陣 add spl 比較 nic 影響 lib com 目錄預測數值型數據：回歸用線性回歸找到最佳擬合直線程序8-1 標準回歸函數和數據導入函數程序8-2 基於程序8-1繪圖圖片8-1 ex0的數據集和它的最佳擬合直線局部加權線性回歸圖片8

深度學習：邏輯回歸

圖片 name 拓展變量測試隨機最終分享圖片 ase 深度學習（Deep Learning）是機器學習（Machine Learning）的一大分支，它試圖使用包含復雜結構或由多重非線性變換構成的多個處理層對數據進行高層抽象的算法。邏輯回歸（Logistic R

機器學習入門——線性回歸預測廣告投入數據集

continue 結果手寫 alt iter 根路徑 num 三種不同的 0.Advertising數據集　　Advertising數據集是關於廣告收益與廣告在不同的媒體上投放的相關數據，分別是在TV，Radio，Newspaper三種媒體上投放花費與，投放所產生的

機器學習筆記（六）邏輯回歸

邏輯回歸 alt 表示結果不變改變最小值 nbsp 可能性一、邏輯回歸問題二分類的問題為是否的問題，由算出的分數值，經過sign函數輸出的是（+1，-1），想要輸出的結果為一個幾率值，則需要改變函數模型，其中，，則邏輯回歸的函數為二、邏輯回歸錯誤評價線性

機器學習實戰-邏輯回歸

相關推薦