對數機率迴歸-機器學習

阿新 • • 發佈：2019-01-04

資料集百度網盤，就是西瓜書3.0a的資料。

首先，載入資料，load_data（file)函式。

def load_data(file):
    s =[]

    with open(file) as f:
        for line in f.readlines():
            line = line.replace('\n','')       #追行讀取 type(line) = str
            s.append(line.split(' '))      #空格分開
    return s

將這個資料視覺化下，大致是這個樣子。

其中，紅，藍分別表示好瓜和壞瓜。可以看出，用一條直線，還是不好劃分的。

這部分程式碼如下：

file = '../data/3_0a.txt'          #檔案地址
s = load_data(file)
print(type(s))
x =[]       #存好瓜的含糖率
y= []    #好瓜的密度
x1 =[]   #壞瓜含糖率
y1 = []  #壞瓜密度

for i in range(1,8):  #讀取好瓜

    for j in range(len(s[i])):
        if j == 2:
            x.append(float(s[i][j]))
        if j ==3:
            y.append(float(s[i][j]))
for i in range(8,len(s)): #壞瓜

    for j in range(len(s[i])):
        if j == 2:
            x1.append(float(s[i][j]))
        if j ==3:
            y1.append(float(s[i][j]))


  
import pylab as pl
pl.plot(x,y,'o')
pl.plot(x1,y1,'ro')
pl.show()

我們接下來用對數機率迴歸模型，具體的公式可以看周志華的《機器學習》第三章的（3.27）這個式子，其他的地方也有。這個是沒約束的優化問題，直接用梯度下降法，求導有問題的，可以機器學習求導..

3.27公式中，yi是樣本的結果，好瓜是1，壞瓜是0.xi是樣本的屬性，我們這裡有兩個屬性。下面就是從前面讀取的資料把xi,yi讀出來。然後把這個值帶入梯度下降法中的導數項。w，b的初始值隨便設定個就行。迭代算吧。程式碼如下：

import numpy as np
import pylab as plt
import my_load_data as mld   #就是前面的那個函式，這段可以刪除，直接把上面的load_data函式放到這裡也行。




file = '../data/3_0a.txt'
s = mld.load_data(file)

x = np.mat(np.zeros((17,3)))  #why (())?     #初始化矩陣。用ndarray無法進行矩陣乘法這類運算，所以要用mat。

y = np.mat(np.zeros((17,1)))
for i in range(1,18,1):                  #yi ,xi讀取
    x[i-1] = np.mat([float(s[i][2]),float(s[i][3]),1])
    if s[i][1]=='是':
        y[i-1] = np.mat([1])
    else:
        y[i-1] =np.mat([0])

start = np.mat([[0.1],[10],[8]])  #w,b的初始化。這裡有三個數，[w1;w2;b]

i = 0
xishu =0.01
while i<2*10**5:    #一萬次差不多就可以了
    s = 0
    for j in range(17):   #3.27前面有個i=1到i=m的求和，就是這裡。
        startT =np.transpose(start)
        xT =np.transpose(x[j])
        bx = startT*xT  
        bx_1 = np.array(bx)[0][0]      
        c = -y[j]*x[j]+(np.exp(bx_1)/(1+np.exp(bx_1)))*x[j]     #導數，寫的太難看，請忽略
        s =s+c 
    s_1 = np.transpose(s)       #導數
    new = start - xishu*s_1           #梯度下降公式，這裡大家應該很熟悉
    start =new
    i=i+1
    if i%10000 ==0:
        print('no%s'%i,'start is %s'%start)
    

    
print(start)

迭代結果:

no10000 start is [[  2.98758124]
 [ 11.91671654]
 [ -4.21286642]]
no20000 start is [[  3.13439493]
 [ 12.43023225]
 [ -4.39732669]]
no30000 start is [[  3.15464273]
 [ 12.50721714]
 [ -4.42401375]]
no40000 start is [[  3.15776018]
 [ 12.5190382 ]
 [ -4.42811559]]
no50000 start is [[  3.15824169]
 [ 12.52086253]
 [ -4.42874883]]
no60000 start is [[  3.15831607]
 [ 12.52114431]
 [ -4.42884664]]
no70000 start is [[  3.15832756]
 [ 12.52118784]
 [ -4.42886175]]
no80000 start is [[  3.15832934]
 [ 12.52119456]
 [ -4.42886408]]
no90000 start is [[  3.15832961]
 [ 12.5211956 ]
 [ -4.42886444]]
no100000 start is [[  3.15832965]
 [ 12.52119576]
 [ -4.4288645 ]]
no110000 start is [[  3.15832966]
 [ 12.52119579]
 [ -4.42886451]]
no120000 start is [[  3.15832966]
 [ 12.52119579]
 [ -4.42886451]]
no130000 start is [[  3.15832966]
 [ 12.52119579]
 [ -4.42886451]]
no140000 start is [[  3.15832966]
 [ 12.52119579]
 [ -4.42886451]]
no150000 start is [[  3.15832966]
 [ 12.52119579]
 [ -4.42886451]]
no160000 start is [[  3.15832966]
 [ 12.52119579]
 [ -4.42886451]]
no170000 start is [[  3.15832966]
 [ 12.52119579]
 [ -4.42886451]]
no180000 start is [[  3.15832966]
 [ 12.52119579]
 [ -4.42886451]]
no190000 start is [[  3.15832966]
 [ 12.52119579]
 [ -4.42886451]]
no200000 start is [[  3.15832966]
 [ 12.52119579]
 [ -4.42886451]]
[[  3.15832966]
 [ 12.52119579]
 [ -4.42886451]]

對數機率迴歸-機器學習

資料集百度網盤，就是西瓜書3.0a的資料。首先，載入資料，load_data（file)函式。def load_data(file): s =[] with open(file) as f: for line in f.readlines

python實現周志華西瓜書《機器學習》習題3.3對數機率迴歸

python小白入手，第一個程式。首先感謝大牛的原始碼： https://blog.csdn.net/onthewaygogoing/article/details/68485682 大牛的思路很巧妙，把矩陣操作轉化成列表操作，時刻保證列表代表的矩陣維度一致。我

《機器學習》對數機率迴歸——筆記

對數機率迴歸不是迴歸函式而是分類函式。廣義線性模型提出問題：需要找到一個單調可微函式將分類任務的真實標記y與線性迴歸模型的預測值聯絡起來線性迴歸預測值，應用於分類問題一般選用“單位階躍函式” 但階躍函式不連續，而對數機率函式正好可以替代階躍函式，它單

小白學習機器學習---第三章(2):對數機率迴歸python實現

上程式碼~~~~~~~~###梯度下降法實現多元線性迴歸 def loadDataSet(): ###資料匯入函式### dataMatrix=[] #資料矩陣，第一列是w=1.0，第2,3列是特徵 labelMatrix=[] #標籤矩陣

機器學習5- 對數機率迴歸+Python實現

[toc] ## 1. 對數機率迴歸考慮二分類任務，其輸出標記 $y \in \{0, 1\}$，記線性迴歸模型產生的預測值 $z=\boldsymbol{w}^T\boldsymbol{x} + b$ 是實值，於是我們需要一個將實值 $z$ 轉換為 $0/1$ 的 $g^{-}(\cdot)$。最理想

線性模型，線性迴歸，對數機率迴歸(Logistic regression)的理解與推導(深度學習前戲( ╯□╰ ))

對數機率迴歸（logistic regression），有時候會譯為邏輯迴歸(音譯)，其實是我們把迴歸模型應用到分類問題時，線性迴歸的一種變形，主要是針對二分類提出的。既然是線性迴歸的一種變形，那麼在理解對數機率迴歸時，我們先來了解一下什麼是線性迴歸。 1.線性迴歸 1. 1線性方程

線性模型-區域性加權線性迴歸機器學習實戰

區域性加權線性迴歸線性迴歸的一個問題是有可能出現欠擬合，因為它求的是具有最小均方誤差的無偏估計，顯然模型欠擬合將無法做出很好的迴歸預測，所以有些方法允許在估計中引入一些偏差，從而降低預測的均方誤差。區域性線性加權的思想是對待預測點附近的每個點賦予一個權重，然後在帶權的樣本上基於最小均方誤差來

參加2018APMCM B賽題四天覆述以及對數模和機器學習賽的個人感想

首先感謝我的隊友——曹學姐以及王學長，讓我第一次數模賽圓滿結束（沒有什麼遺憾吧，盡力了！）。其次，感謝田學長（csdn：Font Tian）給我的兩份題目分析，以及王學長（csdn：那岐）對我演算法的指導。這次亞太

邏輯斯諦迴歸(對數機率迴歸)

文章目錄 LR簡介損失函式參考 LR簡介邏輯斯諦迴歸是一種經典的線性分類方法，又被稱為對數機率迴歸，其屬於對數線性模型。線性迴歸完成了資料的擬合，我們通過引入一個

1.2.11 【Deep Learning翻譯系列】Explanation of Logistic Regression Cost Function 對數機率迴歸代價函式的說明

視訊地址本視訊給出在對數機率迴歸使用這個成本函式的理由。在之前的對數機率迴歸中，預測 y ^

1.2.9&1.2.10 【Deep Learning翻譯系列】Logistic Regression Gradient Descent 對數機率迴歸的梯度下降

我們按如下方式設定了對數機率迴歸， z=wTx+b, z = w T

logistic regression（LR）對數機率迴歸 / 邏輯迴歸公式推導

因為是傻瓜式教程，所以一定會非常詳細！一些概念link到了Wiki的相應解釋上。歡迎捉蟲~！二分類和迴歸的關係考慮x⇒y 表示的二分類或迴歸問題，其中x 是輸入，y 是輸出。 1. 在二分類中，y 的值取0或1，代表被分為正類或負類。在迴歸中，y 的取值為連續值。 2. 線上

對數機率迴歸（Logistic Regression）總結

對數機率迴歸logistic regression，雖然名字是迴歸，但是實際上它是處理分類問題的演算法。簡單的說迴歸問題和分類問題如下：迴歸問題：預測一個連續的輸出。分類問題：離散輸出，比如二分類問題輸出0或1. 邏輯迴歸常用於垃圾郵件分類，天氣預測、

線性模型之對數機率迴歸

線性模型之對數機率迴歸廣義線性模型：$y=g^{-1}(w^Tx+b)$ $g^{-1}(x)$，單調可微函式如果用線性模型完成分類任務如何做? 根據線性模型可知，找到一個單調可微函式將分類任務的真實標記$y_i$與線性模型的預測值聯絡起來即可。廣義線性模型對樣本要求不必要服從正態分

【原】Andrew Ng斯坦福機器學習 Programming Exercise 2——邏輯迴歸

作業說明　　Exercise 2，Week 3，使用Octave實現邏輯迴歸模型。資料集 ex2data1.txt ，ex2data2.txt 　　實現 Sigmoid 、代價函式計算Computing Cost 和梯度下降Gradient Descent。檔案清單

Andrew機器學習課程章節4——多變數線性迴歸

Normal equation:(正規方程) 其中：X為1列值為1的vector（其對應額外的特徵變數）+xi的轉置合併的矩陣。正規方程與梯度下降相比較的優缺點：優點:1.不需要設定初試的學習率α 2.不需

Andrew機器學習課程章節3——線性迴歸回顧

本章主要講解了一些基本的線性代數知識。（非常基礎，沒看視訊的感覺可以直接跳過，防止浪費時間） matrix（矩陣）：在數學中，矩陣（Matrix）是一個按照長方陣列排列的複數或實數集合 vector（向量）：特殊的矩陣，只有一列的矩陣，即 Nx1 matrix 一般使用小寫字

Andrew機器學習課程章節2——單變數線性迴歸

在surpervised question中（x,y）表示一個訓練樣本。 x為features（特徵）y為target（目標）（xi,yi)表示訓練集。上標i just an index into the training set Hypothesis fu

機器學習-Logistic迴歸python實踐【3】（10.26更新）

寫在最前面：Logistic迴歸通過Sigmoid函式接受輸入然後進行預測首先，介紹一下什麼是Sigmoid函式。大家一定聽過海維賽德階躍函式（Heaviside step function），什麼？沒聽過，好吧，換個名字，單位階躍函式，這個認識吧! 這個函式的問題在於該函式

機器學習-嶺迴歸python實踐【2】

寫在最前面：當資料的特徵大於樣本點，線性迴歸就不能用了，因為在計算[(X^T)*X]的逆時候，n>m，n是特徵，m是樣本點，此時的輸入矩陣不是滿秩矩陣，行列式為0。此時，我們可以使用嶺迴歸（ridge regression) 閱讀本文前，需要各位簡單回憶一下線性代數知識

對數機率迴歸-機器學習

相關推薦