李巨集毅機器學習課程--迴歸(Regression)

阿新 • • 發佈：2018-12-09

李老師用的是精靈寶可夢做的比喻，假設進化後的寶可夢的cp值(Combat Power)與未進化之前的寶可夢的cp值相關，我們想找出這兩者之間的函式關係，可以設進化後的cp值為y,進化之前的cp值為x：y = b + w*x (不只可以設一次項，還可以設定二次項，三次項...，這個後面寫)

我們的目的是將上述函式中b和w的值求出來，這裡就引出了一個函式：loss function,如下圖：

這個函式的意義是每個實際的資料和預測資料的差值平方求和，如下圖：

由此我們可以想到，要想預測的函式貼合實際情況，那麼我們的loss function必須求得最小值，(注：現在的w b是該函式的變數

),現在變成了一道數學題，當 w, b取何值時，函式loss function求得最小值?這時候我們就知道了要用到數學微積分的知識，兩個引數，求偏微分都為0即可，但計算機是不能直接求出來這個數的，所以我們要將求偏微分為0的數學公式轉化為計算機可以執行的方案，但思路不變。步驟是這樣的，如圖。

以w為例，隨機取w=w0,如上圖公式，當導數為負時，w0增大，導數為正，w0減小，不停進行迭代，最終停留在微分為0的點。n為學習速率，調整n的大小，可以改變迭代的次數。

問題：1、用更高次數的函式是可以的，因為他們是包含關係，但過高會出現過擬合現象

2、其實導數為0的情況也不一定是最小值(特殊情況，上面的圖已經全部包含)

下面是計算這個函式的程式碼(python):

import numpy as np
import matplotlib.pyplot as plt
x_data = [338., 333., 328., 207., 226., 25., 179., 60., 208., 606.]
y_data = [640., 633., 619., 393., 428., 27., 193., 66., 226., 1591.]
# ydata = b + w * xdata
x = np.arange(-200, -100, 1) #bias
y = np.arange(-5, 5, 0.1) #weight
Z = np.zeros((len(x), len(y))) #建立一個len(x)*len(y)的零矩陣
print(Z)
# X, Y = np.meshgrid(x, y)
#計算loss function
for i in range(len(x)):
    for j in range(len(y)):
        b = x[i]
        w = y[j]
        Z[j][i] = 0
        for n in range(len(x_data)):
            Z[j][i] = Z[j][i] + (y_data[n] - b - w*x_data[n])**2
        Z[j][i] = Z[j][i] / len(x_data)

# ydata = b + w * xdata
b = -120 # initital b
w = -4 # initial w
lr = 1 # learning rate
iteration = 100000

# Store initial values for plotting
b_history = [b]
print(b_history)
w_history = [w]

lr_b = 0
lr_w = 0

# Iterations
for i in range(iteration):
    b_grad = 0
    w_grad = 0
    for n in range(len(x_data)):
        b_grad = b_grad - 2.0*(y_data[n] - b - w*x_data[n])*1.0
        w_grad = w_grad - 2.0*(y_data[n] - b - w*x_data[n])*x_data[n]

    lr_b = lr_b + b_grad**2
    lr_w = lr_w + w_grad**2

    # Update paramaters
    # adagrad,累加當前梯度平方和，學習速率再除以累加的根號
    b = b - lr/np.sqrt(lr_b) * b_grad
    w = w - lr/np.sqrt(lr_w) * w_grad

    # 初始版本，靠調lr改變影象
    #b = b - lr * b_grad
    #w = w - lr * w_grad

    #Store paramaters for plotting
    b_history.append(b)
    w_history.append(w)

# plot the figure
plt.contourf(x, y, Z, 50, alpha=0.5, cmap=plt.get_cmap('jet'))
plt.plot([-188.4], [2.67], 'x', ms=12, markeredgewidth=3, color='orange')
plt.plot(b_history, w_history, 'o-', ms=3, lw=1.5, color='black')
plt.xlim(-200, -100)
plt.ylim(-5, 5)
plt.xlabel(r'$b$', fontsize=16)
plt.ylabel(r'$w$', fontsize=16)
plt.show()

歡迎大家關注我的公眾號：codewangh

李巨集毅機器學習課程--迴歸(Regression)

李巨集毅機器學習課程--迴歸(Regression)

李巨集毅機器學習課程筆記-4.1分類簡介及其與迴歸的區別

李巨集毅機器學習P11 Logistic Regression 筆記

李巨集毅機器學習課程筆記10：Ensemble、Deep Reinforcement Learning

李巨集毅機器學習課程筆記9：Recurrent Neural Network

李巨集毅機器學習課程6~~~深度學習入門

李巨集毅機器學習課程筆記-1.機器學習概論

[機器學習入門] 李巨集毅機器學習筆記-6 （Classification: Logistic Regression；邏輯迴歸）

李巨集毅機器學習 P12 HW2 Winner or Loser 筆記（不使用框架實現使用MBGD優化方法和z_score標準化的logistic regression模型）

線性迴歸李巨集毅機器學習HW1

[機器學習入門] 李巨集毅機器學習筆記-1（Learning Map 課程導覽圖）

【ML】李巨集毅機器學習筆記

李巨集毅機器學習 P14 Backpropagation 筆記

李巨集毅機器學習 P13 Brief Introduction of Deep Learning 筆記

李巨集毅機器學習 P15 “Hello world” of deep learning 筆記

李巨集毅機器學習P7 Gradient Descent (Demo by AOE) 筆記、P8 Gradient Descent (Demo by Minecraft) 筆記

李巨集毅機器學習PTT的理解（1）深度學習的介紹

卷積神經網路CNN |李巨集毅機器學習

李巨集毅機器學習筆記——02.Where does the error come from ?

李巨集毅機器學習-學習筆記

李巨集毅機器學習課程--迴歸(Regression)

相關推薦