深度學習系列（1）——從線性迴歸說起

阿新 • • 發佈：2019-02-07

為什麼先說線性迴歸

本文適合入門級同學，老司機繞行。
吳恩達老師的機器學習課程，介紹的第一個模型就是線性迴歸模型。機器學習（尤其是監督學習），主要圍繞分類和迴歸兩類問題展開，而線性迴歸模型作為最簡單的迴歸模型，與大多數監督學習演算法具有相同的建模思路，包括建立損失函式、優化引數、模型評估。可謂麻雀雖小五臟俱全，瞭解線性迴歸的建模思想能夠有助於理解複雜的深度學習模型。

什麼是線性迴歸：一個簡單的例子

import numpy as np
from numpy import random
import matplotlib.pyplot as plt

X = random.uniform(0 
, 30, 100) # 隨機生成在[0,30]區間內服從均勻分佈的100個數
y = 1.85 * X + random.normal(2, 5, 100) # 對X乘以固定係數後加上隨機擾動

plt.scatter(X, y)
plt.xlabel('X')
plt.ylabel('y')
plt.show()

隨機生成的X和y散點圖

以上程式碼隨機生成一組樣本X和y，現在給定一組X值，需要預測其對應的y值。

解決這個問題的思路如下：

假設X和y之間存線上性關係，即 $y = w * X + b$ ;
$\hat{y} = w X + b$ ，其中 $\hat{y}$ 表示根據線性方程計算得到的 $y$ 值（稱為估計值），為儘可能準確的表達樣本中X和y之間的關係，我們需要找到最優的 $w^{*}$ 和 $b^{*}$ ，使得 $y$ 的實際值和估計值之間的誤差 $| y - \hat{y} |$ 最小化。

以上問題中 $X$ 稱為自變數， $y$ 稱為因變數，找到最優直線方程 $y = w^{*} X + b^{*}$ ，使得因變數的估計值與實際值之間的誤差最小的過程，稱為線性迴歸。

線性迴歸模型的數學推導

將所有樣本點用座標表示為 $(x_{i}, y_{i})$ ， $i = {1, 2, . . ., m}$ ，即共有m各樣本點.
假設線性方程形式為 $y = w X + b$ ，則對於所有的 $i$ ： $\hat{y_{i}} = w x_{i} + b$ .
樣本誤差可表示為：
$l o s s = \sum_{i = 1}^{m} | \hat{y_{i}} - y_{i} |$ $⇓$ $l o s s = \sum_{i = 1}^{m} | w x_{i} + b - y_{i} |$
找到最優引數 $w^{*}$ 和 $b^{*}$ 使得樣本誤差 $l o s s$ 值最小，此時可將 $l o s s$ 看成是關於 $w$ 和 $b$ 的函式，即求解無約束最優化問題： $m i n l o s s = \sum_{i = 1}^{m} | w x_{i} + b - y_{i} |$
雖然線性迴歸可採用最小二乘法求解，但是相對梯度下降法來說，最小二乘法在機器學習中具有很大的侷限性，因此本文介紹梯度下降法求解線性迴歸問題，計算梯度需要對目標函式求偏導，而上面這種形式的目標函式不便於求偏導，因而轉換成誤差平方和形式： $m i n l o s s = \sum_{i = 1}^{m} (w x_{i} + b - y_{i})^{2} .$
梯度下降法主要思想為通過不斷迭代使得解沿著目標函式值下降的方向變化，知道達到指定的精度或是迭代到一定的次數才終止，從而逼近最優解。設函式形式為 $f (x, y)$ ，則當前最優解為 $[x_{k}, y_{k}]$

深度學習系列（1）——從線性迴歸說起

為什麼先說線性迴歸

什麼是線性迴歸：一個簡單的例子

線性迴歸模型的數學推導

深度學習系列（1）——從線性迴歸說起

深度學習系列（1）——初探GAN和W-GAN

Spring Boot 學習系列（01）—從0到1，只需兩分鐘

深度學習實戰（1）--手機跑目標檢測模型（YOLO，從DarkNet到Caffe再到NCNN完整打通）

深度學習實戰（1）--手機端跑YOLO目標檢測網路（從DarkNet到Caffe再到NCNN完整打通）

深度學習框架Keras學習系列（一）：線性代數基礎與numpy使用（Linear Algebra Basis and Numpy）

深度學習R（1）：從零開始建立完全連線的神經網路

【開源】OSharp框架學習系列（1）：總體設計及系列導航

優秀開源軟件學習系列（一）——從零學習Spring4以及學習方法分享

SpringMVC學習系列（1）之初識SpringMVC

（轉載）深度學習基礎（1）——感知器

藍鯨DevOps深度解析系列（1）：藍盾平臺總覽

windows深度學習入門（1）在windows10上安裝TensorFlow

深度學習基礎（二）—— 從多層感知機（MLP）到卷積神經網路（CNN）

深度學習系列（五）：一個簡單深度學習工具箱

Java8學習筆記（1） -- 從函式式介面說起

深度學習系列（七）：自編碼網路與PCA特徵學習的分類對比實驗

深度學習系列（三）：簡單網路的自編碼學習

深度學習Tracking（1）——Learning to Track at 100 FPS with Deep Regression Networks（程式碼理解）

TensorFlow 深度學習框架（1）-- 神經網路與前向傳播