ML—線性迴歸系列（一）—線性迴歸

Andrew Zhang
Tianjin Key Laboratory of Cognitive Computing and Application
Tianjin University
Nov 25, 2015

本來以為線性迴歸是一個特簡單的東西，最近遇到很多基於線性迴歸的東西，才意識到我的無知。為了記錄最近的學習歷程，還是從線性迴歸開始系統總結一下吧。

一、線性迴歸
在實際問題中，在考慮變數 $y$ 與另外一些變數 $x_1,x_2,...,x_n$ 之間關係的時候，為了簡化往往考慮線性模型
h

θ(x)=θ0+θ1x1+...+θnxn=θTx(1-1) $h_{\theta}(x)=\theta_0+\theta_1x_1+...+\theta_nx_n={\theta^Tx} \tag{1-1}$
其中

x0=1 $x_0=1$ .

接下來，目標就是對於訓練資料集 $(x^i,y^i),i=1,2,...,m$ 確定模型最合適的引數 $\theta$ 。採用最小二乘法，定義損失函式
$J(\theta)=\frac{1}{2}\sum_{i=1}^{m}(h_{\theta}(x^{(i)})-y^{(i)})^2 \tag{1-2}$

這裡採用最小二乘是因為最小二乘得到的引數

θ $\theta$ 優效性最好(在所有的線性無偏估計量裡面方差最小).

二、梯度下降法
最小二乘是無約束優化的凸問題，屬於最簡單的凸優化問題，有很多的數值求解的方法，參考參考部落格[1]。本文介紹梯度下降法求解最小二乘優化問題。
在梯度法中引數 $\theta$ 的更新規則為：
$\theta_j=\theta_j-\alpha\frac{d}{d\theta_j}J(\theta) \tag{2-1}$
其中 α

$\alpha$ 為學習率，可以設定為常數，也可以採用一維搜尋方法確定，具體可以檢視參考部落格[2]

ddθjJ(θ) $\frac{d}{d\theta_j}J(\theta)$

=ddθj(12∑mi=1(hθ(x(i))−y(i))2 $=\frac{d}{d\theta_j}(\frac{1}{2}\sum_{i=1}^{m}(h_{\theta}(x^{(i)})-y^{(i)})^2$

=12∑mi=12⋅(hθ(x(i))−y(i))⋅x(i)j $=\frac{1}{2}\sum_{i=1}^{m}{2\cdot(h_{\theta}(x^{(i)})-y^{(i)})\cdot x_j^{(i)}}$

=∑mi=1(hθ(x(i))−y(i))⋅x(i)j $=\sum_{i=1}^{m}{(h_{\theta}(x^{(i)})-y^{(i)})\cdot x_j^{(i)}}$

(2-2) $\tag{2-2}$
公式(2-2)帶入公式(2-1)得到

θj $\theta_j$ 的更新規則為：

θj=θj−α∑mi=1(hθ(x(i))−y(i))⋅x(i)j(2-3) $\theta_j=\theta_j-\alpha\sum_{i=1}^{m}{(h_{\theta}(x^{(i)})-y^{(i)})\cdot x_j^{(i)}} \tag{2-3}$
採用公式(2-3)的方法被稱為批梯度下降法。由於批梯度下降法對與每一次

θ $\theta$ 的更新需要計算所有的樣本，不利於線上計算，因此一般使用如下公式(2-4)所示的隨機梯度下降法(理解的時候只需要每次對引數進行更新迭代的時候假設只有一個樣本即可)：

θj=θj−α(hθ(x(i))−y(i))⋅x(i)j(2-4) $\theta_j=\theta_j-\alpha{(h_{\theta}(x^{(i)})-y^{(i)})\cdot x_j^{(i)}} \tag{2-4}$
並且往往公式(2-4)的收斂效率要遠遠高於(2-3)，可以更早的達到收斂。

三、最小二乘的概率解釋
在參考部落格3中說了線性規劃的最小二乘屬於廣義線性模型，並進行了推導，得到了
$p(y|x,\theta)=\frac{1}{\sqrt{2\pi}}exp(-\frac{1}{2}(y-\theta^Tx)^2) \tag{3-1}$
在這裡我們看一種更簡單點的解釋，假設輸出y與輸入x服從如下等式
$y^{(i)}=\theta ^T x^{(i)}+\epsilon^{(i)} \tag{3-2}$
由於對於取樣的每個樣本都是獨立同分布的，假設誤差項 $\epsilon^{(i)}$ ~ $N(0,\sigma^2)$
則對於每一個取樣樣本有
p(ϵ(i)

ML—線性迴歸系列（一）—線性迴歸

ML—線性迴歸系列（一）—線性迴歸

通俗得說線性迴歸演算法（一）線性迴歸初步介紹

機器學習十大算法系列（一）——邏輯迴歸

Android UI布局-1.1線性布局（一）-線性布局基礎

機器學習筆記（一）線性迴歸模型

（一）線性迴歸與特徵歸一化(feature scaling)

pytorch自我學習基礎（一）線性迴歸

深入理解線性迴歸演算法（一）

深度學習框架Keras學習系列（一）：線性代數基礎與numpy使用（Linear Algebra Basis and Numpy）

機器學習（一）線性迴歸

數據結構系列（三）線性表

【高斯消元】CDOJ1783 曜醬的線性代數課堂（一）

機器學習理論（一）——線性回歸

ng機器學習視頻筆記（一）——線性回歸、代價函數、梯度下降基礎

第二章之集成運算放大器的線性應用基礎（一）

python實現線性回歸（一）原理

數據結構（一）線性表鏈式存儲實現

數據結構（一）線性表循環鏈表之約瑟夫環

數據結構（一）線性表循環鏈表相關補充

數據結構（一）線性表雙向鏈表

ML—線性迴歸系列（一）—線性迴歸

相關推薦