線性迴歸模型的概率解釋

在廣義線性模型中留了個小彩蛋，今天就把這個彩蛋補完啦！這篇部落格主要解釋了怎麼去構造cost function(損失函式) 回顧線性模型 在廣義線性模型中已經推匯出線性迴歸模型的假設函式(hypothesis)：

h_{Θ} (X) = Θ^{T} X + b

其中

Θ = [θ_{1}, θ_{2}, \dots \dots θ_{m}]; X = [x_{1}, x_{2}, \dots \dots, x_{m}]

,b為偏置單元(bias unit)，是一個常數！這篇部落格就是來解釋為什麼cost function(損失函式)是

J (Θ) = 1 / 2 \sum_{i = 1}^{# s a m p l e s} (h_{Θ} (X^{i}) - y^{i})^{2}

概率解釋 符號說明： $y^{i}$ ：第i個訓練樣本的真實值； $h_{Θ} (x^{i})$ : 第i個訓練樣本的預測值，也記為 $\hat{y}$ ； ε^i: 誤差（可能是由各種無法預知的狀況引起的）

假設 $y^{i} = h_{Θ} (x^{i}) + ε^{i}$ 也就是說真實值與預測值之間存在有誤差ε 其中ε~ $N (0, σ^{2})$ , 均值為0，方差為 $, σ^{2}$ 的正太分佈！所以 $p (ε^{i}) = \frac{1}{\sqrt{2} π σ^{2}} e^{- \frac{(ε^{i})^{2}}{2 σ^{2}}}$ , 正態分佈概率公式的啦那麼為什麼 $ε^{i} 服从 (0, σ^{2})$ 的正態分佈呢？？？ 重點內容：

有兩個解釋，第一個有點無腦哈哈哈哈哈哈 a. 使用正態分佈便於計算，因為後面計算涉及到極大似然估計，對數化後原來的指數函式會便於計算！ b. 中心極限定理證明了許多獨立的隨機變數之和會趨向於服從高斯分佈(正態分佈)，而誤差是由多個可認定為獨立因素結合在一起的結果。例如房價預測中，房價可能會取決於房主的心情，房子的位置，房子有沒有帶花園…….這些都可以認為是互不影響的因素，換句話說就是獨立的因素，因此將誤差假設為服從高斯分佈是比較合理的。

注:在機器學習中沒有完全正確的假設，只要假設合理，在現實中有足夠的泛化能力即可！

因此 $(y^{i} | x^{i}; Θ)$ 便可認定為是服從均值為 $h_{Θ} (x^{i}) ，方差为 σ^{2} 的高斯分布$

h_{Θ} (x^{i}) ， 方 差 為 σ^{2} 的 高 斯 分 布

,，這個可以理解為ε均值為0，而

y = h_{Θ} (x) + ϵ

,因此

y^{i}

的均值即為

h_{Θ} (x^{i}) + 0

寫成概率形式即是 $(y^{i} | x^{i}; Θ)$

線性迴歸模型的概率解釋

線性迴歸模型的概率解釋

利用sklearn 中的線性迴歸模型訓練資料使用到的庫有numpy pandas matplotlib

單變數的線性迴歸模型演算法

機器學習筆記（一）線性迴歸模型

Tensorflow程式設計構造一個簡單的線性迴歸模型

莫煩python教程學習筆記——線性迴歸模型的屬性

tensorflow訓練線性迴歸模型

scikit-learn 線性迴歸模型的score函式，返回值是決定係數R^2

線性迴歸模型的效能評價指標

TensorFlow 學習（四）線性迴歸模型

Tensorflow學習筆記二--線性迴歸模型

Tensorflow 實現簡單線性迴歸模型

【機器學習】基於梯度下降法的自線性迴歸模型

Day_2 簡單線性迴歸模型

機器學習100天---day02 簡單線性迴歸模型

TensorFlow構造簡單的線性迴歸模型

機器學習_線性迴歸模型

【機器學習筆記02】最小二乘法（多元線性迴歸模型）

【機器學習筆記01】最小二乘法（一元線性迴歸模型）

深度學習&PyTorch筆記（1）線性迴歸模型