CS229機器學習個人筆記（3）——Logistic Regression+Regularization

阿新 • • 發佈：2019-01-12

1.Classification

Logistic Regression其實就是Classification，但是由於歷史原因名字被記作了邏輯迴歸。它與線性迴歸的區別在於 $h_\theta(x)$ 被限制在了0與1之間，這是通過下面的S函式（Sigmoid function）實現的： $g(z)=\frac{1}{1+e^{-z}}$
其中： $z=\theta^Tx$
此時我們的假設函式 $h_\theta(x)=g(\theta^tx)=\frac{1}{1+e^{-\theta^Tx}}$

2.Cost Function

線性迴歸中的損失函式是：

J(θ0,θ1…θn)=12m∑i=1m(hθ(x(i))−y(i)))2 $J(\theta_0,\theta_1\dots\theta_n) =\frac{1}{2m}\displaystyle\sum_{i=1}^{m}\left(h_\theta(x^{(i)})-y^{(i)})\right)^2$

其中： $h_\theta(x) = \theta_0+x_1\theta_1+x_2\theta_2+\dots+x_n\theta_n$

線性迴歸損失函式有很明顯的實際意義，就是平方損失。而邏輯迴歸卻不是，它的預測函式

hθ(x) $h_\theta(x)$ 明顯是非線性的，如果類比的使用線性迴歸的損失函式於邏輯迴歸，那

J(θ) $J(θ)$ 很有可能就是非凸函式，即存在很多區域性最優解，但不一定是全域性最優解。我們希望構造一個凸函式，也就是一個碗型函式做為邏輯迴歸的損失函式。
這裡寫圖片描述

注：雖然得到的梯度下降演算法表面上看上去與線性迴歸的梯度下降演算法一樣，但是這裡的

hθ(x)=g(θTX) $h_θ(x)=g(θ^TX)$ 與線性迴歸中不同，所以實際上是不一樣的。另外，在執行梯度下降演算法之前，進行特徵縮放依舊是非常必要的。

具體求導公式的推導：

3.Multiclass Classification-One-vs-all

這裡寫圖片描述

4.Regularization

線性迴歸中的Overfitting與Underfitting：
這裡寫圖片描述

邏輯迴歸中的Overfitting與Underfitting：

這裡寫圖片描述

Overfitting：高偏差
Underfitting：高方差
下圖很直觀的展現出偏差與方差的區別：
這裡寫圖片描述

怎麼來解決過擬合的問題？簡單來說造成過擬合是因為次數高的項存在，那麼只要減小相應的係數 $\theta$ 就能避免過擬合。

對於線性迴歸：

這裡寫圖片描述

對於邏輯迴歸：
這裡寫圖片描述

CS229機器學習個人筆記（3）——Logistic Regression+Regularization

1.Classification

2.Cost Function

3.Multiclass Classification-One-vs-all

4.Regularization

CS229機器學習個人筆記（3）——Logistic Regression+Regularization

CS229機器學習個人筆記（2）——Linear Regression with Multiple Variables

CS229機器學習個人筆記（1）——Linear Regression with One Variable

學習理論、模型選擇、特徵選擇——斯坦福CS229機器學習個人總結（四）

2018-3-21李巨集毅機器學習視訊筆記（十三）--“Hello Wrold” of Deep learning

Andrew Ng機器學習課程筆記（四）之神經網絡

《Python 機器學習》筆記（一）

《Python 機器學習》筆記（四）

《Python機器學習》筆記（六）

機器學習讀書筆記（四）樸素貝葉斯基礎篇之網站賬號分類

機器學習讀書筆記（三）決策樹基礎篇之從相親說起

機器學習簡要筆記（二）——常見學習任務及算法

CCNA學習指南筆記（3） LAN與以太網

機器學習速成筆記（二）：訓練與損失

機器學習速成筆記（一）：主要術語

機器學習實戰筆記（一）- 使用SciKit-Learn做回歸分析

機器學習課程筆記（2）

機器學習與Tensorflow（3）—— 機器學習及MNIST資料集分類優化

機器學習數學原理（3）——生成型學習演算法

Coursera吳恩達機器學習教程筆記（一）

CS229機器學習個人筆記（3）——Logistic Regression+Regularization

1.Classification

2.Cost Function

3.Multiclass Classification-One-vs-all

4.Regularization

相關推薦