吳恩達機器學習（二）多元線性迴歸（假設、代價、梯度、特徵縮放、多項式）

阿新 • • 發佈：2018-12-11

0. 前言

多元線性迴歸（Multivariate Linear Regression）是多個變數的線性迴歸函式。初始作如下定義：

$n$ --- 特徵的數量
$x^{(i)}$ --- 第 $i$ 個樣本
$x_{j}^{(i)}$ --- 第 $i$ 個樣本的第 $j$ 個特徵

1. 假設函式（Hypothesis）

用一線性函式擬合樣本資料集，與單變數線性迴歸不同的是，其中的變數 $x$ 有多個，給出如下定義：

$\LARGE h_{\theta}=\theta_{0}+\theta_{1}x_{1}+\theta_{2}x_{2}+...+\theta_{n}x_{n}$

我們可定義 $x_{0}=1 \ or\ x_{0}^{(i)}=1$ ，則可將 $\vec{x}$ 和 $\vec{\theta}$ 寫成 $x=\begin{bmatrix} x_{0} \\ x_{1} \\ ...\\ x_{n} \end{bmatrix}$ 和 $\theta=\begin{bmatrix} \theta_{0}\\ \theta_{1}\\ ...\\ \theta_{n} \end{bmatrix}$ ，則 $h_{\theta}$ 可定義成如下：

$\LARGE h_{\theta}=\theta^{T}x$

2. 代價函式（Cost Function）

$\LARGE J(\theta)=\frac{1}{2m}\sum_{i=1}^{m}(h_{\theta}(x^{(i)})-y^{(i)})^2$

3. 梯度下降（Gradient Descent）

$\LARGE \theta_{j}:=\theta_{j}-\alpha \frac{\partial }{\partial \theta_{j} }J(\theta)\\ \Rightarrow \theta_{j}:=\theta_{j}-\alpha \frac{1}{m}\sum_{i=1}^{m}(h_{\theta}(x^{(i)})-y^{(i)})x_{j}^{(i)}$

4. 特徵縮放（Feature Scaling）

假設多元線性迴歸中的兩個變數 $x_{1}\in (0,2000)\ x_{2} \in (0,5)$ ，由於它們的取值範圍相差甚遠，會造成梯度下降的收斂速度慢，可將其歸一化於 $(0,1)$ 之間，可加快梯度下降的收斂。有時，可採用均值歸一化（Mean normalization），給出定義如下：

$\LARGE x_{i}=\frac{x_{i}-\mu_{i}}{s_{i}}$

其中， $\mu_{i}$ 為均值， $s_{i}$ 為取值範圍的最大值減去最小值。

注：不一定需要歸一化至 $(-1,1)$ ，只需要幾個變數的取值範圍相對合適接近，即可。

5. 多項式迴歸方程（Polynomial Regression）

對於 $h_{\theta}=\theta_{0}+\theta_{1}x+\theta_{2}x^{2}+\theta_{3}x^{3}$ ，可令 $x_{1}=x ,\ x_{2}=x^{2},\ x_{3}=x^{3}$ ，再採用多元梯度下降即可。但對於這種情況，不同變數之間的取值範圍可能相差很大，特徵縮放是必要的

。有時也可採用平方根進行擬合， $h_{\theta}=\theta_{0}+\theta_{1}x+\theta_{2}\sqrt{x}+...$ 。

吳恩達機器學習（二）多元線性迴歸（假設、代價、梯度、特徵縮放、多項式）

目錄

0. 前言

1. 假設函式（Hypothesis）

2. 代價函式（Cost Function）

3. 梯度下降（Gradient Descent）

4. 特徵縮放（Feature Scaling）

5. 多項式迴歸方程（Polynomial Regression）

吳恩達機器學習筆記 —— 2 單變數線性迴歸

吳恩達機器學習筆記 —— 5 多變數線性迴歸

吳恩達機器學習練習1——單變數線性迴歸

吳恩達機器學習第一次作業：線性迴歸

吳恩達機器學習筆記29-反向傳播算法（Backpropagation Algorithm）

吳恩達機器學習筆記 —— 5 多變量線性回歸

吳恩達機器學習筆記8-多變量線性回歸(Linear Regression with Multiple Variables)--多維特征

機器學習練習二：多元線性迴歸

吳恩達機器學習訓練祕籍整理四十四到五十二章（七）優化測試和端到端

吳恩達機器學習訓練祕籍整理二十八到三十二章（四）學習曲線

吳恩達機器學習訓練祕籍整理二十到二十七章（三）

吳恩達機器學習訓練祕籍整理十一到十九章（二）

演算法工程師修仙之路：吳恩達機器學習（二）

吳恩達機器學習（二）多元線性迴歸（假設、代價、梯度、特徵縮放、多項式）

吳恩達機器學習（十二）主成分分析（降維、PCA）

演算法工程師修仙之路：吳恩達機器學習（十二）

吳恩達機器學習筆記（十二）-支援向量機

吳恩達機器學習筆記（二）（附程式設計作業連結）

吳恩達機器學習第5周Neural Networks（Cost Function and Backpropagation）

吳恩達機器學習筆記（六） —— 支持向量機SVM

吳恩達機器學習（二）多元線性迴歸（假設、代價、梯度、特徵縮放、多項式）

目錄

0. 前言

1. 假設函式（Hypothesis）

2. 代價函式（Cost Function）

3. 梯度下降（Gradient Descent）

4. 特徵縮放（Feature Scaling）

5. 多項式迴歸方程（Polynomial Regression）

相關推薦