Coursera機器學習基石筆記week9

Linear Regression

線性迴歸的預測函式取值在整個實數空間，這跟線性分類不同。 $h (x) = w^{T}$

X h(x)=w^TX

h (x) = w^{T} X

在一維或者多維空間裡，線性迴歸的目標是找到一條直線（對應一維）、一個平面（對應二維）或者更高維的超平面，使樣本集中的點更接近它，也就是殘留誤差Residuals最小化。如下圖所示：
在這裡插入圖片描述
一般最常用的錯誤測量方式是基於最小二乘法（這裡是線性的），其目標是計算誤差的最小平方和對應的權重w，即上節課介紹的squared error：

Linear Regression Algorithm

首先，運用矩陣轉換的思想，將EinEin計算轉換為矩陣的形式。
在這裡插入圖片描述

對於此類線性迴歸問題，

E_{in}(w)

一般是個凸函式。凸函式的話，我們只要找到一階導數等於零的位置，就找到了最優解。那麼，我們將

E_w

對每個

w_i

,i=0,1,⋯,d求偏導，偏導為零的

w_i

，即為最優化的權重值分佈。
在這裡插入圖片描述

那麼如何求導呢？

讓倒數為0，即可計算出w：
在這裡插入圖片描述

對於可逆的矩陣

X^TX

來說，我們就可以使用上述偽逆矩陣進行計算了，但是針對於奇異（不可逆）矩陣來說，逆矩陣

(X^TX)^{-1}

就不一定存在了。但是一般來說，如果樣本數量N遠大於樣本維度d+1的話，是能保證矩陣的逆是存在的。如果不可逆，大部分計算軟體也可以處理這個問題，計算出一個逆矩陣。所以，一般的偽逆矩陣都是可解的。

Generalization Issue

在這裡插入圖片描述
有兩種觀點：1、這不屬於機器學習範疇。因為這種closed-form解的形式跟一般的機器學習演算法不一樣，而且在計算最小化誤差的過程中沒有用到迭代。2、這屬於機器學習範疇。因為從結果上看，EinEin和EoutEout都實現了最小化，而且實際上在計算逆矩陣的過程中，也用到了迭代。
在這裡插入圖片描述
那麼 $E_in(w_{LIN})=\frac{1}{N}||(I-XX^+)y||^2=\frac{1}{N}||(I-H)y||^2$

粉色區域是X分別乘以不同的w來生成一個新的空間，那麼我們ŷ也是由w乘以X產生的，因此ŷ要在這個空間內。
我們要做的就是讓y與ŷ最小，也就是垂直於這個空間的時候。
H就是把y對映為ŷ，Hy=ŷ
I-H就是通過(I−H)y=y−ŷ，使y轉換為y−ŷ

接下來，先探究一下H的性質：

$Hat \ Matrix\ H=X(X^TX)^{-1}X^T$

對稱性(symetric)，即H= $H^T$ :

$H^T=(X(X^TX)^{-1}X^T)^T$

$=X((X^TX)^{-1})^TX^T$

$=X(X^TX)^{-1}X^T$

$=H$
冪等性(idempotent)，即 $H^2=H$ ：

$H^2=(X(X^TX)^{-1}X^T)(X(X^TX)^{-1}X^T)$

$=X(X^TX)^{-1}(X^TX)(X^TX)^{-1}X^T$

$=X(X^TX)^{-1}X^T$

$=H$

首先複習一下跡運算。

如果A是m $*$ n,B是n $*$ m的話，那麼trace(AB)=trace(BA)
多個矩陣相乘得到的方陣的跡，和將這些矩陣中的最後一個挪到最前面之後相乘的跡是相同的。當然，我們需要考慮挪動之後矩陣乘積依然定義良好：

Tr(ABC)=Tr(CAB)=Tr(BCA)
如果 $\alpha$ 是一個標量的話，那麼 $trace(\alpha C)=\alpha trace(C)$ , $trace(\alpha)=\alpha$

這裡給出trace(I-H)=N-(d+1),那麼為什麼呢？一個矩陣的trace（跡）等於其對角元素的和。

$trace(I-H)=trace(I)-trace(H)$

Coursera機器學習基石筆記week9

Linear Regression

Linear Regression Algorithm

Generalization Issue

Coursera機器學習基石筆記week9

Coursera機器學習基石筆記week4

Coursera機器學習基石筆記week3

Coursera機器學習基石筆記Week2

Coursera機器學習基石筆記Week1

Coursera機器學習基石筆記week7

Coursera機器學習基石筆記week8

Coursera機器學習基石筆記week6

Coursera機器學習基石筆記week5

Coursera機器學習基石筆記week16

Coursera機器學習基石筆記week15

Coursera機器學習基石筆記week14

Coursera機器學習基石筆記week13

Coursera機器學習基石筆記week12

Coursera機器學習基石筆記week11

Coursera機器學習基石筆記week10

機器學習基石筆記-Lecture 10 Logistic regression

機器學習基石筆記-Lecture 9 Linear regression

機器學習基石筆記-Lecture 4 Learning is possible

機器學習基石筆記-Lecture 3 Types of learning

Coursera機器學習基石筆記week9

Linear Regression

Linear Regression Algorithm

Generalization Issue

相關推薦