主成分分析(PCA)（matlab版本）

一、基礎知識

假設兩個樣本X、Y，它們的均值分別為 $\overline{X}$ 、 $\overline{Y}$

\overline{Y}

\overline{Y}

，樣本X和樣本Y的協方差為：

Cov(X,Y) = \frac{\sum_{i=1}^{n}(X_i-\overline{X})(Y_i-\overline{Y})}{n-1}

協方差為正時說明X和Y是正相關，協方差為負時X和Y是負相關¹，協方差為0時X和Y相互獨立。
若

XW=\lambda W

，則稱

\lambda

是X的特徵值，W是對應的特徵向量。

XW

的結果等同於

W

按係數

\lambda

的縮放。當X是n階可逆對稱矩陣時，存在正交

Q

(

Q^{-1}=Q^T

)，使得：

Q^T X Q = \begin {pmatrix} \lambda_1 &amp; 0 &amp; \cdots &amp;0 \\ 0 &amp; \lambda_2 &amp; \cdots &amp; 0 \\ \vdots &amp; \vdots &amp; \ddots &amp; \vdots \\ 0 &amp; 0 &amp; \cdots &amp; \lambda_n \end {pmatrix}

對矩陣X進行奇異值分解，就可以得到特徵值和特徵向量（Q的列向量）。

二、PCA的理解

資料發生降維時會產生資訊損失，同時希望損失儘可能小，降維標準為：樣本到超平面的距離足夠小或者樣本在超平面的投影足夠分散²,詳細的介紹請看這裡。
假設m個n維度資料 $(x^{1},x^{2},...,x^{m})$ 是中心化後的資料，經過變換得到的新座標系為 $\{w_1,w_2,...,w_n\}$ ，其中w是標準正交基，滿足 $||w||_2 =1,w_i^Tw_j =0$ 這裡丟棄部分資料，新的座標系為： $\{w_1,w_2,...,w_{n'}\}$ ,樣本點 $x^i$ 在n’維度的新座標系上的投影為： $Z^{(i)}=(z_1^i,z_2^i,...,z_{n'}^i)$
其中 $z_j^i = w_j^Tx^i$ 是 $x^i$ 在低維座標系中第J維的座標值。若用 $z^{(i)}$ 來恢復原始資料 $x^{(i)}$ ,得到：
$\overline {x^i} = \sum_{j=1}^{n'}z_j^iw_j=WZ^i$
考慮整個樣本集，我們希望樣本到超平面足夠近，即
$min {\sum_{\overline {x^i}}^{m}||\overline {x^i}-x^i ||_2^2}$

主成分分析(PCA)（matlab版本）

一、基礎知識

二、PCA的理解

主成分分析(PCA)（matlab版本）

【機器學習】主成分分析PCA（Principal components analysis）

【轉載】主成分分析法（PCA）

主成分分析法（PCA）

Python資料分析學習筆記（6）資料規約實戰--以主成分分析PCA為例

（3）主成分分析(PCA)——基於python+numpy

機器學習（七）：主成分分析PCA降維_Python

SparkML之特徵提取（一）主成分分析(PCA)

主成分分析(PCA)和區域性線性嵌入（LEE）原理詳解

降維之主成分分析法（PCA）

機器學習回顧篇（14）：主成分分析法（PCA）

人臉識別中用主成分分析PCA來將資料降維--MATLAB程式碼

機器學習之路：python 特征降維主成分分析 PCA

主成分分析PCA & 奇異值分解SVD

吳恩達老師機器學習筆記主成分分析PCA

主成分分析PCA學習一條龍

【機器學習演算法實現】主成分分析 PCA ——基於python+numpy

【機器學習筆記15】主成分分析(PCA)

一步步教你輕鬆學主成分分析PCA降維演算法

主成分分析(PCA)

主成分分析(PCA)（matlab版本）

一、基礎知識

二、PCA的理解

相關推薦