1. 程式人生 > >主成分分析PCA學習一條龍

主成分分析PCA學習一條龍

轉自:https://yoyoyohamapi.gitbooks.io/mit-ml/content/%E7%89%B9%E5%BE%81%E9%99%8D%E7%BB%B4/articles/PCA.html

https://www.jianshu.com/p/162bb4ea1b7f

1.有什麼功能?

進行資料降維,從n個特徵裡選出k個最具有代表性的,使資料損失降到最小,儘可能保有原來的資料特徵。

假設需要從n維降到k維,那麼需要找出k個n維向量,將原有的資料投影到k個n維向量構成的k維空間,並保證投影誤差足夠小。

比如下圖,就找到了2個3維向量,構成了一個二維平面,可將3維特徵進行投影。

2.演算法的步驟

1.先進行標準化,使資料的差值不那麼大:

//標準差你應該記得怎麼算的吧,就是根號下的方差。

 2.計算協方差矩陣Σ: