1. 程式人生 > >【資料收集】PCA降維

【資料收集】PCA降維

post hive ron str AD span clas htm logs

重點整理:

PCA(Principal Components Analysis)主成分分析,是圖像處理中經常用到的降維方法

1、原始數據:

假定數據是二維的

x=[2.5, 0.5, 2.2, 1.9, 3.1, 2.3, 2, 1, 1.5, 1.1]T

y=[2.4, 0.7, 2.9, 2.2, 3.0, 2.7, 1.6, 1.1, 1.6, 0.9]T

2、計算協方差矩陣

1)協方差矩陣:

標準差和方差一般是用來描述一維數據的

協方差就是一種用來度量兩個隨機變量關系的統計量(協方差也只能處理二維問題,需要計算多個協方差)

協方差矩陣是一個對稱的矩陣,而且對角線是各個維度上的方差。

2)協方差矩陣的求法:

協方差矩陣計算的是不同維度之間的協方差,而不是不同樣本之間的

協方差矩陣是計算不同維度間的協方差,要時刻牢記這一點。樣本矩陣的每行是一個樣本,每列為一個維度,所以我們要按列計算均值

3、計算協方差矩陣的特征向量和特征值

這些矢量都是單位矢量,也就是它們的長度為1,這對PCA來說是很重要

4、選擇成分組成模式矢量

按照特征值由大到小進行排列,這將給出成分的重要性級別。

如果你的原始數據是n維的,你選擇了前p個主要成分,那麽你現在的數據將僅有p維。現在我們要做的是組成一個模式矢量,它由你保持的所有特征矢量構成,每一個特征矢量是這個矩陣的一列。

參考:

PCA降維方法(主成分分析)詳解 http://chyyeng.blog.163.com/blog/static/169182302012111433537985/

PCA算法學習_1(OpenCV中PCA實現人臉降維) - tornadomeet - 博客園 http://www.cnblogs.com/tornadomeet/archive/2012/09/06/2673104.html

PCA(1)_落落_新浪博客 http://blog.sina.com.cn/s/blog_69d515b10100kim3.html

【資料收集】PCA降維