1. 程式人生 > >機器學習課程-第 8 周-降維(Dimensionality Reduction)—主成分分析(PCA)

機器學習課程-第 8 周-降維(Dimensionality Reduction)—主成分分析(PCA)

art 不同 計算機 dimens 是什麽 課程 繪制 start pca

1. 動機一:數據壓縮

第二種類型的 無監督學習問題,稱為 降維。有幾個不同的的原因使你可能想要做降維。一是數據壓縮,數據壓縮不僅允許我們壓縮數據,因而使用較少的計算機內存或磁盤空間,但它也讓我們加快我們的學習算法。

但首先,讓我們談論 降維是什麽。作為一種生動的例子,我們收集的數據集,有許多,許多特征,我繪制兩個在這裏。

將數據從二維降一維:

技術分享圖片

技術分享圖片

技術分享圖片

將數據從三維降至二維: 這個例子中我們要將一個三維的特征向量降至一個二維的特征向量。過程是與上面類似的,我們將三維向量投射到一個二維的平面上,強迫使得所有的數據都在同一個平面上,降至二維的特征向量。

技術分享圖片

這樣的處理過程可以被用於把任何維度的數據降到任何想要的維度

,例如將1000維的特征降至100維。

2. 動機二:數據可視化

技術分享圖片

機器學習課程-第 8 周-降維(Dimensionality Reduction)—主成分分析(PCA)