機器學習課程-第 8 周-降維(Dimensionality Reduction)—主成分分析(PCA)

阿新 • • 發佈：2019-02-10

art 不同計算機 dimens 是什麽課程繪制 start pca

1. 動機一：數據壓縮

第二種類型的 無監督學習問題，稱為降維。有幾個不同的的原因使你可能想要做降維。一是數據壓縮，數據壓縮不僅允許我們壓縮數據，因而使用較少的計算機內存或磁盤空間，但它也讓我們加快我們的學習算法。

但首先，讓我們談論 降維是什麽。作為一種生動的例子，我們收集的數據集，有許多，許多特征，我繪制兩個在這裏。

將數據從二維降一維：

技術分享圖片

將數據從三維降至二維：這個例子中我們要將一個三維的特征向量降至一個二維的特征向量。過程是與上面類似的，我們將三維向量投射到一個二維的平面上，強迫使得所有的數據都在同一個平面上，降至二維的特征向量。

技術分享圖片

這樣的處理過程可以被用於把任何維度的數據降到任何想要的維度

，例如將1000維的特征降至100維。

機器學習課程-第 8 周-降維(Dimensionality Reduction)—主成分分析(PCA)

art 不同計算機 dimens 是什麽課程繪制 start pca 1. 動機一：數據壓縮第二種類型的無監督學習問題，稱為降維。有幾個不同的的原因使你可能想要做降維。一是數據壓縮，數據壓縮不僅允許我們壓縮數據，因而使用較少的計算機內存或磁盤空間，但它也讓我們