【機器學習】簡述多種降維演算法

【轉載請註明出處】chenrudan.github.io

最近看了一些關於降維演算法的東西，本文首先給出了七種演算法的一個資訊表，歸納了關於每個演算法可以調節的(超)引數、演算法主要目的等等，然後介紹了降維的一些基本概念，包括降維是什麼、為什麼要降維、降維可以解決維數災難等，然後分析可以從什麼樣的角度來降維，接著整理了這些演算法的具體流程。主要目錄如下:

老規矩，先上一個各個演算法資訊表，X表示高維輸入矩陣大小是高維數D乘以樣本個數N，C=XXT，Z表示降維輸出矩陣大小低維數d乘以N，E=ZZT，線性對映是Z=WTX，高維空間中兩兩之間的距離矩陣為A，Sw,Sb分別是LDA的類內散度矩陣和類間散度矩陣，k表示流形學習中一個點與k個點是鄰近關係，F

表示高維空間中一個點由周圍幾個點的線性組合矩陣，M=(I−F)(I−F)T。−表示不確定。P是高維空間中兩點距離佔所有距離比重的概率矩陣，Q低維空間中兩點距離佔所有距離比重的概率矩陣。l表示全連線神經網路的層數，Dl表示每一層的節點個數。

圖1 不同降維演算法對比

這裡autoencoder是否去中心化個人覺得還是有點疑問，在處理影象資料的時候，會對輸入圖片做一個變到0均值的預處理，但是這個操作是針對一張樣本內減均值[1]，這裡的去中心化指的是針對某一維資料減均值，並不是一個概念。下面開始具體談談降維相關的內容。

1. 降維基本概念

降維的意思是能夠用一組個數為d的向量zi來代表個數為D的向量x

i所包含的有用資訊，其中d<D。假設對一張512*512大小的圖片，用svm來做分類，最直接的做法是將圖按照行或者列展開變成長度為512*512的輸入向量xi，跟svm的引數相乘。假如能夠將512*512的向量在保留有用資訊的情況下降維到100，那麼儲存輸入和引數的空間會減少很多，計算向量乘法的時間也會減少很多。所以降維能夠有效的減少計算時間。而高維空間的資料很有可能出現分佈稀疏的情況，即100個樣本在100維空間分佈肯定是非常稀疏的，每增加一維所需的樣本個數呈指數級增長，這種在高維空間中樣本稀疏的問題被稱為維數災難。降維可以緩解這種問題。

而為什麼可以降維，這是因為資料有冗餘，要麼是一些沒有用的資訊，要麼是一些重複表達的資訊，例如一張512*512的圖只有中心100*100的區域內有非0值，剩下的區域就是沒有用的資訊，又或者一張圖是成中心對稱的，那麼對稱的部分資訊就重複了。正確降維後的資料一般保留了原始資料的大部分的重要資訊，它完全可以替代輸入去做一些其他的工作，從而很大程度上可以減少計算量。例如降到二維或者三維來視覺化。

2. 從什麼角度出發來降維

一般來說可以從兩個角度來考慮做資料降維，一種是直接提取特徵子集做特徵抽取，例如從512*512圖中只取中心部分，一種是通過線性/非線性的方式將原來高維空間變換到一個新的空間，這裡主要討論後面一種。後面一種的角度一般有兩種思路來實現[2]，一種是基於從高維空間對映到低維空間的projection方法，其中代表演算法就是PCA，而其他的LDA、Autoencoder也算是這種，主要目的就是學習或者算出一個矩陣變換W，用這個矩陣與高維資料相乘得到低維資料。另一種是基於流形學習的方法，流形學習的目的是找到高維空間樣本的低維描述，它假設在高維空間中資料會呈現一種有規律的低維流形排列，但是這種規律排列不能直接通過高維空間的歐式距離來衡量，如下左圖所示，某兩點實際上的距離應該是下右圖展開後的距離。如果能夠有方法將高維空間中流形描述出來，那麼在降維的過程中就能夠保留這種空間關係，為了解決這個問題，流形學習假設高維空間的區域性區域仍然具有歐式空間的性質，即它們的距離可以通過歐式距離算出(Isomap)，或者某點座標能夠由臨近的節點線性組合算出(LLE)，從而可以獲得高維空間的一種關係，而這種關係能夠在低維空間中保留下來，從而基於這種關係表示來進行降維，因此流形學習可以用來壓縮資料、視覺化、獲取有效的距離矩陣等。

圖2 流形學習

3. 幾種降維方法流程

3.1 主成分分析PCA

PCA由Karl Pearson在1901年發明，是一種線性降維方法，高維空間(維數為D)的某個點xi=(x1,x2,…,xD)通過與矩陣W相乘對映到低維空間(維數為d，d<D)中的某個點zi=WTxi，其中W的大小是D∗d，i對應的是第i個樣本點。從而可以得到N個從D維空間對映到d維空間的點，PCA的目標是讓對映得到的點zi儘可能的分開，即讓N個zi的方差儘可能大。假如D維空間中的資料每一維均值為0，即∑ixi=0，那麼兩邊乘上WT得到的降維後的資料每一維均值也是0，考慮一個矩陣C=1NX∗XT，這個矩陣是這組D維資料的協方差矩陣，可以看出對角線上的值是D維中的某一維內的方差，非對角線元素是D維中兩維之間的協方差。

<br>1NX∗XT=⎛⎝⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜<br>1N∑i=1Nx21iamp;…amp;1N∑i=1NxT1ixDi&amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp

【機器學習】簡述多種降維演算法

1. 降維基本概念

2. 從什麼角度出發來降維

3. 幾種降維方法流程

3.1 主成分分析PCA

【機器學習】簡述多種降維演算法

MARK:簡述多種降維演算法

【機器學習】K-means聚類演算法初探

簡述多種降維演算法

【機器學習】使用python實現kNN演算法

【機器學習】人像識別（二）——PCA降維

【機器學習】關於t-sne：降維、視覺化

【機器學習】資料降維—主成分分析（PCA）

【機器學習】資料降維—線性判別分析（LDA）

【機器學習】5種距離度量方法詳解+Python實現([]+lambda+np.frompyfunc+向量法等多種方法實現)

【機器學習】梯度下降演算法分析與簡述

【機器學習】影象中的降噪方法之一：低秩降噪

【機器學習】隨機森林 Random Forest 得到模型後，評估參數重要性

【機器學習】主成分分析PCA（Principal components analysis）

【機器學習】1 監督學習應用與梯度下降

【機器學習】EM的算法

【機器學習】DBSCAN Algorithms基於密度的聚類算法

【機器學習】數據預處理之將類別數據轉換為數值

【機器學習】對梯度下降算法的進一步理解

【機器學習】手寫數字識別算法

【機器學習】簡述多種降維演算法

1. 降維基本概念

2. 從什麼角度出發來降維

3. 幾種降維方法流程

3.1 主成分分析PCA

相關推薦