奇異值分解(SVD)原理詳解及推導（轉）

阿新 • • 發佈：2019-01-17

很不錯的文章，適合入門。

在網上看到有很多文章介紹SVD的，講的也都不錯，但是感覺還是有需要補充的，特別是關於矩陣和對映之間的對應關係。前段時間看了國外的一篇文章，叫A Singularly Valuable Decomposition The SVD of a Matrix，覺得分析的特別好，把矩陣和空間關係對應了起來。本文就參考了該文並結合矩陣的相關知識把SVD原理梳理一下。

SVD不僅是一個數學問題，在工程應用中的很多地方都有它的身影，比如前面講的PCA，掌握了SVD原理後再去看PCA那是相當簡單的，在推薦系統方面，SVD更是名聲大噪，將它應用於推薦系統的是Netflix大獎的獲得者Koren，可以在Google上找到他寫的文章；用SVD可以很容易得到任意矩陣的滿秩分解，用滿秩分解可以對資料做壓縮。可以用SVD來證明對任意M*N的矩陣均存在如下分解：

這個可以應用在資料降維壓縮上！在資料相關性特別大的情況下儲存X和Y矩陣比儲存A矩陣佔用空間更小！

在開始講解SVD之前，先補充一點矩陣代數的相關知識。

正交矩陣

正交矩陣是在歐幾里得空間裡的叫法，在酉空間裡叫酉矩陣，一個正交矩陣對應的變換叫正交變換，這個變換的特點是不改變向量的尺寸和向量間的夾角，那麼它到底是個什麼樣的變換呢？看下面這張圖

假設二維空間中的一個向量OA，它在標準座標系也即e1、e2表示的座標是中表示為(a,b)'（用'表示轉置），現在把它用另一組座標e1'、e2'表示為(a',b')'，存在矩陣U使得(a',b')'=U(a,b)'，則U即為正交矩陣。從圖中可以看到，正交變換隻是將變換向量用另一組正交基表示，在這個過程中並沒有對向量做拉伸，也不改變向量的空間位置，加入對兩個向量同時做正交變換，那麼變換前後這兩個向量的夾角顯然不會改變。上面的例子只是正交變換的一個方面，即旋轉變換，可以把e1'、e2'座標系看做是e1、e2座標系經過旋轉某個斯塔角度得到，怎麼樣得到該旋轉矩陣U呢？如下

a'和b'實際上是x在e1'和e2'軸上的投影大小，所以直接做內積可得，then

從圖中可以看到

所以

正交陣U行（列）向量之間都是單位正交向量。上面求得的是一個旋轉矩陣，它對向量做旋轉變換！也許你會有疑問：剛才不是說向量空間位置不變嗎？怎麼現在又說它被旋轉了？對的，這兩個並沒有衝突，說空間位置不變是絕對的，但是座標是相對的，加入你站在e1上看OA，隨著e1旋轉到e1'，看OA的位置就會改變。如下圖：

如圖，如果我選擇了e1'、e2'作為新的標準座標系，那麼在新座標系中OA（原標準座標系的表示）就變成了OA'，這樣看來就好像座標系不動，把OA往順時針方向旋轉了“斯塔”角度，這個操作實現起來很簡單：將變換後的向量座標仍然表示在當前座標系中。

旋轉變換是正交變換的一個方面，這個挺有用的，比如在開發中需要實現某種旋轉效果，直接可以用旋轉變換實現。正交變換的另一個方面是反射變換，也即e1'的方向與圖中方向相反，這個不再討論。

總結：正交矩陣的行（列）向量都是兩兩正交的單位向量，正交矩陣對應的變換為正交變換，它有兩種表現：旋轉和反射。正交矩陣將標準正交基對映為標準正交基（即圖中從e1、e2到e1'、e2'）

特徵值分解——EVD

在討論SVD之前先討論矩陣的特徵值分解（EVD），在這裡，選擇一種特殊的矩陣——對稱陣（酉空間中叫hermite矩陣即厄米陣）。對稱陣有一個很優美的性質：它總能相似對角化，對稱陣不同特徵值對應的特徵向量兩兩正交。一個矩陣能相似對角化即說明其特徵子空間即為其列空間，若不能對角化則其特徵子空間為列空間的子空間。現在假設存在mxm的滿秩對稱矩陣A，它有m個不同的特徵值，設特徵值為