如何使用線性代數實現最小二乘法擬合曲線
也許在我們讀高中的時候,就知道在數學的世界裡,有一種直線擬合的方式:最小二乘法。它是一種數學優化技術,原理是通過最小化誤差的平方和尋找資料的最佳函式匹配。
比如研究x和y之間的關係,假設我們擁有的資料是將這些資料描繪在x-y直角座標系中,發現這些點並沒有能夠連線成一條直線。
但趨勢近似一條曲線,這時可以假設這條曲線為: 。
根據最小二乘的原理,使即最小化,可以得到值,再根據直線過點得出b的值。為橫座標的平均值,為縱座標的平均值。
其中,,。
其實最小二乘法不僅可以擬合直線(一次),還可以擬合曲線(≥2次)。
在溫習了高中所學的最小二乘法後,讓我們使用大學裡線性代數的知識,進行擬合吧。
Ax=b,A是m*n型的矩陣其中m>n,A列滿秩,那麼Ax=b可能有解,也可能無解。
如果Ax=b有解,因為列滿秩,容易得知x的解是唯一的,其實可以想象成空間裡投影,就是b在A的列空間上C(A)裡投影是唯一的;
如果Ax=b無解,說明b ∉ C(A),那麼我們把問題轉化一下:求,使得A與b之間的距離最小,也就是Min
這時我們需要一點空間想象的能力,所要求的,無非就是向量b在C(A)這個空間上的投影點,因為只有在這種情況下,||b-A||才是最小。
我們來看一個點在直線上投影的例子:
如圖,我們要求b在a上的投影向量p,只要稍微懂點高中數學的向量知識,我們可以得到下面兩個式子:
①p+e=b,e⊥a
②p=ta(t∈R)
因為e⊥a,所以,也就是,所以
那麼b在a上的投影向量為
又因為
所以投影向量又可以寫成
習慣上,我們習慣將稱為投影矩陣,比如對任意b∈,Sb是b在a上的投影向量。
我們會發現一個有趣的性質,,其實很好理解,Sb是指b在a上的投影向量,那麼則是指b在a上投影一次後的投影,再投影一次,Sb和無疑是相等的,所以,根據容易得出,此處不進行推導。
接著進行分析,看上圖,易知b-p⊥C(A),那麼則有,去括號得,我們稱此方程為法方程,Ax=b可能無解,但一定有解。
那麼,就是最小二乘法擬合下的最優值。
接著來看p,因為p=A,則。巧妙的,我們可以很容易地發現
說了這麼多,是不是感覺用線性代數完成最小二乘法特別的方便呢!