1. 程式人生 > >關於最大似然估計和最小二乘法的理解和公式推導

關於最大似然估計和最小二乘法的理解和公式推導

最小二乘法可以從Cost/Loss function角度去想,這是統計(機器)學習裡面一個重要概念,一般建立模型就是讓loss function最小,而最小二乘法可以認為是 loss function = (y_hat -y )^2的一個特例,類似的想各位說的還可以用各種距離度量來作為loss function而不僅僅是歐氏距離。所以loss function可以說是一種更一般化的說法。

最大似然估計是從概率角度來想這個問題,直觀理解,似然函式在給定引數的條件下就是觀測到一組資料realization的概率(或者概率密度)。最大似然函式的思想就是什麼樣的引數才能使我們觀測到目前這組資料的概率是最大
的。

類似的從概率角度想的估計量還有矩估計(moment estimation)。就是通過一階矩 二階矩等列方程,來反解出引數。

各位有人提到了正態分佈。最大似然估計和最小二乘法還有一大區別就是,最大似然估計是需要有分佈假設的,屬於引數統計,如果連分佈函式都不知道,又怎麼能列出似然函式呢? 而最小二乘法則沒有這個假設。 二者的相同之處是都把估計問題變成了最優化問題。但是最小二乘法是一個凸優化問題,最大似然估計不一定是。