1. 程式人生 > >機器學習儲備(2):高斯分佈

機器學習儲備(2):高斯分佈

今天講解獨立同分布的概念,高斯分佈,一維高斯分佈。

1、獨立同分布

指隨機過程中,任何時刻的取值都為隨機變數,如果這些隨機變數服從同一分佈,並且互相獨立,那麼這些隨機變數是獨立同分布。

先說說獨立這個概念。在預測德克薩斯州區域的房屋價值時,房屋樣本x1和樣本x2之間的預測是相互獨立的,它們之間不存在任何關係,這也是接近實際的。

同分布是指預測的房屋都是來自於德克薩斯州這塊區域的,你不能拿北京的某個小三居扔到這個模型中去做預測吧,如果非要這樣,誤差一定會很大。

2、高斯分佈

高斯分佈(Gaussian distribution), 又稱為正態分佈(Normal distribution),是一個非常重要在各個領域有廣泛應用的概率分佈。

正態曲線的特點是中間高,兩頭低,左右對稱,人們經常稱之為鐘形曲線。

若隨機變數X服從一個數學期望為μ、方差為σ^2的正態分佈,記為N(μ,σ^2)。

其概率密度函式為正態分佈的,期望值μ決定了它的位置,標準差σ^2資料的偏離程度。

當μ = 0,σ = 1時的高斯分佈又稱為標準正態分佈。

3、一維正態分佈

若隨機變數服從如下的概率密度函式,則表明是一維正態分佈。

當然,還有多維正態分佈,在此不做詳述。