概率統計與機器學習：期望，方差，數學期望，樣本均值，樣本方差之間的區別

阿新 • • 發佈：2019-01-04

1.樣本均值：我們有n個樣本，每個樣本的觀測值為Xi，那麼樣本均值指的是 1/n * ∑x(i)，求n個觀測值的平均值

2.數學期望：就是樣本均值，是隨機變數，即樣本數其實並不是確定的

PS：從概率論的角度而言：樣本指的是我們現在有多少東西需要去觀測，它是一種隨機變數，即樣本的多少是不確定的，我們得到的樣本均值並不是真正意義上的期望。

3.期望：已知其觀測值f（x）及其概率P，求其觀測值與概率乘積的累加和，∑Xi*Pi

PS：期望是一種固定值，他的觀測值是基於已知某幾類數值及其概率，是不同於數學期望中的觀測值Xi的，數學期望的觀測值有一點取決於樣本數量的味道，也就是求和這裡的n其實是不同的

4.方差：先看一下方差的公式

直觀的說就是：觀測值f(x)與其期望相減的差值的期望換言之：方差反應的是觀測值與其期望的偏差 PS：因為是與期望相減，所以這裡的方差本質也是一個固定值而非隨機變數 5.樣本方差：

這裡的觀測值減去的是均值！均值的意思就是原本物質所存在的均值，即 1/n * ∑x(i) 而實際上我們可以得知方差的求解應該減去的是期望才對，其中的緣故在於我們並不能得知真正的期望是多少，只能通過隨機變數的樣本求得一個近似的值來預估期望，即利用下式來證明：

，當theta值是樣本均值的時候，該式值最小（每個值減他們總和的均值）
那麼同理返回樣本方差的等式，上式最小意味著利用樣本均值求解樣本方差會把真實方差算小了

因此將N處理成N-1來增大樣本方差的值引出兩個結論：（a）當分母為N-1的時候，是我們對方差做的一個無偏估計（b）當分母為N的時候，是我們對方差做的一個極大似然估計做一個小總結：樣本均值是數學期望，求的是n個觀測值的平均值，而期望指的是觀測值及其概率的乘積的累加和
在樣本足夠多的情況下，可以理解為樣本均值趨近於期望E
即：1/n*∑x(i) ≈ ∑p(i)*x(i) 方差的本質是固定不變的，得到的是這個狀態正兒八經與期望的偏差，而樣本方差是隨機變數，得到的是也是一種偏差，只不過這種偏差是對正確偏差的一種估計值。

概率統計與機器學習：期望，方差，數學期望，樣本均值，樣本方差之間的區別

概率統計與機器學習：期望，方差，數學期望，樣本均值，樣本方差之間的區別

概率統計與機器學習：獨立同分布，極大似然估計，線性最小二乘迴歸

概率統計與機器學習：常見分布性質總結

概率統計與機器學習：極大後驗概率以及正則化項

機器學習：訓練集，驗證集與測試集

機器學習：決策樹過擬合與剪枝，決策樹程式碼實現（三）

機器學習：模型性能評估與參數調優

智能小車29：自動駕駛與機器學習

斯坦福大學公開課機器學習：Neural Networks，representation: non-linear hypotheses（為什麽需要做非線性分類器）

斯坦福大學公開課機器學習：advice for applying machine learning | learning curves （改進學習算法：高偏差和高方差與學習曲線的關系）

斯坦福大學公開課機器學習：machine learning system design | data for machine learning（數據量很大時，學習算法表現比較好的原理）

機器學習：驗證數據集與交叉驗證

面向機器學習：數據平臺設計與搭建實踐

機器學習：線性回歸——理論與代碼實現（基於正規方程與梯度下降）

先驗概率、後驗概率、似然函數與機器學習中概率模型（如邏輯回歸）的關系理解

機器學習：K近鄰演算法，kd樹

機器學習：Multinoulli分佈與多項式分佈

先驗概率、後驗概率、似然函式與機器學習中概率模型（如邏輯迴歸）的關係理解

【模式識別與機器學習】——3.9勢函式法：一種確定性的非線性分類方法

機器學習：梯度消失（vanishing gradient）與梯度爆炸（exploding gradient）問題

概率統計與機器學習：期望，方差，數學期望，樣本均值，樣本方差之間的區別

相關推薦