1. 程式人生 > >數據挖掘——統計學分析(五:統計量)

數據挖掘——統計學分析(五:統計量)

隨機模擬 學分 精確 挖掘 中位數 試驗 重復 方差 卡方

統計量

通過從總體中抽取樣本構造適當的統計量,由樣本性質推斷總體性質的樣本函數。


常用的統計量

1)樣本均值

2)樣本方差、標準差

3)樣本的變異系數——C=根號(D(x))/E(x)

4)k階距

5)中心距

6)樣本偏度

7)樣本峰度

註:偏度、峰度在質量控制和可靠性研究應用較多。

次序統計量

參數估計和假設檢驗的重要統計量。

1)最小、最大次序統計量

2)樣本極差=最大統計量-最小統計量

3)中位數、分位數、四分位數

充分統計量

統計量加工過程中一點信息都不損失的統計量稱為充分統計量。

關於分布的幾個概念

抽樣分布

總體的分布類型已知,則對於任一自然數n,都能導出統計量的分布數學表達式。精確的分布大多實在正態總體情況下得到的。

漸進分布

當抽樣分布的n較大時,就用極限分布作為抽樣分布的一種近似,這種極限分布稱為漸進分布。

隨機模擬獲得的近似分布

通過反復的重復試驗得到的觀測值滿足的分布。

由正態分布導出的幾個重要分布

卡方分布

t分布

F分布

在方差分析、回歸方程的顯著性檢驗中有著重要的地位。


數據挖掘——統計學分析(五:統計量)