1. 程式人生 > >matlab第十二課:統計

matlab第十二課:統計

目標:

  1. 統計

統計

概述:

  • 資料的科學
  • 涉及資料的收集,分析,解釋,演示和組織

統計的主要方法:

  • 描述性統計
  • 推理統計 

一、推理統計

數值模式和圖形方法查詢模式,總結資料集中的資訊

Mean, Median, Mode, and Quartile(四分位數):

Range and Interquartile Range

Variance and Standard Deviation:

Figures Are Always More Powerful:

x = 1:14; 
freqy = [1 0 1 0 4 0 1 0 3 1 0 0 1 1];
subplot(1,3,1);  bar(x,freqy);  xlim([0 15]); 
subplot(1,3,2);  area(x,freqy);  xlim([0 15]); 
subplot(1,3,3);  stem(x,freqy);  xlim([0 15]);

Boxplot:

每個位置從左往右分別代表最小值、下四分位點、中位數、上四分位點和最大值。

marks = [80 81 81 84 88 92 92 94 96 97]; 
boxplot(marks) 
prctile(marks, [25 50 75])

Skewness: skewness()

X = randn([10 3])*3; 
X(X(:,1)<0, 1) = 0;  
X(X(:,3)>0, 3) = 0; 
boxplot(X, {'Right-skewed', 'Symmetric', 'Left-skewed'}); 
y = skewness(X)



y =

    1.0487    0.2193   -1.5381

Kurtosis(峰態):

  • 分佈平坦度的一種度量
  • 正態分佈的峰度為零。
    • 正峰度:更陡峭的峰
    • 負峰度:更平坦的峰

二、描述性統計

使用樣本資料進行估計、決策和預測的方法

Statistical Hypothesis Testing(統計假設檢驗):

利用資料進行決策的一種方法

例如:我在這個班上能拿到A級嗎?

其中H0是空假設,H1是可選擇假設。

Hypothesis Testing Procedure(假設檢驗程式):

  • 為假設檢驗確定概率,比如0.95
  • 95%是H0的置信區間
  • 檢查你的分數是否落入區間

t-test Example:
 

load stockreturns; 
x1 = stocks(:,3);  
x2 = stocks(:,10); 
boxplot([x1, x2], {'3', '10'}); 
[h,p] = ttest2(x1, x2)

h =

     1


p =

    0.0423

Two-tailed Significance Test:

One-tailed Significance Test:

Common Hypothesis Tests: