1. 程式人生 > >分類和迴歸模型常用的效能評價指標

分類和迴歸模型常用的效能評價指標

在預測任務中,給定樣例集 D = { ( x 1 , y

1 ) , ( x 2 , y 2
) , , ( x m , y
m
) } D=\lbrace(x_1,y_1),(x_2,y_2),\ldots,(x_m,y_m)\rbrace ,其中 y i y_i 是示例 x i x_i 的真實標記, m m 表示樣例數量, m + m^+ m m^- 分別表示正例和反例的數量。

迴歸任務

均方誤差(mean squared error)

E ( f ; D ) = 1 m i = 0 m ( f ( x i ) y i ) 2 E(f;D)=\frac{1}{m}\sum_{i=0}^{m}{(f(x_i)-y_i)^2}

均方根誤差(Root Mean Squared Error, RMSE)

E ( f ; D ) = 1 m i = 0 m ( f ( x i ) y i ) 2 E(f;D)=\sqrt{\frac{1}{m}\sum_{i=0}^{m}{(f(x_i)-y_i)^2}}

平均絕對百分比誤差(Mean Absolute Percent Error, MAPE)

E ( f ; D ) = 1 m i = 0 m y i f ( x i ) y i E(f;D)=\frac{1}{m}\sum_{i=0}^{m}{\left|\frac{y_i-f(x_i)}{y_i} \right|}

MAPE相比於MSE和RMSE,不易受個別離群點影響,魯棒性更強。

分類任務

錯誤率

分類錯誤的樣本數佔總樣本數的比例。
E ( f ; D ) = 1 m i = 0 m I ( f ( x i ) y i ) E(f;D)=\frac{1}{m}\sum_{i=0}^{m}{ \mathbb{I} (f(x_i)\neq y_i)}
其中, I ( ) \mathbb{I}(\cdot) 為指示函式,在 \cdot 為真時取1,否則取0。

精度(Precision)

分類正確的樣本數佔總樣本數的比例。
a c c ( f ; D ) = 1 m i = 0 m I ( f ( x i ) = y i ) = 1 E ( f ; D ) acc(f;D)=\frac{1}{m}\sum_{i=0}^{m}{ \mathbb{I} (f(x_i)= y_i)}=1-E(f;D)

平均精度(Average Precision, AP)

每個類別下的樣本準確率的算術平均。
a c c ( f ; D ) = 1 2 ( i = 0 m I ( f ( x i ) = y i ) I ( y i = 1 ) m + + i = 0 m I ( f ( x i ) = y i ) I ( y i = 1 ) m ) acc(f;D)=\frac{1}{2}\left(\frac{\sum_{i=0}^{m}{ \mathbb{I} (f(x_i)= y_i)\cdot\mathbb{I} (y_i=1)}}{m^+}+\frac{\sum_{i=0}^{m}{ \mathbb{I} (f(x_i)= y_i)\cdot\mathbb{I} (y_i=-1)}}{m^-} \right)