1. 程式人生 > >混淆矩陣confusion matrix, 準確率,召回率

混淆矩陣confusion matrix, 準確率,召回率

混淆矩陣

. 預測正確(接受) 預測錯誤(拒絕)
TP TN(第一類分類錯誤,去真) P
FP(第二類分類錯誤,存偽) FN N

列表示:實際屬性
行表示:預測值

  • FP
    第一類分類錯誤

  • TN
    第二類分類錯誤

  • FPrate

    FPRate=FPN=FPTN+FP
  • Specificity

    Specificity=1FPRate=TNN=TN
    FN+FP
  • Recall


    Recall=TPP=TPTP+TN
  • Precision

    Precision=TPTP+FP
  • Accuracy

Accuracy=TP+FNP+N
  • Fscore
    FScore=Precision×Recall

以上這些都屬於靜態的指標,當正負樣本不平衡時它會存在著嚴重的問題。極端情況下比如正負樣本比例為1:99(這在有些領域並不少見),那麼一個基準分類器只要把所有樣本都判為負,它就擁有了99%的精確度,但這時的評價指標是不具有參考價值的。另外就是,現代分類器很多都不是簡單地給出一個0或1的分類判定,而是給出一個分類的傾向程度,比如貝葉斯分類器輸出的分類概率。對於這些分類器,當你取不同閾值,就可以得到不同的分類結果及分類器評價指標,依此人們又發明出來ROC曲線以及AUC(曲線包圍面積)指標來衡量分類器的總體可信度。

視覺化解釋

  • 圖表示

  • 計算Precision 的點

Precision=1111+10
  • 計算Recall的點