1. 程式人生 > >分類問題的常用評價指標precision和recall

分類問題的常用評價指標precision和recall

對於二分類問題常用的評價指標是精確率(precision)以及召回率(recall)。

通常,以關注的類為正類,其他的類為負類。

則在預測的時候會有如下四種情況:

  • TP——將正類預測為正類的數量
  • FN——將正類預測為負類的數量
  • FP——將負類預測為正類的數量
  • TN——將負類預測為負類的數量

精確率定義為:precision=TP/(TP+FP)  

即在預測為正類的結果集中,真的為正類的比例定義為準確率。

召回率定義為:recall=TP/(TP+FN)

即在所有的正類中,被成功預測為正類的數量。

形象一點的例子:假設現在有一大群動物,正類為老虎。現在我們將判別每一隻動物的種類。

那麼準確率就是:在我們判定為老虎的動物中,precision=真老虎的數量 / 我們認為是老虎的數量。

而召回率就是:我們成功判定的老虎數量 / 所有真老虎的數量