1. 程式人生 > >掃盲記-第七篇--常見深度學習模型評估指標

掃盲記-第七篇--常見深度學習模型評估指標

index 預測類別 采樣 als 並集 尋找 清晰 質量 重要

學習來源 公眾號:有三AI https://mp.weixin.qq.com/s/u-QTHFSA-8rwvL0KBVYXjQ

深度學習模型評估指標

一個深度學習模型在各類任務中的表現都需要定量的指標進行評估,才能夠進行橫向的對比比較,包含了分類、回歸、質量評估、生成模型中常用的指標。

1 分類評測指標

圖像分類是計算機視覺中最基礎的一個任務,也是幾乎所有的基準模型進行比較的任務,從最開始比較簡單的10分類的灰度圖像手寫數字識別mnist,到後來更大一點的10分類的cifar10和100分類的cifar100,到後來的imagenet,圖像分類任務伴隨著數據庫的增長,一步一步提升到了今天的水平。現在在Imagenet這樣的超過1000萬圖像,2萬類的數據集中,計算機的圖像分類水準已經超過了人類。

圖像分類,顧名思義就是一個模式分類問題,它的目標是將不同的圖像,劃分到不同的類別,實現最小的分類誤差,這裏只考慮單標簽分類問題,即每一個圖片都有唯一的類別。

對於單個標簽分類的問題,評價指標主要有AccuracyPrecisionRecallF-scorePR曲線,ROCAUC

在計算這些指標之前,先計算幾個基本指標,這些指標是基於二分類的任務,也可以拓展到多分類: