精確率，查準率，召回率

阿新 • • 發佈：2018-12-15

精確率（Precision），又稱為“查準率”。
召回率（Recall），又稱為“查全率”。
召回率和精確率是廣泛用於資訊檢索和統計學分類領域的兩個度量值，用來評價結果的質量。其中召回率是是檢索出的相關文件數和文件庫中所有的相關文件數的比率，衡量的是檢索系統的查全率。精確率是檢索出的相關文件數與檢索出的文件總數的比率，衡量的是檢索系統的查準率。如以下公式所示：

召回率(Recall) = 系統檢索到的相關檔案 / 系統所有相關的檔案總數

精確率(Precision) = 系統檢索到的相關檔案 / 系統所有檢索到的檔案總數
1
2
3
下面這個例子可以有助於對精確率和召回率兩個概念的理解：

在一個數據庫中有1000個文件，其中有100個是與NBA相關的，系統檢索出75個文件，其中，只有50個是與NBA相關，此時：

精確率 = 50 / 75 = 67%

召回率 = 50 / 100 = 50%

上面的檢索為第一次檢索，同樣的環境下改變檢索技術後進行第二次檢索，系統檢索出150個文件，其中，90個是與NBA相關的，此時：

精確率 = 90 / 150 = 60%

召回率 = 90 / 100 = 90%

我們發現，精確率和召回率是互相影響的，理想情況下肯定是做到兩者都高，但是一般情況下準確率高、召回率就低，召回率低、準確率高，當然如果兩者都低，那是什麼地方出問題了。

F度量（F-measure），結合精確率和召回率。
基於上文，不難得出準確率與召回率兩者基本存在一種“互補”的關係，簡單描述就有點像天平的兩端，你大我小，或者你小我大（這個比喻可能不是非常嚴謹）。所以在具體的應用當中，我們應該以哪一個指標為主呢？有沒有一個綜合的指標涵蓋了這兩個指標呢？此時，就需要引出F度量。F值的計算公式如下：
F1=2∗P∗R/(P+R)
F1=2∗P∗R/(P+R)

結合上文的例子，利用上述公式計算得到，第一次檢索的F1為57%，第二次檢索的F1為72%，顯然改變技術後的檢索效果優於改變前。
Map（mean Average Precision）
mAP是為解決P，R，F-measure的單點值侷限性的。為了得到一個能夠反映全域性效能的指標，可以看考察下圖，其中兩條曲線(方塊點與圓點)分佈對應了兩個檢索系統的精確率-召回率曲線。可以看出，雖然兩個系統的效能曲線有所交疊但是以圓點標示的系統的效能在絕大多數情況下要遠好於用方塊標示的系統。從中我們可以發現一點，如果一個系統的效能較好，其曲線應當儘可能的向上突出。更加具體的，曲線與座標軸之間的面積應當越大。最理想的系統，其包含的面積應當是1，而所有系統的包含的面積都應當大於0。

這就是用以評價資訊檢索系統的最常用效能指標，平均準確率mAP其規範的定義如下:(其中P，R分別為精確率與召回率)。

ROC（Receiver Operating Characteristic）
AUC（Area Under roc Curve）
ROC和AUC是評價分類器的指標，上面第一個圖的ABCD仍然使用，只是需要稍微變換。

回到ROC上來，ROC的全名叫做Receiver Operating Characteristic。
ROC關注兩個指標

True Positive Rate ( TPR ) = TP / [ TP + FN] ，TPR代表能將正例分對的概率

False Positive Rate( FPR ) = FP / [ FP + TN] ，FPR代表將負例錯分為正例的概率

在ROC 空間中，每個點的橫座標是FPR，縱座標是TPR，這也就描繪了分類器在TP（真正的正例）和FP（錯誤的正例）間的trade-off。ROC的主要分析工具是一個畫在ROC空間的曲線——ROC curve。我們知道，對於二值分類問題，例項的值往往是連續值，我們通過設定一個閾值，將例項分類到正類或者負類（比如大於閾值劃分為正類）。因此我們可以變化閾值，根據不同的閾值進行分類，根據分類結果計算得到ROC空間中相應的點，連線這些點就形成ROC curve。ROC curve經過（0,0）（1,1），實際上(0, 0)和(1, 1)連線形成的ROC curve實際上代表的是一個隨機分類器。一般情況下，這個曲線都應該處於(0, 0)和(1, 1)連線的上方。如圖所示。

用ROC curve來表示分類器的performance很直觀好用。可是，人們總是希望能有一個數值來標誌分類器的好壞。

於是Area Under roc Curve(AUC)就出現了。顧名思義，AUC的值就是處於ROC curve下方的那部分面積的大小。通常，AUC的值介於0.5到1.0之間，較大的AUC代表了較好的Performance。
---------------------
作者：yuanCruise
來源：CSDN
原文：https://blog.csdn.net/qiu931110/article/details/80197754
版權宣告：本文為博主原創文章，轉載請附上博文連結！

精確率，查準率，召回率

精確率，查準率，召回率

斯坦福大學公開課機器學習：machine learning system design | trading off precision and recall（F score公式的提出：學習算法中如何平衡（取舍）查準率和召回率的數值）

準確率（Precision查準率）召回率（Recall查全率）和F-Meansure、mAP

機器學習之分類(Classification) 精確率、準確率、召回率

簡單的解釋一下查準率和召回率

準確率、查準率、召回率

詳解Precision（查準率，精確率），Recall（查全率，召回率），Accuracy（準確率）

二分類相關評估指標（召回率、準確率，精確率，F度量，AUC和ROC）

機器學習模型準確率，精確率，召回率，F-1指標及ROC曲線

（轉載）準確率（accuracy），精確率（Precision），召回率（Recall）和綜合評價指標（F1-Measure ）-絕對讓你完全搞懂這些概念

準確率（accuracy），精確率（Precision），召回率（Recall）和綜合評價指標（F1-Measure ）

精確率與召回率，RoC曲線與PR曲線

mAP，召回率（Recall），精確率（Precision）

準確率(Accuracy), 精確率(Precision), 召回率(Recall)和F1-Measure，confusion matrix

【YOLO學習】召回率（Recall），精確率（Precision），平均正確率（Average_precision(AP) ），交除並（Intersection-over-Union（IoU））

召回率，精確率，mAP如何計算

[機器學習]模型評價參數，準確率，召回率，F1-score

CS229 7.2 應用機器學習方法的技巧，準確率，召回率與 F值

模型評估的基本概念以及ROC/AUC（召回率(查全率、覆蓋率)/取偽率(負召回率 )/精確率(命中率、查準率)/準確率）

【深度學習-機器學習】分類度量指標 : 正確率、召回率、靈敏度、特異度，ROC曲線、AUC等

精確率，查準率，召回率

相關推薦