Python3寫精確率(precision)、召回率(recall)以及F1分數(F1_Score)

阿新 • • 發佈：2018-12-05

1. 四個概念定義：TP、FP、TN、FN

先看四個概念定義：
- TP，True Positive
- FP，False Positive
- TN，True Negative
- FN，False Negative

如何理解記憶這四個概念定義呢？

舉個簡單的二元分類問題例子：

假設，我們要對某一封郵件做出一個判定，判定這封郵件是垃圾郵件、還是這封郵件不是垃圾郵件？

如果判定是垃圾郵件，那就是做出（Positive）的判定；
如果判定不是垃圾郵件，那就做出（Negative）的判定。

True Positive（TP）意思表示做出Positive的判定，而且判定是正確的。因此，TP的數值表示正確的Positive判定的個數。
同理，False Positive（TP）數值表示錯誤的Positive判定的個數。
依此，True Negative（TN）數值表示正確的Negative判定個數。
False Negative（FN）數值表示錯誤的Negative判定個數。

程式碼實現：

import numpy as np

y_true = np.array([0, 1, 1, 0, 1, 0])
y_pred = np.array([1, 1, 1, 0, 0, 1])

#true positive
TP = np.sum(np.logical_and(np.equal(y_true,1),np.equal(y_pred,1)))
print(TP)

#false positive
FP = np.sum(np.logical_and(np.equal(y_true,0),np.equal(y_pred,1)))
print(FP)

#true negative
TN = np.sum(np.logical_and(np.equal(y_true,1),np.equal(y_pred,0)))
print(TN)

#false negative
FN = np.sum(np.logical_and(np.equal(y_true,0),np.equal(y_pred,0)))
print(FN)

2. Precision、Recall、Accuracy、F1 Score（F Score，F Measure）

四個概念定義：

- precision = TP / (TP + FP)
- recall = TP / (TP + FN)
- accuracy = (TP + TN) / (TP + FP + TN + FN)
- F1 Score = 2*P*R/(P+R)，其中P和R分別為 precision 和 recall

為什麼要有F1 Score?也稱F1 Mersure，這是因為通常情況下，precision高的話，recall就會低；precision低的時候，recall往往比較高。為了權衡這種關係(tradeoff)，所以有了F值。

當=1時候，也就是我們常說的F1 Score。

程式碼實現：

#請先安裝sklearn、numpy庫
from sklearn.metrics import precision_score, recall_score, f1_score
import numpy as np

y_true = np.array([[0, 1, 1],
                   [0, 1, 0]])
y_pred = np.array([[1, 1, 1],
                   [0, 0, 1]])

y_true = np.reshape(y_true, [-1])
y_pred = np.reshape(y_pred, [-1])

p = precision_score(y_true, y_pred, average='binary')
r = recall_score(y_true, y_pred, average='binary')
f1score = f1_score(y_true, y_pred, average='binary')

print(p)
print(r)
print(f1score)

在推薦系統裡實現precision、recall以及F1 Score：

R(u)表示根據使用者在訓練集上的行為給使用者做出的Top-n推薦列表，

T(u)表示系統向用戶推薦標籤後，使用者實際選擇的物品集

def Precision_Recall_F1Score(train,test,N):
    hit = 0
    n_recall = 0
    n_precision = 0
    for user in train.keys():
        tu = test[user]
        rank = Recommend(user,N)
        for item ,pui in rank:
            if item in tu:
                hit += 1
        n_recall += len(tu)
        n_precision += N
    recall = hit / (1.0 * n_recall)
    precision = hit / (1.0 * n_precision)
    F1 = (2 * precision * recall) / (precision + recall)
    return [precision, recall, F1]

其中Recommend()函式為推算演算法，本文僅給出使用precision，recall以及F值來作為評測指標的程式碼實現部分

參考文獻：

[1] https://www.cnblogs.com/jiangyi-uestc/p/6044282.html

[2] https://blog.csdn.net/blythe0107/article/details/75003890

[3] 項亮，陳義，王益，推薦系統實踐[M]. 河北：人民郵電出版社, 2012:26-43

Python3寫精確率(precision)、召回率(recall)以及F1分數(F1_Score)

1. 四個概念定義：TP、FP、TN、FN

2. Precision、Recall、Accuracy、F1 Score（F Score，F Measure）

Python3寫精確率(precision)、召回率(recall)以及F1分數(F1_Score)

推薦系統評測指標—精準率(Precision)、召回率(Recall)、F值(F-Measure)

準確率accuracy、精確率precision和召回率recall

推薦系統評測指標—準確率(Precision)、召回率(Recall)、F值(F-Measure)

系統評測指標—準確率(Precision)、召回率(Recall)、F值(F-Measure)

機器學習和推薦系統中的評測指標—準確率(Precision)、召回率(Recall)、F值(F-Measure)簡介

機器學習演算法中的準確率(Precision)、召回率(Recall)、F值(F-Measure)

效能度量：準確率(Precision)、召回率(Recall)、F值(F-Measure)；P-R曲線；ROC；AUC

混淆矩陣、精度precision、召回率recall、準確率accuracy、F1值

推薦系統評測指標—準確率(Precision)、召回率(Recall)、F值(F-Measure)_DM

自然語言處理技術之準確率(Precision)、召回率(Recall)、F值(F-Measure)簡介

評估指標：準確率(Precision)、召回率(Recall)以及F值(F-Measure)

準確率(accuracy),精確率(Precision)和召回率(Recall),AP,mAP的概念

機器學習：準確率(Precision)、召回率(Recall)、F值(F-Measure)、ROC曲線、PR曲線

精確率（Precision）、召回率（Recall）、F1-score、ROC、AUC

精確率（準確率、查準率、precision）、召回率（查全率、recall）、RoC曲線、AUC面積、PR曲線

精確率、召回率、F1 值、ROC、AUC 各自的優缺點是什麽？

機器學習實踐（十五）—sklearn之分類演算法-邏輯迴歸、精確率、召回率、ROC、AUC

機器學習效能評估指標（精確率、召回率、ROC、AUC）

NLP-準確率、精確率、召回率和F1值

Python3寫精確率(precision)、召回率(recall)以及F1分數(F1_Score)

1. 四個概念定義：TP、FP、TN、FN

2. Precision、Recall、Accuracy、F1 Score（F Score，F Measure）

相關推薦