準確率，召回率，F1 值、ROC，AUC、mse,mape評價指標

阿新 • • 發佈：2019-01-01

在機器學習、資料探勘領域，工業界往往會根據實際的業務場景擬定相應的業務指標。本文旨在一起學習比較經典的三大類評價指標，其中第一、二類主要用於分類場景、第三類主要用於迴歸預測場景，基本思路是從概念公式，到優缺點，再到具體應用（分類問題，本文以二分類為例）。

1.準確率P、召回率R、F1 值

定義
- 準確率（Precision）：P=TP/(TP+FP)。通俗地講，就是預測正確的正例資料佔預測為正例資料的比例。
- 召回率（Recall）：R=TP/(TP+FN)。通俗地講，就是預測為正例的資料佔實際為正例資料的比例
- F1值（F score）：
思考
- 正如下圖所示，F1的值同時受到P、R的影響，單純地追求P、R的提升並沒有太大作用。在實際業務工程中，結合正負樣本比，的確是一件非常有挑戰的事。
- 影象展示
- 下面附上原始碼

import numpy as np
import matplotlib.pyplot as plt
from mpl_toolkits.mplot3d import Axes3D
from matplotlib import cm

fig = plt.figure()
ax = fig.add_subplot(111,projection='3d')
x = np.linspace(0,1,100)
p,r = np.meshgrid(x,x)    #meshgrid函式建立一個二維的座標網路
z = 2*p*r/(p+r)
ax.plot_surface(x,y,z,rstride=4,cstride=4,cmap=cm.YlGnBu_r)
ax.set_title('F1')  #標題
ax.set_xlabel('precision')   #x軸標籤
ax.set_ylabel('recall')   #y軸標籤
plt.show()

2.ROC、AUC

概念
- TPR=TP/(TP+FN)=TP/actual positives
- FPR=FP/(FP+TN)=FP/actual negatives
- ROC是由點（TPR,FPR）組成的曲線，AUC就是ROC的面積。AUC越大越好。
- 一般來說，如果ROC是光滑的，那麼基本可以判斷沒有太大的overfitting
影象展示
程式碼

library(ROCR)
p=c(0.5,0.6,0.55,0.4,0.7)
y=c(1,1,0,0,1)
pred = prediction(p, y)
perf = performance(pred,"tpr","fpr")
plot(perf,col="blue",lty=3, lwd=3,cex.lab=1.5, cex.axis=2, cex.main=1.5,main="ROC plot")

python計算AUC

from sklearn import metrics
def aucfun(act,pred):
  fpr, tpr, thresholds = metrics.roc_curve(act, pred, pos_label=1)
  return metrics.auc(fpr, tpr)

直接利用AUC優化分類任務（R語言版）

#生成訓練資料
set.seed(1999)
x1 = rnorm(1000)          
x2 = rnorm(1000)
z = 1 + 2*x1 + 3*x2       
pr = 1/(1+exp(-z))        
y = rbinom(1000,1,pr)     

#使用logloss作為訓練目標函式
df = data.frame(y=y,x1=x1,x2=x2)
glm.fit=glm( y~x1+x2,data=df,family="binomial")

#下面使用auc作為訓練目標函式
library(ROCR)

CalAUC <- function(real,pred){
  rocr.pred=prediction(pred,real)
  rocr.perf=performance(rocr.pred,'auc')
  as.numeric([email protected])
}
#初始值
beta0=c(1,1,1)

loss <- function(beta){
  z=beta[1]+beta[2]*x1+beta[3]*x2
  pred=1/(1+exp(-z))
  -CalAUC(y,pred)
}

res=optim(beta0,loss,method = "Nelder-Mead",control = list(maxit = 100))

3.PRC、ROC比較

AUC是ROC的積分（曲線下面積），是一個數值，一般認為越大越好，數值相對於曲線而言更容易當做調參的參照。
PR曲線會面臨一個問題，當需要獲得更高recall時，model需要輸出更多的樣本，precision可能會伴隨出現下降/不變/升高，得到的曲線會出現浮動差異（出現鋸齒），無法像ROC一樣保證單調性。
在正負樣本分佈得極不均勻(highly skewed datasets)的情況下，PRC比ROC能更有效地反應分類器的好壞。

4.mape平均絕對百分誤差

定義
技巧
- 在sklearn中，對於迴歸任務，一般都提供了mse損失函式（基於樹的模型除外）。但有時我們會遇到sklearn中沒有定義的損失函式，那麼我們可以自定重寫模型或者定義函式，下面以xgboost為模型，mape作為損失函式為例（grad、hess分別對應損失函式一階導、二階導）。
- 程式碼

def mapeobj(preds,dtrain):
    gaps = dtrain.get_label()
    grad = np.sign(preds-gaps)/gaps
    hess = 1/gaps
    grad[(gaps==0)] = 0
    hess[(gaps==0)] = 0
    return grad,hess  

def evalmape(preds, dtrain):
    gaps = dtrain.get_label()
    err = abs(gaps-preds)/gaps
    err[(gaps==0)] = 0
    err = np.mean(err)
    return 'error',err

準確率，召回率和F1值

正確率、召回率和F值是在魚龍混雜的環境中，選出目標的重要評價指標。不妨看看這些指標的定義先：正確率 = 正確識別的個體總數 / 識別出的個體總數召回率 = 正確識別的個體總數 / 測試集中存在的個體總數 F值 = 正確

準確率，召回率，F1 值、ROC，AUC、mse,mape評價指標

在機器學習、資料探勘領域，工業界往往會根據實際的業務場景擬定相應的業務指標。本文旨在一起學習比較經典的三大類評價指標，其中第一、二類主要用於分類場景、第三類主要用於迴歸預測場景，基本思路是從概念公式，到

CS229 7.2 應用機器學習方法的技巧，準確率，召回率與 F值

建立模型當使用機器學習的方法來解決問題時，比如垃圾郵件分類等，一般的步驟是這樣的： 1）從一個簡單的演算法入手這樣可以很快的實現這個演算法，並且可以在交叉驗證集上進行測試； 2）畫學習曲線以決定是否更多的資料，更多的特徵或者其他方式會有所幫助； 3）人工檢查那些演算法預測錯誤的例子（在交叉驗證集上）

NLP-準確率、精確率、召回率和F1值

記錄準確率(Accuracy)、精確率(Precision)、召回率(Recall)和F1值(F-Measure)計算公式，和如何使用TensorFlow實現一、計算公式二、TensorFlow實現 # Accuracy w

機器學習之分類問題的評估指標2---準確率、精確率、召回率以及F1值

本節主要了解一下sklearn.metrics下計算準確率、精確率、召回率和F1值的函式以及對於多分類問題計算時的理解 1、sklearn.metrics.accuracy_score(y_true, y_pred, normalize=True, sample_weigh

準確率，召回率，F1 值、ROC，AUC、mse，mape 評價指標

在機器學習、資料探勘領域，工業界往往會根據實際的業務場景擬定相應的業務指標。本文旨在一起學習比較經典的三大類評價指標，其中第一、二類主要用於分類場景、第三類主要用於迴歸預測場景，基本思路是從概念公式，到優缺點，再到具體應用（分類問題，本文以二分類為例）。 1.準確率P、召回

使用LogisticRegression和SGDClassifier對良/惡性腫瘤進行分類，並計算出準確率召回率和F1的值

# -*- coding: utf-8 -*- """ Created on Tue Oct 24 10:08:40 2017 @author: liuyajun """ import pandas as pd import numpy as np from sklearn

R語言︱分類器的效能表現評價（混淆矩陣，準確率，召回率，F1,mAP、ROC曲線）

筆者寄語：分類器演算法最後都會有一個預測精度，而預測精度都會寫一個混淆矩陣，所有的訓練資料都會落入這個矩陣中，而對角線上的數字代表了預測正確的數目，即True Positive+True Nagetive。——————————————————————————相關內容：————

資料分析，資訊檢索，分類體系中常用指標簡明解釋——關於準確率、召回率、F1、AP、mAP、ROC和AUC

在資訊檢索、分類體系中，有一系列的指標，搞清楚這些指標對於評價檢索和分類效能非常重要，因此最近根據網友的部落格做了一個彙總。準確率、召回率、F1 資訊檢索、分類、識別、翻譯等領域兩個最基本指標是召回率(Recall Rate)和準確率(Precision Rate)，召回率也叫查全率，準確率也叫查準

[機器學習]模型評價參數，準確率，召回率，F1-score

就是 ddl .com gpo sci 擔心 height 數據 -s 很久很久以前，我還是有個建築夢的大二少年，有一天，講圖的老師看了眼我的設計圖，說：“我覺得你這個設計做得很緊張”，當時我就崩潰，對緊張不緊張這樣的評價標準理解無能。多年後我終於明白老師當年的意思，然鵝已

（轉載）準確率（accuracy），精確率（Precision），召回率（Recall）和綜合評價指標（F1-Measure ）-絕對讓你完全搞懂這些概念

自然語言處理(ML),機器學習(NLP),資訊檢索(IR)等領域,評估(evaluation)是一個必要的工作,而其評價指標往往有如下幾點:準確率(accuracy),精確率(Precision),召回率(Recall)和F1-Measure。本文將簡單介紹其中幾個概念。中文中這幾個評價指標翻譯各有不同，

準確率（accuracy），精確率（Precision），召回率（Recall）和綜合評價指標（F1-Measure ）

自然語言處理(ML),機器學習(NLP),資訊檢索(IR)等領域,評估(evaluation)是一個必要的工作,而其評價指標往往有如下幾點:準確率(accuracy),精確率(Precision),召回率(Recall)和F1-Measure。本文將簡單介紹其中幾個概念。

準確率和召回率，以及評價標準F1 score

一.準確率和召回率 T為相應的情況的個數實際為真實際為假預測為真T1T3預測為假T2T4 準確率(accuracy)的計算公式是：A=(T1+T4)/(T1+T2+T3+T4) 查準率(precision)的計算公式是： P=(T1)/(T1+T3)

準確率，召回率，F值（Precision & Recall）

在資訊檢索，文類問題中，我們會遇到準確率(Precision)，召回率(Recall)，和F值(F-Measure又稱為F-Score)。網上對於這些定義已經有很詳細的解釋，我在此再寫一下，用作自己複習之用如果有雷同，請告知。召回率(R

我對於準確率---p值，召回率R值以及F值的理解

再網際網路廣告的推薦系統和反作弊的實踐中經常遇到準確率，召回率，F值幾個東西，剛入行的時候，我經常搞混，直到後來我逐漸明白了。舉個列子！我們用一個模型去判斷一段時間的作弊流量，假設該段時間的流量是100個，作弊的是25個，沒有作弊的是75個，假設這裡正樣本為沒有作弊的流量。然

機器學習模型準確率，精確率，召回率，F-1指標及ROC曲線

01準確率，精確率，召回率，F-1指標及ROC曲線假設原樣本有兩類，正樣本True和負樣本False 正樣本 -------------------------------True 負樣本 --------------------------------False 真正樣本 True P

【機器學習筆記】：一文讓你徹底理解準確率，精準率，召回率，真正率，假正率，ROC/AUC

作者：xiaoyu 微信公眾號：Python資料科學非經作者允許，禁止任何商業轉載。 ROC/AUC作為機器學習的評估指標非常重要，也是面試中經常出現的問題（80%都會問到）。其實，理解它並不是非常難，但是好多朋友都遇到了一個相同的問題，那就是：每次看書的時候

精確度，準確率，召回率，漏警概率，虛警概率

一組樣本，個數為M，正例有P個，負例有N個，判斷為正例的正例有TP個，判斷為負例的正例有FN個(假的負例）P=TP+FN 判斷為負例的負例為TN個，判斷為正例的負例有FP個（假的正例）N=TN+FP 精確度（Precision）P=所有判斷為正例的例子中，真正為正例的所佔

【機器學習－西瓜書】二、效能度量：召回率；P-R曲線；F1值；ROC;AUC

關鍵詞：準確率（查準率，precision）；召回率（查全率，recall）；P-R曲線，平衡點（Break-Even Point， BEP）；F1值，F值；ROC（Receiver Operating Characteristic，受試者工作特徵）；AUC（A

詳解Precision（查準率，精確率），Recall（查全率，召回率），Accuracy（準確率）

　　中文的翻譯有點亂，大致是這樣的：Precision（查準率，精確率），Recall（查全率，召回率），Accuracy（準確率）。下面提到這三個名詞都用英文表示。　　從一個例子入手：我們訓練了一個識貓模型，送一張圖片給模型，模型就能告訴你該圖片是否有貓。目標是找出所有有貓圖片。

準確率，召回率，F1 值、ROC，AUC、mse,mape評價指標

1.準確率P、召回率R、F1 值

2.ROC、AUC

3.PRC、ROC比較

4.mape平均絕對百分誤差

相關推薦