分類模型的效果評估

阿新 • • 發佈：2018-12-22

資料探勘建模中最後一步就是對模型進行效果評估，驗證模型的效能，讓你的模型具有說服力，本文對分類模型的評估做了彙總，並結合Sklearn講解如何繪製ROC曲線、PR曲線。

混淆矩陣
在這裡插入圖片描述
真正例TP（True Positive）、假負例FN（False Negative）
假正例FP（False Positive）、真負例TN（True Negative）
分類評價指標說明：

精準率（Precision）也稱查準率，表示模型預測結果為正樣本的樣例中，真實情況為正樣本的樣例所佔比例。
$precision= \frac{TP}{TP+FP}$
召回率（Recall）也稱查全率，表示真實情況為正樣本的樣例中，被模型預測為正樣本的比例。
準確率（Accuracy）表示模型預測準的樣例佔總樣本的比例。但是在實際建模中，很少使用這麼指標，因為在正樣本和負樣本不均衡時，假如正樣本950個，負樣本50個，這是隨意亂猜都為正樣本，準確率也可以的高達95%,因此在樣本分佈不均時，一般不看這個指標，而是採用F1指標。
F1也稱F1_score,它是基於精準率和召回率的調和平均值。P指的是Precision，R指的是Recall
Fβ對精準率和召回率設定不同的權重，區別對待,
當β>1時更看重召回率（查全率）；當β<1時更看重精準率（查準率）；當β=1時即為F1值。
真正例率TPR、假正例率FPR
ROC_AUC表示ROC曲線下方的面積，橫軸FPR，縱軸TPR，這才是實際建模中經常使用的衡量分類模型的效果的指標。
PR_AUC表示PR曲線下方的面積，橫軸Precision、縱軸Recall

9.以上指標針對二分類，判斷多分類指標時，使用以下方法：

對各個混淆矩陣分別計算Precision和Recall，從而使用巨集精準率macro_precison、巨集召回率macro_recall、巨集F1 macro_F1
對各混淆矩陣中對應元素（TP、FN、FP、TN）分別求平均值，從而使用微精準率micro_precison、微召回率micro_recall、微F1 micro_F1

利用Python畫ROC曲線

def draw_roc(y_test, prob_test_list, clf_name='None'):
    '''畫roc_auc曲線'''
    fpr0, tpr0, _ = roc_curve(y_test, prob_test_list[0])
    fpr1, tpr1, _ = roc_curve(y_test, prob_test_list[1])

    roc_auc0 = auc(fpr0, tpr0)
    roc_auc1 = auc(fpr1, tpr1)
    plt.title('ROC_AUC_CURVE')
    plt.plot(fpr0, tpr0, 'b', label='RF AUC = %0.2f' % roc_auc0)
    plt.plot(fpr1, tpr1, 'g', label='LR AUC = %0.2f' % roc_auc1)
    plt.legend(loc='lower right')
    plt.plot([0, 1], [0, 1], 'r--')
    plt.xlim([0, 1])
    plt.ylim([0, 1])
    plt.ylabel('True Positive Rate')
    plt.xlabel('False Positive Rate')
    plt.show()
    plt.savefig('../pic/%s_roc_auc.png' % clf_name)

畫K-Fold 的ROC曲線

def draw_k_fold_roc(X,Y,clf,clf_name):
    '''k折roc_auc曲線，X,Y為陣列ndarray格式'''
    cv = StratifiedKFold(n_splits=5, shuffle=True, random_state=None)
    prob_list=[]
    label_list=[]
    for train, test in cv.split(X, Y):
        print(X[train])
        pred_prob=clf.fit(X[train],Y[train]).predict_proba(X[test])[:,1]
        prob_list.append(pred_prob)
        label_list.append(Y[test])

    plt.title('ROC_AUC_CURVE')
    for i in range(5):
        fpr, tpr, _ = roc_curve(label_list[i], prob_list[i])
        roc_auc = auc(fpr, tpr)
        plt.plot(fpr, tpr, i, label='%s AUC = %0.2f' % (clf_name,roc_auc),alpha=0.5)

    plt.legend(loc='lower right')
    plt.plot([0, 1], [0, 1], 'r--')
    plt.xlim([0, 1])
    plt.ylim([0, 1])
    plt.ylabel('True Positive Rate')
    plt.xlabel('False Positive Rate')
    plt.show()
    plt.savefig('../pic/%s_kfold_roc_auc.png' % clf_name)

利用Python畫PR曲線

def get_pr_roc_and_coords(model_list,X_train,y_train,X_test,y_test,save_dir):
    # 畫出訓練集和驗證集的AUC圖以及PR曲線圖
    pr_coord_all=pd.DataFrame()
    roc_coord_all=pd.DataFrame()
    model_reports=[]
    clf_confu_matrixs=[]
    for model_info in model_list:
        model=model_info.get('model')
        model_name=model_info.get('model_name')
        model_fullname=model_info.get('model_fullname')
        model.fit(X_train,y_train)

        # pred_train_label=model.predict(X_train)
        pred_train_prob=model.predict_proba(X_train)[:,1]
        pred_test_label=model.predict(X_test)
        pred_test_prob=model.predict_proba(X_test)[:,1]


        # 畫訓練集和驗證集的roc_auc圖
        plt.figure()
        fpr_train, tpr_train, thresholds_roc_train = roc_curve(y_train, pred_train_prob)
        fpr_test, tpr_test, thresholds_roc_test = roc_curve(y_test, pred_test_prob)
        roc_auc_train = auc(fpr_train, tpr_train)
        roc_auc_test = auc(fpr_test, tpr_test)

        plt.plot(fpr_train, tpr_train, lw=2, alpha=0.8, color="r",
                 label='(train AUC = %0.3f)' % (roc_auc_train))
        plt.plot(fpr_test, tpr_test, lw=2, alpha=0.8, color="b",
                 label='(validation AUC = %0.3f)' % (roc_auc_test))
        plt.plot([0, 1], [0, 1], linestyle='--', lw=2, color='r',
                 label='Reference Line', alpha=.8)
        plt.legend(loc="lower right")
        plt.xlim([0, 1])
        plt.ylim([0, 1])
        plt.xlabel('False Positive Rate')
        plt.ylabel('True Positive Rate')
        plt.title('%s ROC_curve'%model_fullname)
        plt.savefig(save_dir+'/%s_roc.png'%model_name)
        # plt.show()
        plt.close()


        # 畫訓練集和驗證集的pr曲線
        plt.figure()
        precision_train, recall_train, thresholds_pr_train = precision_recall_curve(y_train, pred_train_prob)
        precision_test, recall_test, thresholds_pr_test = precision_recall_curve(y_test, pred_test_prob)
        AP_train = average_precision_score(y_train, pred_train_prob)
        AP_test = average_precision_score(y_test, pred_test_prob)

        plt.plot(recall_test, precision_test, lw=2, alpha=0.8, color="b",
                 label='(validation set AUC = %0.3f)' % (AP_test))
        plt.plot(recall_train, precision_train, lw=2, alpha=0.8, color="r",
                 label='(train set AUC = %0.3f)' % (AP_train))
        plt.legend(loc="upper right")
        plt.xlim([0, 1])
        plt.ylim([0, 1])
        plt.xlabel('Recall')
        plt.ylabel('Precision')
        plt.title('%s PR_Curve'%model_fullname)
        plt.savefig(save_dir+'/%s_pr.png'%model_name)
        # plt.show()
        plt.close()

分類模型效果評估

分類模型效果評估評估標準： Accuracy Precision Recal F Score ROC curve 以鳶尾花資料集為例子，我們用PCA（主成分迴歸法）（重點展示效果評估這一塊，所以暫時只用這一方法選擇特徵）絳維，然後進行建模，最後對模型的效果進行評估。 imp

回歸模型效果評估系列1-QQ圖

們的 cap plt linspace sci ros 虛線 ati ntile （erbqi）導語 QQ圖全稱 Quantile-Quantile圖，也就是分位數-分位數圖，簡單理解就是把兩個分布相同分位數的值，構成點(x,y)繪圖；如果兩個分布很接近，那個點(x,y)會

回歸模型效果評估系列2-MAE、MSE、RMSE、MAPE(MAPD)

不同 term 指標 tle 相對差距 view watermark root MAE、MSE、RMSE、MAPE(MAPD)這些都是常見的回歸預測評估指標，重溫下它們的定義和區別以及優缺點吧 MAE(Mean Absolute Error) 平均絕

演算法模型---演算法調優---資料探勘模型效果評估方法彙總

基於損失函式的標準混淆矩陣混淆矩陣用在分類器中，是對每一類樣本的統計，包括正確分類和錯誤分類的個數。對於m類樣本，可能的錯誤種類有m2−mm^2-mm2−m個。對於2分類問題存在4種可能的情況：

分類模型的評估方法-F分數(F-Score)

前面介紹了機器學習中分類模型的精確率(Precision)和召回率(Recall)評估指標。對於Precision和Recall，雖然從計算公式來看，並沒有什麼必然的相關性關係，但是，在大規模資料集合中，這2個指標往往是相互制約的。理想情況下做到兩個指標都高當然

分類模型效果評價

10個相對 nbsp 就是 ack spa 依賴指標圖形整理一下目前在工作和學習中用到的分類模型效果，也就是俗稱的“準確率”的各種表達形式。避免以後忘記，查一下又要給某論壇交記憶稅。（一）準確率accuracy 準確率=分類正確的樣

分類模型的效果評估

資料探勘建模中最後一步就是對模型進行效果評估，驗證模型的效能，讓你的模型具有說服力，本文對分類模型的評估做了彙總，並結合Sklearn講解如何繪製ROC曲線、PR曲線。混淆矩陣真正例TP（True Positive）、假負例FN（False Negativ

Classification： Precision/Recall ,ROC, AUC等分類模型評估方法，Multilabel and Multioutput Classification

Classification 一.資料集獲取及預處理 1 資料集匯入 2資料集劃分二、binary classification 二元分類器自己實現交叉驗證函式 confusion ma

筆記︱風控分類模型種類（決策、排序）比較與模型評估體系（ROC/gini/KS/lift）

轉載自素質雲部落格。本筆記源於CDA-DSC課程，由常國珍老師主講。該訓練營第一期為風控主題，培訓內容十分緊湊，非常好，推薦：CDA資料科學家訓練營 —————————————————————————————————————————— 一、風控建

分類模型評估——func()

“所有模型都是壞的，但有些模型是有用的”。建立模型之後，接下來就要去評估模型，以確定此模型是否“有用”。sklearn庫的metrics模組提供各種評估方法，包括分類評估、迴歸評估、聚類評估和交叉驗證等，本節主要介紹分類模型評估方法。　　評估分類是判斷預測值時否很好的與實際標記值相匹配。正確的鑑別

快速理解分類模型評估指標

一、從混淆矩陣說起我們以二分類模型來舉例，假設我們要預測使用者在借款之後是否會逾期。對於我們的預測來說，有逾期/不逾期兩種結果。對於真實情況，同樣有逾期/不逾期兩種結果。我們以逾期為正例，以不逾期為反例，將預測結果與真實結果進行列聯交叉，就生成了混淆矩陣

二分類模型評估指標的計算方法與程式碼實現

一、定義在研究評估指標之前，先給出分類結果混淆矩陣（confusion matrix）。預測真實正例反例正例 TP FN 反例 FP TN 1.準確率--accuracy 定義：對於給定的測試資料集，分類器正確分類的樣本數與總樣

python + sklearn ︱分類效果評估——acc、recall、F1、ROC、迴歸、距離

轉自：https://blog.csdn.net/sinat_26917383/article/details/75199996 之前提到過聚類之後，聚類質量的評價：聚類︱python實現六大分群質量評估指標（蘭德係數、互資訊、輪廓係數） R語言相關分類效果評估：R語言︱分類器的效能表現評價

二分類模型評估之 ROC曲線和PR曲線

1、二分模型考慮一個二分問題，即將例項分成正類（Positive）或負類（Negative）。對一個二分問題來說，會出現四種情況: TP: 如果一個例項是正類並且也被預測成正類，即為真正類（True Positive); FP: 如果一個例項是負類而被

資料探勘（三）分類模型的描述與效能評估，以決策樹為例

關於分類的第一部分我們要講一些關於分類的基本概念，然後介紹最基本的一種分類模型-決策樹模型，再基於此討論一下關於分類模型的效能評估。 =================================

機器學習-分類模型評估標準

對模型的泛化效能進行評估，不僅需要有效可行的實驗估計方法，還需要有衡量模型泛化能力的評價標準，這就是效能度量(performance measure)，迴歸任務最常用的效能度量是"均方誤差" (mean squared error)。下面主要介紹分類模型的

PHP 根據子ID遞歸獲取父級ID，實現逐級分類導航效果

top () == return clas urn php nbsp 遞歸代碼： //當前路徑 $cate=M(‘wangpan_class‘)->select(); function get_top_parentid($cate,$i

Keras 最新《面向小數據集構建圖像分類模型》

網絡 ict regular n) val sent rom link prepare 本文地址：http://blog.keras.io/building-powerful-image-classification-models-using-very-little-dat

機器學習模型效果評價

rms average 能說殘差 ima img 精確 rec 但是一、分類 1、精確率被識別成正類的，有多少是真正的正類。 2、召回率真正的正類，有多少等被找出來（召回）。 3、準確率被分類樣本總數中，有多少是正確分類的。 4、F1 F1 = 2 * (p

MXNET：分類模型

實現線性回歸一個 puts bat pick .data val att 線性回歸模型適用於輸出為連續值的情景，例如輸出為房價。在其他情景中，模型輸出還可以是一個離散值，例如圖片類別。對於這樣的分類問題，我們可以使用分類模型，例如softmax回歸。為了便於討論，讓我

分類模型的效果評估

相關推薦