weka使用教程3--對分類結果進行分析

阿新 • • 發佈：2018-12-12

1 Summary

Correctly Classified Instances :正確分類的例項 Incorrectly Classified Instances ：錯誤分類的例項 Kappa statistic：就是假設有兩個相互獨立的人分別將N個物品分成C個相互獨立的類別,如果雙方結果完全一致則K值為1,反之K值為0; Mean absolute error ：就是把N次實驗的絕對誤差求和,然後除以實際值與均值之差的求和. 此值越小實驗越準確. Root mean squared error：即均方根誤差,是用來衡量樣本的離散程度的.也就是將N次實驗中的實驗值與平均值之差求和,除以實驗次數,再把商開根號. Relative absolute error ：就是把N次實驗的絕對誤差求和,然後除以實際值與均值之差的求和. 此值越小實驗越準確. Root relative squared error ：上面的做完再開根號... Total Number of Instances ：樣本總數

2 Detailed Accuracy By Class

TP Rate :True Positive,被判定為正樣本，事實上也是證樣本。

FP Rate :False Positive,被判定為正樣本，但事實上是負樣本。

Precision :即在檢索後返回的結果中，真正正確的個數佔整個結果的比例。precesion = TP/(TP+FP) 。

Recall :即在檢索結果中真正正確的個數佔整個資料集（檢索到的和未檢索到的）中真正正確個數的比例。recall = TP/(TP+FN)即，檢索結果中，你判斷為正的樣本也確實為正的，以及那些沒在檢索結果中被你判斷為負但是事實上是正的（FN）。

F-Measure :是Precision和Recall加權調和平均P和R指標有時候會出現的矛盾的情況，這樣就需要綜合考慮他們，最常見的方法就是F-Measure（又稱為F-Score）。

MCC :

ROC Area: ROC曲線下方的面積（Area Under the ROC Curve, AUC）提供了評價模型平均效能的另一種方法。如果模型是完美的，那麼它的AUC = 1，如果模型是個簡單的隨機猜測模型，那麼它的AUC = 0.5，如果一個模型好於另一個，則它的曲線下方面積相對較大

PRC Area:

3 Confusion Matrix

第一行：565個a正確分類 135個a錯誤分成了b

第二行：168個b錯誤分成了a 532個正確分類

weka使用教程3--對分類結果進行分析

1 Summary

2 Detailed Accuracy By Class

3 Confusion Matrix

weka使用教程3--對分類結果進行分析

利用隨機森林和梯度替身決策樹對titanic資料進行分類，並對結果進行分析

對計數結果進行4舍5入

演算法 -- 四種方法獲取的最長“迴文串”，並對時間複雜進行分析對比&PHP

hadoop[10]-對彙總結果進行排序

自己寫UDF函式匯入hive對查詢結果進行格式化顯示（Java）

【自然語言處理入門】03：利用線性迴歸對資料集進行分析預測（下）

linux下使用awk,wc,sort,uniq,grep對nginx日誌進行分析和統計

【自然語言處理入門】03：利用線性迴歸對資料集進行分析預測（上）

mahout入門之對推薦結果進行評估

Loadrunner效能測試結果進行分析

利用StegSolve、Python對.jpg檔案進行分析

實現模糊查詢時對特殊字元進行處理和對查詢結果進行處理

如何編寫指令碼對專案程式碼進行分析（測試篇）

mongoose對查詢結果進行排序

機器學習筆記（3）——使用聚類分析演算法對文字分類（分類數k未知）

quick-cocos2d-x教程3:程序框架內文件夾分析之docs文件夾

蜜罐技術——通過布置一些作為誘餌的主機、網絡服務或者信息，誘使攻擊方對它們實施攻擊，從而可以對攻擊行為進行捕獲和分析

Python爬蟲(二)——對開封市58同城出租房數據進行分析

使用conlleval.pl對CRF測試結果進行評價的方法

weka使用教程3--對分類結果進行分析

1 Summary

2 Detailed Accuracy By Class

3 Confusion Matrix

相關推薦