1. 程式人生 > >信用評分中VOI和PSI的計算邏輯

信用評分中VOI和PSI的計算邏輯

  • 群體穩定性指標(population stability index)
    群體穩定性指標(population stability index)公式: psi = sum((實際佔比-預期佔比)* ln(實際佔比/預期佔比))舉個例子解釋下,比如訓練一個logistic迴歸模型,預測時候會有個類概率輸出,p。在你的測試資料集上的輸出設定為p1,將它從小到大排序後將資料集10等分(每組樣本數一直,此為等寬分組),計算每等分組的最大最小預測的類概率值。現在你用這個模型去對新的樣本進行預測,預測結果叫p2,利用剛才在測試資料集上得到的10等分每等分的上下界。按p2將新樣本劃分為10分(不一定等分了哦)。實際佔比就是新樣本通過p2落在p1劃分出來的每等分界限內的佔比,預期佔比就是測試資料集上各等分樣本的佔比。意義就是如果模型更穩定,那麼在新的資料上預測所得類概率應該更建模分佈一致,這樣落在建模資料集所得的類概率所劃分的等分割槽間上的樣本佔比應該和建模時一樣,否則說明模型變化,一般來自預測變數結構變化。通常用作模型效果監測。一般認為PSI小於0.1時候模型穩定性很高,0.1-0.2一般,需要進一步研究,大於0.2模型穩定性差,建議修復。