1. 程式人生 > >R-squared 和 Adjusted R-squared聯絡與區別

R-squared 和 Adjusted R-squared聯絡與區別

原文見:

下面是自己理解的總結:

大概意思就是說,R-squared(值範圍0-1)描述的 輸入變數對輸出變數的解釋程度。在單變數線性迴歸中R-squared 越大,說明擬合程度越好。
然而只要曾加了更多的變數,無論增加的變數是否和輸出變數存在關係,則R-squared 要麼保持不變,要麼增加。
So, 需要adjusted R-squared ,它會對那些增加的且不會改善模型效果的變數增加一個懲罰向。
結論,如果單變數線性迴歸,則使用 R-squared評估,多變數,則使用adjusted R-squared。
在單變數線性迴歸中,R-squared和adjusted R-squared是一致的。
另外,如果增加更多無意義的變數,則R-squared 和adjusted R-squared之間的差距會越來越大,Adjusted R-squared會下降。但是如果加入的特徵值是顯著的,則adjusted R-squared也會上升