1. 程式人生 > >資料探勘領域中的分類和迴歸區別是什麼?

資料探勘領域中的分類和迴歸區別是什麼?

先簡單的說下吧,下面給出實際例子

類和迴歸的區別在於輸出變數的型別。

定量輸出稱為迴歸,或者說是連續變數預測;
定性輸出稱為分類,或者說是離散變數預測。

舉個例子:
預測明天的氣溫是多少度,這是一個迴歸任務;
預測明天是陰、晴還是雨,就是一個分類任務。 


拿支援向量機舉個例子,分類問題和迴歸問題都要根據訓練樣本找到一個實值函式g(x). 迴歸問題的要求是:給定一個新的模式,根據訓練集推斷它所對應的輸出y(實數)是多少。也就是使用y=g(x)來推斷任一輸入x所對應的輸出值。分類問題是:給定一個新的模式,根據訓練集推斷它所對應的類別(如:+1-1)。也就是使用y=sign(g(x))

來推斷任一輸入x所對應的類別。綜上,迴歸問題和分類問題的本質一樣,不同僅在於他們的輸出的取值範圍不同。分類問題中,輸出只允許取兩個值;而在迴歸問題中,輸出可取任意實數。