【演算法原理】從模型假設看線性迴歸和邏輯迴歸
阿新 • • 發佈:2019-01-25
摘要
本文從演算法的模型假設方面,對線性迴歸、邏輯迴歸和感知器做一下簡要對比,說明了它們之間的聯絡。
符號約定
1)樣本集合: ,其中表示一共個樣本中的第個
2),表示輸入向量,其中是為了統一格式
3)為標量,代表第個樣本對應的值(或分類問題中的label)
4),表示待求引數
5),表示維空間中的一個超平面
問題描述
已知個樣本,當時,我們想要估計出相對應的輸出。根據取值範圍的不同,問題分為兩種情況。
1)當可以取無限多的連續值時,該問題稱為迴歸問題
2)當只能取有限多的離散值時,該問題稱為分類問題
P.S. 好吧,第2中情況稱為分類,很好理解。可第1種情況,為啥叫回歸?有啥意義?其實,沒啥意義,完全可以忽略。但感興趣的可以繼續閱讀參考文獻[1]。
線性迴歸 Linear Regression
一、模型假設
即,我們假設輸入和輸出之間的關係,符合以上的模型。問題是,你為何要做這種假設呢?如果這個假設本身就是錯的怎麼辦呢?
因為通過對樣本集的觀察和分析,直觀上認為模型應該是這個樣子的。當然如果假設本身就是錯的,那麼無論如何都學習不到很好的結果。這個時候只能修正模型假設,重新再來。
二、目標函式
顯然,目標函式的每一項,是模型預測結果與真實值直接的誤差的平方。因此,目標函式刻畫的是,某一個特定的模型(對應一個特定的