機器學習（一）線性迴歸

　　哇！耽擱了兩天，今天來把第一篇正兒八經的機器學習的演算法部落格補上，其實我也是在校學生一枚，看了很多演算法和別人的總結，寫了很多筆記。所以現在想試著把自己之前整理過的筆記和思考之後的注意點寫下來，如果有問題歡迎給我指出來哦~

1.什麼是線性迴歸

　　對於所有接觸機器學習的小夥伴來說，幾乎都被安利過大神吳恩達的機器學習入門視訊，而課程講的第一個機器學習演算法就是線性迴歸。實際上，線性迴歸屬於監督學習的內容，監督學習分為分類和迴歸兩部分；而線性迴歸又是迴歸內容中基礎又經典的部分。
　　機器學習的實質說白了就是通過資料之間的關係找出某種對映f:X→y。而針對線性迴歸來說就是假定X與y之間有線性相關關係。（注意，一定是線性相關關係，和多項式關係區分開啊！）
　　迴歸的最明顯特徵就是輸出的結果y

i為連續變數（這個連續變數一般都是浮點數，但是有的也是整數哦）。而線性迴歸的經典原型是：

hθ(x⃗ )=θ0+θ1x1+θ2x2+...+θnxn=∑i=0nθixi
　　而向量形式表示為：hθ(x⃗ )=θ⃗ Tx⃗
　　但是我們必須明確的一點是，θ⃗ 的取值是有很多種的，也就是說沒有限定條件下是不確定的，那麼這個時候我們想要找出最佳的模型則需要通過損失來幫忙。

2.線性迴歸的損失函式

　　損失函式（有時也被成為代價函式），是我們尋找最佳模型的一種依據。線上性迴歸這裡，對應的就是找出最符合資料的權重引數θ⃗ ,即[θ0,θ1,...,θn]T。針對線性迴歸，損失函式一般誰用均方差MSE，即：

J(θ1,θ2,...,θn)=12m∑i=1m(hθ(x⃗ (i))−y(i))2
　　其中，m代表樣本個數，前面的12m是為了求導方便，不影響最後的計算結果的。
　　實際上，這個就是預測值和實際值的距離的平方的均值，為什麼選用這個為損失函式呢？一反面是能正常的反應預測值和實際值的差距，更重要的一點是這個函式是凸函式！（感覺找出了凸函式就等於找到了家一樣，各種安全有木有~~）
　　而通過損失函式求解我們的最優權重引數一般有兩個思路：最小二乘法和迭代法
　　先來說最小二乘法，使用最小二乘法是線性迴歸特有的，可以一步到位直接解出引數的，具體過程就先不寫啦，直接給出引數的解：θ⃗ =(

XTX)−1XTY⃗
　　接下來是使用迭代法，而迭代法就有大家都很熟悉的梯度下降法、牛頓法、擬牛頓法等。迭代法是通過一步一步的不斷優化更新權重引數，使其最後達到最優解的（因為我們的損失函式是凸函式，所以是全域性最優解）。我們以梯度下降法為例，通過對損失函式求偏導並令其為零可以得到需要更新的部分，如下：θ⃗ =θ⃗ −αXT(Xθ⃗ −Y⃗ )
　　其中，α是學習率（也叫步長），是超引數，在訓練模型的時候需要手動調整的引數。不宜太大，也不宜太小。
　　實際中，我們一般不會真的計算到準確的最小值點的位置，所以迭代次數一般會設限制以防止機器執行的太久。而且針對α，在實際工程中會呼叫一些包進行自適應處理，也就是說，α一般會自己進行調整，不會固定不變的。
　　針對線性迴歸的損失函式一般使用的是梯度下降，實際上牛頓法和擬牛頓法也可以。牛頓法在小資料量級上速度會很快，但是當資料量非常大的時候，對記憶體的耗用會很嚴重，所以可能會採用BFGS或者L-BFGS。而這個時候還會出現能否平行計算的問題，就算可以進行平行計算，那麼計算速度也會下降。

3.過擬合與欠擬合

　　欠擬合比較好理解，主要就是模型學習的不到位，資料本身該有的特性沒學到導致的模型效能不好，這個問題也比較好解決。一般通過提高資料量就能解決。
　　過擬合問題是我們在機器學習當中考慮最多的一個問題。何之謂過擬合？通俗點講也就是說，如果我們有特別多的特徵，那麼我們假設的函式可以對訓練資料擬合的非常好，即J(θ1,θ2,...,θn)=12m∑i=1m(hθ(x⃗ (i))−y(i))2≈0，但是這樣的話會喪失一般性，從而導致對新給的預測樣本會預測的非常差。（其實也就是說把不應該學習的也學習來了，這樣的話對於帶預測樣本來說就是噪聲了）。為了解決過擬合問題，在損失函式中引入了正則化。我們常用的正則化一般是L1正則化和L2正則化。而線性迴歸因為引入的正則化項不同，從而出現了Ridge迴歸、Lasso迴歸以及ElasticNet迴歸。（這三隻放在後面單獨總結）
　　那麼，為什麼引入正則化項就能防止過擬合呢？其實主要原理就是通過引入權重引數來限制模型的複雜度，在李航的《統計學習方法》中稱為降低結構風險，而結構風險小的模型一般泛化能力都是較好的。關於三種迴歸之間的差別和風險降低的原理之後再說哦！

4.多項式迴歸

　　最開始學線性迴歸的時候我也出現過把多項式迴歸當做線性迴歸的情況。。。多項式迴歸的假設函式假設為：

hθ(x⃗ )=θ0+θ1x1+θ2x2+θ3x21+θ4x22+θ5x1x2
　　此時就不再是線性迴歸，而是多項式迴歸。其實看這個很像是特徵的對映。但是如果我們令x0=1,

機器學習（一）線性迴歸

1.什麼是線性迴歸

2.線性迴歸的損失函式

3.過擬合與欠擬合

4.多項式迴歸

機器學習（一）線性迴歸

機器學習（六）線性迴歸演算法分析概覽

機器學習（一）邏輯迴歸與softmax迴歸及程式碼示例

機器學習（七）線性迴歸、正規方程、邏輯迴歸的正規化

機器學習筆記（一）線性迴歸模型

用python來實現機器學習（一）：線性迴歸（linear regression）

槓精的機器學習（一）：線性迴歸

pytorch自我學習基礎（一）線性迴歸

機器學習（一）：快速入門線性分類器

機器學習（一）

機器學習（一）梯度下降算法的實現及過程分析

機器學習（三）—線性回歸、邏輯回歸、Softmax回歸的區別

Python機器學習（一）

機器學習（一）——Linear Regression

機器學習（一）--------簡介

TensorFlow 學習（四）線性迴歸模型

演算法工程師修仙之路：吳恩達機器學習（一）

機器學習（一） numpy的函式以及基本用法

機器學習（四）邏輯迴歸模型訓練

（一）線性迴歸與特徵歸一化(feature scaling)

機器學習（一）線性迴歸

1.什麼是線性迴歸

2.線性迴歸的損失函式

3.過擬合與欠擬合

4.多項式迴歸

相關推薦