1. 程式人生 > >線性迴歸(一)

線性迴歸(一)

線性迴歸

  1. 單變數線性迴歸的目標是:通過模型來描述某一特徵(解釋變數X)與連續輸出(目標變數y)之間的關係,當只有一個解釋變數時線性模型定義如下。y=W0+W1X。W0成為函式在y軸上的截距,W1為係數。目標是通過學習得到線性方程的兩個權值,並用他們描述解釋變數和目標變數之間的關係,當解釋變數為非訓練集中資料時,可用此線性關係來預測對應的輸出。
  2. 多元線性迴歸:線性迴歸模型擴充套件為多個解釋變數,y=W0X0+W1X1+W2X2+…+WmXm = ΣWiXi = (點積)W^TX
  3. 相關性係數矩陣是一個包含皮爾遜積矩相關係數,他用來衡量兩兩特徵間的線性依賴關係
  4. 基於最小二乘法構建線性迴歸模型在這裡插入圖片描述
  5. 代價函式y代表真實結果,y^代表預測值
  6. 梯度下降法是一種方法,優化的是代價函式

線性迴歸模型效能的評估

  1. 殘差圖:以殘差為縱座標,以任何其他指定的量為橫座標的散點圖。度量線性迴歸模型的視覺化工具
  2. MSE 均方誤差在這裡插入圖片描述
  3. 決定係數 R^2:可以看做是MSE的標準化版本Var(y)表示方差
    Var(y)表示方差

正則化

線性迴歸中的正則化(目的解決過擬合的現象)
過擬合的原因:1.訓練資料過少,2.特徵過多,3.模型過於複雜

  1. 嶺迴歸在這裡插入圖片描述
  2. LASSO迴歸在這裡插入圖片描述
  3. 總結在這裡插入圖片描述