機器學習：線性迴歸、嶺迴歸、Lasso迴歸

阿新 • • 發佈：2018-11-17

轉載自：https://blog.csdn.net/hzw19920329/article/details/77200475

線性迴歸作為一種迴歸分析技術，其分析的因變數屬於連續型變數，如果因變數轉變為離散型變數，將轉換為分類問題。迴歸分析屬於有監督學習問題，本部落格將重點回顧標準線性迴歸知識點，並就線性迴歸中可能出現的問題進行簡單探討，引出線性迴歸的兩個變種嶺迴歸以及Lasso迴歸，最後通過sklearn庫模擬整個迴歸過程。

目錄結構

線性迴歸的一般形式
線性迴歸中可能遇到的問題
過擬合問題及其解決方法
線性迴歸程式碼實現
嶺迴歸與Lasso迴歸

嶺迴歸以及Lasso迴歸程式碼實現

線性迴歸的一般形式

這裡寫圖片描述

線性迴歸中可能遇到的問題

求解損失函式的最小值有兩種方法：梯度下降法以及正規方程，兩者的對比在附加筆記中有列出。
特徵縮放：即對特徵資料進行歸一化操作，進行特徵縮放的好處有兩點，一是能夠提升模型的收斂速度，因為如果特徵間的資料相差級別較大的話，以兩個特徵為例，以這兩個特徵為橫縱座標繪製等高線圖，繪製出來是扁平狀的橢圓，這時候通過梯度下降法尋找梯度方向最終將走垂直於等高線的之字形路線，迭代速度變慢。但是如果對特徵進行歸一化操作之後，整個等高線圖將呈現圓形，梯度的方向是指向圓心的，迭代速度遠遠大於前者。二是能夠提升模型精度。

學習率α的選取：如果學習率α選取過小，會導致迭代次數變多，收斂速度變慢；學習率α選取過大，有可能會跳過最優解，最終導致根本無法收斂。

過擬合問題及其解決方法

問題：以下面一張圖片展示過擬合問題
解決方法：(1)：丟棄一些對我們最終預測結果影響不大的特徵，具體哪些特徵需要丟棄可以通過PCA演算法來實現；(2)：使用正則化技術，保留所有特徵，但是減少特徵前面的引數θ的大小，具體就是修改線性迴歸中的損失函式形式即可，嶺迴歸以及Lasso迴歸就是這麼做的。

線性迴歸程式碼示例

import matplotlib.pyplot as plt
import numpy as np
from sklearn import datasets, linear_model, discriminant_analysis, cross_validation

def load_data():
    diabetes = datasets.load_diabetes()
    return cross_validation.train_test_split(diabetes.data, diabetes.target, test_size=0.25, random_state=0)

def test_LinearRegression(*data):
    X_train, X_test, y_train, y_test = data
    #通過sklearn的linear_model建立線性迴歸物件
    linearRegression = linear_model.LinearRegression()
    #進行訓練
    linearRegression.fit(X_train, y_train)
    #通過LinearRegression的coef_屬性獲得權重向量,intercept_獲得b的值
    print("權重向量:%s, b的值為:%.2f" % (linearRegression.coef_, linearRegression.intercept_))
    #計算出損失函式的值
    print("損失函式的值: %.2f" % np.mean((linearRegression.predict(X_test) - y_test) ** 2))
    #計算預測效能得分
    print("預測效能得分: %.2f" % linearRegression.score(X_test, y_test))

if __name__ == '__main__':
    #獲得資料集
    X_train, X_test, y_train, y_test = load_data()
    #進行訓練並且輸出預測結果
    test_LinearRegression(X_train, X_test, y_train, y_test)

線性迴歸示例輸出

權重向量:[ -43.26774487 -208.67053951  593.39797213  302.89814903 -560.27689824
  261.47657106   -8.83343952  135.93715156  703.22658427   28.34844354], b的值為:153.07
損失函式的值: 3180.20
預測效能得分: 0.36

嶺迴歸與Lasso迴歸

嶺迴歸與Lasso迴歸的出現是為了解決線性迴歸出現的過擬合以及在通過正規方程方法求解θ的過程中出現的x轉置乘以x不可逆這兩類問題的，這兩種迴歸均通過在損失函式中引入正則化項來達到目的，具體三者的損失函式對比見下圖：

其中λ稱為正則化引數，如果λ選取過大，會把所有引數θ均最小化，造成欠擬合，如果λ選取過小，會導致對過擬合問題解決不當，因此λ的選取是一個技術活。
嶺迴歸與Lasso迴歸最大的區別在於嶺迴歸引入的是L2範數懲罰項，Lasso迴歸引入的是L1範數懲罰項，Lasso迴歸能夠使得損失函式中的許多θ均變成0，這點要優於嶺迴歸，因為嶺迴歸是要所有的θ均存在的，這樣計算量Lasso迴歸將遠遠小於嶺迴歸。

可以看到，Lasso迴歸最終會趨於一條直線，原因就在於好多θ值已經均為0，而嶺迴歸卻有一定平滑度，因為所有的θ值均存在。

嶺迴歸以及Lasso迴歸程式碼實現

嶺迴歸程式碼示例

import matplotlib.pyplot as plt
import numpy as np
from sklearn import datasets, linear_model, discriminant_analysis, cross_validation

def load_data():
    diabetes = datasets.load_diabetes()
    return cross_validation.train_test_split(diabetes.data, diabetes.target, test_size=0.25, random_state=0)

def test_ridge(*data):
    X_train, X_test, y_train, y_test = data
    ridgeRegression = linear_model.Ridge()
    ridgeRegression.fit(X_train, y_train)
    print("權重向量:%s, b的值為:%.2f" % (ridgeRegression.coef_, ridgeRegression.intercept_))
    print("損失函式的值:%.2f" % np.mean((ridgeRegression.predict(X_test) - y_test) ** 2))
    print("預測效能得分: %.2f" % ridgeRegression.score(X_test, y_test))

#測試不同的α值對預測效能的影響
def test_ridge_alpha(*data):
    X_train, X_test, y_train, y_test = data
    alphas = [0.01, 0.02, 0.05, 0.1, 0.2, 0.5, 1, 2, 5, 10, 20, 50, 100, 200, 500, 1000]
    scores = []
    for i, alpha in enumerate(alphas):
        ridgeRegression = linear_model.Ridge(alpha=alpha)
        ridgeRegression.fit(X_train, y_train)
        scores.append(ridgeRegression.score(X_test, y_test))
    return alphas, scores

def show_plot(alphas, scores):
    figure = plt.figure()
    ax = figure.add_subplot(1, 1, 1)
    ax.plot(alphas, scores)
    ax.set_xlabel(r"$\alpha$")
    ax.set_ylabel(r"score")
    ax.set_xscale("log")
    ax.set_title("Ridge")
    plt.show()

if __name__ == '__main__':
    #使用預設的alpha
    #獲得資料集
    #X_train, X_test, y_train, y_test = load_data()
    #進行訓練並且預測結果
    #test_ridge(X_train, X_test, y_train, y_test)

    #使用自己設定的alpha
    X_train, X_test, y_train, y_test = load_data()
    alphas, scores = test_ridge_alpha(X_train, X_test, y_train, y_test)
    show_plot(alphas, scores)

Lasso迴歸程式碼示例

import matplotlib.pyplot as plt
import numpy as np
from sklearn import datasets, linear_model, discriminant_analysis, cross_validation

def load_data():
    diabetes = datasets.load_diabetes()
    return cross_validation.train_test_split(diabetes.data, diabetes.target, test_size=0.25, random_state=0)

def test_lasso(*data):
    X_train, X_test, y_train, y_test = data
    lassoRegression = linear_model.Lasso()
    lassoRegression.fit(X_train, y_train)
    print("權重向量:%s, b的值為:%.2f" % (lassoRegression.coef_, lassoRegression.intercept_))
    print("損失函式的值:%.2f" % np.mean((lassoRegression.predict(X_test) - y_test) ** 2))
    print("預測效能得分: %.2f" % lassoRegression.score(X_test, y_test))

#測試不同的α值對預測效能的影響
def test_lasso_alpha(*data):
    X_train, X_test, y_train, y_test = data
    alphas = [0.01, 0.02, 0.05, 0.1, 0.2, 0.5, 1, 2, 5, 10, 20, 50, 100, 200, 500, 1000]
    scores = []
    for i, alpha in enumerate(alphas):
        lassoRegression = linear_model.Lasso(alpha=alpha)
        lassoRegression.fit(X_train, y_train)
        scores.append(lassoRegression.score(X_test, y_test))
    return alphas, scores

def show_plot(alphas, scores):
    figure = plt.figure()
    ax = figure.add_subplot(1, 1, 1)
    ax.plot(alphas, scores)
    ax.set_xlabel(r"$\alpha$")
    ax.set_ylabel(r"score")
    ax.set_xscale("log")
    ax.set_title("Ridge")
    plt.show()

if __name__=='__main__':
    X_train, X_test, y_train, y_test = load_data()
    # 使用預設的alpha
    #test_lasso(X_train, X_test, y_train, y_test)
    # 使用自己設定的alpha
    alphas, scores = test_lasso_alpha(X_train, X_test, y_train, y_test)
    show_plot(alphas, scores)

附上學習筆記

參考文獻

python大戰機器學習
Andrew Ng機器學習公開課
http://www.jianshu.com/p/35e67c9e4cbf
http://freemind.pluskid.org/machine-learning/sparsity-and-some-basics-of-l1-regularization/#ed61992b37932e208ae114be75e42a3e6dc34cb3

機器學習：線性迴歸、嶺迴歸、Lasso迴歸

轉載自：https://blog.csdn.net/hzw19920329/article/details/77200475 線性迴歸作為一種迴歸分析技術，其分析的因變數屬於連續型變數，如果因變數轉變為離散型變數，將轉換為分類問題。迴歸分析屬於有監督學習問題，本部落格將重點回

機器學習：線性迴歸和嶺迴歸入門程式碼

機器學習中運用python進行對房子價格的預測程式碼，資料庫直接使用sklearn自帶的boston，使用三種方法進行預測，分別是：線性迴歸直接預測、梯度下降預測、嶺迴歸預測 from sklearn.datasets import load_boston fr

機器學習：線性迴歸與Python程式碼實現

前言：本篇博文主要介紹線性迴歸模型（linear regression），首先介紹相關的基礎概念和原理，然後通過Python程式碼實現線性迴歸模型。特別強調，其中大多理論知識來源於《統計學習方法_李航》和斯坦福課程翻譯筆記以及Coursera機器學習課程。 1.線性迴歸

吳恩達機器學習：線性迴歸

首先說一些關於課程的題外話。對於 Ng 的這個課程，筆者沒有選擇在 Coursera 上學習課程，一來是因為 Coursera 有自己的課程週期，但這個週期不一定適合所有人。其次 Coursera 的課程作業是使用 Octave 語言，而筆者個人覺得不管是學習還

機器學習：決策樹cart演算法在分類與迴歸的應用（上）

#include #include #include #include #include #include #include #include #include #include #include using namespace std; //置信水平取0.95時的卡方表 const double CHI

從零單排入門機器學習：線性回歸（linear regression）實踐篇

class rom enter instr function ont 線性 gin 向量線性回歸（linear regression）實踐篇之前一段時間在coursera看了Andrew ng的機器學習的課程，感覺還不錯，算是入門了。這次打算以該課程的作業

機器學習：線性判別式分析(LDA)

get generated 分類 learn 參數關註 ble 直線圖片 1.概述線性判別式分析（Linear Discriminant Analysis），簡稱為LDA。也稱為Fisher線性判別（Fisher Linear Disc

機器學習：線性回歸——理論與代碼實現（基於正規方程與梯度下降）

overfit 返回 pen ear 隨機梯度是否很大的建模回歸一線性模型給定由n個屬性描述的列向量$f(\mathbf{x})={(x^{(1)};x^{(2)};...;x^{(n)})}$，其中 $x^{(j)}$是$\textbf{x}$

Bobo老師機器學習筆記第八課-方差、偏差、嶺迴歸、LASSO迴歸？

對誤差分類問題一、什麼是偏差和方差？先看下面這幅圖圖：方差：都是圍著資料中心的，方差越大則表示距離資料中心分佈的越分散，越小說明越近越集中偏差：偏離資料中心，偏差越大，說明整個資料距離中心越遠，偏差越小，說明距離資料中心越近。這兩者的關係通常是矛盾的，降低偏

機器學習(三)線性迴歸、廣義線性迴歸、非線性迴歸

機器學習(三)線性迴歸模型、廣義線性迴歸模型、非線性迴歸模型線性迴歸（資料集要滿足正態分佈）一元線性迴歸模型：在這裡會想到，如何確定方程中的係數呢？我們先來了解最小二乘法，簡單來說就是這個點作y軸的平行線與直線相交，那一段y值的平方求和起來最小就是了

概率統計與機器學習：獨立同分布，極大似然估計，線性最小二乘迴歸

獨立同分布獨立性概念：事件A，B發生互不影響公式：P(XY)=P(X)P(Y) ，即事件的概率等於各自事件概率的乘積舉例：正例：兩個人同時向上拋硬幣，兩個硬幣均為正面的概率反例：獅子在某地區出現的概率為X，老虎出現概率為Y，同時出現

機器學習之線性迴歸：演算法兌現為python程式碼

前面三天推送機器學習線性迴歸演算法之最小二乘法，從假設到原理，詳細分析了直接求解和梯度下降兩種演算法，接下來手動編寫python程式碼實現線性迴歸的演算法吧。 1 資料預處理在拿到一個數據集後，往往需要經過漫長的預處理過程，不要忽視這個看似與建立模

機器學習筆記:線性迴歸、邏輯斯蒂迴歸推導

參考書籍：《統計學習方法》，cs229，其他 1、線性迴歸 1.1、線性迴歸表示線性迴歸屬於監督學習問題，輸入X與輸出Y成線性關係，只要我們得到了這個具體的關係，那麼對於待預測的資料X我們便可以知道Y的值。現在就來求這個線性關係先定義好變量表示。記輸入變量表示為

機器學習：貝葉斯總結_3：線性迴歸和貝葉斯迴歸

線性迴歸的基函式模型 y(x,w)=w0+w1x1+......+wDxD y(x,w)=w0+∑M−1j=1wjϕj(x) ϕj(x)：是基函數基函式：多項式；高斯；sigmoid函式基函

機器學習：單變數線性迴歸及梯度下降

***************************************** 注：本系列部落格是博主學習Stanford大學 Andrew Ng 教授的《機器學習》課程筆記。博主深感學過課程後，不進行總結很容易遺忘，根據課程加上自己對不明白問題的補充遂有此係列部落格。

機器學習-對線性迴歸、邏輯迴歸、各種迴歸的概念學習

迴歸問題的條件/前提：1）收集的資料2）假設的模型，即一個函式，這個函式裡含有未知的引數，通過學習，可以估計出引數。然後利用這個模型去預測/分類新的資料。1. 線性迴歸假設特徵和結果都滿足線性。即不大於一次方。這個是針對收集的資料而言。收集的資料中，每一個分量，

機器學習筆記——線性迴歸（Linear Regression）

線性迴歸演算法 1 簡單線性迴歸（Simple Liner Regression）解決迴歸問題思想簡答，容易實現許多強大的非線性模型的基礎結果具有很好的可解釋性蘊含機器學習中的很多重要思想 1.1 什麼是線性迴歸演算法？

機器學習入門線性迴歸及梯度下降

分享一下我老師大神的人工智慧教程！零基礎，通俗易懂！http://blog.csdn.net/jiangjunshow 也歡迎大家轉載本篇文章。分享知識，造福人民，實現我們中華民族偉大復興！

機器學習實現——線性迴歸

線性迴歸，作為機器學習入門，比較好理解，小學數學中y=kx+b到研究生階段開始進行了深度研究，之前用兩對引數確定兩個未知數，現在用n對引數來估計一套近似值，不過由於未知數的數量，以及線性模型的不確定，要讓線性迴歸達到一個預測未來還是相當有難度的。隨著一些重要的模型和深度學習的引入，線性迴歸雖

機器學習演算法 - 線性迴歸

線性迴歸演算法解決迴歸問題思想簡單，容易實現許多強大的非線性模型的基礎結果具有很好的可解釋性蘊含機器學習中很多重要的思想$$y=ax_i +b$$ 樣本特徵只有一個的線性迴歸問題，為簡單線性迴歸。樣本特徵有多個的線性迴歸問題

機器學習：線性迴歸、嶺迴歸、Lasso迴歸

目錄結構

線性迴歸的一般形式

線性迴歸中可能遇到的問題

過擬合問題及其解決方法

線性迴歸程式碼示例

線性迴歸示例輸出

嶺迴歸與Lasso迴歸

嶺迴歸以及Lasso迴歸程式碼實現

嶺迴歸程式碼示例

Lasso迴歸程式碼示例

附上學習筆記

參考文獻

相關推薦