09 線性迴歸及矩陣運算

阿新 • • 發佈：2019-12-01

09 線性迴歸及矩陣運算

線性迴歸

定義：通過一個或者多個自變數與因變數之間進行建模的迴歸分析。其中可以為一個或者多個自變數之間的線性組合。
一元線性迴歸：涉及到的變數只有一個
多元線性迴歸：變數兩個或以上
通用公式：h(w) = w0 + w1x1 + w2x2 + ....= wTx
其中w,x 為矩陣：wT=(w0, w1, w2) x=（1，x1, x2)T

迴歸的應用場景（連續型資料）

房價預測
銷售額預測（廣告，研發成本，規模等因素）
貸款額度

線性關係模型

定義：通過屬性 (特徵) 的線性組合來進行預測的函式：
- f(x) = w1x1 + w2x2 + w3x3 + ...... + wdxd + b
- w : weight (權重） b: bias (偏置項）
- 多個特徵： (w1:房子的面積， w2:房子的位置 ..)

損失函式（誤差）

《統計學習方法》 - 演算法，策略，優化

線性迴歸，最小二乘法，正規方程 & 梯度下降

損失函式（誤差大小）

yi 為第i個訓練樣本的真實值
hw(xi)為第i個訓練樣本特徵值組合預測函式（預測值）

尋找最優化的w
1. 最小二乘法之正規方程（直接求解到最小值，特徵複雜時可能沒辦法求解）
  - 求解：w= (xTx）-1 xTy
  - X 為特徵值矩陣，y為目標值矩陣
  - 缺點: 特徵過於複雜時，求解速度慢
2. 最小二乘法之梯度下降
  - 使用場景：面對訓練資料規模龐大的任務
  - 超引數：a

線性迴歸演算法案例

API

sklearn.linear_model.LinealRegression()

普通最小二乘法線性迴歸
coef_: 迴歸係數（w值)

sklearn.linear_model.SGDRegressir()

通過使用SGD最小化線性模型
coef_: 迴歸係數
不能手動指定學習率

波士頓房價預測

from sklearn.datasets import load_boston
from sklearn.linear_model import LinearRegression, SGDRegressor
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import mean_squared_error

def mylinear():
    """
    線性迴歸預測房價
    :return: None
    """
    # 1. 獲取資料
    lb = load_boston()

    # 2. 分割資料集到訓練集和測試集
    x_train, x_test, y_train, y_test = train_test_split(lb.data, lb.target, test_size=0.25)
    print(y_train, y_test)

    # 3. 進行標準化處理(特徵值和目標值都必須標準化處理）
    # 例項化兩個標準化API,特徵值和目標值要用各自fit
    # 特徵值
    std_x = StandardScaler()
    x_train = std_x.fit_transform(x_train)
    x_test = std_x.transform(x_test)

    std_y = StandardScaler()
    y_train = std_y.fit_transform(y_train)
    y_test = std_y.transform(y_test)

    # 4. estimator預測
    # 4.1 正規方程求解預測結果
    lr = LinearRegression()
    lr.fit(x_train, y_train)
    print(lr.coef_)
    y_lr_predict = std_y.inverse_transform(lr.predict(x_test))
    print('正規方程測試集裡面每個房子的預測價格：', y_lr_predict)
    print('正規方程的均方誤差：',mean_squared_error(std_y.inverse_transform(y_test),y_lr_predict))

    # 4.1 梯度下降進行梯度預測
    sgd = SGDRegressor()
    lr.fit(x_train, y_train)
    print(sgd.coef_)
    y_sgd_predict = std_y.inverse_transform(sgd.predict(x_test))
    print('梯度下降測試集裡面每個房子的預測價格：', y_sgd_predict)
    print('梯度下降的均方誤差：', mean_squared_error(std_y.inverse_transform(y_test), y_sgd_predict))
    return None


if __name__ == '__main__':
    mylinear()

迴歸效能評估

均方誤差（Mean Squared Error MSE) 評價機制

mean_squared_error(y_true, y_pred)
真實值和預測值為標準化話之前的值

兩種預測方式的選擇

樣本量選擇
樣本量大於100K --> SGD 梯度下降
樣本量小於100K --> 其他

梯度下降	正規方程
需要選擇學習率	不需要
需要多次迭代	一次運算得出
當特徵數量大時也能較好使用	需要計算（xTx）-1,運算量大
適用於各種型別的模型	只適用於線性模型

特點：線性迴歸器是最為簡單、易用的迴歸模型，在不知道特徵之間關係的情況下，
可以使用線性迴歸器作為大多數系統的首要選擇。LinearRegression 不能解決擬合問題。

過擬合與欠擬合

定義：
1. 過擬合（overfitting)：一個假設在訓練資料上能夠獲得比其他假設更好的擬合，但是在訓練資料外卻不能很好擬合。（模型過於複雜）
  模型複雜的原因：資料的特徵和目標值之間的關係不僅僅是線性關係。
2. 欠擬合（underfitting)：一個假設在訓練資料上不能獲得更好的擬合，但是在訓練資料外也不能很好的擬合。（模型過於簡單）

欠擬合原因及解決方法

原因：學習到的資料特徵過少
解決方法：增加資料的特徵數量

過擬合原因及解決方法

原因：原始特徵過多，存在一些嘈雜特徵，模型過於複雜是因為模型嘗試去兼顧各個測試資料點
解決方法：
- 進行特徵選擇，消除關聯性很大的特徵（人為排除，很難做）
- 交叉驗證（讓所有資料都有過訓練）- 檢驗但不能解決
- 正則化：不斷嘗試，減少權重（高次項特徵的影響）
特徵選擇：
- 過濾式：低方差特徵
- 嵌入式：正則化，決策樹，神經網路

（減少高指數項係數，趨近於0，減少權重）

L2正則化

作用：可以使得W的每個元素都很小，都接近於0
優點：越小的引數說明模型越簡單，越簡單的模型越不容易產生過擬合現象。
迴歸解決過擬合的方式：
L2正則化， Ridge：嶺迴歸：帶有正則化的線性迴歸，解決過擬合。

Ridge API

sklearn.linear_model.Ridge(alpha=1.0)
- 具有L2正則化的線性最小二乘法
- alpha: 正則化力度 0~1（小數）， 1~10（整數）
- coef_: 迴歸係數

正則化力度對權重的影響（力度越大，越趨向於0）

from sklearn.datasets import load_boston
from sklearn.linear_model import LinearRegression, SGDRegressor, Ridge
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import mean_squared_error

def mylinear():
    """
    線性迴歸預測房價
    :return: None
    """
    # 1. 獲取資料
    lb = load_boston()

    # 2. 分割資料集到訓練集和測試集
    x_train, x_test, y_train, y_test = train_test_split(lb.data, lb.target, test_size=0.25)
    print(y_train, y_test)

    # 3. 進行標準化處理(特徵值和目標值都必須標準化處理）
    # 例項化兩個標準化API,特徵值和目標值要用各自fit
    # 特徵值
    std_x = StandardScaler()
    x_train = std_x.fit_transform(x_train)
    x_test = std_x.transform(x_test)

    std_y = StandardScaler()
    y_train = std_y.fit_transform(y_train)
    y_test = std_y.transform(y_test)

    # 4. estimator預測
    # 4.1 正規方程求解預測結果
    lr = LinearRegression()
    lr.fit(x_train, y_train)
    print(lr.coef_)
    y_lr_predict = std_y.inverse_transform(lr.predict(x_test))
    print('正規方程測試集裡面每個房子的預測價格：', y_lr_predict)
    print('正規方程的均方誤差：',mean_squared_error(std_y.inverse_transform(y_test),y_lr_predict))

    # 4.2 梯度下降進行梯度預測
    sgd = SGDRegressor()
    lr.fit(x_train, y_train)
    print(sgd.coef_)
    y_sgd_predict = std_y.inverse_transform(sgd.predict(x_test))
    print('梯度下降測試集裡面每個房子的預測價格：', y_sgd_predict)
    print('梯度下降的均方誤差：', mean_squared_error(std_y.inverse_transform(y_test), y_sgd_predict))

    # 4.3 嶺迴歸預測
    rd = Ridge(alpha=1.0)
    rd.fit(x_train, y_train)
    print(rd.coef_)
    y_rd_predict = std_y.inverse_transform(rd.predict(x_test))
    print('嶺迴歸測試集裡面每個房子的預測價格：', y_rd_predict)
    print('嶺迴歸的均方誤差：', mean_squared_error(std_y.inverse_transform(y_test), y_rd_predict))


    return None


if __name__ == '__main__':
    mylinear()

線性迴歸LinearRegression 與 Ridge對比

嶺迴歸：迴歸得到的迴歸係數更符合實際，更可靠。另外，能讓估計引數的波動範圍變小，變得更穩定。在存在病態資料偏多的研究中有較大的使用價值

09 線性迴歸及矩陣運算

09 線性迴歸及矩陣運算線性迴歸定義：通過一個或者多個自變數與因變數之間進行建模的迴歸分析。其中可以為一個或者多個自變數之間的線性組合。一元線性迴歸：涉及到的變數只有一個多元線性迴歸：變數兩個或以上通用公式：h(w) = w0 + w1x1 + w2x2 + ....= wTx 其中w,x 為矩陣

矩陣及矩陣運算

http post 右下角次方 -c 交換 src 元素行數矩陣：一個m×n的矩陣就是m×n個數排成m行n列的一個數陣。由於它把許多數據緊湊的集中到了一起，所以有時候可以簡便地表示一些復雜的模型。在數學中，一個矩陣說穿了就是一個二維數組。單位矩陣：從左上角到右下角的對

機器學習入門線性迴歸及梯度下降

分享一下我老師大神的人工智慧教程！零基礎，通俗易懂！http://blog.csdn.net/jiangjunshow 也歡迎大家轉載本篇文章。分享知識，造福人民，實現我們中華民族偉大復興！

線性迴歸及RANSAC異常值清除演算法案例

線性迴歸及RANSAC異常值清除演算法案例 1、常規線性迴歸 import matplotlib.pyplot as plt import seaborn as sns import pandas as pd import numpy as np from sklearn.linear_mo

梯度下降法求多元線性迴歸及Java實現

對於資料分析而言，我們總是極力找數學模型來描述資料發生的規律，有的資料我們在二維空間就可以描述，有的資料則需要對映到更高維的空間。資料表現出來的分佈可能是完全離散的，也可能是聚整合堆的，那麼機器學習的任務就是讓計算機自己在資料中學習到資料的規律。那麼這個規律通常是可以用一些函式來描述，

Python之線性代數（矩陣運算，逆矩陣，伴隨矩陣）

np.eye(10)*10 # 10階方陣，當對角線值為1時為對角矩陣 np.eye(5) array([[1., 0., 0., 0., 0.], [0., 1., 0., 0., 0.], [0., 0., 1

Python_一元線性迴歸及迴歸顯著性

1、資料準備資料來源自《應用迴歸分析》（第四版） ## 火災損失表 ### 距離消防站km x = [3.4, 1.8, 4.6, 2.3, 3.1, 5.5, 0.7, 3.0, 2.6, 4.

【python資料探勘課程】十八.線性迴歸及多項式迴歸分析四個案例分享

這是《Python資料探勘課程》系列文章，也是我這學期大資料金融學院上課的部分內容。本文主要講述和分享線性迴歸作業中，學生們做得比較好的四個案例，經過我修改後供大家學習，內容包括： 1.線性迴歸預測Pizza價格案例 2.線性迴歸分析波士頓房價案例 3.隨機

python資料探勘筆記】十八.線性迴歸及多項式迴歸分析四個案例分享

python資料探勘課程】十八.線性迴歸及多項式迴歸分析四個案例分享 #2018-03-30 18:24:56 March Friday the 13 week, the 089 day SZ SSMR 1.線性迴歸預測Pizza價格案例 2.線性迴歸分析波士頓房

機器學習入門：線性迴歸及梯度下降（附matlab程式碼）

本文會講到： (1)線性迴歸的定義 (2)單變數線性迴歸 (3)cost function：評價線性迴歸是否擬合訓練集的方法 (4)梯度下降：解決線性迴歸的方法之一 (5)feature scaling：加快梯度下降執行速度的方法 (6)多變數線性迴歸 Linea

機器學習之線性迴歸及程式碼示例

一、線性迴歸線性迴歸一般用來做連續值的預測，預測的結果為一個連續值。因訓練時學習樣本不僅要提供學習的特徵向量X，而且還要提供樣本的實際結果（標記label），所以它是一種有監督學習。其中 X={x0,x1,...,xn}。線性迴歸需要學習得到的是一個對映

線性迴歸及梯度下降演算法詳解

一、線性迴歸問題迴歸最簡單的定義是，給出一個點集D，用一個函式去擬合這個點集，並且使得點集與擬合函式間的誤差最小，如果這個函式曲線是一條直線，那就被稱為線性迴歸，如果曲線是一條二次曲線，就被稱為二次迴歸。總的來說，迴歸的目的就是建立一個迴歸方程用

python手擼線性迴歸及引數解釋

線性迴歸，簡單的理解，在二維空間中，找到一條直線去儘可能的擬合樣本資料，給出新的樣本x，可以預測其y值，y是連續值，分類是離散值，如圖1所示；如果是高維空間，那就是找到一個超平面去擬合，當然也可以是曲線；為了方便理解，以二維空間的直線為例，所謂找到最好的直線，就是找引數a和

機器學習：單變數線性迴歸及梯度下降

***************************************** 注：本系列部落格是博主學習Stanford大學 Andrew Ng 教授的《機器學習》課程筆記。博主深感學過課程後，不進行總結很容易遺忘，根據課程加上自己對不明白問題的補充遂有此係列部落格。

Machine Learning（Stanford）| 斯坦福大學機器學習筆記--第二週（1.多元線性迴歸及多元線性迴歸的梯度下降）

一.Multivariate Linear regression(多元線性迴歸) 現在起將開始介紹一種新的更為有效的線性迴歸形式。這種形式適用於多個變數或者多特徵量的情況。在之前學習過的線性迴歸中

一起學python-opencv四（字串操作和陣列運算及矩陣運算）

沒錯，這個應該是暫時的numpy的第一階段學習的最後一講。在下一講將要先回歸到opencv，因為暫時這些numpy的知識肯定是夠好幾講用的，numpy這個東西確實有點枯燥，所以先回歸到opencv應用一下，理論到實踐的過程是需要的。我們還是耐心地字串函式

線性迴歸矩陣求導

一種方便區別是概率還是似然的方法是，根據定義，"誰誰誰的概率"中誰誰誰只能是概率空間中的事件，換句話說，我們只能說，事件(發生)的概率是多少多少(因為事件具有概率結構從而刻畫隨機性，所以才能談概率)；而"誰誰誰的似然"中的誰誰誰只能是引數，比如說，引數等於時的似然是多少

資料結構例程——對稱矩陣的壓縮儲存及基本運算

線性迴歸之最小二乘法舉例推導及python實現

1 核心思想通過最小化方差，使得擬合結果無限接近目標結果。 2 通過一元線性方程舉例說明 3 通過python實現一元線性擬合 import matplotlib.pyplot as plt import random # 用於儲存x,y擬合數據 x = []

【ML_Algorithm 1】線性迴歸——演算法推導及程式碼實現

：：：：：：：：線性迴歸：：：：：：：：第一式第二式從式一到式二，需要新增一個

09 線性迴歸及矩陣運算

09 線性迴歸及矩陣運算

線性迴歸

迴歸的應用場景 （連續型資料）

線性關係模型

損失函式（誤差）

線性迴歸演算法案例

API

波士頓房價預測

迴歸效能評估

兩種預測方式的選擇

過擬合與欠擬合

欠擬合原因及解決方法

過擬合原因及解決方法

L2正則化

Ridge API

線性迴歸LinearRegression 與 Ridge對比

相關推薦

迴歸的應用場景（連續型資料）