簡單線性迴歸演算法

阿新 • • 發佈：2018-11-27

一、目標

尋找一條直線，最大程度的“擬合”樣本特徵和樣本輸出標記之間的關係。在迴歸問題中我們預測的是一個具體的數值，這個具體的數值是在一個連續的空間裡的，如果想看兩個特徵的迴歸問題就需要在三維空間裡進行觀察。樣本特徵有多個的迴歸稱為多元線性迴歸

損失函式

對a求偏導數：

最後得到的結果：

求a、b的Python程式碼：

封裝SampleLinearRegression演算法的程式碼實現

"""coding:utf-8"""
import numpy as np
class SimpleLinearRegression(object):
    def __init__(self):
        """初始化Simple Linear Regression 模型"""
        self.a_ = None
        self.b_ = None
    def fit(self,x_train,y_train):
        """根據訓練資料集x_train,y_train訓練Simple Linear Regression模型"""
        assert x_train.ndim == 1, \
            "Simple Linear Regressor can only solve single feature training data."
        assert len(x_train) == len(y_train), \
            "the size of x_train must be equal to the size of y_train"
        x_mean = np.mean(x_train)
        y_mean = np.mean(y_train)
        num = 0.0
        d = 0.0
        for x,y in zip(x_train,y_train):
            num += (x-x_mean)*(y-y_mean)
            d += (x-x_mean)**2

        self.a_ = num/d
        self.b_ = y_mean-self.a_*x_mean
        return self

    def predict(self,x_predict):
        """給定待預測資料集x_predict,返回表示x_predict的結果向量"""
        assert x_predict.ndim == 1, \
            "Simple Linear Regressor can only solve single feature training data."
        assert self.a_ is not None and self.b_ is not None, \
            "must fit before predict!"
        return np.array([self._predict(x) for x in x_predict])

    def _predict(self,x):
        """給定單個待預測資料x，返回x的預測結果值"""
        return self.a_ * x +self.b_

    def __repr__(self):
        return "SimpleLinearRegression1()"

檢驗封裝演算法的測試程式碼

"""coding:utf-8"""
import numpy as np
import matplotlib.pyplot as plt
X = np.array([1.,2.,3.,4.,5.])
y = np.array([1.,3.,2.,3.,5.])
plt.scatter(X,y)
plt.axis([0,6,0,6])
plt.show()
from play_ML.SimpleLinearRrgression import SimpleLinearRegression
slr = SimpleLinearRegression()
slr.fit(X,y)
y_hat = slr.predict(X)
plt.scatter(X,y)
plt.plot(X,y_hat,color="r")
plt.axis([0,6,0,6])
plt.show()

測試結果

簡單線性迴歸演算法

一、目標尋找一條直線，最大程度的“擬合”樣本特徵和樣本輸出標記之間的關係。在迴歸問題中我們預測的是一個具體的數值，這個具體的數值是在一個連續的空間裡的，如果想看兩個特徵的迴歸問題就需要在三維空間裡

【機器學習演算法推導】簡單線性迴歸與多元線性迴歸

線性迴歸，主要用於從資料中擬合出一條直線（或更高維的平面），這條直線能夠很好地體現資料的特徵，比如，它能夠使得平面上的點都均勻地分佈在這條直線上。演算法思想對於簡單線性迴歸和多元線性迴歸，其演算法過程是相同的，不同之處在於簡單線性迴歸只有一個特徵需要擬合，多元線

梯度下降法實現最簡單線性迴歸問題python實現

梯度下降法是非常常見的優化方法，在神經網路的深度學習中更是必會方法，但是直接從深度學習去實現，會比較複雜。本文試圖使用梯度下降來優化最簡單的LSR線性迴歸問題，作為進一步學習的基礎。 import numpy as np import pandas as pd from numpy import *

簡單線性迴歸-最小二乘法推導過程

最近學習線性迴歸，自己推導了一下最小二乘法。其他參考文章： https://blog.csdn.net/chasdmeng/article/details/38869941?utm_source=blogxgwz0 https://blog.csdn.net/iter

Bobo老師機器學習筆記第五課-線性迴歸演算法的評估指標

評價線性迴歸的指標有四種，均方誤差（Mean Squared Error）、均方根誤差（Root Mean Squared Error）、平均絕對值誤差（Mean Absolute Error）以及R Squared方法。 sklearnz中使用的，也是大家推薦的方法是R Squared方法。

Bobo老師機器學習筆記第五課-簡單線性迴歸

課程地址：https://coding.imooc.com/class/169.html 最小二乘法的推導部落格點選此處程式碼實現（參考Bobo實現，如果要看BoBo老師原始碼，請點選此處）： # -*- encoding: utf-8 -*- """ 實現簡單的線性迴歸, 自己

簡單線性迴歸（ols）-py

簡單的線性迴歸，主要是sklearn庫的學習以及程式碼的實現 http://scikit-learn.org/stable/index.html # -*- coding: utf-8 -*- """ Created on Thu Nov 1 16:51:59 2018 @autho

6.線性迴歸之簡單線性迴歸

起步線性迴歸是利用數理統計和迴歸分析，來確定兩種或兩種以上變數間相互依賴的定量關係的一種統計分析方法。與之前的分類問題（Classification ）不一樣的是，分類問題的結果是離散型的；而回歸問題中的結果是數值型的。描述資料的特徵 1.均值( mean ) 2.中位

深入理解線性迴歸演算法（二）：正則項的詳細分析

前言當模型的複雜度達到一定程度時，則模型處於過擬合狀態，類似這種意思相信大家看到個很多次了，本文首先討論了怎麼去理解複雜度這一概念，然後回顧貝葉斯思想（原諒我有點囉嗦），並從貝葉斯的角度去理解正則項的含義以及正則項降低模型複雜度的方法，最後總結全文。 &nb

深入理解線性迴歸演算法（三）：淺談貝葉斯線性迴歸

前言上文介紹了正則化項與貝葉斯的關係，正則化項對應於貝葉斯的先驗分佈，因此通過設定引數的先驗分佈來調節正則化項。本文首先介紹了貝葉斯線性迴歸的相關性質，和正則化引數λ的作用，然後簡單介紹了貝葉斯思想的模型比較，最後總結全文。目錄 1、後驗引數分佈和預測變數分

機器學習筆記第5課：線性迴歸演算法

線性迴歸可能是統計學和機器學習中最知名且易於理解的演算法之一。它不就是一項起源於統計學的技術嗎？預測建模主要關注的是讓模型的誤差最小化，或者說，在可以解釋的前提下，儘可能作出最準確的預測。我們會借用，重用，甚至是竊取許多不同領域（包括統計學）的演算法，並將其用於上述的目標。線性迴歸

skiti-learn線性迴歸演算法庫

線性迴歸的目的是要得到輸出向量Y和輸入特徵X之間的線性關係，求出線性迴歸係數θ,也就是 Y=Xθ。其中Y的維度為mx1，X的維度為mxn，而θ的維度為nx1 LinearRegression 最常見的普通線性迴歸，損失函式如下： J(θ)=1/2 (Xθ−Y)T (Xθ−Y)

基於sciket-learn實現線性迴歸演算法

線性迴歸演算法主要用來解決迴歸問題，是許多強大的非線性模型的基礎，無論是簡單線性迴歸，還是多元線性迴歸，思想都是一樣的，假設我們找到了最佳擬合方程（對於簡單線性迴歸，多元線性迴歸對應多個特徵作為一組向量）y=ax+b，則對於每一個樣本點xi，根據我們的直線方程，預測值為y^i = axi + b,真

在Ignite中使用線性迴歸演算法

　　在本系列前面的文章中，簡單介紹了一下Ignite的機器學習網格，下面會趁熱打鐵，結合一些示例，深入介紹Ignite支援的一些機器學習演算法。　　　　如果要找合適的資料集，會發現可用的有很多，但是對於線性迴歸來說，一個非常好的備選資料集就是房價，可以非常方便地從UCI網站獲取合適的資料。　　　　在本文中會訓

機器學習（六）線性迴歸演算法分析概覽

前言前面介紹了迴歸家族中的邏輯迴歸，本篇部落格我們開始介紹線性迴歸演算法相關的問題，正所謂不同的特徵資料有不同的演算法來對待，今天我們要研究的這個演算法正好是具有線性特徵的資料所具有的特徵，與前面演算法的一個

Tensorflow 實現簡單線性迴歸模型

Tensorflow是深度學習常用的一個框架，從目前官方文件看，Tensorflow支援CNN、RNN和LSTM演算法，這都是目前在Image，Speech和NLP領域最流行的深度神經網路模型。為了熟悉和理解tensor

【機器學習】線性迴歸演算法的過擬合比較

回顧過擬合與欠擬合主要介紹了什麼是欠擬合什麼是過擬合對抗過擬合主要介紹了線性迴歸中對抗過擬合的方法，主要包括：L1-norm的LASSO迴歸、L2-norm的Ridge迴歸，此外還有一個沒有提到，L1-norm和L2-norm結合的Elasitc Net(彈性網

梯度下降、線性迴歸演算法中的梯度下降、為什麼要用梯度下降演算法。

梯度梯度是一個向量。函式上某點的梯度的方向：導數最大的方向。梯度的大小（梯度的模）：該點的導數的大小。梯度下降對於一般二次函式而言：由於梯度的方向是導數最大的方向，順著梯度方向走，函式值就變大的最快，順著梯度的反方向，那麼函式值減小最快的方向，導數也慢慢減小。當導數減為

三個評價線性迴歸演算法的標準MSE、RMSE、MAE

在分類演算法中，我們首先將資料集分成訓練資料集和測試資料集，用訓練資料集去訓練我們的分類模型，用測試資料集的輸入特徵去預測，將預測的結果與測試資料集的真實結果對比，得出模型的準確率。對於線性迴歸演算法：

【ML_Algorithm 1】線性迴歸——演算法推導及程式碼實現

：：：：：：：：線性迴歸：：：：：：：：第一式第二式從式一到式二，需要新增一個

簡單線性迴歸演算法

相關推薦