【Machine Learning 】線性迴歸

阿新 • • 發佈：2018-12-14

線性迴歸

我們可以通過測量損耗來衡量線路的適合程度。
線性迴歸的目標是最小化損失。
為了找到最佳擬合線，我們嘗試找到最小化損失的b值（截距）和m值（斜率）。
收斂是指引數在每次迭代時停止變化時的引數
學習率是指每次迭代時引數的變化程度。
我們可以使用Scikit-learn的LinearRegression()模型對一組點進行線性迴歸。

Scikit-Learn庫

line_fitter = LinearRegression() 建立模型
line_fitter.fit(temperature, sales) 傳入引數
sales_predict = line_fitter.predict(temperature) 預測模型

import codecademylib3_seaborn
from sklearn.linear_model import LinearRegression
import matplotlib.pyplot as plt
import numpy as np

temperature = np.array(range(60, 100, 2))
temperature = temperature.reshape(-1, 1)
sales = [65, 58, 46, 45, 44, 42, 40, 40, 36, 38, 38, 28, 30, 22, 27, 25, 25, 20, 15, 5]

line_fitter = LinearRegression()
line_fitter.fit(temperature, sales)
sales_predict = line_fitter.predict(temperature)

plt.plot(temperature, sales, 'o')
plt.plot(temperature,sales_predict)

plt.show()

原理

預測直線直線上會有loss

import codecademylib3_seaborn
import matplotlib.pyplot as plt
months = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12]
revenue = [52, 74, 79, 95, 115, 110, 129, 126, 147, 146, 156, 184]

#slope:
m = 12
#intercept:
b = 35

plt.plot(months, revenue, "o")

y = [m*month + b for month in months]

plt.plot(months,y)

plt.show()

LOSS

計算loss時要使用平方距離如下圖 A的loss是 9(3^2) B的loss是1(1^2)

總loss=10 如果發現一條線路使loss小於10 那麼這條線路會成為更好的線路

for i in range(len(y)):
  total_loss+=(y_predicted[i]-y[i])**2

減少loss

grandient descent 梯度下降

找到一點斜率向下的方向說明可以減少損失,所以應該漸變向下

公式

N is the number of points we have in our dataset
m is the current gradient guess 斜率
b is the current intercept guess 截距

找到當截距=b時的梯度的函式

def get_gradient_at_b(x,y,m,b):
    diff=0
    for i in range(len(x)):
      diff+=(y[i]-(m*x[i]+b))
    b_gradient=diff*(-2)/len(x)
    return b_gradient

公式

N is the number of points we have in our dataset
m is the current gradient guess 斜率
b is the current intercept guess 截距

找到當斜率=m時的梯度的函式

def get_gradient_at_m(x, y, m, b):
    diff = 0
    N = len(x)
    for i in len(x):
      diff += x[i]*(y[i]-(m*x[i]+b))
    m_gradient = -2/N * diff
    return m_gradient

得到合適的梯度

def get_gradient_at_b(x, y, b, m):
  N = len(x)
  diff = 0
  for i in range(N):
    x_val = x[i]
    y_val = y[i]
    diff += (y_val - ((m * x_val) + b))
  b_gradient = -(2/N) * diff  
  return b_gradient

def get_gradient_at_m(x, y, b, m):
  N = len(x)
  diff = 0
  for i in range(N):
      x_val = x[i]
      y_val = y[i]
      diff += x_val * (y_val - ((m * x_val) + b))
  m_gradient = -(2/N) * diff  
  return m_gradient

#Your step_gradient function here
def step_gradient(x, y, b_current, m_current):
    b_gradient = get_gradient_at_b(x, y, b_current, m_current)
    m_gradient = get_gradient_at_m(x, y, b_current, m_current)
    b = b_current - (0.01 * b_gradient)
    m = m_current - (0.01 * m_gradient)
    return [b, m]

months = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12]
revenue = [52, 74, 79, 95, 115, 110, 129, 126, 147, 146, 156, 184]

# current intercept guess:
b = 0
# current slope guess:
m = 0

b, m = step_gradient(months, revenue, b, m)
print(b, m)

【Machine Learning 】線性迴歸

線性迴歸我們可以通過測量損耗來衡量線路的適合程度。線性迴歸的目標是最小化損失。為了找到最佳擬合線，我們嘗試找到最小化損失的b值（截距）和m值（斜率）。收斂是指引數在每次迭代時停止變化時的引數學習率是指每次迭代時引數的變化程度。我們可以

【番外】線性迴歸和邏輯迴歸的 MLE 視角

線性迴歸令 z = w

【機器學習】線性迴歸演算法的過擬合比較

回顧過擬合與欠擬合主要介紹了什麼是欠擬合什麼是過擬合對抗過擬合主要介紹了線性迴歸中對抗過擬合的方法，主要包括：L1-norm的LASSO迴歸、L2-norm的Ridge迴歸，此外還有一個沒有提到，L1-norm和L2-norm結合的Elasitc Net(彈性網

【Machine :Learning】樸素貝葉斯

1. 樸素貝葉斯：條件概率在機器學習演算法的應用。理解這個演算法需要一點推導。不會編輯公式。。核心就是在已知訓練集的前提條件下，算出每個特徵的概率為該分類的概率，然後套貝葉斯公式計算預測集的所有分類概率，預測型別為概率最大的型別 from numpy import * def l

【ML_Algorithm 1】線性迴歸——演算法推導及程式碼實現

：：：：：：：：線性迴歸：：：：：：：：第一式第二式從式一到式二，需要新增一個

【學習筆記】線性迴歸

人們早就知道(並且找到了計算方法)，相比涼爽的天氣，在溫度較高的時候，蟋蟀鳴叫更為頻繁。這裡文件給出了我們圖片，我們拿一個直尺很容易就能畫一條線來近似這種關係。雖然該直線並沒有精確的穿過每個點，但是我們還是能總結出大概的關係: y = w*x + b 這裡的 y

【深度學習】線性迴歸（一）原理及python從0開始實現

文章目錄線性迴歸單個屬性的情況多元線性迴歸廣義線性模型實驗資料集介紹相關連結 Python實現環境編碼

【深度學習】線性迴歸（三）使用MXNet深度學習框架實現線性迴歸

文章目錄概述程式碼概述這篇文章使用MXNet深度學習框架中的Gluon包實現小批量隨機梯度下降的線性迴歸問題。可以參考我的上一篇文章【深度學習】線性迴歸（二）小批量隨機梯度下降及其python實現。主要包

【深度學習】線性迴歸（二）小批量隨機梯度下降及其python實現

文章目錄概述小批量隨機梯度下降解析解和數值解小批量隨機梯度下降 python實現需要的先驗知識程式碼和實驗概述本文

【機器學習】線性迴歸模型分析

具體原理不講了，線性迴歸模型，代價損失函式 COST是均方誤差，梯度下降方法。屬性取值。模型的屬性取值設定需要根據每一個引數的取值範圍來確定，將所有的屬性的取值統一正則化normalization，統一規定在0~1的範圍，或者-1~1的範圍內，這樣在進行線性迴歸時不會造成

【機器學習】線性迴歸+程式碼實現

參考：《機器學習實戰》原始碼地址以及資料：https://github.com/JieruZhang/MachineLearninginAction_src 1. 標準線性迴歸(LR) y

【Machine Learning】使用隨機森林進行特徵選擇

一、特徵選擇在我們做特徵工程時，當我們提取完特徵後，可能存在並不是所有的特徵都能分類起到作用的問題，這個時候就需要使用特徵選擇的方法選出相對重要的特徵用於構建分類器。此外，使用特徵選擇這一步驟也大大減少了訓練的時間，而且模型的擬合能力也不會出現很大的降低問

【Machine Learning】【Python】三、PSO + PCA優化SVM引數C和gamma ---- 《SVM物體分類和定位檢測》

---------------------【6.27 更新libsvm使用方法】-------------------------------------------------------------

【machine learning】GMM演算法（Python版）

本文參考CSDN大神的博文，並在講述中引入自己的理解，純粹理清思路，並將程式碼改為了Python版本。（在更改的過程中，一方面理清自己對GMM的理解，一方面學習了numpy的應用，不過也許是Python粉指數超標才覺得有必要改(⊙o⊙)）一、GMM模型

【Machine learning】引數估計（個人通俗理解）

問題背景：我們知道了總體的分佈，但不知道分佈的引數，因此我們就要對未知的引數做出估計。兩個型別的估計： 1.點估計 2.區間估計 1.點估計包括矩估計和極大似然估計 1）矩估計：用樣本矩去估計總體矩這裡就可以用樣本一階矩（均值）估計整體一階矩（

【Machine Learning】【Python】一、HoG + SVM 物體分類 ---- 《SVM物體分類和定位檢測》

----------【2018.09.07更新】--- 如果你看到了這篇文章，並且從github下載了程式碼想走一遍整個流程。我強烈建議你把《SVM物體分類和定位檢測》這一系列的6篇文章都仔細看一遍。內容不多，但會對你理解演算法和程式碼有很大的幫助。 ----------

【Machine Learning】Python開發工具：Anaconda+Sublime

作者：白寧超 2016年12月23日21:24:51 摘要：隨著機器學習和深度學習的熱潮，各種圖書層出不窮。然而多數是基礎理論知識介紹，缺乏實現的深入理解。本系列文章是作者結合視訊學習和書籍基礎的筆記所得。本系列文章將採用理論結合實踐方式編寫。首先介紹機器學習和深度學習的範疇，然後介紹關於訓練集、測試

【Machine Learning】機器學習及其基礎概念簡介

基本概念：訓練集，測試集，特徵值，監督學習，非監督學習，半監督學習，分類，迴歸概念學習：人類學習概念：鳥，車，計算機定義：概念學習是指從有關某個布林函式的輸入輸出訓練樣例中推斷出該布林函式例子：學習 “享受運動" 這一概念：小明進行水上運動，是否享受運動取決於很多因素樣例天

【Machine Learning】KNN演算法虹膜圖片識別

import csv import math import random import operator ''' Description:python呼叫機器學習庫scikit-learn的K臨近演算法，實現花瓣分類 Author:Bai Ningchao DateTime:2017年1

【Machine Learning】決策樹案例：基於python的商品購買能力預測系統

作者：白寧超 2016年12月24日22:05:42 摘要：隨著機器學習和深度學習的熱潮，各種圖書層出不窮。然而多數是基礎理論知識介紹，缺乏實現的深入理解。本系列文章是作者結合視訊學習和書籍基礎的筆記所得。本系列文章將採用理論結合實踐方式編寫。首先介紹機器學習和深度學習的範疇，然後介紹關於訓練集、

【Machine Learning 】線性迴歸

線性迴歸

Scikit-Learn庫

原理

LOSS

減少loss

grandient descent 梯度下降

公式

找到當截距=b時的梯度的函式

公式

找到當斜率=m時的梯度的函式

相關推薦