線性迴歸與嶺迴歸python程式碼實現

阿新 • • 發佈：2019-01-02

一、標準線性迴歸

線上性迴歸中我們要求的引數為：

所以程式碼實現主要就是實現上式，python程式碼如下：

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

# implement stand regress
def standRegress(xArr,yArr):
    # 將陣列轉換為矩陣
    xMat = np.mat(xArr)
    yMat = np.mat(yArr)
    xTx = xMat.T * xMat # 計算xTx的
    if np.linalg.det(xTx) == 0.0:
        print('xTx不能求逆矩陣')
        return
    theta = xTx.I * (xMat.T * yMat)
    yHat = xMat*theta
    return yHat

# import data
ex0 = np.loadtxt('ex0.txt',delimiter='\t')

# deal with data
xArr = []
yArr = []
for data in ex0:
    # print(data)
    xTmp = []
    yTmp = []
    xTmp.append(data[0])
    xTmp.append(data[1])
    yTmp.append(data[2])
    xArr.append(xTmp)
    yArr.append(yTmp)

# print(ex0)
# print(xArr[0:2])
print(yArr)
# ws = standRegress(xArr,yArr)
# print(ws)
yHat = standRegress(xArr,yArr)
xMat = np.mat(xArr)
yMat = np.mat(yArr)
# print(yMat.T[0,:].flatten().A[0])
plt.scatter(xMat[:,1].flatten().A[0],yMat.T[0,:].flatten().A[0]) # real data
plt.plot(xMat[:,1],yHat,'r-') # predict data
plt.show()

執行結果如下：

二、區域性加權線性迴歸

使用區域性加權解出的迴歸係數為：

python程式碼如下：

import numpy as np
import matplotlib.pyplot as plt

def lwlr(testPoint,xArr,yArr,k=1.0):
    xMat = np.mat(xArr)
    yMat = np.mat(yArr)
    m = np.shape(xMat)[0] #shape 讀取矩陣的長度 shape[0]獲得矩陣第一維的長度
    # print(m)
    weights = np.mat(np.eye(m)) # 建立對角矩陣
    # print(weights)
    for j in range(m):                      #next 2 lines create weights matrix
        diffMat = testPoint - xMat[j,:]     #矩陣每行的差
        weights[j,j] = np.exp(diffMat*diffMat.T/(-2.0*k**2)) # 計算權重
    xTx = xMat.T * (weights * xMat)
    if np.linalg.det(xTx) == 0.0:
        print("This matrix is singular, cannot do inverse")
        return
    ws = xTx.I * (xMat.T * (weights * yMat))
    return testPoint * ws

def lwlrTest(testArr,xArr,yArr,k=1.0):
    m = np.shape(testArr)[0]
    yHat = np.zeros(m)
    for i in range(m):
        yHat[i] = lwlr(testArr[i],xArr,yArr,k)
    return yHat

# import data
ex0 = np.loadtxt('ex0.txt',delimiter='\t')

# deal with data
xArr = []
yArr = []
for data in ex0:
    # print(data)
    xTmp = []
    yTmp = []
    xTmp.append(data[0])
    xTmp.append(data[1])
    yTmp.append(data[2])
    xArr.append(xTmp)
    yArr.append(yTmp)

# 對單點估計
# yHat = lwlr(xArr[0],xArr,yArr,1.0)
# print(yHat)
# 得到所有點的估計
yHat = lwlrTest(xArr,xArr,yArr,0.02)
xMat = np.mat(xArr)
yMat = np.mat(yArr)
# print(xMat)
strInd = xMat[:,1].argsort(0) # argsort返回陣列值從小到大排列後各元素對應的索引值
# print(strInd)
xSort = xMat[strInd][:,0,:] # 排序
# print(xSort)

plt.scatter(xMat[:,1].flatten().A[0],yMat.T[0,:].flatten().A[0]) # real data
plt.plot(xSort[:,1],yHat[strInd],'r-') # predict data
plt.show()

執行結果如下：

更改k的值會獲得不同的曲線，k越小，對真實資料擬合的越好（但可能過擬合），k越大，越趨向於標準的線性迴歸。

三、嶺迴歸

嶺迴歸就是在矩陣xTx上增加一項使得矩陣非奇異，從而能夠對其求逆。從上面兩端程式碼我們可以看到，在之前對xTx求逆時都需要先判斷xTx是否可以求逆，而嶺迴歸就是解決這個問題的。嶺迴歸的迴歸係數計算公式為：

實現程式碼如下：

import numpy as np
import matplotlib.pyplot as plt

def ridgeRegres(xMat,yMat,lam=0.2):
    xTx = xMat.T*xMat
    denom = xTx + np.eye(np.shape(xMat)[1])*lam
    if np.linalg.det(denom) == 0.0:
        print("This matrix is singular, cannot do inverse")
        return
    ws = denom.I * (xMat.T*yMat)
    return ws

def ridgeTest(xArr,yArr):
    xMat = np.mat(xArr); yMat=np.mat(yArr).T
    yMean = np.mean(yMat) # 資料標準化
    # print(yMean)
    yMat = yMat - yMean
    # print(xMat)
    #regularize X's
    xMeans = np.mean(xMat,0)
    xVar = np.var(xMat,0)
    xMat = (xMat - xMeans) / xVar #（特徵-均值）/方差
    numTestPts = 30
    wMat = np.zeros((numTestPts,np.shape(xMat)[1]))
    for i in range(numTestPts): # 測試不同的lambda取值，獲得係數
        ws = ridgeRegres(xMat,yMat,np.exp(i-10))
        wMat[i,:]=ws.T
    return wMat


# import data
ex0 = np.loadtxt('abalone.txt',delimiter='\t')
xArr = ex0[:,0:-1]
yArr = ex0[:,-1]
# print(xArr,yArr)
ridgeWeights = ridgeTest(xArr,yArr)
# print(ridgeWeights)
plt.plot(ridgeWeights)
plt.show()

執行結果如圖：

縱座標為迴歸係數，橫座標為log(lambda)，在最左邊，迴歸係數與線性迴歸一致，最右邊係數全部縮減為0.

其中間某部分可以得到最好的預測結果，為了定量進行尋找最佳引數，還需要進行交叉驗證。

以上程式碼python環境均為python3.6

程式碼參考：

《機器學習實戰》

資料取自《機器學習實戰》附帶資料

線性迴歸與嶺迴歸python程式碼實現

一、標準線性迴歸線上性迴歸中我們要求的引數為：所以程式碼實現主要就是實現上式，python程式碼如下： import numpy as np import pandas as pd import matplotlib.pyplot as plt # implem

SVM原理_SVM分類和迴歸預測中的python程式碼實現

今天晚上有點惱火，花60大洋買了一本書，越來越替某些出書的作者擔憂（真想說一句，閉上你TM的那張臭嘴，別用良心去轉版權費），寫的真的是太糟糕了…….不知到是什麼支撐它寫下去的。不說了，回到上面的內容。但還是要說幾點注意事項：（1）支援向量機它輸出的不是

Logistic Regression 邏輯迴歸演算法例子，python程式碼實現

轉載自原文邏輯迴歸 Logistic Regression 雖然名字叫做邏輯迴歸 Logistic regression ，但它是一種分類演算法。對於文字處理方便，邏輯迴歸是一種非常強大的分類器。它主要通過在邏輯函式上執行迴歸來實現，正如其名字。邏輯迴歸的一個小

機器學習：線性迴歸與Python程式碼實現

前言：本篇博文主要介紹線性迴歸模型（linear regression），首先介紹相關的基礎概念和原理，然後通過Python程式碼實現線性迴歸模型。特別強調，其中大多理論知識來源於《統計學習方法_李航》和斯坦福課程翻譯筆記以及Coursera機器學習課程。 1.線性迴歸

機器學習：邏輯迴歸與Python程式碼實現

前言：本篇博文主要介紹邏輯迴歸（logistic regression），首先介紹相關的基礎概念和原理，然後通過Python程式碼實現邏輯迴歸的二分類問題。特別強調，其中大多理論知識來源於《統計學習方法_李航》和斯坦福課程翻譯筆記以及Coursera機器學習課程。本篇博

邏輯迴歸原理介紹與案例python程式碼實現

邏輯迴歸是用於分類的演算法。平常的線性迴歸方程為f(x)=wx+b，此時f(x)的取值可以是任意的，要讓預測的值可以分類，例如分類到class1是預測值為1，分類到class2時預測值為0。這時我們就要用到分類函式。下面來介紹一個分類函式sigmoid：其中z=wx+bf（z

機器學習：線性迴歸和嶺迴歸入門程式碼

機器學習中運用python進行對房子價格的預測程式碼，資料庫直接使用sklearn自帶的boston，使用三種方法進行預測，分別是：線性迴歸直接預測、梯度下降預測、嶺迴歸預測 from sklearn.datasets import load_boston fr

【機器學習】正則化的線性迴歸 —— 嶺迴歸與Lasso迴歸

注：正則化是用來防止過擬合的方法。在最開始學習機器學習的課程時，只是覺得這個方法就像某種魔法一樣非常神奇的改變了模型的引數。但是一直也無法對其基本原理有一個透徹、直觀的理解。直到最近再次接觸到這個概念，經過一番苦思冥想後終於有了我自己的理解。 0. 正則化（

常用的幾種機器學習演算法迴歸模型python程式碼實現

由於在論文實驗過程中一直使用的是python語言完成的論文實驗，所以在論文需要使用機器學習方法時就考慮使用了scikit-learn。 scikit-learn是一款很好的Python機器學習庫，它包含以下的特點：（1）簡單高效的資

邏輯斯諦迴歸--Python程式碼實現

原文出處本文在原文的基礎上增加僅一些個人理解前言上一篇文章中，已經說明在邏輯斯諦迴歸模型中就是利用極大似然估計，來求出引數ωω，然後根據輸入的xx，利用公式來預測yy 在本文中，當求出ωω後，不再利用P(Y=1|x)=exp(wx)1+exp(

梯度下降和邏輯迴歸例子(Python程式碼實現)

import numpy as np import pandas as pd import os data = pd.read_csv("iris.csv") # 這裡的iris資料已做過處理 m, n = data.shape dataMatIn = np.ones((m, n)) dataM

CART之迴歸樹python程式碼實現

一、CART ( Classification And Regression Tree) 分類迴歸樹 1、基尼指數：在分類問題中，假設有KK 個類，樣本點屬於第kk 類的概率為PkPk ，則概率分佈的基尼指數定義為： Gini(P)=∑k=1KPk(1

資料探勘經典演算法：線性迴歸、區域性加權迴歸、嶺迴歸、逐步線性迴歸 sklearn實現

這裡記錄一下關於迴歸方面的知識包括（線性迴歸、區域性加權迴歸、嶺迴歸、逐步線性迴歸）等基礎思想和程式碼實現。以及sklearn的實現方法。（資料來自機器學習實戰第八章）迴歸：分類的目標變數是標稱型資料，而回歸可以對連續型資料做預測，同樣也是尋找一條最佳的擬合線

機器學習：線性迴歸、嶺迴歸、Lasso迴歸

轉載自：https://blog.csdn.net/hzw19920329/article/details/77200475 線性迴歸作為一種迴歸分析技術，其分析的因變數屬於連續型變數，如果因變數轉變為離散型變數，將轉換為分類問題。迴歸分析屬於有監督學習問題，本部落格將重點回

機器學習 --- 線性迴歸與邏輯迴歸

線性迴歸和邏輯迴歸在機器學習上是一種監督式學習。在預測類問題上，我們希望能通過一個對映關係 ,當給定變數，能得到一個較為滿意的預測結果，迴歸方法旨在找到能表示樣本空間分佈的對映關係。一、線性迴歸的基本形式

嶺迴歸與lasso迴歸

a. 什麼是嶺迴歸和lasso迴歸？為什麼要用嶺迴歸和lasso迴歸？嶺迴歸選參的一般原則是什麼。對OLS進行範數1正則化叫Lasso迴歸。對OLS進行範數2正則化叫嶺迴歸。進行嶺迴歸和Lasso迴歸的主要目的： 1.解決病態矩陣的過擬合和欠擬合問題。 2

機器學習（一）邏輯迴歸與softmax迴歸及程式碼示例

本文適合已經對機器學習、人工智慧有過一定了解，但是還沒有自己寫過程式碼，或者一直在使用現有框架的同學。不用框架自己寫一次程式碼的過程還是很有必要的，能讓你真正地理解原理與機器學習中各個步驟的實現過程，而不是停留在“好像懂了”、只會調庫的階段。目錄

《一元一次方程解》虛擬碼與Python程式碼實現

解一元一次方程虛擬碼: class TreeStructure expression:string ->表示式 left:TreeStructure ->左邊的樹

線性迴歸與邏輯迴歸的區別

線性迴歸以經典的預測房價為例，假設樣本為（X,yiX, y_iX,yi），其中X是多維變數（X=(x1,x2...xn)X = (x_1, x_2...x_n)X=(x1,x2...xn)）

線性迴歸、嶺迴歸、Lasso迴歸、邏輯迴歸的總結

對於所有的模型和演算法，都有一個目標方程，比較理想的目標方程應該有兩部分構成：損失函式和正則項，一個用來衡量模型的擬合效果，一個用來儘可能保證模型的簡單和穩定： Obj(Θ)=L(Θ)+Ω(Θ)(2)(2)Obj(Θ)=L(Θ)+Ω(Θ) 損失函式：平方

線性迴歸與嶺迴歸python程式碼實現

一、標準線性迴歸

二、區域性加權線性迴歸

三、嶺迴歸

相關推薦