機器學習_線性回歸

阿新 • • 發佈：2018-08-15

ray 線性回歸麻煩小時數據集 nal best lin rand()

線性回歸

人工智能是機器學習的父類；機器學習是深度學習的父類

1. 怎麽做線性回歸？

2. 理解回歸 -- 最大似然函數

3. 應用正態分布概率密度函數 -- 對數總似然

4. 推導出損失函數 -- 推導出解析解

5. 代碼實現解析解的方式求解 -- 梯度下降法的開始 -- sklearn模塊使用線性回歸

線性： y = a * x 一次方的變化

回歸：回歸到平均值

簡單線性回歸

算法 = 公式

一元一次方程組

一元：一個x 影響y的因素，維度

一次：x的變化沒有非線性的變化

y = a * x + b

x1,y1 x2,y2 x3,y3 x4,y4 ...

誤差最小的 -- 最優解

做機器學習，沒有完美解，只有最優解

做機器學習就是要以最快的速度，找到誤差最小的最優解

一個樣本的誤差：

yi^ - yi

找到誤差最小的時刻；為了去找到誤差最小的時刻，需要反復嘗試，a,b

根據最小二乘法去求得誤差

反過來誤差最小時刻的a,b就是最終最優解模型！！！

===========================================================================

多元線性回歸

y = a*x+b

y = w0+w1*x1+w2*x2

向量轉置相乘x0=1

不止兩個特征

截距(w0)，什麽都不做，本身就存在那裏(物體本身就漂亮，不加修飾也漂亮)

x1...xn：n個特征

本質上就是算法（公式）變換為了多元一次方程組

y = w1 * x1 + w2 * x2 + w3 * x3 + ... +wn * xn + w0 * x0 (x0恒為1時可不寫)

===========================================================================

最大似然估計：

是一種統計方法，用來求一個樣本集的相關概率密度函數的參數

‘似然’(likelihood)：即‘可能性’，通俗易懂叫法：‘最大可能性估計’

likelihood 與 probability 同義詞

中心極限定理：

是概率論中討論隨機變量序列部分和分步漸進於正態分布的一類定理

誤差(ε)：

第i個樣本實際的值等於預測的值加誤差

假定所有的樣本都是獨立的，有上下的震蕩，震蕩認為是隨機變量，足夠多的隨機變量疊加之後形成的分布，根據中心極限定理，它服從的就是正態分布，因為它是正常狀態下的分布

最小二乘法：

概率密度函數：

最簡單的概率密度函數：均勻分布的密度函數，

技術分享圖片

一維正態分布

若隨機變量X服從一個位置參數為μ、尺度參數為σ的概率分布，且其概率密度函數為

技術分享圖片

則這個隨機變量就稱為正態隨機變量，正態隨機變量服從的分布就稱為正態分布

標準正態分布

當μ=0，σ=1時，正態分布就成為標準正態分布：

技術分享圖片

求總似然：

技術分享圖片

因為連乘太麻煩，故想到用log函數使得連乘變成相加，log函數為單調遞增函數，故可以.

技術分享圖片

通過最大似然估計的思想，利用了正態分布的概率密度函數，推導出了損失函數

誤差函數的另一種表達：

技術分享圖片

找損失最小的過程就是求極值的過程(導數為0)

技術分享圖片

解析解：

技術分享圖片

總結：

(1) 為什麽求總似然的時候，要用正態分布？

中心極限定理，如果假設樣本之間是獨立事件，誤差變量隨即產生，那麽就服從正太分布.

(2) 總似然不是概率相乘嗎？為什麽用了概率密度函數的f(xi)進行了相乘？

因為概率不好求，所以當我們可以找到概率密度相乘最大的時候，就相當於找到了概率相乘最大的時候.

(3) 概率為什麽不好求？

因為求的是面積，需要積分，麻煩。不用去管數學上如何根據概率密度函數去求概率.

(4) 總似然最大和最優解有什麽關系？

當我們找到可以使得總似然最大的條件，也就是可以找到我們的DataSet數據集最吻合某個正態分布，即找到了最優解

通過最大似然估計的思想，利用了正態分布的概率密度函數，推導出了損失函數

(5) 什麽是損失函數？

一個函數最小，就對應了模型是最優解，預測歷史數據可以最準.

(6) 線性回歸的損失函數是什麽？

最小二乘法；MSE(mean squared error)[平方均值損失函數，均方誤差]

(6) 線性回歸的損失函數有哪些假設？

樣本獨立；隨機變量；服從正態分布

(7) ML學習特點：

不強調模型100%正確；

強調模型是有價值的，堪用的.

通過對損失函數求導，來找到最小值，求出θ的最優解；

代碼實現解析解的方式求解

import numpy as np
import matplotlib.pyplot as plt
 
#這裏相當於是隨機X維度X1，rand是隨機均勻分布
#rand()：返回0-1之間的數
X=2*np.random.rand(100,1)#100行1列
 
#人為的設置真實的Y一列，np.random.randn(100,1)是設置error(方差)，randn是標準正態分布
#np.random.randn(100,1)返回標準正態分布上的一個隨機值，取0的概率比較大一些
#（4+3*X）是預測值、np.random.randn(100,1)是誤差ε
#預測值==W的轉置*X
#4==W0；3==W1
y=4+3*X+np.random.randn(100,1)#100行1列
 
#整合X0和X1
#np.ones(100,1)輸出100行1列個1
X_b=np.c_[np.ones((100,1)),X]
print(X_b)
 
#常規等式求解θ(theta)
#inv:求逆、dot：點乘、.T：轉置
theta_best=np.linalg.inv(X_b.T.dot(X_b)).dot(X_b.T).dot(y)

print(theta_best)

#創建測試集裏面的X1
X_new=np.array([[0],[2]])
X_new_b=np.c_[(np.ones((2,1))),X_new]
print(X_new_b)
y_predict=X_new_b.dot(theta_best)
print(y_predict)
‘‘‘
[[3.98173243]
[10.17046616]]
‘‘‘


 
 
plt.plot(X_new,y_predict,‘r-‘)
plt.plot(X,y,‘b.‘)
plt.axis([0,2,0,15])#標註x軸的範圍是0-2，y的範圍是0-15
plt.show()


 
 
實際上當數據特別多的時候，用上述方法求解特別慢

機器學習_線性回歸

ray 線性回歸麻煩小時數據集 nal best lin rand() 線性回歸人工智能是機器學習的父類；機器學習是深度學習的父類 1. 怎麽做線性回歸？ 2. 理解回歸 -- 最大似然函數 3. 應用正態分布概率密度函數 -- 對數總似然 4

從零單排入門機器學習：線性回歸（linear regression）實踐篇

class rom enter instr function ont 線性 gin 向量線性回歸（linear regression）實踐篇之前一段時間在coursera看了Andrew ng的機器學習的課程，感覺還不錯，算是入門了。這次打算以該課程的作業

第四篇[機器學習] 機器學習，線性回歸的優化

images .html span mod 來看 itl sso linear 我們當我們的數據存在多重共線性時，即其中的一個自變量可以用其他一個或幾個自變量的線性表達式進行表示，你會發現，擬合之後的方差會特別大一般說來當解釋變量的容忍度(TOLERANCE)小於0.1

20171028機器學習之線性回歸過擬合問題的解決方案

ces 函數彈性 alpha mach rom 定性 ast cep 在函數中加入一個正則項：三種方式：一、Ridge回歸（嶺回歸）：　　優點：具有較高的準確性、魯棒性以及穩定性　　缺點：求解速度慢二、Lasso回歸：　　優點：求解速度快（原理降維計算

【機器學習】--線性回歸中L1正則和L2正則

last clas nbsp post pan red font 推廣 http 一、前述 L1正則，L2正則的出現原因是為了推廣模型的泛化能力。相當於一個懲罰系數。二、原理 L1正則：Lasso Regression L2正則：Ridge Regression

機器學習：線性回歸——理論與代碼實現（基於正規方程與梯度下降）

overfit 返回 pen ear 隨機梯度是否很大的建模回歸一線性模型給定由n個屬性描述的列向量\(f(\mathbf{x})={(x^{(1)};x^{(2)};...;x^{(n)})}\)，其中 \(x^{(j)}\)是\(\textbf{x}\)

機器學習之線性回歸

read 權重矩陣 add spl 比較 nic 影響 lib com 目錄預測數值型數據：回歸用線性回歸找到最佳擬合直線程序8-1 標準回歸函數和數據導入函數程序8-2 基於程序8-1繪圖圖片8-1 ex0的數據集和它的最佳擬合直線局部加權線性回歸圖片8

機器學習入門——線性回歸預測廣告投入數據集

continue 結果手寫 alt iter 根路徑 num 三種不同的 0.Advertising數據集　　Advertising數據集是關於廣告收益與廣告在不同的媒體上投放的相關數據，分別是在TV，Radio，Newspaper三種媒體上投放花費與，投放所產生的

機器學習中的回歸理解

機器學習中的線性模型理解機器學習中的類別均衡問題？分為類別平衡問題和類別不平衡問題類別平衡問題：可以采用回歸類別不平衡問題：可以采用在縮放針對類別的回歸問題有線性回歸：非線性回本文出自 “簡答生活” 博客，謝絕轉載！機器學習中的回歸理解

[機器學習實戰] Logistic回歸

.... log 運算 blog 死亡率在線實戰批處理參數更新 1. Logistic回歸：　　1）優點：計算代價不高，易於理解和實現；　　2）缺點：容易欠擬合，分類精度可能不高；　　3）適用數據類型：數值型和標稱型數據； 2. 分類思想：　　根據現有數

關於機器學習中LASSO回歸的相關補充

lasso回歸軟閾收縮算子 fist算法在之前的相關文章中筆者給出了一般回歸的補充，即嶺回歸和LASSO回歸，它們都是為了解決在回歸過程中的過擬合問題，其具體解決方案就分別是在目標函數後增加2範數和1範數以限定參數的表現，對於嶺回歸而言，由於2使用範數的原因，這個目標函數仍是可導的，但對於LASSO回

機器學習之邏輯回歸

反向 margin -1 mil 局部最優一個數簡單 line 滿足給定一張圖片，如何讓計算機幫助我們識別它是不是一張貓的圖片，這個問題可以看成一個簡單的分類問題。如下圖所示，平面上有兩種不同顏色（黑色，紅色）的點，我們要做到就是要找到類似與那條直線那樣的界限。當某個

機器學習之Logistic 回歸算法

簡單生成選擇效率 split max 坐標 opened 似然函數 1 Logistic 回歸算法的原理 1.1 需要的數學基礎我在看機器學習實戰時對其中的代碼非常費解，說好的利用偏導數求最值怎麽代碼中沒有體現啊，就一個簡單的式子：θ= θ - α Σ [( hθ(

【CS229筆記一】監督學習，線性回歸，LMS算法，正態方程，概率解釋和局部加權線性回歸

中心 sqrt 情況 pst 預測更新然而回歸 gauss 監督學習對於一個房價預測系統，給出房間的面積和價格，以面積和價格作坐標軸，繪出各個點。定義符號： \(x_{(i)}\)表示一個輸入特征\(x\)。 \(y_{(i)}\)表示一個輸出目標\(y\)。

機器學習1-關於回歸問題的準確性評價

均方誤差定性完美 absolute post div red ria var 網址https://book.douban.com/reading/46607817/ 建立回歸器後，需要建立評價回歸器擬合效果的指標模型。平均誤差(mean absolute error)

機器學習：邏輯回歸（損失函數）

梯度模型分享圖片 com info 而且機器學習邏輯分類 # # 由於邏輯回歸解決的是分類問題，而且是二分類，因此定義損失函數時也要有兩類　　# 1）如果 y = 1（p ≥ 0.5），p 越小，損失函數越大；　　# 2）如果 y = 0（p ≤ 0.5），

機器學習_線性迴歸模型

1.線性迴歸 1.1模型 1.1.1目標函式（損失函式、正則） a.無正則：最小二乘線性迴歸（OLS） b.L2正則：嶺迴歸（Ridge Regression） c.L1正則：Lasso 1.1.2概率解釋最小二乘線性迴歸等價於

機器學習實戰-邏輯回歸

one har 改進 lin [] readlines 機器 iter sun 邏輯回歸：簡單的來說，在線性回歸的基礎上加入了Sigmoid函數！ import numpy as np import matplotlib.pyplot as plt from matp

機器學習之 Logistic 回歸(邏輯回歸)

準備 eight 後者 sel sigmoid sts 公式兩種回歸算法目錄 Logistic回歸博客園地址：https://www.cnblogs.com/chenyoude/ git 地址：https://github.com/nickcyd/machine_

吳恩達機器學習筆記一_單變量線性回歸

gre ima 梯度下降算法 line 公式 delta mat 所有 pan 單變量線性回歸綱要代價函數梯度下降算法全局最優與局部最優代價函數函數定義： \[ J(\theta_0,\theta_1,...)=\frac{1}{2m}\sum_{i=1}^

機器學習_線性回歸

相關推薦