機器學習從零開始系列連載(2)——線性迴歸

阿新 • • 發佈：2019-01-04

作者：張磊

編輯：趙一帆

本週剩餘內容：

2. 建模方法回顧

2.0 偏差與方差

2.1 線性迴歸-Linear Regression

2.1.1 模型原理

2.1.2 損失函式

2.2 支援向量機-Support Vector Machine

2.2.1 模型原理

2.2.2 損失函式

2.2.3 核方法

2.3 邏輯迴歸-Logistic Regression

2.3.1 模型原理

2.3.2 損失函式

2.4 Bagging and Boosting框架

2.4.1 Bagging框架

2.4.2 Boosting框架

2.5 Additive Tree 模型

2.5.1 Random Forests

2.5.2 AdaBoost with trees

2.5.3 Gradient Boosting Decision Tree

2.5.4 簡單的例子

2.6 人工神經網路-Neural Network

2.6.1 神經元

2.6.2 神經網路的常用結構

2.6.3 一個簡單的神經網路例子

以通用的監督學習為例，基本包含4個部分:

偏差與方差

● 在機器學習演算法中，偏差是由先驗假設的不合理帶來的模型誤差，高偏差會導致欠擬合：所謂欠擬合是指對特徵和標註之間的因果關係學習不到位，導致模型本身沒有較好的學到歷史經驗的現象；

● 方差表徵的是模型誤差對樣本發生一定變化時的敏感度，高方差會導致過擬合：模型對訓練樣本中的隨機噪聲也做了擬合學習，導致在未知樣本上應用時出現效果較差的現象；

● 機器學習模型的核心之一在於其推廣能力，即在未知樣本上的表現。

對方差和偏差的一種直觀解釋

一個例子，假如我們有預測模型:

我們希望用f^e(x)估計f(x)，如果使用基於square loss 的線性迴歸，則誤差分析如下:

所以大家可以清楚的看到模型學習過程其實就是對偏差和方差的折中過程。

模型原理

標準線性迴歸通過對自變數的線性組合來預測因變數，組合自變數的權重通過最小化訓練集中所有樣本的預測平方誤差和來得到，原理如下。

● 預測函式

● 引數學習－採用最小二乘法

所有機器學習模型的成立都會有一定的先驗假設，線性迴歸也不例外，它對資料做了以下強假設:

● 自變數相互獨立，無多重共線性

● 因變數是自變數的線性加權組合：

● 所有樣本獨立同分布(iid)，且誤差項服從以下分佈：

最小二乘法與以上假設的關係推導如下:

使用MLE(極大似然法)估計引數如下:

線性迴歸有兩個重要變體：

● Lasso Regression:採用L1正則並使用MAP做引數估計

● Ridge Regression:採用L2正則並使用MAP做引數估計

關於正則化及最優化後續會做介紹。

損失函式

進一步閱讀可參考：Least Squares

https://en.wikipedia.org/wiki/Least_squares

機器學習從零開始系列連載(2)——線性迴歸

作者：張磊編輯：趙一帆本週剩餘內容： 2. 建模方法回顧 2.0 偏差與方差 2.1 線性迴歸-Linear Regression 2.1.1 模型原理 2.1.2 損失函式 2.2 支援向量機-Support Vector Machine

Python從零開始系列連載（2）——jupyter的常用操作

前文說了學Python先安裝anaconda的環境我們現在來看看安裝完之後怎麼用我已經迫不及待寫程式碼了洋洋灑灑幾千行喂，烙鐵，你的口水都流出來了，快醒醒【用力拍】有需要Python學習資料的小夥伴嗎?小編整理一套Python資料和PDF，感興趣者

技術 | Python從零開始系列連載（二十九）

寫爬蟲防止被封的關鍵有以下幾點： ● 偽裝請求報頭（request header） ● 減輕訪問頻率，速度 ● 使用代理IP 一般第一點都能做到，第二點減輕訪問頻率就會大大增加任務時間，而使用代理就能

Python從零開始系列連載（5）——Python的基本運算和表示式（上）

變數變數是什麼意思？還記得之前講過的裝菜的盤子和碗麼？不記得就回去看看咯如果你學過其他語言，使用變數先要定義，或者在定義的同時賦值而派森的變數不需要單獨定義，你直接在賦值的過程中完成了定義有需要Python學習資料的小夥伴嗎?小編整理一套Python資料和PD

Python從零開始系列連載（14）——Python特色資料型別（字典）（下）

字典的操作字典提供了很多方法對字典操作： 1.dict.keys() 作用：返回包含字典所有key的列表 2.dict.values() 作用：返回包含字典所有value的列表 3.dict.items() 作用：返

Python從零開始系列連載（18）——Python特色資料型別（函式）（中）

無返回值的函式之前說了好多，都是有返回值的函式，那有沒有沒返回值的函式呢？這個可以有！函式中變數的作用域變數的作用域就是在程式中能對這個變數操作的區域範圍有點像初高中學的函式的定義域 Python允許同名變數的出現

Python從零開始系列連載（17）——Python特色資料型別（函式）（上）

函式說到函式，如果你沒有程式設計基礎，可能馬上會想到初高中學過的： y = f（x）例如：y = x +1 當我們 x = 1時，y = 2 x = 2，y = 3 小明：老溼，我們不是初中生！函式可以將問題簡化，我們可以重複使用這個函式解決

Python從零開始系列連載（22）——Python檔案操作（下）

檔案寫入之前講過了檔案開啟建立和關閉，我們接著來談談檔案寫入之前我們說了使用open（）加上檔案的絕對路徑或者相對路徑可以開啟檔案這裡我們講一個更簡單的方法我們匯入os模組 os模組是和作業系統相關的模組在Python中這樣操作：

Python從零開始系列連載（24）——Python的time模組簡單使用

time模組在之前的課程中我們已經匯入過常用模組，比如 os 模組我們在這節課中，要學習time模組的匯入和使用 time，顧名思義，是時間相關的模組~ 和 os 模組匯入方法相同 import 模組名即可匯入模組那什麼是模組

Python從零開始系列連載（1）——安裝環境

前言人生苦短，我選Python！ ★★★★直奔主題！！！安裝環境現在，我帶大家裝anaconda，而不是裝Python。因為Python英文是蟒蛇，anaconda是水蟒。大家和我一起搜尋一下anaconda：在首頁我們可以看到： P

PowerShell學習小結——PowerShell從零開始系列之四

PowerShell能堅持看到這裏的同學，相信對PowerShell的命令使用應該不陌生，由於後面的內容較為繁雜，所以必須要熟悉PowerShell命令這裏準備了一些基礎的題目，有興趣的一定要動手操作一下：如何查看wuauserv服務運行狀態如何停止wuauserv服務如何查看explorer進程有服務器條件

從零開始系列-Caffe從入門到精通之一環境搭建

python 資源暫時不可用強制 rec htm color 查看 cpu blog 先介紹下電腦軟硬件情況吧：處理器：Intel? Core? i5-2450M CPU @ 2.50GHz × 4 內存：4G 操作系統：Ubuntu Kylin(優麒麟) 16.04

從零開始搭建系統2.7——Quartz安裝及配置

get AR blank 安裝 pos html uart body cnblogs 從零開始搭建系統2.7——Quartz安裝及配置從零開始搭建系統2.7——Quartz安裝及配置

從零開始搭建系統2.3——Cat安裝及配置

AR lan tar gpo 從零開始系統 .com .html log 從零開始搭建系統2.3——Cat安裝及配置從零開始搭建系統2.3——Cat安裝及配置

從零開始搭建系統2.5——Apollo安裝及配置

logs OS get html .cn apol blog class AR 從零開始搭建系統2.5——Apollo安裝及配置從零開始搭建系統2.5——Apollo安裝及配置

從零開始搭建系統2.4——Jenkins安裝及配置

AR gpo blank .cn 安裝 jenkin cnblogs 搭建 pro 從零開始搭建系統2.4——Jenkins安裝及配置從零開始搭建系統2.4——Jenkins安裝及配置

從零開始搭建系統2.1——Nexus安裝及配置

安裝 nexus pos HR class .html ref 系統 href 從零開始搭建系統2.1——Nexus安裝及配置從零開始搭建系統2.1——Nexus安裝及配置

PowerShell從零開始系列之二

PowerShell好了，之前我們講過學習PowerShell的必要性，那麽今天開始實際操作下PowerShell。PowerShell預裝在Windows 7以上的系統中，無需額外下載，即可使用你可以在開始菜單中找到 Windows PowerShell或者通過 Win+R 運行 PowerShell以打開

從零開始系列之vue全家桶（3）安裝使用vuex

info 獲取 clas from 顯示共享安裝 default 重要什麽是vuex? vuex：Vue提供的狀態管理工具，用於同一管理我們項目中各種數據的交互和重用，存儲我們需要用到數據對象。即data中屬性同時有一個或幾個組件同時使用，就是data中共用的屬性。

從零開始系列之vue全家桶（4）帶新手小白一起搭建第一個個人網站項目

轉載個人網站 rfi red nbsp oot ott osx 全部未經允許，嚴禁轉載，全文由blackchaos提供。在安裝好了前面大部分需要的插件，我們開始進行第一個個人項目。結合vue+vuex+vue-cli+vue-router+webpack使用。

機器學習從零開始系列連載(2)——線性迴歸

相關推薦