【ML模型詳細推導3】- 感知機

阿新 • • 發佈：2018-11-26

感知機

1. 一句話介紹感知機
2. 模型介紹（原始形式）
3. 感知機的對偶形式

1. 一句話介紹感知機

· 一個二分類的線性分類模型。
· 感知機學習旨在求出將訓練集資料進行線性劃分的分類超平面，匯入基於誤分類的損失函式，利用梯度下降法對損失函式進行極小化，求得模型。
· 分為原始形式和對偶形式。

2. 模型介紹（原始形式）

前提：資料集要求線性可分性
- 模型：
$f ($

x ) = s i g n ( w x

+ b ) f(x)=sign(wx+b)

f (x) = s i g n (w x + b)

其中，sign(x)=\left\{\begin{matrix} +1,&amp; x\geqslant 0 &amp; \\ -1 &amp; x&lt;0&amp; \end{matrix}\right.

- 損失函式（學習策略）
損失函式，誤分類點到超平面的“函式間隔”和：
$L(w,b) = -\sum_{x_i\in M}y_i (wx_i+b)$ 其中， $M$ 為誤分類的集合。

函式間隔待了解
（Q1：什麼是函式間隔，和幾何間隔的區別）

- 隨機梯度下降（學習演算法）

隨機梯度下降法，最小化損失函式 $L(w,b)$
梯度：
$\triangledown _wL(w,b)=-\sum _{x_i\in M}y_i x_i \\$ $\triangledown _bL(w,b)=-\sum _{x_i\in M}y_i$
隨機選取一個數據點 $(x_i,y_i)$ ，判斷其是否誤分類，也就是判斷 $y_i\cdot(wx+b)<0$ 與否
若 $y_i f(x)<0$ ，對 $w,b$ 進行更新：
$w\leftarrow w+\eta y_ix_i$ $b\leftarrow b+\eta y_i$ 其中， $\eta$ 為學習率。
感知機學習演算法是誤分類驅動的，這樣，因為資料線性可分，通過迭代可以直至訓練集中沒有誤分類點。

3. 感知機的對偶形式

- 模型：
將訓練集 $\{(x_1,y_1)(x_2,y_2)…(x_i,y_i)\}$ 全部代入進行隨機下降，若第 i 個樣本用的次數為 $n_i$ ，則最後訓練出的 $w$ 和 $b$ ：
$w = \sum _{i=1}^{N}n_i\eta y_ix_i$ $b = \sum _{i=1}^{N}n_i\eta y_i$

將 $w$ 和 $b$ 帶入感知機原始形式得對偶形式：
$f(x) = sign(\sum _{j=1}^{N}n_j\eta y_jx_j \cdot x+ \sum _{j=1}^{N}n_j\eta y_j)$

【ML模型詳細推導3】- 感知機

感知機

1. 一句話介紹感知機

2. 模型介紹（原始形式）

3. 感知機的對偶形式

【ML模型詳細推導3】- 感知機

【ML模型詳細推導1】- 線性迴歸

【機器學習模型詳細推導4】-決策樹

【機器學習模型詳細推導2】- 邏輯迴歸

【統計學習方法讀書筆記】感知機的個人理解（2）

【統計學習方法讀書筆記】感知機的個人理解（1）

【城北徐公之機器學習】感知機模型

【Keras入門日誌（3)】Keras中的序貫（Sequential）模型與函式式（Functional）模型

【Static Program Analysis - Chapter 3】Type Analysis

【JVM.3】虛擬機性能監控與故障處理工具

【shell腳本學習-3】

【Mac系統 + Python + Django】之開發一個釋出會系統【Django模型（二）】【Mac系統 + Mysql】之安裝Mysql資料庫【Python + Mysql】之用pymysql庫連線Mysql資料庫並進行增刪改查操作

C++：環境配置【visual Studio 2017 + Opencv 3】

【Untiy3d-編輯器相關3】各種面板上新增自定義選單

過河【狀態壓縮DP】+【完整的數論推導過程】

The Dole Queue【紫書例題4.3】

【劍指offer{1-3}】二維陣列查詢、空格替換、從尾到頭列印連結串列

【遊戲開發閱讀列表3】圖形學

【ML經典書籍系列1】解讀PRML

【C++學習詳細教程目錄】

【ML模型詳細推導3】- 感知機

感知機

1. 一句話介紹感知機

2. 模型介紹（原始形式）

3. 感知機的對偶形式

相關推薦