【演算法原理】從模型假設看線性迴歸和邏輯迴歸

摘要

本文從演算法的模型假設方面，對線性迴歸、邏輯迴歸和感知器做一下簡要對比，說明了它們之間的聯絡。

符號約定

1）樣本集合: $(x^{i}, y^{i}) (1 ⩽ i ⩽ m)$ ，其中 $i$ 表示一共 $m$ 個樣本中的第 $i$ 個
2） $x^{i} = (x_{0}^{i}, x_{1}^{i}, x_{2}^{i}, \dots, x_{n}^{i}) (x_{0}^{i} = 1)$ ，表示輸入向量，其中 $x_{0}^{i} = 1$ 是為了統一格式
3） $y^{i}$ 為標量，代表第 $i$ 個樣本對應的值（或分類問題中的label）
4） $θ = (θ_{0}, θ_{1}, θ_{2}, \dots, θ_{n})$ ，表示待求引數
5） $x \cdot θ^{T} = θ_{0} + \sum_{j = 1}^{n} θ_{j} x_{j} = 0$

x \cdot θ^{T} = θ_{0} + \sum_{j = 1}^{n} θ_{j} x_{j} = 0

，表示

n

維空間中的一個超平面

問題描述

已知 $m$ 個樣本 $(x^{i}, y^{i}) (1 ⩽ i ⩽ m)$ ，當 $x = x^{0}, x^{0} \notin (x^{1}, x^{2}, \dots, x^{m})$ 時，我們想要估計出相對應的輸出 $y^{0}$ 。根據 $y^{0}$ 取值範圍的不同，問題分為兩種情況。
1）當 $y^{0}$ 可以取無限多的連續值時，該問題稱為迴歸問題
2）當 $y^{0}$ 只能取有限多的離散值時，該問題稱為分類問題
P.S. 好吧，第2中情況稱為分類，很好理解。可第1種情況，為啥叫回歸？有啥意義？其實，沒啥意義，完全可以忽略。但感興趣的可以繼續閱讀參考文獻[1]。

線性迴歸 Linear Regression

一、模型假設

y = h_{θ} (x) = x \cdot θ^{T} (1)

即，我們假設輸入和輸出之間的關係，符合以上的模型。問題是，你為何要做這種假設呢？如果這個假設本身就是錯的怎麼辦呢？
因為通過對樣本集的觀察和分析，直觀上認為模型應該是這個樣子的。當然如果假設本身就是錯的，那麼無論如何都學習不到很好的結果。這個時候只能修正模型假設，重新再來。

二、目標函式

L = \frac{1}{2 m} \sum_{j = 1}^{m} (x^{i} \cdot θ^{T} - y^{i})^{2} (2)

顯然，目標函式的每一項，是模型預測結果與真實值直接的誤差的平方。因此，目標函式刻畫的是，某一個特定的模型（對應一個特定的

θ

）,在樣本集上的整體表現。我們的目標是可以讓目標函式取到最小值。求解最小值的過程，就是求解

θ

的過程。等號後面的

\frac{1}{2 m}

完全可以不加，因為

m

【演算法原理】從模型假設看線性迴歸和邏輯迴歸

摘要

符號約定

問題描述

線性迴歸 Linear Regression

【演算法原理】從模型假設看線性迴歸和邏輯迴歸

【C++拾遺】從記憶體佈局看C++虛繼承的實現原理

【演算法-分治】從陣列中取出n個元素的所有組合（需要深入理解遞迴）

【Android體驗】從使用者角度看，Android手機/應用應該要這樣：

【番外】線性迴歸和邏輯迴歸的 MLE 視角

機器學習演算法總結--線性迴歸和邏輯迴歸

Python實現線性迴歸和邏輯迴歸演算法

資料探勘從入門到放棄（一）：線性迴歸和邏輯迴歸

【Go 原始碼分析】從 sort.go 看排序演算法的工程實踐

【推薦精讀】從item-base到svd再到rbm，多種Collaborative Filtering(協同過濾演算法)從原理到實現

【編譯原理】深入淺出構造 First 集和 Follow 集的演算法流程

【編譯原理】提取左部公因子演算法

【演算法比賽】主流機器學習/深度學習模型程式碼模板

【一週演算法實踐】__2.模型構建之整合模型

【演算法學習】AVL平衡二叉搜尋樹原理及各項操作程式設計實現（C++）

【專案實戰】從抽獎演算法感受演算法奧妙

【React Native】從原始碼一步一步解析它的實現原理

【演算法+OpenCV】基於三次Bezier原理的曲線擬合演算法C++與OpenCV實現

【Android】從原始碼角度看Handler機制

大戰設計模式（第二季）【1】———— 從源碼看工廠模式