斯坦福大學機器學習筆記——邏輯迴歸、高階優化以及多分類問題

shi先簡單說一下邏輯迴歸，其實會有很多人誤解，會將邏輯迴歸當成迴歸演算法，其實邏輯迴歸就是我們所說的分類問題，所謂的邏輯，一般我們說的邏輯就是邏輯0或者邏輯1，所以可以藉此理解。但是邏輯迴歸不僅僅只包括兩分類問題，它還包括多分類問題。
那麼能否使用線性迴歸的思想解決邏輯迴歸嗎，我們從以下兩方面考慮：
1. 假設如下圖所示的資料集:
這裡寫圖片描述
假設使用線性迴歸來擬合該資料集，當出現一個較大的波動點時（最右側的點），則擬合得到的曲線為藍色的線，當大於0.5時，判斷為1，小於0.5時判斷為0（等於0.5判斷為哪一類無所謂，以後遇到同樣的問題，採用相同的處理方式），會出現很多的誤差點。
2.採用線性迴歸得到的擬合曲線，在進行判斷時會出現很多大於1或者小於0的點，對於分類問題則明顯是不合適。
我們下面說學的方法就是邏輯迴歸的演算法，它的輸出永遠在0~1之間。

邏輯迴歸的假說（hypothesis）：
邏輯迴歸假說的表示式應該滿足我們上面提到的特性，它的輸出值永遠在0~1之間，當大於0.5時，判斷為0；當小於0.5時判斷為1。
所以我們採用邏輯迴歸假說的形式為：

hθ(x)=g(θTx)=11+e−θTx

其中，g代表邏輯函式，也叫作sigmoid函式，它是一種常用的S形函式，公式為：

g(z)=11+e−z

它的影象為：
這裡寫圖片描述
hθ(x)的作用：對於給定的輸入變數x，根據選擇的引數θ計算輸出變數為1的概率，即

hθ(x)=P(y=1|x;θ)=1−P(y=0|x;θ)

例如，在給定的x和θ的情況下，計算得到的hθ(x)=0.7，則說明該樣例有70%的可能性為正例。

決策邊界（decision boundary）：
其實最終判斷為0還是判斷為1，我們一般採用的標準是：
當輸出大於或等於0.5時，判斷為1；小於0.5時，判斷為0。
對於上面的邏輯函式：

hθ(x)=g(θTx)=11+e−θTx

當θTx大於等於0時，判斷為1；當θTx小於0時，判斷為0。
決策邊界的含義實際就是找到能夠正確劃分我們資料集為兩類（對於兩類問題）的邊界，下面舉例來說明一下：
這裡寫圖片描述
對於上面的資料集，我們可以判斷當θ=[−3,1,1]時，可以實現資料的劃分，則對應的直線為θTx=−3+x1+x2，對於上述資料集的決策邊界為−3+x1+x2=0，當−3+x1+x2≥0時，判斷為1，當−

3+x1+x2<0時，判斷為0，所以決策邊界為−3+x1+x2=0。
需要注意的是：
決策邊界是hθ(x)，決定於θ，它不是資料集的屬性。它的確定過程為：
資料→確定引數→分類邊界→預測結果

代價函式（cost function）：
對於線性迴歸，我們採用的代價函式為：誤差平方和（均方誤差）即，J(θ)=1m∑mi=112(hθ(x(i)−y(i)))2，如果對於邏輯迴歸，hθ(x)=11+e−θTx，帶入到平方誤差和公式中會使得對於引數θ，J(θ)為非凸函式，所以對於邏輯迴歸來說，線性迴歸的代價函式不適用。
我們定義邏輯迴歸的代價函式為：

J(θ)=1m∑i=1mCost(hθ(x(i)−y(i)))
其中，Cost(hθ(x)−y)={−l

斯坦福大學機器學習筆記——邏輯迴歸、高階優化以及多分類問題

斯坦福大學機器學習筆記——邏輯迴歸、高階優化以及多分類問題

斯坦福大學機器學習筆記——正則化的邏輯迴歸模型

斯坦福大學機器學習筆記——異常檢測演算法（高斯分佈、多元高斯分佈、異常檢測演算法）

斯坦福大學機器學習筆記——聚類（k-均值聚類演算法、損失函式、初始化、聚類數目的選擇）

機器學習筆記:線性迴歸、邏輯斯蒂迴歸推導

斯坦福大學機器學習筆記——推薦系統（協同過濾、低秩分解、推薦系統）

斯坦福大學機器學習筆記——多變數的線性迴歸以及梯度下降法注意事項（內有程式碼）

斯坦福大學機器學習筆記——單變數的線性迴歸以及損失函式和梯度下降法（包含程式碼）

Machine Learning（Stanford）| 斯坦福大學機器學習筆記--第二週（1.多元線性迴歸及多元線性迴歸的梯度下降）

斯坦福大學機器學習筆記——特徵和多項式迴歸以及正規方程

斯坦福大學機器學習筆記——機器學習系統設計（誤差分析、查全率和查準率、F1值）

Machine Learning（Stanford）| 斯坦福大學機器學習筆記--第一週（1.監督學習與無監督學習的介紹）

斯坦福大學深度學習筆記：邏輯迴歸

CSDN機器學習筆記一概述、線性迴歸

吳恩達斯坦福大學機器學習 CS229 課程學習筆記（一）

機器學習-對線性迴歸、邏輯迴歸、各種迴歸的概念學習

【機器學習筆記】二、 Regression迴歸

斯坦福大學機器學習課程第二周筆記

斯坦福2014機器學習筆記七----應用機器學習的建議

斯坦福CS20SI TensorFlow學習筆記1——graph、session和op

斯坦福大學機器學習筆記——邏輯迴歸、高階優化以及多分類問題

相關推薦