一、邏輯迴歸

1.邏輯迴歸

什麼是邏輯迴歸問題，通俗地講就是監督下的分類問題。通過前面的學習，我們已經掌握如何解決線性(非線性)迴歸的問題。那面對分類問題我們是否也可以用線性迴歸呢？簡單起見，我們先討論二元分類，首先讓我們來看一個例子，腫瘤的大小與是否是惡性的關係，其中紅色的×表示腫瘤大小，對應的y軸表示是否為惡性。
這裡寫圖片描述
我們對資料進行線性迴歸，得到了一條很完美的直線。我們可以規定，當擬合出來的y值大於0.5時，為惡性1；當y值小於0.5時，為良性0。這一切看起來似乎很合理，當我們增加一個數據，即有一個腫瘤非常大，顯然它是惡性的，但是再用線性迴歸時，我們可以發現為了去更好地擬合，直線的斜率變低，0.5不再是惡性與良性的分界線。除了這個問題之外，我們知道y

的可取值應該是[0,1]，而採用線性迴歸我們發現y的可取值是[−∞,+∞]。這一系列的問題就促使我們希望尋求一個新的方法來解決分類問題。

2.假設表示

線上性迴歸問題中，我們定義了

hθ(x)=θTx(1) 在分類問題中，我們改變該函式，增加一個作用函式，即 hθ(x)=g(θTx)(2) 其中g(z)為sigmoid函式 g(z)=11+e−z(3)
那麼把式(3)代入式(2)，得 hθ(x)=11+e−θTx(4) 為什麼要使用sigmoid函式？有一系列的數學原因，感興趣的可以搜尋廣義線性模型，在這裡就不闡述原因了。我們來直觀地感受一下sigmoid函式，當z→−∞

時，g→0；當z→+∞時，g→1。
這裡寫圖片描述

下面我們對hθ(x)輸出的結果做一個解釋。由於它的取值範圍，我們可以把它理解為概率。若hθ(x)=0.7，在二元分類（本例）中即表示腫瘤在輸入變數x下為惡性(y=1)的概率為70%。由於是二元分類，y取值不是0就是1，因此腫瘤為良性(y=0)的概率為1−70%=30%。
由於sigmoid函式的性質，且hθ(x)∈(0,1)，我們認為當hθ(x)≥0.5時，我們把資料x預測為類1即y=1；當hθ(x)<0.5時，我們把資料x預測為類0即y=0。因此當θTx≥0時，預測為類1;當θTx<0時，預測為類0。

3.決策邊界

既然是分類問題，那麼對於二分類，h

θ(x)一定可以做出一個決策邊界，當資料集在某一側時預測為類1，在另一側時預測為類0。為了更直觀地理解，我們來看一個這樣一個例子，訓練集分為兩類，其中紅叉表示一類，藍圈表示另一類。
這裡寫圖片描述

對於

hθ(x)=g(θ0+θ1x1+θ2x2)(5) 假設我們得到的引數θ=[−311]，此時決策邊界為黑線所示。由sigmoid函式我們可知，當θ0+θ1x1+θ2x2≥0時，預測為類1，即為直線以上；當θ0+θ1x1+θ2x2<0時，預測為類0，即為直線以下。我們預先規定：紅叉為類1，藍圈為類0。
注：這裡有人可能會有疑問，假如我們規定紅叉為類0，藍圈為類1，如果我們還是認為θTx≥0即取得直線上方的點為為類1，θTx<0即取得直線下方的點為類0，那豈不是會分錯？學完本系列，我將給出答案，這也是我曾經學習ML時的困惑。

4.代價函式

線上性迴歸問題中，我們是這樣定義代價函式的

J(θ)=12m∑i=1m(hθ(x(i))−y(i))2(6) 那我們可不可以用這個代價函式來解決邏輯迴歸？答案是否定的，因為hθ(x)中包含了一個非線性函式即sigmoid函式，這使得J(θ)不是凸函式，有很多區域性最小值，很難通過梯度下降法或其他方法得到全域性最優值。我們來看一下

機器學習入門系列三（關鍵詞：邏輯迴歸，正則化）

一、邏輯迴歸

1.邏輯迴歸

2.假設表示

3.決策邊界

4.代價函式

機器學習入門系列三（關鍵詞：邏輯迴歸，正則化）

Stanford機器學習第三週：邏輯迴歸與正則化

Stanford機器學習---第三週.邏輯迴歸、正則化

吳恩達機器學習 - 邏輯迴歸的正則化吳恩達機器學習 - 邏輯迴歸的正則化

【機器學習】過擬合、欠擬合與正則化

斯坦福大學(吳恩達) 機器學習課後習題詳解第六週程式設計題正則化線性迴歸以及方差與偏差

深度學習小白——神經網路3（資料預處理，dropout，正則化）

機器學習入門系列04，Gradient Descent（梯度下降法）

機器學習入門系列03，Error的來源：偏差和方差(bias和variance)

Spring Boot入門系列三（資源文件屬性配置）

CS231n——機器學習演算法——線性分類（下：Softmax及其損失函式）

CS231n——機器學習演算法——線性分類（中：SVM及其損失函式）

機器學習入門系列(2)--機器學習概覽(下)

機器學習入門系列(1)--機器學習概覽(上)

《機器學習實戰》第五章：Logistic迴歸（1）基本概念和簡單例項

NLP大神推薦的機器學習入門書單（附大量百度網盤電子書）

Udacity機器學習入門——交叉驗證（cross-validation）

用Python開始機器學習（7：邏輯迴歸分類）

機器學習筆記 -吳恩達（第七章：邏輯迴歸，python實現附原始碼）

機器學習演算法的Python實現 (1)：logistics迴歸與線性判別分析（LDA）

機器學習入門系列三（關鍵詞：邏輯迴歸，正則化）

一、邏輯迴歸

1.邏輯迴歸

2.假設表示

3.決策邊界

4.代價函式

相關推薦