Coursera機器學習-第三週-邏輯迴歸Logistic Regression

Classification and Representation 1. Classification
Linear Regression （線性迴歸）考慮的是連續值（[0,1]之間的數）的問題，而Logistic Regression（邏輯迴歸）考慮的是離散值（例如只能取0或1而不能取0到1之間的數）的問題。舉個例子，你需要根據以往季度的電力資料，預測下一季度的電力資料，這個時候需要使用的是線性迴歸，因為這個值是連續的，而不是離散的。而當你需要判斷這個人抽菸還是不抽菸的問題時，就需要使用邏輯迴歸了，因為答案必然是抽菸或不抽菸這其中的一個，也就是離散值。
圖一
這裡寫圖片描述

圖解：
第1：對於Email的分類是否是垃圾/不垃圾
第2：線上交易：欺詐/不欺詐
第3：腫瘤：惡性或良性
上面所說的都是分類問題，因為選擇是有限個的（都是2個），這個應該很好理解。
通常，將我們所需要得到的定義為正類，另外的定義為負類，但有時也可以隨意，並不是嚴格的。例如，與圖中相反的，可以將惡性(malignant)定義為負類(Negative)，良性(benign)為正類(Positive)。
圖二：

/下圖給出8個樣例/
這裡寫圖片描述

使用線性迴歸hθ(x)=θTx,對這8個樣例進行擬合，如上圖中粉線所示，我們設定一個閾值，當hθ≥0.5 ,我們將它判定為正類，表示為惡性，當hθ≤0.5,我們將它判定為負類，表示為良性。
即malignant=0.5的點投影下來，其右邊的點預測y=1;左邊預測y=0；則能夠很好地進行分類。
可以這麼理解，我們先觀看橫軸，表示Tumor Size也就是腫瘤大小，越往右邊為惡性的可能性也就越大，所以看起來這圖還是合理的。
但是，這個時候來了一個新的樣本，如下圖三：
這裡寫圖片描述

這種情況下，假設linear regression預測由粉紅線變為藍線，那麼由0.5的boundary得到的線性方程中，不能很好地進行分類。不滿足，
h

θ(x)≥0.5,y=1
hθ(x)<0.5,y=0
上圖，豎直的藍線本是原本的分割線，左邊為良性，右邊為惡性，多了一個新樣本後，線性迴歸又擬合出一條新線（藍線），這樣，你再根據上面hθ(x)的值來判斷，就會將一些本是惡性的歸為良性了。
說到這裡，應該引入邏輯迴歸了。
2. Hypothesis Representation
Logistic Regression(邏輯迴歸)
圖四：
這裡寫圖片描述

邏輯迴歸的取值，從圖上右側來看也能得到 0≤hθ(x)≤1
仔細觀察一下，不就是將原來的線性函式θTx 通過函式g 進行映射了麼？得到邏輯迴歸的表達公式： hθ(x)=g(z)=11+e−z,

z=θTx
z≥0,g(z)≥0.5;z<0,g(z)<0.5
由下圖五，我們可以知道它的性質，在給定x與θ 的值後，y=1與y=0 的概率之和為1，也就是說不是1就是0的意思
圖五
這裡寫圖片描述

3. Decision Boundary
所謂決策邊界，其實就是分類邊界，如下圖所示的粉線，向上則是y=1區域，向下則是y=0區域，那麼問題來了，決策邊界是怎麼來的？
圖六：
這裡寫圖片描述

這裡先給出了θT={−3,1,1}的取值 ,其實θT的取值我們是需要通過選擇才能得到的，而不是直接給出，這裡只是為了更好的理解而直接給出的，我們得到hθ(x)=g(−3+x1+x2),回顧一下上面所講的邏輯迴歸：

圖七：

這裡寫圖片描述

hθ(x)=g(z)=11+e−z,z=θTx
z≥0,g(z)≥0.5，y=1;z<0,g(z)<0.5,y=0,由此得到當−3+x1+x2≥0時,y=1，則得到如圖六所示的粉線上方啦。

我們來看一個例題：

這裡寫圖片描述

根據上面所講，將θT={5,−1,0}代入，得到5−x1，當5−x1≥0時，也就是x1≤5時, y=1,得到：
這裡寫圖片描述

當然，決策邊界並不一定都是線性的，還有非線性的，我們來看這麼一個例子：
圖八
這裡寫圖片描述

按照上面所講，將θT={−1,0,0,1,1}代入得到hθ(x)=g(x21+x22−1),令x21+x22−1≥0得到一個半徑為1的圓，為決策邊界，圓的內側為y=

Coursera機器學習-第三週-邏輯迴歸Logistic Regression

Coursera機器學習-第三週-邏輯迴歸Logistic Regression

Stanford機器學習---第三週.邏輯迴歸、正則化

機器學習演算法之：邏輯迴歸 logistic regression (LR)

機器學習筆記04：邏輯迴歸(Logistic regression)、分類(Classification)

Stanford機器學習第三週：邏輯迴歸與正則化

吳恩達機器學習第三週

機器學習 | 吳恩達機器學習第三週程式設計作業(Python版)

機器學習第三週（下）

機器學習 | 吳恩達機器學習第三週學習筆記

Coursera機器學習-第五週-Neural Network BackPropagation

Coursera機器學習-第七週-Support Vector Machine

Coursera-吳恩達-機器學習-第七週-測驗-Support Vector Machines

Coursera-吳恩達-機器學習-第七週-程式設計作業: Support Vector Machines

Coursera-吳恩達-機器學習-第十週-測驗-Large Scale Machine Learning

Coursera-吳恩達-機器學習-第八週-程式設計作業: K-Means Clustering and PCA

Coursera-吳恩達-機器學習-第八週-測驗-Principal Component Analysis

Coursera-吳恩達-機器學習-第六週-程式設計作業: Regularized Linear Regression and Bias/Variance

Coursera-吳恩達-機器學習-第六週-測驗-Machine Learning System Design

Coursera NG 機器學習第五週正則化 bias Vs variance Python實現

Coursera-吳恩達-機器學習-第五週-程式設計作業: Neural Networks Learning

Coursera機器學習-第三週-邏輯迴歸Logistic Regression

相關推薦