斯坦福大學深度學習筆記：邏輯迴歸

阿新 • • 發佈：2019-01-01

邏輯迴歸（LOGISTIC REGRESSION）

Logistic regression （邏輯迴歸）是當前業界比較常用的機器學習方法，用於估計某種事物的可能性。之前在經典之作《數學之美》中也看到了它用於廣告預測，也就是根據某廣告被使用者點選的可能性，把最可能被使用者點選的廣告擺在使用者能看到的地方，然後叫他“你點我啊！”使用者點了，你就有錢收了。這就是為什麼我們的電腦現在廣告氾濫的原因了。

1.分類問題

分類問題中，我們嘗試預測的是結果是否屬於某一個類（例如正確或錯誤）。分類問題的例子有：判斷一封電子郵件是否是垃圾郵件；判斷一次金融交易是否是欺詐，判定是否有腫瘤等等。
我們從二元的分類問題開始討論。
我們將因變數(dependant variable)可能屬於的兩個類分別稱為負向類（negative class）和正向類（positive class），則因變數

y=0為negative class

y=1為positive class

2.數學模型

以腫瘤問題為例，我們對腫瘤問題用線性迴歸的方法求出了適合資料的一條直線：

線性迴歸給了我們一條直線，而對於分類問題，我們要輸出是或否，我們可以預測

當hθ大於等於0.5時，預測y=1
當hθ小於0.5時，預測y=0

但如何這是有了一個很大的腫瘤這個時候0.5作為閥值來預測腫瘤是不是良性的就不合適了，所以我們引入新的數學模型，邏輯迴歸讓模型輸出的範圍在0到1之間。

邏輯迴歸模型的假設是：hθ(x)=g(θTX)

其中：

X是特徵向量
g代表邏輯函式（logistic function）是一個常用的邏輯函式為S形函式（Sigmoid function），公式為：

其圖形為：

所以我們得到：

hθ(x) = 對於給定的輸入x，y=1的概率。

例如，如果對於給定的x,通過已經確定的引數計算得出hθ(x)=0.7，則表示有百分之70的機率y為正向類，相應地y為負向類的機率為1-0.7=0.3。

3.判定邊界

我們通過影象可以看出θTx = 0是一個決策邊界，當它大於0或小於0時，邏輯迴歸模型分別預測不同的分類結果。例如，

hθ(x)=g(θ0+θ1x1+θ2x2)

θ0,θ1,θ2分別取-3, 1, 1,

則當3+x1+x2≥0時, y = 1; 則x1+x2 =3是一個決策邊界，圖形表示如下：

決策邊界-我愛公開課-52opencourse.com

上述只是一個線性的決策邊界，當hθ(x)更復雜的時候，我們可以得到非線性的決策邊界，例如：

非線性的決策邊界1-我愛公開課-52opencourse.com

這個描述的邊界為一個圓

這裡當x1^2+x2^2≥1時，y=1

我們可以用非常複雜的模型來適應非常複雜形狀的判定邊界。

4.代價函式

我們習慣用平方差來定義代價函式，但這裡我們用平方差定義hθ(x) 我們得到的是一個非凸函式。它會有很多區域性最小值，這樣會影響我們用階梯下降演算法尋找最小值。

所以我們重新定義了代價函式：

對於Cost(hθ(x),y)我們先看 y=1的情況

當y=1但hθ不為1時誤差隨著hθ的變小而變大。如果在y=1時得到hθ(x)=0 那Cost→∞,這是對學習演算法很大的懲罰。

對於Cost(hθ(x),y)我們先看 y=0的情況

當y=0但hθ不為0時誤差隨著hθ的變大而變大。

由於只有兩種分類，我們可以把Cost(hθ(x),y)簡化如下：

代入代價函式得到：

在得到這樣一個代價函式以後，我們便可以用梯度下降演算法來求得能使代價函式最小的引數了。
演算法為：

求導後得到：

注：雖然得到的梯度下降演算法表面上看上去與線性迴歸的梯度下降演算法一樣，但是這裡的hθ(x)=g(θTX)與線性迴歸中不同，所以實際上是不一樣的。另外，在執行梯度下降演算法之前，進行特徵縮放依舊是非常必要的。
一些梯度下降演算法之外的選擇：
除了梯度下降演算法以外還有一些常被用來令代價函式最小的演算法，這些演算法更加複雜和優越，而且通常不需要人工選擇學習率，通常比梯度下降演算法要更加快速。這些演算法有：共軛梯度（Conjugate Gradient）,區域性優化法(Broyden fletcher goldfarb shann,BFGS)和有限記憶體區域性優化法(LBFGS)

斯坦福大學深度學習筆記：邏輯迴歸

z 邏輯迴歸（LOGISTIC REGRESSION） Logistic regression （邏輯迴歸）是當前業界比較常用的機器學習方法，用於估計某種事物的可能性。之前在經典之作《數學之美》中也看到了它用於廣告預測，也就是根據某廣告被使用者點選的可

斯坦福大學深度學習筆記：神經網路

神經網路演算法在八十到九十年代被廣泛使用過， 20世紀90年代，各種各樣的淺層機器學習模型相繼被提出，例如支撐向量機（SVM，Support Vector Machines）、 Boosting、最大熵方法（如LR，Logistic Regression）等。但之後便使用的變少了。但最近又開始流行起來了，原

吳恩達深度學習筆記(6)--邏輯迴歸(Logistic Regression)

邏輯迴歸(Logistic Regression) 在這節課中，我們會重溫邏輯迴歸學習演算法，該演算法適用於二分類問題，本節將主要介紹邏輯迴歸的Hypothesis Function（假設函式）。對於二元分類問題來講，給定一個輸入特徵向量X，它可能對應一張圖片，你想識別這張圖片識

斯坦福大學機器學習筆記——正則化的邏輯迴歸模型

在上面部落格中我們討論了正則化的線性迴歸模型，下面我們來討論一下正則化的邏輯迴歸模型。前面我們講述了兩種常用於邏輯迴歸的方法：基於梯度下降法的邏輯迴歸模型基於高階優化的邏輯迴歸模型基於

斯坦福大學機器學習筆記——邏輯迴歸、高階優化以及多分類問題

shi先簡單說一下邏輯迴歸，其實會有很多人誤解，會將邏輯迴歸當成迴歸演算法，其實邏輯迴歸就是我們所說的分類問題，所謂的邏輯，一般我們說的邏輯就是邏輯0或者邏輯1，所以可以藉此理解。但是邏輯迴歸不僅僅只包括兩分類問題，它還包括多分類問題。那麼能否使用線性迴歸的

機器學習6：邏輯迴歸到深度學習的思考

如下圖，出現了不可分的情形：，表明x1與x2並不是兩個很好的特徵，可以從如下方面進行思考： 1、通過特徵變換（將x1與x2通過各種運算組合得到新的可分特徵x3與x4），將模型變成線性可分的模型。比如將上述點轉換成每個點到一個固定座標的距離，得到如下情形：，變成線性可分。 2

斯坦福大學深度學習公開課cs231n學習筆記（10）卷積神經網路

前記：20世紀60年代，Hubel和Wiesel在研究貓腦皮層中用於區域性敏感和方向選擇的神經元時，發現其獨特的網路結構可以有效地降低反饋神經網路的複雜性，繼而提出了卷積神經網路（Convolutio

Deep Learning 1_深度學習UFLDL教程：Sparse Autoencoder練習（斯坦福大學深度學習教程）

1前言本人寫技術部落格的目的，其實是感覺好多東西，很長一段時間不動就會忘記了，為了加深學習記憶以及方便以後可能忘記後能很快回憶起自己曾經學過的東西。首先，在網上找了一些資料，看見介紹說UFLDL很不錯，很適合從基礎開始學習，Adrew Ng大牛寫得一點都不裝B，感覺非常好

Deep Learning 4_深度學習UFLDL教程：PCA in 2D_Exercise（斯坦福大學深度學習教程）

前言本節練習的主要內容：PCA，PCA Whitening以及ZCA Whitening在2D資料上的使用，2D的資料集是45個數據點，每個資料點是2維的。要注意區別比較二維資料與二維影象的不同，特別是在程式碼中，可以看出主要二維資料的在PCA前的預處理不需要先0均值歸一化，而二維自然影象需要先

Deep Learning 3_深度學習UFLDL教程：預處理之主成分分析與白化_總結（斯坦福大學深度學習教程）

1PCA ①PCA的作用：一是降維；二是可用於資料視覺化；注意：降維的原因是因為原始資料太大，希望提高訓練速度但又不希望產生很大的誤差。 ② PCA的使用場合：一是希望提高訓練速度；二是記憶體太小；三是希望資料視覺化。 ③用PCA前的預處理：(1)規整化特徵的均值大致為0；(

Deep Learning 19_深度學習UFLDL教程：Convolutional Neural Network_Exercise（斯坦福大學深度學習教程）

基礎知識概述 CNN是由一個或多個卷積層（其後常跟一個下采樣層）和一個或多個全連線層組成的多層神經網路。CNN的輸入是2維影象（或者其他2維輸入，如語音訊號）。它通過區域性連線和權值共享，再通過池化可得到平移不變特徵。CNN的另一個優點就是易於訓練

Deep Learning 8_深度學習UFLDL教程：Stacked Autocoders and Implement deep networks for digit classification_Exercise（斯坦福大學深度學習教程）

前言 2.實驗環境：win7， matlab2015b，16G記憶體，2T硬碟 3.實驗內容：Exercise: Implement deep networks for digit classification。利用深度網路完成MNIST手寫數字資料庫中手寫數字的識別。即：用6萬個已標註資料（即：6萬

斯坦福大學深度學習筆記：邏輯迴歸

邏輯迴歸（LOGISTIC REGRESSION）

1.分類問題

2.數學模型

3.判定邊界

4.代價函式

斯坦福大學深度學習筆記：邏輯迴歸

斯坦福大學深度學習筆記：神經網路

吳恩達深度學習筆記(6)--邏輯迴歸(Logistic Regression)

斯坦福大學機器學習筆記——正則化的邏輯迴歸模型

斯坦福大學機器學習筆記——邏輯迴歸、高階優化以及多分類問題

機器學習6：邏輯迴歸到深度學習的思考

斯坦福大學深度學習公開課cs231n學習筆記（10）卷積神經網路

Deep Learning 1_深度學習UFLDL教程：Sparse Autoencoder練習（斯坦福大學深度學習教程）

Deep Learning 4_深度學習UFLDL教程：PCA in 2D_Exercise（斯坦福大學深度學習教程）

Deep Learning 3_深度學習UFLDL教程：預處理之主成分分析與白化_總結（斯坦福大學深度學習教程）

Deep Learning 19_深度學習UFLDL教程：Convolutional Neural Network_Exercise（斯坦福大學深度學習教程）

Deep Learning 8_深度學習UFLDL教程：Stacked Autocoders and Implement deep networks for digit classification_Exercise（斯坦福大學深度學習教程）

Deep Learning 11_深度學習UFLDL教程：資料預處理（斯坦福大學深度學習教程）

Deep Learning 13_深度學習UFLDL教程：Independent Component Analysis_Exercise（斯坦福大學深度學習教程）

Deep Learning 12_深度學習UFLDL教程：Sparse Coding_exercise（斯坦福大學深度學習教程）

Deep Learning 6_深度學習UFLDL教程：Softmax Regression_Exercise（斯坦福大學深度學習教程）

Deep Learning 7_深度學習UFLDL教程：Self-Taught Learning_Exercise（斯坦福大學深度學習教程）

Deep Learning 2_深度學習UFLDL教程：向量化程式設計（斯坦福大學深度學習教程）

Deep Learning 9_深度學習UFLDL教程：linear decoder_exercise（斯坦福大學深度學習教程）

Deep Learning 10_深度學習UFLDL教程：Convolution and Pooling_exercise（斯坦福大學深度學習教程）

斯坦福大學深度學習筆記：邏輯迴歸

邏輯迴歸（LOGISTIC REGRESSION）

1.分類問題

2.數學模型

3.判定邊界

4.代價函式

相關推薦