Stanford機器學習---第三週.邏輯迴歸、正則化

阿新 • • 發佈：2019-01-16

第三週邏輯迴歸與正則化

學完前三週簡要做個總結，梳理下知識框架：

第一講邏輯迴歸Logistic Regression

1.分類問題Classification Problem

for example

->Email: Spam / Not Spam 判斷一封郵件是不是垃圾郵件？

->Online Transaction:Fraudulent(Yes/NO)?判斷某個網路交易是否是詐騙？

->Tumor:Malignant / Benign?判斷腫瘤是惡性還是良性？

綜上，分類問題就是這樣一類問題：針對某個實際樣本，根據某種標準，判斷它屬於哪一個類別，其最終結果是離散的輸出值。

分類問題在生活中很常見，除了以上的例子外，想對某水體取樣判斷水質的酸鹼性、對某地大氣取樣判斷其空氣汙染級別，以上問題的解決都屬於今天我們討論的話題。

2.名次解釋

對於分類classification問題，要構建邏輯迴歸模型去預測，注意：這裡的邏輯迴歸雖然也有‘迴歸’二字，但並不是針對迴歸問題而言，因為其預測的結果是離散值，所以不要被“迴歸”二字混淆，邏輯迴歸並不屬於迴歸問題。

3.假設函式Hypothesis

分類問題要求Classification: y = 0 or 1

相應地預測結果 h(x) need to be limited to : 0 <= h(x) <= 1

所以，對於邏輯迴歸中的假設函式我們有如下定義（線上性迴歸模型上進行改進）：

當樣本預測結果h(x)>=0.5時，預測輸出值y=1;若h(x)<0.5時，預測輸出值y = 0;

所以這使得假設函式h(x)有這樣的物理意義：h(x)表徵預測結果y=1的概率；

4.決策邊界Decision boundary

決策邊界是假設函式h(x)的一個屬性，當通過訓練集擬合出了一條曲線-----即x對應的θ確定，那麼相應的決策邊界也就確定。

決策邊界就是θ^(T)x=0的曲線,曲線的兩側分別對應y=0 or 1。根據一個樣本落在曲線的哪一側，從而對結果進行決策。

4.代價函式J(θ)

代價函式J如果採用線性迴歸模型中的平方誤差函式定義，得到的J是一個non-convex(凸)，採用梯度下降不易得到全域性最優解，這裡我們採用概率論中的極大似然估計對J做一個凸優化，有：

整理可得：

代價函式雖然重新定義，但是更符合邏輯問題的預測情況，當y=1時：若h(x)->1，cost->0;若h(x)->0,cost->

∞，代價函式J很好的體現了“代價”這一含義。

★★★5.邏輯迴歸模型Logistic Regression Model

與線性迴歸模型的區別：y = 0 or 1

0 <= h(x) <= 1

①假設/擬合函式Hypothesis:

②引數Parameter:

③代價函式Cost Function:

④目標Goal:

對於邏輯迴歸模型Logistic Regression Model的求解主要有：梯度下降和高階優化演算法。

6.梯度下降Gradient Decent

梯度下降演算法在第二週的線性迴歸模型中有詳細描述，思路就是沿著J(θ)偏導數的方向以α的步伐下降，同時同步更新θ，迭代下去直至J(θ)收斂。

對於Logistic Regression由於J(θ)有變化，梯度下降演算法雖然在原理上沒有任何變化，就其表達形式我們也重新做一下推導：

◆對於θ的更新第二個等號的後面表示式的由來，就是對J(θ)求偏導，筆者曾經詳細的推導過，利用了一點g(z)函式的性質和適當的換元，感興趣的讀者可以試著推到下，最終你會驚人的發現：邏輯迴歸在改變J的前提下梯度下降演算法的表達形式與Linear Regression表達形式出奇的一致:-)，當然，h(x)的形式不同啦！QAQ

7.高階優化演算法Advanced Optimization

Andrew Ng在這裡講到了三種高階優化演算法，它們的高階是指相對於梯度下降演算法而言，有更快的收斂速度和自適應性，無需人工選擇學習速率α，缺點就是太複雜。

Andrew Ng坦言，對於這些高階優化演算法，重要的是成功應用這些演算法於不同的學習問題，而不太需要真正理解這些演算法的內環間在做什麼。

8.多類別分類問題Multi-class classification

之前講的都是兩種輸出y = 0 or 1,實際生活中會遇到多種類別的問題，解決這類多類別分類問題的基礎，就是之前的邏輯迴歸。

for example

Weather : Sunny , Cloudy , Rain , Snow（預測天氣情況）

Email tagging : Work , Friends , Family , Hobby(郵件歸類)

這時候相應的，y = 1 , 2 , 3 ,4 ....

One-vs-all思路：

選中某一類，其餘歸於一類，對於這樣的邏輯迴歸問題進行求解得到分類器h1(x);

再依次選擇其他類別，分別求解得到h2(x)....hn(x)(假設有n類)

最終，對某個樣本x進行預測時，挑選hi(x)中的最大值（可以理解為交集）

第二講正則化Regularization

正則化是一種處理過擬合問題的有效手段，Andrew Ng調侃道熟練掌握和使用梯度下降+高階優化演算法+正則化，就能在silicon valley混得不錯TAT.

1.過擬合現象overfitting

所謂的過擬合，就是特徵量冗餘，導致擬合函式雖然能夠很好的滿足訓練集，但是波動性大、方差大，對於新的樣本值不能很好的預測（用老話講，有點“過猶不及”的味道）

以下是欠擬合、正確擬合、過擬合的圖示比較，更直觀一些：

解決過擬合的方法，這裡介紹用處很大的正則化方法Regularization

★★★2.正則化對代價函式的改進

思路：引入θ求和項對1-n的θ進行懲罰，λ稱為正則化引數

因為有sigmaθ項的存在，在最小化代價函式的最終結果除了θ0外所有的θ都趨近於0。

當λ很大時，擬合曲線趨近於一條水平直線，結果欠擬合，且梯度下降演算法不能很好工作，通常λ選作1，就可以優化過擬合的情況。

至於如何將正則化的原理應用到線性迴歸模型、邏輯迴歸模型中去，就需要包括筆者在內的大家在實際問題中去動手實踐了！~

第三週的課程結束，伴隨著寒假的來臨，臨近新年要給自己大大的禮物才是，明天week4,Go~

Stanford機器學習---第三週.邏輯迴歸、正則化

第三週邏輯迴歸與正則化

Stanford機器學習---第三週.邏輯迴歸、正則化

Coursera機器學習-第三週-邏輯迴歸Logistic Regression

Stanford機器學習第三週：邏輯迴歸與正則化

吳恩達機器學習第三週

機器學習 | 吳恩達機器學習第三週程式設計作業(Python版)

機器學習第三週（下）

機器學習 | 吳恩達機器學習第三週學習筆記

FPGA機器學習之stanford機器學習第三堂2

機器學習入門系列三（關鍵詞：邏輯迴歸，正則化）

吳恩達機器學習 - 邏輯迴歸的正則化吳恩達機器學習 - 邏輯迴歸的正則化

機器學習基礎（三十） —— 線性迴歸、正則化（regularized）線性迴歸、區域性加權線性迴歸（LWLR）

吳恩達《機器學習》課程總結（7）正則化

線性迴歸和邏輯迴歸的正則化regularization

概率統計與機器學習：極大後驗概率以及正則化項

Stanford機器學習---第三講. 邏輯迴歸和過擬合問題的解決 logistic Regression & Regularization

【轉載】Stanford機器學習---第三講. 邏輯迴歸和過擬合問題的解決 logistic Regression & Regularization

小白學習機器學習---第三章(2):對數機率迴歸python實現

機器學習第三練：為慈善機構尋找捐助者

【原】Andrew Ng斯坦福機器學習 Programming Exercise 2——邏輯迴歸

Coursera-吳恩達-機器學習-第七週-測驗-Support Vector Machines

Stanford機器學習---第三週.邏輯迴歸、正則化

第三週 邏輯迴歸與正則化

相關推薦

第三週邏輯迴歸與正則化