吳恩達機器學習第三週

阿新 • • 發佈：2018-11-10

轉載https://www.cnblogs.com/LoganGo/p/8562575.html

一.邏輯迴歸問題（分類問題）

生活中存在著許多分類問題，如判斷郵件是否為垃圾郵件；判斷腫瘤是惡性還是良性等。機器學習中邏輯迴歸便是解決分類問題的一種方法。
二分類：通常表示為yϵ{0,1}，0：“Negative Class”，1：“Possitive Class”。
邏輯迴歸的預測函式表示式hθ(x)（hθ(x)>=0 && hθ(x)<=1）：
其中g(z)被稱為邏輯函式或者Sigmiod函式，其函式圖形如下：

理解預測函式hθ(x)的意義：其實函式hθ(x)的值是系統認為樣本值Y為1的概率大小，可表示為hθ(x)=P(y=1|x;θ)=1-P(y=0|x;θ).
決策邊界（Decision boundary）：y=0和y=1的分界線，由邏輯函式圖形可知，當y=1時，g(z)>=0.5，z>=0，也就是說θTX>=0，這樣我們就可以通過以xi為座標軸，作出θTX=0這條直線，這條直線便是決策邊界。如下圖所示：
代價函式（Cost Function）J(θ)：一定要是一個凸函式（Convex Function），這樣經過梯度下降方便找到全域性最優。

根據以上兩幅圖我們可以看出，當預測值hθ(x)和實際值結果y相同時，代價值為0；當預測值hθ(x)和實際結果y不同時，代價值無窮大。組合在一起可以寫為：

向量化後可寫為：
梯度下降演算法：和線性迴歸中使用的一樣

向量化：
高階優化方法（用來代替梯度下降選擇引數θ）：Conjugate gradient（共軛梯度法）、BFGS、L-BFGS，只需要掌握用法即可，不需瞭解原理。
優點：不需要手動選擇學習速率α，收斂速度比梯度下降快，更復雜。
```
%首先寫一個函式用來計算代價函式和代價函式的梯度
function [jVal, gradient] = costFunction(theta)
  jVal = [...code to compute J(theta)...];
  gradient = [...code to compute derivative of J(theta)...];
end

%然後在命令列中通過呼叫fminunc()函式來計算引數θ
```
options = optimset('GradObj', 'on', 'MaxIter', 100);
initialTheta = zeros(2,1);
[optTheta, functionVal, exitFlag] = fminunc(@costFunction, initialTheta, options);
多分類問題：可以轉化為n+1個二分類問題看待，如下：
通過這種形式，我們可以預測出結果最接近哪個y值。

二.過擬合問題和解決方法

Underfit：欠擬合問題具有高偏差；Overfit：過擬合問題具有高方差。
過擬合的定義：如果訓練集中有過多的特徵項，訓練函式過於複雜，而訓練資料又非常少。我們學到的演算法可能會完美的適應訓練集，也就是說代價會接近與0。但是卻沒有對新樣本的泛化能力。
解決方法：手動的選擇合適的特徵；或者使用模型選擇演算法（用來選取特徵變數）。
正規化（Regularization）：正則化中我們將保留所有的特徵變數，但是會減小特徵變數的數量級（引數數值的大小θ(j)），相當於減少引數θ(j)所對應的多項式對整個預測函式的影響。以下內容以線性迴歸為例。
正規化代價函式：其中λ過大會導致欠擬合。
正規化梯度下降：θ0不需要

其中當引數Θ不為θ0時，梯度下降形式又可以改寫為：

正規化正規方程：其中L為(n+1)*(n+1)維矩陣。
正規化邏輯迴歸：

代價函式：

梯度下降形式和線性迴歸相同。
正規化邏輯迴歸中高階的求解引數θ方法：

吳恩達機器學習第三週

轉載https://www.cnblogs.com/LoganGo/p/8562575.html 一.邏輯迴歸問題（分類問題）生活中存在著許多分類問題，如判斷郵件是否為垃圾郵件；判斷腫瘤是惡性還是良性等。機器學習中邏輯迴歸便是解決分類問題的一種方法。二分類：通常表示為yϵ{0,1}

機器學習 | 吳恩達機器學習第三週程式設計作業(Python版)

實驗指導書下載密碼:fja4 本篇部落格主要講解，吳恩達機器學習第三週的程式設計作業，作業內容主要是利用邏輯迴歸演算法(正則化)進行二分類。實驗的原始版本是用Matlab實現的，本篇部落格主要用Python來實現。目錄 1.實驗包含的檔案 2.使用邏

機器學習 | 吳恩達機器學習第三週學習筆記

第三週PPT彙總下載連結:https://pan.baidu.com/s/101uY5KV_2i3Ey516DYma_A 密碼:8o4e 上一篇部落格主要介紹了第二週的課程的內容，包括多變數線性迴歸，使用梯度下降法求解多變數線性迴歸的實用技巧，特徵縮放與模型特徵選擇並

Coursera-吳恩達-機器學習-第七週-測驗-Support Vector Machines

忘記截圖了，做了二次的，有點繞這裡，慢點想就好了。正確選項是，It would be reasonable to try increasing C. It would also be reasonable to try decreasing σ2. &n

Coursera-吳恩達-機器學習-第七週-程式設計作業: Support Vector Machines

本次文章內容： Coursera吳恩達機器學習課程，第七週程式設計作業。程式語言是Matlab。本文只是從程式碼結構上做的小筆記，更復雜的推導不在這裡。演算法分兩部分進行理解，第一部分是根據code對演算法進行綜述，第二部分是程式碼。本次作業分兩個part，第一個是using SVM，第

機器學習 | 吳恩達機器學習第六週學習筆記

課程視訊連結第六週PPT 下載密碼:zgkq 本週主要講解了如何設計機器學習系統和如何改進機器學習系統，包括一些模型選擇的方法，模型效能的評價指標，模型改進的方法等。目錄一、應用機器學習建議 1.決定下一步做什麼 2.評估假設函式 3.模型選擇和訓練、驗

機器學習 | 吳恩達機器學習第八週學習筆記

課程視訊連結第八週PPT 下載密碼:qedd 上週主要講解了支援向量機SVM的原理包括優化目標、大間隔以及核函式等SVM核心內容，以及SVM的使用。本週主要講解經典的無監督聚類演算法k-means，包括k-means的優化目標，原理以及一些引數設定細節；和降維演算法PCA的原理，

機器學習 | 吳恩達機器學習第八週程式設計作業(Python版）

實驗指導書下載密碼:higl 本篇部落格主要講解，吳恩達機器學習第八週的程式設計作業，主要包含KMeans實驗和PCA實驗兩部分。原始實驗使用Matlab實現，本篇部落格提供Python版本。目錄 1.實驗包含的檔案 2.KMeans實驗 3.K-me

機器學習 | 吳恩達機器學習第七週程式設計作業(Python版)

實驗指導書下載密碼:a15g 本篇部落格主要講解，吳恩達機器學習第七週的程式設計作業，包含兩個實驗，一是線性svm和帶有高斯核函式的svm的基本使用；二是利用svm進行垃圾郵件分類。原始實驗使用Matlab實現，本篇部落格提供Python版本。目錄 1.

機器學習 | 吳恩達機器學習第七週學習筆記

課程視訊連結第七週PPT 下載密碼:tmss 上週主要講解了如何設計機器學習系統和如何改進機器學習系統，包括一些模型選擇的方法，模型效能的評價指標，模型改進的方法等。本週主要講解支援向量機SVM的原理包括優化目標、大間隔以及核函式等SVM核心內容，以及SVM的使用。 &nbs

機器學習 | 吳恩達機器學習第六週程式設計作業(Python版）

實驗指導書下載密碼:4t4y 本篇部落格主要講解，吳恩達機器學習第六週的程式設計作業，作業內容主要是實現一個正則化的線性迴歸演算法，涉及本週講的模型選擇問題，繪製學習曲線判斷高偏差/高方差問題。原始實驗使用Matlab實現，本篇部落格提供Python版本。目錄 1.實驗包

Coursera-吳恩達-機器學習-第十週-測驗-Large Scale Machine Learning

本片文章內容： Coursera吳恩達機器學習課程，第十週 Large Scale Machine Learning 部分的測驗，題目及答案截圖。 1.cost increase ，說明資料diverge。減小learning rate。 stochastic不需要每步都是減

Coursera-吳恩達-機器學習-第八週-程式設計作業: K-Means Clustering and PCA

本次文章內容： Coursera吳恩達機器學習課程，第八週程式設計作業。程式語言是Matlab。本文只是從程式碼結構上做的小筆記，更復雜的推導不在這裡。演算法分兩部分進行理解，第一部分是根據code對演算法進行綜述，第二部分是程式碼。本次作業分兩個part，第一個是K-Means Clu

Coursera-吳恩達-機器學習-第八週-測驗-Principal Component Analysis

本片文章內容： Coursera吳恩達機器學習課程，第八週的測驗，題目及答案截圖。

Coursera-吳恩達-機器學習-第六週-程式設計作業: Regularized Linear Regression and Bias/Variance

本次文章內容： Coursera吳恩達機器學習課程，第六週程式設計作業。程式語言是Matlab。學習演算法分兩部分進行理解，第一部分是根據code對演算法進行綜述，第二部分是程式碼。 0 Introduction 在這個練習中，應用regularized linea

Coursera-吳恩達-機器學習-第六週-測驗-Machine Learning System Design

說實話，這一次的測驗對我還是有一點難度的，為了刷到100分，刷了7次（哭）。無奈，第2道和第4道題總是出錯，後來終於找到錯誤的地方，錯誤原因是思維定式，沒有動腦和審題正確。這兩道題細節會在下面做出講解。第二題分析：題意問，使用大量的資料，在哪兩種情況時

Coursera-吳恩達-機器學習-第五週-程式設計作業: Neural Networks Learning

本次文章內容： Coursera吳恩達機器學習課程，第五週程式設計作業。程式語言是Matlab。學習演算法分兩部分進行理解，第一部分是根據code對演算法進行綜述，第二部分是程式碼。 0 Introduction 在這個練習中，將應用 backpropagation

Coursera-吳恩達-機器學習-第十一週-測驗-Application: Photo OCR

本片文章內容： Coursera吳恩達機器學習課程，第十一週 Application: Photo OCR 部分的測驗，題目及答案截圖。 1000*1000，每次移動2畫素，總共是500*500=250000次，兩個視窗是500000次。 &nb

深度學習-吳恩達第一課第三週課程作業

第二週的課程作業是利用邏輯迴歸來訓練一個分類器來辨別一張圖片是否為貓，這周老師講了單隱層的神經網路，所以先看看利用這個模型能否在上次作業的基礎上對訓練準確度作出改善訓練一個神經網路神經網路分為幾層，隱藏層中包含幾個神經元，使用的啟用函式初始化引數 W（i）和

吳恩達機器學習第5周Neural Networks（Cost Function and Backpropagation）

and div bsp 關於邏輯回歸 info src clas 分享 5.1 Cost Function 假設訓練樣本為：{(x1),y(1)),(x(2),y(2)),...(x(m),y(m))} L = total no.of layers in network

吳恩達 機器學習 第三週

轉載https://www.cnblogs.com/LoganGo/p/8562575.html

一.邏輯迴歸問題（分類問題）

二.過擬合問題和解決方法

相關推薦

吳恩達機器學習第三週