Coursera-AndrewNg(吳恩達)機器學習筆記——第三周

阿新 • • 發佈：2018-03-20

訓練 ros 方便 font 就是梯度下降全局最優用法郵件

一.邏輯回歸問題（分類問題）

生活中存在著許多分類問題，如判斷郵件是否為垃圾郵件；判斷腫瘤是惡性還是良性等。機器學習中邏輯回歸便是解決分類問題的一種方法。
二分類：通常表示為y?{0,1}，0：“Negative Class”，1：“Possitive Class”。
邏輯回歸的預測函數表達式h_θ(x)（h_θ(x)>=0 && h_θ(x)<=1）：

其中g(z)被稱為邏輯函數或者Sigmiod函數，其函數圖形如下：

理解預測函數h_θ(x)的意義：其實函數h_θ(x)的值是系統認為樣本值Y為1的概率大小，可表示為h_θ(x)=P(y=1|x;θ)=1-P(y=0|x;θ).

決策邊界（Decision boundary）：y=0和y=1的分界線，由邏輯函數圖形可知，當y=1時，g(z)>=0.5，z>=0，也就是說θ^TX>=0，這樣我們就可以通過以x_i為坐標軸，作出θ^TX=0這條直線，這條直線便是決策邊界。如下圖所示：
代價函數（Cost Function）J(θ)：一定要是一個凸函數（Convex Function），這樣經過梯度下降方便找到全局最優。

根據以上兩幅圖我們可以看出，當預測值h_θ(x)和實際值結果y相同時，代價值為0；當預測值h_θ(x)和實際結果y不同時，代價值無窮大。組合在一起可以寫為：

向量化後可寫為：
梯度下降算法：和線性回歸中使用的一樣

向量化：
高級優化方法（用來代替梯度下降選擇參數θ）：Conjugate gradient（共軛梯度法）、BFGS、L-BFGS，只需要掌握用法即可，不需了解原理。
優點：不需要手動選擇學習速率α，收斂速度比梯度下降快，更復雜。
```
%首先寫一個函數用來計算代價函數和代價函數的梯度
function [jVal, gradient] = costFunction(theta)
  jVal = [...code to compute J(theta)...];
  gradient = [...code to compute derivative of J(theta)...];
end

%然後在命令行中通過調用fminunc()函數來計算參數θ
 
```
options = optimset(‘GradObj‘, ‘on‘, ‘MaxIter‘, 100);
initialTheta = zeros(2,1);
[optTheta, functionVal, exitFlag] = fminunc(@costFunction, initialTheta, options);
多分類問題：可以轉化為n+1個二分類問題看待，如下：

通過這種形式，我們可以預測出結果最接近哪個y值。

二.過擬合問題和解決方法

Underfit：欠擬合問題具有高偏差；Overfit：過擬合問題具有高方差。
過擬合的定義：如果訓練集中有過多的特征項，訓練函數過於復雜，而訓練數據又非常少。我們學到的算法可能會完美的適應訓練集，也就是說代價會接近與0。但是卻沒有對新樣本的泛化能力。
解決方法：手動的選擇合適的特征；或者使用模型選擇算法（用來選取特征變量）。
正規化（Regularization）：正則化中我們將保留所有的特征變量，但是會減小特征變量的數量級（參數數值的大小θ(j)），相當於減少參數θ(j)所對應的多項式對整個預測函數的影響。以下內容以線性回歸為例。
正規化代價函數：其中λ過大會導致欠擬合。

正規化梯度下降：θ₀不需要

其中當參數Θ不為θ₀時，梯度下降形式又可以改寫為：

正規化正規方程：其中L為(n+1)*(n+1)維矩陣。
正規化邏輯回歸：

代價函數：

梯度下降形式和線性回歸相同。
正規化邏輯回歸中高級的求解參數θ方法：

無~~~~

Coursera-AndrewNg(吳恩達)機器學習筆記——第三周

訓練 ros 方便 font 就是梯度下降全局最優用法郵件一.邏輯回歸問題（分類問題）生活中存在著許多分類問題，如判斷郵件是否為垃圾郵件；判斷腫瘤是惡性還是良性等。機器學習中邏輯回歸便是解決分類問題的一種方法。二分類：通常表示為y?{0,1}，0：“Negat

吳恩達機器學習筆記第三部分未完成且暫時不打算完成

Linear regression and logistic regression,when u apply them ,sometimes cause the overfitting.Another term for this is that thisalgorithm h

Coursera-吳恩達-機器學習-（第5周筆記）Neural Networks——Learning

Week 5 —— Neural Networks : Learning 目錄一代價函式和反向傳播 1-1 代價函式首先定義一些我們需要使用的變數： L =網路中的總層數 sl =第l層中的單位數量（不

Coursera-吳恩達-機器學習-（第11周筆記）應用例項：photo OCR

Week 11 ——Application Example: Photo OCR 目錄影象OCR（Optical Character Recognition） 1-1 問題描述在這一段介紹一種機器學習的應用例項照片OCR技術

吳恩達機器學習（第2周--Octave/Matlab Tutorial）【下】

第2周--Plotting Data>> t = [0:0.01:0.98]; >> y1 = sin(2*pi*4*t); >> plot(t,y1) >> y1 = cos(2*pi*4*t); >> plo

Coursera 斯坦福吳恩達機器學習課程筆記 (1)

看了課程一週後發現忘光了，決定做一個筆記用作複習。如果涉及到侵權問題請聯絡我，我會立馬刪除並道歉。同時，禁止任何形式的轉載，包括全文轉載和部分轉載。如需使用請聯絡本人 [email protected]。如若發現侵權行為，我學過智慧財產權法的，嘿嘿第一週：基礎概念和

吳恩達機器學習筆記 —— 5 多變量線性回歸

擬合進行 image 價格常用從表 cnblogs 優化深度本篇主要講的是多變量的線性回歸，從表達式的構建到矩陣的表示方法，再到損失函數和梯度下降求解方法，再到特征的縮放標準化，梯度下降的自動收斂和學習率調整，特征的常用構造方法、多維融合、高次項、平方根，最後基

吳恩達機器學習筆記 —— 9 神經網絡學習

滿了線性回歸復雜 amp 技術分享 tps 機器神經網絡前饋型神經網絡本章講述了神經網絡的起源與神經元模型，並且描述了前饋型神經網絡的構造。更多內容參考機器學習&深度學習在傳統的線性回歸或者邏輯回歸中，如果特征很多，想要手動組合很多有效的特征是不

吳恩達機器學習筆記（六） —— 支持向量機SVM

次數括號圖片最小我們支持向量機svm UNC 意思 strong 主要內容：一.損失函數二.決策邊界三.Kernel 四.使用SVM 一.損失函數二.決策邊界對於：當C非常大時，括號括起來的部分就接近於0，所以就變成了：

吳恩達機器學習筆記 —— 17 推薦系統

htm 特征問題這就是 ref 圖片系統得出工業本章講述了推薦系統相關的知識，比如基於內容的推薦算法、基於協同過濾的推薦算法以及實踐中遇到的問題。更多內容參考機器學習&深度學習推薦系統是機器學習在工業界應用最廣泛的方向，很多電子商務類、咨詢類的

吳恩達機器學習筆記 —— 12 機器學習系統設計

不知道 cor 算法項目詞語樣本我們們的 ... http://www.cnblogs.com/xing901022/p/9362339.html 本章主要圍繞機器學習的推薦實踐過程以及評測指標，一方面告訴我們如何優化我們的模型；另一方面告訴我們對於分類的算法

吳恩達機器學習筆記 —— 14 無監督學習

www 最簡業務一次曲線 logs img 下一個 com http://www.cnblogs.com/xing901022/p/9368432.html 本章講述的是第一個無監督的機器學習算法，在無監督的算法中，樣本數據只有特征向量，並沒有標註的y值。比如聚類

吳恩達機器學習筆記 —— 19 應用舉例：照片OCR（光學字符識別）

參考 https ocr 噪聲也說字符 www. 定位 cnblogs http://www.cnblogs.com/xing901022/p/9374258.html 本章講述的是一個復雜的機器學習系統，通過它可以看到機器學習的系統是如何組裝起來的；另外也說明了一

吳恩達機器學習筆記 —— 11 應用機器學習的建議

切分 image 們的正則化如果 mage 樣本獲得建議 http://www.cnblogs.com/xing901022/p/9356783.html 本篇講述了在機器學習應用時，如何進行下一步的優化。如訓練樣本的切分驗證？基於交叉驗證的參數與特征選擇？在訓

吳恩達機器學習筆記

叠代公式 spec end webkit 測量 ase letter s函數 1 機器學習的含義（1）Field of study that gives computers the ability to learn without being explicitly p

吳恩達機器學習筆記1-機器學習概述

可能 perf hat 定義視頻 nbsp 這樣的 spec 學習能力今天看了視頻的第一章-緒論：初識機器學習（Machine Learning） 1、定義： Arthur Samuel（1959）.Machine Learning:Field of study tha

吳恩達機器學習筆記2-監督學習

word ins problems 一個 should regress ssi pri read 英文; Supervised Learning 　　In supervised learning, we are given a data set and already kn

吳恩達機器學習筆記4-單變量線性回歸

alt 方法 bsp 目標 .com 函數 bubuko 機器學習絕對值今天看個5個課時的視頻，對假設函數、代價函數、以及梯度下降有了一個大概的了解。假設函數：代價函數：我們的目標就是求得J的最小值梯度下降：在一個上坡上找一個點，求得這個點周圍的絕對值最大的導數

[吳恩達機器學習筆記]11機器學習系統設計5數據量對機器學習的影響

ril 預測數據教程擬合 mic 因此效果數據集 11. 機器學習系統的設計覺得有用的話,歡迎一起討論相互學習~Follow Me 參考資料斯坦福大學 2014 機器學習教程中文筆記 by 黃海廣 11.5 數據量對機器學習的影響 Data For Mac

[吳恩達機器學習筆記]13聚類K-means

沒有 rand 幫助聯系 method ima 運用重新 function 13.聚類覺得有用的話,歡迎一起討論相互學習~Follow Me 13.1無監督學習簡介從監督學習到無監督學習在一個典型的監督學習中，我們有一個有標簽的訓練集，我們的目標是找到能夠區分正

Coursera-AndrewNg(吳恩達)機器學習筆記——第三周

一.邏輯回歸問題（分類問題）

二.過擬合問題和解決方法

相關推薦