Stanford機器學習課程(Andrew Ng) Week 1 Model and Cost Function --- 第二節 Cost Function

阿新 • • 發佈：2019-01-03

Cost Function

在學習線性迴歸之前，我們有必要補充代價函式的知識，來幫助我們弄清楚如何把最有可能的直線和我們的資料相擬合。

這裡寫圖片描述

還是上節課的資料集，而假設函式也是這樣的一個最基本的線性函式形式

我們把θi稱為模型引數，而且我們將討論如何選擇不同的θ0和θ1

這裡寫圖片描述

我們想要選擇合適θ0和θ1來使直線最好的擬合圖中的資料點。
所以這裡有一個最小化的概念就是使假設函式與訓練樣本之間的誤差最小

圖中右上角的式子，求取訓練集中每一個樣例的假設值與真實值的差的平方，再進行求和，平均，最終得到平均誤差。我們要做的就是儘量最小化這個平均誤差
將式子改寫代價函式的形式就是右下角的式子，意為求出使代價函式J(θ0， θ1)

最小的θ0和θ1，所以代價函式也成為平方誤差代價函式。
平方誤差代價函式可能是解決迴歸問題最常用的一種代價函式

Cost Function Intuition1：

下面我們通過一些例子來獲取一些直觀的感受：

為了更好的理解代價函式，
我們使用更為簡化的一個例子h(x) = θ1x

這裡寫圖片描述

兩個重要函式h(x) and J(x)

假設函式h(x)是對於固定的θ1，這是一個關於x的函式，θ1控制斜率

代價函式J(x)是關於引數θ1的函式

假設我們訓練樣本包含三個點(1 , 1),(2 , 2),(3 , 3)

這裡寫圖片描述

假設θ1 = 1，我們算出θ1 = 1 時候的代價函式為0+0+0=0

並且我們在J(θ)上找到θ1= 1時候對應的點(1 , 0)

所以如果θ1=0.5的時候會發生什麼呢

這裡寫圖片描述

從圖中我們也可以看出h(θ)和y之間的差值其實就是特徵點與直線之間的距離

如過θ為0呢？

這裡寫圖片描述

假設函式直接和x軸重合，當然θ值也可以為負，不過相應的代價函式點可能會非常的大。計算更多的值我們可以看到J(θ1)的樣子了

J(θ)中任何一個點都對應著代價函式的一條擬合直線。

所以θ1=1時可以獲得最佳擬合的直線。

Cost Function Intuition2：

兩個引數

上面為了更好的視覺化代價函式，將θ0設為了0.
而下面我們將使用兩個值

來計算代價函式。

這裡寫圖片描述

先假設一個假設函式，但並不是很好的擬合數據。

這裡寫圖片描述

根據給出的θ0和θ1的值。我們在右邊畫出代價函式的影象，但是我們現在有兩個引數，不好畫出，但是仍會呈現出弓形：

這裡寫圖片描述

下面兩個軸代表θ0和θ1，縱軸代表某個特定的點(θ0 , θ1)代價函式的大小

輪廓圖表示代價函式

這裡列出了不同值情況下的代價函式影象

這裡每一圈代表表示J(θ0 , θ1)相同的所有點的集合，左邊就是相應的假設函式，比如上圖中的（800，-0.15）點離中心圓很遠，就代表還遠沒有達到最佳的擬合效果。

這裡寫圖片描述

從圖中看出有的點和離中心比較近，相應的假設函式也看起來能更好的劃分資料。

但是畫出這些圖相當麻煩，所以我們要尋找一種方法能自動找出是這些代價函式J取最小值的引數θ0和θ1。

Stanford機器學習課程(Andrew Ng) Week 1 Model and Cost Function --- 第二節 Cost Function

Cost Function 在學習線性迴歸之前，我們有必要補充代價函式的知識，來幫助我們弄清楚如何把最有可能的直線和我們的資料相擬合。還是上節課的資料集，而假設函式也是這樣的一個最基本的線性函式形式我們把θi稱為模型引數，而且

Stanford機器學習課程(Andrew Ng) Week 1 Parameter Learning --- 線性迴歸中的梯度下降法

本節將梯度下降與代價函式結合，並擬合到線性迴歸的函式中這是我們上兩節課得到的函式，包括：梯度下降的公式用於擬合的線性假設和h(x) 平方誤差代價函式 J

Stanford機器學習課程筆記1-Linear Regression與Logistic Regression

轉載請註明出處: http://xiahouzuoxin.github.io/notes/課程計劃主講人Andrew Ng是機器學習界的大牛，創辦最大的公開課網站coursera，前段時間還聽說加入了百度。他講的機器學習課程可謂每個學計算機的人必看。整個課程的大綱大致如下：I

Stanford機器學習課程筆記4-Kmeans與高斯混合模型

這一部分屬於無監督學習的內容，無監督學習內容主要包括：Kmeans聚類演算法、高斯混合模型及EM演算法、Factor Analysis、PCA、ICA等。本文是Kmeans聚類演算法、高斯混合模型的筆記，EM演算法是適用於存在latent/hidden變數的通用演算法，高斯混

Stanford機器學習課程筆記3-學習理論部分

簡單補充點SVM吧關於SVM的筆記部落格內沒有整理，主要是因為另外，關於LibSVM的理論，除了Andrew Ng給的Handout外，推薦的就是林智仁兩份資料：好了，SVM不多說了，本文主要是要說一些偏機器學習中實踐的東西（雖然標題是學習理論，但其實是機器學習實踐更恰當些）

Stanford coursera Andrew Ng 機器學習課程程式設計作業（Exercise 1）Python3.x

Exercise 1：Linear Regression---實現一個線性迴歸在本次練習中，需要實現一個單變數的線性迴歸。假設有一組歷史資料<城市人口，開店利潤>，現需要預測在哪個城市中開店利潤比較好？歷史資料如下：第一列表示城市人口數，單位為萬人；第二

AI-004: 吳恩達教授（Andrew Ng）的機器學習課程學習筆記1-14

本文是學習Andrew Ng的機器學習系列教程的學習筆記。教學視訊地址：本文中的白色背景視訊截圖來自Andrew Ng的視訊腳程, 思維導圖為原創總結。 ML基礎介紹，單變數的線性迴歸： Introduce ML: grew out of work in A

Andrew Ng機器學習課程筆記（四）之神經網絡

Andrew機器學習課程章節1——初識機器學習

問題1：什麼是機器學習以及機器學習的通用演算法如今一般使用的是Tom Mitchell對機器學習的定義：原文為： A computer program is said to learn from experience E with respecet to some task T and

【原】Coursera—Andrew Ng機器學習—課程筆記 Lecture 10—Advice for applying machine learning

Lecture 10—Advice for applying machine learning 10.1 如何除錯一個機器學習演算法？有多種方案： 1、獲得更多訓練資料；2、嘗試更少特徵；3、嘗試更多特徵；4、嘗試新增多項式特徵；5、減小 λ；6、增大 λ 為了避免一個方案一個方

AI-005: 吳恩達教授（Andrew Ng）的機器學習課程學習筆記15-20

本文是學習Andrew Ng的機器學習系列教程的學習筆記。教學視訊地址：本文中的白色背景視訊截圖來自Andrew Ng的視訊腳程, 思維導圖為原創總結。多變數的線性迴歸： 15. Linear Regression with multiple variables

AI-009: 吳恩達教授（Andrew Ng）的機器學習課程學習筆記38-47

本文是學習Andrew Ng的機器學習系列教程的學習筆記。教學視訊地址： 38. Neural Networks - Representation - Non-linear hypotheses Why neural networks? Simple linear

AI-008: 吳恩達教授（Andrew Ng）的機器學習課程學習筆記34-37

本文是學習Andrew Ng的機器學習系列教程的學習筆記。教學視訊地址：正則化來解決過擬合問題： 34. Regularization - the problem of overfitting What’s overfitting? 過擬合就是我們的假設函式與樣本

AI-007: 吳恩達教授（Andrew Ng）的機器學習課程學習筆記27-33

本文是學習Andrew Ng的機器學習系列教程的學習筆記。教學視訊地址：分類問題思維導圖： 27. Logistic Regression - Classification Example: It is not good to use linear regr

AI-014: 吳恩達教授（Andrew Ng）的機器學習課程學習筆記49

本文是學習Andrew Ng的機器學習系列教程的學習筆記。教學視訊地址： 49. Machine learning system design: prioritizing what to work on: spam classification example 以建立

【原】Coursera—Andrew Ng機器學習—課程筆記 Lecture 11—Machine Learning System Design

Lecture 11—Machine Learning System Design 11.1 垃圾郵件分類本章中用一個實際例子：垃圾郵件Spam的分類來描述機器學習系統設計方法。首先來看兩封郵件，左邊是一封垃圾郵件Spam，右邊是一封非垃圾郵件Non-Spam：垃圾郵件有很多features。如果我

【原】Coursera—Andrew Ng機器學習—課程筆記 Lecture 12—Support Vector Machines 支援向量機

Lecture 12 支援向量機 Support Vector Machines 12.1 優化目標 Optimization Objective 支援向量機(Support Vector Machine) 是一個更加強大的演算法，廣泛應用於工業界和學術界。與邏輯迴歸和神經網路相比, SVM在學習複雜的非

【原】Coursera—Andrew Ng機器學習—課程筆記 Lecture 14—Dimensionality Reduction 降維

Lecture 14 Dimensionality Reduction 降維 14.1 降維的動機一:資料壓縮 Data Compression 現在討論第二種無監督學習問題：降維。降維的一方面作用是資料壓縮，允許我們使用較少的記憶體或磁碟空間，也加快演算法速度。例子：假設我們用兩個特徵描述一個物

【原】Coursera—Andrew Ng機器學習—課程筆記 Lecture 15—Anomaly Detection異常檢測

Lecture 15 Anomaly Detection 異常檢測 15.1 異常檢測問題的動機 Problem Motivation 異常檢測(Anomaly detection)問題是機器學習演算法的一個常見應用。這種演算法雖然主要用於無監督學習問題，但從某些角度看，它又類似於一些監督學習問題。舉例：

【原】Coursera—Andrew Ng機器學習—課程筆記 Lecture 16—Recommender Systems 推薦系統

Lecture 16 Recommender Systems 推薦系統 16.1 問題形式化 Problem Formulation 在機器學習領域，對於一些問題存在一些演算法，能試圖自動地替你學習到一組優良的特徵。通過推薦系統(recommender systems)，將領略一小部分特徵學習的思想。

Stanford機器學習課程(Andrew Ng) Week 1 Model and Cost Function --- 第二節 Cost Function

Cost Function

Cost Function Intuition1：

兩個重要函式h(x) and J(x)

假設函式h(x)是對於固定的θ1，這是一個關於x的函式，θ1控制斜率

代價函式J(x)是關於引數θ1的函式

假設我們訓練樣本包含三個點(1 , 1),(2 , 2),(3 , 3)

假設θ1 = 1，我們算出θ1 = 1 時候的代價函式為0+0+0=0

並且我們在J(θ)上找到θ1= 1時候對應的點(1 , 0)

所以如果θ1=0.5的時候會發生什麼呢

如過θ為0呢？

Cost Function Intuition2：

兩個引數

先假設一個假設函式，但並不是很好的擬合數據。

輪廓圖表示代價函式

相關推薦