演算法工程師修仙之路：吳恩達機器學習（十三）

阿新 • • 發佈：2018-12-31

吳恩達機器學習筆記及作業程式碼實現中文版

第十章支援向量機

優化目標

在監督學習中，許多學習演算法的效能都非常類似，因此，重要的不是你該選擇使用學習演算法 A 還是學習演算法 B，而更重要的是，所建立的大量資料在應用這些演算法時，表現情況通常依賴於你的水平。比如你為學習演算法所設計的特徵量的選擇，以及如何選擇正則化引數，諸如此類。
支援向量機(Support VectorMachine)，簡稱 SVM，與邏輯迴歸和神經網路相比，在學習複雜的非線性方程時提供了一種更為清晰，更加強大的方式。
從邏輯迴歸開始展示如何一點一點修改來得到本質上的支援向量機：
- 在邏輯迴歸中我們已經熟悉了下圖的假設函式形式和右邊的 S 型激勵函式。
- 如果有一個 $y=1$ 的樣本，不管是在訓練集中或是在測試集中，又或者在交叉驗證集中，總之是 $y=1$ ，現在我們希望 $ℎ_\theta(x)$ 趨近 1。因為我們想要正確地將此樣本分類，這就意味著當 $ℎ_\theta(x)$ 趨近於 1 時， $ℎ_\theta(x)$ 應當遠大於 0，這裡的>>意思是遠遠大於 0。
- 相反地，如果我們有另一個樣本，即 $y=0$ 。我們希望假設函式的輸出值將趨近於 0，這對應於 $\theta^Tx$ ，或者就是 $z$ 會遠小於 0，因為對應的假設函式的輸出值趨近 0。
- 現在，一起來考慮兩種情況：一種是y等於 1 的情況；另一種是y等於 0 的情況。
- 在第一種情況中，假設 $y=1$ ，此時在目標函式中只需有第一項起作用，因為 $y=1$ 時， $(1 − y)$ 項將等於 0。因此，當在 $y=1$ 的樣本中時，即在 (x, y)中，我們得到 $-log(\frac{1}{1+e^{-z}})$ 這一項。
- 如果畫出關於 $z$ 的函式，我們同樣可以看到，當 $z$ 增大時，也就是相當於 $\theta^Tx$ 增大時， $z$ 對應的值會變的非常小。對整個代價函式而言，影響也非常小。這也就解釋了，為什麼邏輯迴歸在觀察到正樣本 $y=1$ 時，試圖將 $\theta^Tx$ 設定得非常大。因為，在代價函式中的這一項會變的非常小。
- 現在開始建立支援向量機，我們會從這個代價函式開始，也就是 $-log(1-\frac{1}{1+e^{-z}})$ 一點一點修改，取這裡的 $z=1$ 點，先畫出將要用的代價函式：
- 新的代價函式是一條直線，也就是用紫紅色畫的曲線，這裡已經非常接近邏輯迴歸中使用的代價函數了，不過這裡是由兩條線段組成，即位於右邊的水平部分和位於左邊的直線部分，左邊直線部分的斜率並不重要。但是，這裡我們將使用的新的代價函式，是在 $y=1$ 的前提下的。
- 目前，我們只是討論了 $y=1$ 的情況，另外一種情況是當 $y=0$ 時，此時代價函式只留下了 $-log(1-\frac{1}{1+e^{-z}})$ 這一項。如果你將這一項作為 $z$ 的函式，那麼，這裡就會得到橫軸 $z$ 。同樣地，我們要替代這一條藍色的線，用相似的方法：
- 如果我們用一個新的代價函式來代替，即這條從 0 點開始的水平直線，然後是一條斜線，像上圖。那麼，現在給這兩個方程命名為 $cost_1(z)$ 和 $cost_0(z)$ 。這裡的下標是指在代價函式中，對應的 $y=1$ 和 $y=0$ 的情況，擁有了這些定義後，現在，我們就開始構建支援向量機：
- 首先，我們要除去1/m這一項，當然，這僅僅是由於人們使用支援向量機時，對比於邏輯迴歸而言，不同的習慣所致，這也會得出同樣的 $\theta$ 最優值。
- 第二點概念上的變化，我們只是指在使用支援向量機時，一些如下的標準慣例，而不是邏輯迴歸。對於邏輯迴歸，在目標函式中，我們有兩項：第一個是訓練樣本的代價，第二個是我們的正則化項。這就相當於我們想要最小化 $A$ 加上正則化引數 $\lambda$ ，然後乘以其他項 $B$ ，我們所做的是通過設定不同正則引數 $\lambda$ 達到優化目的，使得訓練樣本擬合的更好，即最小化 $A$ 。
- 對於支援向量機，按照慣例，我們將使用一個不同的引數替換這裡使用的 $\lambda$ 來權衡這兩項，就是第一項和第二項我們依照慣例使用一個不同的引數稱為 $C$ ，同時改為優化目標 $C×A+B$ 。
- 在邏輯迴歸中，如果給定 $\lambda$ 一個非常大的值，意味著給予 $B$ 更大的權重。而這裡，就對應於將 $C$ 設定為非常小的值，那麼，相應的將會給 $B$ 比給 $A$ 更大的權重。
- 因此，這只是一種不同的方式來控制這種權衡或者一種不同的方法，即用引數來決定是更關心第一項的優化，還是更關心第二項的優化。
- 那麼，我現在刪掉這裡的 $\lambda$ ，並且用常數 $C$ 來代替。這就得到了在支援向量機中我們的整個優化目標函式。然後最小化這個目標函式，得到 SVM 學習到的引數 $C$ ：
- 最後有別於邏輯迴歸輸出的概率。在這裡，我們的代價函式，當最小化代價函式，獲得引數 $\theta$ 時，支援向量機所做的是它來直接預測 $y$ 的值等於1，還是等於0，當 $\theta^Tx$ 大於或者等於 0 時，這個假設函式會預測1，其他情況為0。
- 這就是支援向量機數學上的定義。

演算法工程師修仙之路：吳恩達機器學習（十三）

吳恩達機器學習筆記及作業程式碼實現中文版第十章支援向量機優化目標在監督學習中，許多學習演算法的效能都非常類似，因此，重要的不是你該選擇使用學習演算法 A 還是學習演算法 B，而更重要的是，所建立的大量資料在應用這些演算法時，表現情況通常依賴於你的水平。比如你

演算法工程師修仙之路：吳恩達機器學習（九）

吳恩達機器學習筆記及作業程式碼實現中文版神經網路引數的反向傳播演算法代價函式假設神經網路的訓練樣本有 m

演算法工程師修仙之路：吳恩達機器學習（八）

吳恩達機器學習筆記及作業程式碼實現中文版第六章神經網路學習特徵和直觀理解從本質上講，神經網路能夠通過學習得出其自身的一系列特徵。神經網路中，單層神經元（無中間層）的計算可用來表示邏輯運算，比如邏輯與(AND)、邏輯或(OR)。邏輯

演算法工程師修仙之路：吳恩達機器學習（七）

吳恩達機器學習筆記及作業程式碼實現中文版第六章神經網路學習非線性假設無論是線性迴歸還是邏輯迴歸都有這樣一個缺點：當特徵太多時，計算的負荷會非常大。使用非線性的多項式項，能夠幫助我們建立更好的分類模型。假設我們有非常多的特徵，例如大於 100 個

演算法工程師修仙之路：吳恩達機器學習（六）

吳恩達機器學習筆記及作業程式碼實現中文版第五章正則化過擬合問題線性迴歸和邏輯迴歸能夠有效地解決許多問題，但是當將它們應用到某些特定的機器學習應用時，會遇到過擬合(over-fitting)的問題，可能會導致它們效果很差。正則化(regulari

演算法工程師修仙之路：吳恩達機器學習（五）

吳恩達機器學習筆記及作業程式碼實現中文版第四章 Logistic迴歸簡化代價函式與梯度下降邏輯迴歸的代價函式： C

演算法工程師修仙之路：吳恩達機器學習（四）

吳恩達機器學習筆記及作業程式碼實現中文版第四章 Logistic迴歸分類在分類問題中，要預測的變數y是離散的值，邏輯迴歸 (Logistic Regression) 演算法是目前最流行使用最廣泛的一種學習演算法。在分類問題中，我們嘗試預測的是結果

演算法工程師修仙之路：吳恩達機器學習（三）

吳恩達機器學習筆記及作業程式碼實現中文版第三章多變數線性迴歸多維特徵現在我們對房價模型增加更多的特徵，例如房間數樓層等，構成一個含有多個變數的模型，模型中的特徵為

演算法工程師修仙之路：吳恩達機器學習（二）

吳恩達機器學習筆記及作業程式碼實現中文版第二章單變數線性迴歸模型描述我們使用一個監督學習演算法的例子：預測住房價格。我們要使用一個數據集，資料集包含俄勒岡州波特蘭市的住房價格。在這裡，我要根據不同房屋尺寸所售出的價格，畫出我的資

演算法工程師修仙之路：吳恩達機器學習（一）

吳恩達機器學習筆記及作業程式碼實現中文版第一章緒論：初識機器學習什麼是機器學習 Machine Learning(機器學習)是研究計算機怎樣模擬或實現人類的學習行為，以獲取新的知識或技能，重新組織已有的知識結構使之不斷改善自身的效能。機器學習被用

演算法工程師修仙之路：吳恩達機器學習（十）

吳恩達機器學習筆記及作業程式碼實現中文版第七章神經網路引數的反向傳播演算法理解反向傳播為了更好地理解反向傳播演算法，我們再來仔細研究一下前向傳播的原理：反向傳播演算法做的是：梯度檢測當我們對一個較為複雜

演算法工程師修仙之路：吳恩達機器學習（十五）

吳恩達機器學習筆記及作業程式碼實現中文版第十章支援向量機大間隔分類器的數學原理假設我有兩個二維向量 u

演算法工程師修仙之路：吳恩達機器學習（十四）

吳恩達機器學習筆記及作業程式碼實現中文版第十章支援向量機直觀上對大間隔的理解人們有時將支援向量機看作是大間距分類器。支援向量機模型的代價函式，在左邊這裡我畫出了關於 z 的代價函式

演算法工程師修仙之路：吳恩達機器學習（十二）

吳恩達機器學習筆記及作業程式碼實現中文版第九章機器學習系統設計確定執行的優先順序以一個垃圾郵件分類器演算法為例進行討論。為了解決這樣一個問題，我們首先要做的決定是如何選擇並表達特徵向量

演算法工程師修仙之路：吳恩達機器學習（十一）

吳恩達機器學習筆記及作業程式碼實現中文版第八章應用機器學習的建議決定下一步做什麼獲得更多的訓練例項——通常是有效的，但代價較大，下面的方法也可能有效，可考慮先採用下面的幾種方法：嘗試減少特徵的數量；嘗試獲得更多的特徵

演算法工程師修仙之路：吳恩達機器學習作業（一）

吳恩達機器學習筆記及作業程式碼實現中文版第一個程式設計作業：單變數線性迴歸（python程式碼實現）一元線性迴歸問題描述在本練習的這一部分中，您將使用只有單變數的線性迴歸方法預測餐車的利潤。假設你是一家連鎖餐廳的執行長，正在

演算法工程師修仙之路：python3官方文件筆記（三）

本筆記來自於python手冊的中文版 Python 簡介 Python 中的註釋以 # 字元起始，直至實際的行尾。註釋可以從行首開始，也可以在空白或程式碼之後，但是不出現在字串中。文字字串中的 # 字元僅僅表示 # 。程式碼中的註釋

演算法工程師修仙之路：python3官方文件筆記（二）

本筆記來自於python手冊的中文版使用 Python 直譯器呼叫 Python 直譯器通常你可以在主視窗輸入一個檔案結束符（Unix系統是Control-D，Windows系統是Control-Z）讓直譯器以 0 狀態碼退出。如果那沒有作用，你可以通過輸入

演算法工程師修仙之路：python3廖雪峰教程筆記（一）

此筆記摘錄於廖雪峰先生的教程，感謝廖先生的無私分享，特此致敬！ python簡介 Python是一種什麼語言？用任何程式語言來開發程式，都是為了讓計算機幹活，而計算機幹活的CPU只認識機器指令，所以，儘管不同的程式語言差異極大，最後都得“翻譯”成

演算法工程師修仙之路：python3官方文件筆記（一）

本筆記來自於python手冊的中文版第一章開胃菜雖然 Python 易於使用，但它卻是一門完整的程式語言。與 Shell 指令碼或批處理檔案相比，它為編寫大型程式提供了更多的結構和支援。 Python 提供了比 C 更多的錯誤檢查

演算法工程師修仙之路：吳恩達機器學習（十三）

吳恩達機器學習筆記及作業程式碼實現中文版

第十章 支援向量機

優化目標

相關推薦

第十章支援向量機