演算法工程師修仙之路：吳恩達機器學習（七）

阿新 • • 發佈：2018-12-08

吳恩達機器學習筆記及作業程式碼實現中文版

第六章神經網路學習

非線性假設

無論是線性迴歸還是邏輯迴歸都有這樣一個缺點：當特徵太多時，計算的負荷會非常大。
使用非線性的多項式項，能夠幫助我們建立更好的分類模型。假設我們有非常多的特徵，例如大於 100 個變數，我們希望用這 100 個特徵來構建一個非線性的多項式模型，結果將是數量非常驚人的特徵組合，即便我們只採用兩兩特徵的組合( $x_{1}$

x 2 + x 1 x 3

+ x 1 x 4 + .

. . + x 2 x 3 + x 2 x 4 + . . . + x 9 9 x 1 00 x_1x_2 +x_1x_3 + x_1x_4+. . . +x_2x_3 + x_2x_4+. . . +x_99x_100 $x_{1} x_{2} + x_{1} x_{3} + x_{1} x_{4} + . . . + x_{2} x_{3} + x_{2} x_{4} + . . . + x_{9} 9 x_{1} 00$ )，我們也會有接近 5000 個組合而成的特徵。這對於一般的邏輯迴歸來說需要計算的特徵太多了。
假設我們希望訓練一個模型來識別視覺物件（例如識別一張圖片上是否是一輛汽車），一種方法是我們利用很多汽車的圖片和很多非汽車的圖片，然後利用這些圖片上一個個畫素的值（飽和度或亮度）來作為特徵。
假如我們只選用灰度圖片，每個畫素則只有一個值（而非 RGB 值），我們可以選取圖片上的兩個不同位置上的兩個畫素，然後訓練一個邏輯迴歸演算法利用這兩個畫素的值來判斷圖片上是否是汽車：
假使我們採用的都是 50x50 畫素的小圖片，並且我們將所有的畫素視為特徵，則會有2500 個特徵，如果我們要進一步將兩兩特徵組合構成一個多項式模型，則會有約 $2500^2/2$ 個（接近 3 百萬個）特徵。普通的邏輯迴歸模型，不能有效地處理這麼多的特徵，這時候我們需要神經網路。

模型展示

神經網路模型建立在很多神經元之上，每一個神經元又是一個個學習模型。這些神經元（也叫啟用單元，activation unit）採納一些特徵作為輸出，並且根據本身的模型提供一個輸出。
在神經網路中，引數又可被成為權重（ weight）。
我們設計出了類似於神經元的神經網路，效果如下：
- 其中 $x_1, x_2, x_3$ 是輸入單元（ input units），我們將原始資料輸入給它們。
- $a_1, a_2, a_3$ 是中間單元，它們負責將資料進行處理，然後呈遞到下一層。
- 最後是輸出單元，它負責計算 $ℎ_\theta(x)$ 。
神經網路模型是許多邏輯單元按照不同層級組織起來的網路，每一層的輸出變數都是下一層的輸入變數。
下圖為一個 3 層的神經網路，第一層稱為輸入層（ Input Layer），最後一層稱為輸出層（ Output Layer），中間一層稱為隱藏層（ Hidden Layers）。我們為每一層都增加一個偏差單位（ bias unit）：
- $a_i^{(j)}$ 代表第 $j$ 層的第 $i$ 個啟用單元。 $\theta^{(j)}$ 代表從第 $j$ 層對映到第 $j+1$ 層時的權重的矩陣，例如 $\theta^{(1)}$ 代表從第一層對映到第二層的權重的矩陣。其尺寸為：以第 $j+1$ 層的啟用單元數量為行數，以第 $j$ 層的啟用單元數加一為列數的矩陣。例如：下圖所示的神經網路中 $\theta^{(1)}$ 的尺寸為 3*4。
- 對於上圖所示的模型，啟用單元和輸出分別表達為：
  - $a_1^{(2)}=g(\theta_{10}^{(1)}x_0+\theta_{11}^{(1)}x_1+\theta_{12}^{(1)}x_2+\theta_{13}^{(1)}x_3)$ ；
  - $a_2^{(2)}=g(\theta_{20}^{(1)}x_0+\theta_{21}^{(1)}x_1+\theta_{22}^{(1)}x_2+\theta_{23}^{(1)}x_3)$ ；
  - $a_3^{(2)}=g(\theta_{30}^{(1)}x_0+\theta_{31}^{(1)}x_1+\theta_{32}^{(1)}x_2+\theta_{33}^{(1)}x_3)$

演算法工程師修仙之路：吳恩達機器學習（七）

吳恩達機器學習筆記及作業程式碼實現中文版第六章神經網路學習非線性假設無論是線性迴歸還是邏輯迴歸都有這樣一個缺點：當特徵太多時，計算的負荷會非常大。使用非線性的多項式項，能夠幫助我們建立更好的分類模型。假設我們有非常多的特徵，例如大於 100 個

演算法工程師修仙之路：吳恩達機器學習（九）

吳恩達機器學習筆記及作業程式碼實現中文版神經網路引數的反向傳播演算法代價函式假設神經網路的訓練樣本有 m

演算法工程師修仙之路：吳恩達機器學習（八）

吳恩達機器學習筆記及作業程式碼實現中文版第六章神經網路學習特徵和直觀理解從本質上講，神經網路能夠通過學習得出其自身的一系列特徵。神經網路中，單層神經元（無中間層）的計算可用來表示邏輯運算，比如邏輯與(AND)、邏輯或(OR)。邏輯

演算法工程師修仙之路：吳恩達機器學習（六）

吳恩達機器學習筆記及作業程式碼實現中文版第五章正則化過擬合問題線性迴歸和邏輯迴歸能夠有效地解決許多問題，但是當將它們應用到某些特定的機器學習應用時，會遇到過擬合(over-fitting)的問題，可能會導致它們效果很差。正則化(regulari

演算法工程師修仙之路：吳恩達機器學習（五）

吳恩達機器學習筆記及作業程式碼實現中文版第四章 Logistic迴歸簡化代價函式與梯度下降邏輯迴歸的代價函式： C

演算法工程師修仙之路：吳恩達機器學習（四）

吳恩達機器學習筆記及作業程式碼實現中文版第四章 Logistic迴歸分類在分類問題中，要預測的變數y是離散的值，邏輯迴歸 (Logistic Regression) 演算法是目前最流行使用最廣泛的一種學習演算法。在分類問題中，我們嘗試預測的是結果

演算法工程師修仙之路：吳恩達機器學習（三）

吳恩達機器學習筆記及作業程式碼實現中文版第三章多變數線性迴歸多維特徵現在我們對房價模型增加更多的特徵，例如房間數樓層等，構成一個含有多個變數的模型，模型中的特徵為

演算法工程師修仙之路：吳恩達機器學習（二）

吳恩達機器學習筆記及作業程式碼實現中文版第二章單變數線性迴歸模型描述我們使用一個監督學習演算法的例子：預測住房價格。我們要使用一個數據集，資料集包含俄勒岡州波特蘭市的住房價格。在這裡，我要根據不同房屋尺寸所售出的價格，畫出我的資

演算法工程師修仙之路：吳恩達機器學習（一）

吳恩達機器學習筆記及作業程式碼實現中文版第一章緒論：初識機器學習什麼是機器學習 Machine Learning(機器學習)是研究計算機怎樣模擬或實現人類的學習行為，以獲取新的知識或技能，重新組織已有的知識結構使之不斷改善自身的效能。機器學習被用

演算法工程師修仙之路：吳恩達機器學習（十三）

吳恩達機器學習筆記及作業程式碼實現中文版第十章支援向量機優化目標在監督學習中，許多學習演算法的效能都非常類似，因此，重要的不是你該選擇使用學習演算法 A 還是學習演算法 B，而更重要的是，所建立的大量資料在應用這些演算法時，表現情況通常依賴於你的水平。比如你

演算法工程師修仙之路：吳恩達機器學習（十）

吳恩達機器學習筆記及作業程式碼實現中文版第七章神經網路引數的反向傳播演算法理解反向傳播為了更好地理解反向傳播演算法，我們再來仔細研究一下前向傳播的原理：反向傳播演算法做的是：梯度檢測當我們對一個較為複雜

演算法工程師修仙之路：吳恩達機器學習（十五）

吳恩達機器學習筆記及作業程式碼實現中文版第十章支援向量機大間隔分類器的數學原理假設我有兩個二維向量 u

演算法工程師修仙之路：吳恩達機器學習（十四）

吳恩達機器學習筆記及作業程式碼實現中文版第十章支援向量機直觀上對大間隔的理解人們有時將支援向量機看作是大間距分類器。支援向量機模型的代價函式，在左邊這裡我畫出了關於 z 的代價函式

演算法工程師修仙之路：吳恩達機器學習（十二）

吳恩達機器學習筆記及作業程式碼實現中文版第九章機器學習系統設計確定執行的優先順序以一個垃圾郵件分類器演算法為例進行討論。為了解決這樣一個問題，我們首先要做的決定是如何選擇並表達特徵向量

演算法工程師修仙之路：吳恩達機器學習（十一）

吳恩達機器學習筆記及作業程式碼實現中文版第八章應用機器學習的建議決定下一步做什麼獲得更多的訓練例項——通常是有效的，但代價較大，下面的方法也可能有效，可考慮先採用下面的幾種方法：嘗試減少特徵的數量；嘗試獲得更多的特徵

演算法工程師修仙之路：吳恩達機器學習作業（一）

吳恩達機器學習筆記及作業程式碼實現中文版第一個程式設計作業：單變數線性迴歸（python程式碼實現）一元線性迴歸問題描述在本練習的這一部分中，您將使用只有單變數的線性迴歸方法預測餐車的利潤。假設你是一家連鎖餐廳的執行長，正在

演算法工程師修仙之路：python3官方文件筆記（三）

本筆記來自於python手冊的中文版 Python 簡介 Python 中的註釋以 # 字元起始，直至實際的行尾。註釋可以從行首開始，也可以在空白或程式碼之後，但是不出現在字串中。文字字串中的 # 字元僅僅表示 # 。程式碼中的註釋

演算法工程師修仙之路：python3官方文件筆記（二）

本筆記來自於python手冊的中文版使用 Python 直譯器呼叫 Python 直譯器通常你可以在主視窗輸入一個檔案結束符（Unix系統是Control-D，Windows系統是Control-Z）讓直譯器以 0 狀態碼退出。如果那沒有作用，你可以通過輸入

演算法工程師修仙之路：python3廖雪峰教程筆記（一）

此筆記摘錄於廖雪峰先生的教程，感謝廖先生的無私分享，特此致敬！ python簡介 Python是一種什麼語言？用任何程式語言來開發程式，都是為了讓計算機幹活，而計算機幹活的CPU只認識機器指令，所以，儘管不同的程式語言差異極大，最後都得“翻譯”成

演算法工程師修仙之路：python3官方文件筆記（一）

本筆記來自於python手冊的中文版第一章開胃菜雖然 Python 易於使用，但它卻是一門完整的程式語言。與 Shell 指令碼或批處理檔案相比，它為編寫大型程式提供了更多的結構和支援。 Python 提供了比 C 更多的錯誤檢查

演算法工程師修仙之路：吳恩達機器學習（七）

吳恩達機器學習筆記及作業程式碼實現中文版

第六章 神經網路學習

非線性假設

模型展示

相關推薦

第六章神經網路學習