Google---機器學習速成課程(十二)- 神經網路簡介 (Introduction to Neural Networks)

阿新 • • 發佈：2019-01-03

神經網路簡介 (Introduction to Neural Networks)

神經網路是更復雜版本的特徵組合。實質上，神經網路會學習適合您的相應特徵組合。

學習目標

對神經網路有一定的瞭解，尤其是瞭解以下方面：

隱藏層
啟用函式

-------------------------------------------------------

特徵組合這一單元的話，就會發現以下分類問題屬於非線性問題：

直角座標曲線圖。傳統的 x 軸用“x1”標記。傳統的 y 軸用“x2”標記。藍點佔據西北和東南象限；黃點佔據西南和東北象限。

圖 1. 非線性分類問題。

“非線性”意味著您無法使用形式為

的模型準確預測標籤。也就是說，“決策面”不是直線。之前，我們瞭解了對非線性問題進行建模的一種可行方法 - 特徵組合。

現在，請考慮以下資料集：

資料集包含許多橙點和藍點。很難確定一個連貫的圖案，但橙點依稀呈螺旋狀，而藍點可能會呈不同的螺旋狀。

圖 2. 更難的非線性分類問題。

圖 2 所示的資料集問題無法用線性模型解決。為了瞭解神經網路可以如何幫助解決非線性問題，我們首先用圖表呈現一個線性模型：

為了瞭解神經網路可以如何幫助解決非線性問題，我們首先用圖表呈現一個線性模型：

輸入輸出

圖 3. 用圖表呈現的線性模型。

每個藍色圓圈均表示一個輸入特徵，綠色圓圈表示各個輸入的加權和。

要提高此模型處理非線性問題的能力，我們可以如何更改它

隱藏層

在下圖所示的模型中，我們添加了一個表示中間值的“隱藏層”。隱藏層中的每個黃色節點均是藍色輸入節點值的加權和。輸出是黃色節點的加權和。

圖 4. 兩層模型的圖表。

此模型是線性的嗎？是的，其輸出仍是其輸入的線性組合。

在下圖所示的模型中，我們又添加了一個表示加權和的“隱藏層”。

圖 5. 三層模型的圖表。

此模型仍是線性的嗎？是的，沒錯。當將輸出表示為輸入的函式並進行簡化時，只是獲得輸入的另一個加權和而已。該加權和無法對圖 2 中的非線性問題進行有效建模。

啟用函式

要對非線性問題進行建模，我們可以直接引入非線性函式。我們可以用非線性函式將每個隱藏層節點像管道一樣連線起來。

在下圖所示的模型中，在隱藏層 1 中的各個節點的值傳遞到下一層進行加權求和之前，我們採用一個非線性函式對其進行了轉換。這種非線性函式稱為啟用函式。

圖 6. 包含啟用函式的三層模型的圖表。

現在，我們已經添加了啟用函式，如果新增層，將會產生更多影響。通過在非線性上堆疊非線性，我們能夠對輸入和預測輸出之間極其複雜的關係進行建模。簡而言之，每一層均可通過原始輸入有效學習更復雜、更高級別的函式。如果您想更直觀地瞭解這一過程的工作原理，請參閱

Chris Olah 的精彩博文。

常見啟用函式

以下 S 型啟用函式將加權和轉換為介於 0 和 1 之間的值。

曲線圖如下：

圖 7. S 型啟用函式。

相較於 S 型函式等平滑函式，以下修正線性單元啟用函式（簡稱為 ReLU）的效果通常要好一點，同時還非常易於計算。

ReLU 的優勢在於它基於實證發現（可能由 ReLU 驅動），擁有更實用的響應範圍。S 型函式的響應性在兩端相對較快地減少。

圖 8. ReLU 啟用函式。

實際上，所有數學函式均可作為啟用函式。假設表示我們的啟用函式（ReLU、S 型函式等等）。因此，網路中節點的值由以下公式指定：

TensorFlow 為各種啟用函式提供開箱即用型支援。但是，我們仍建議從 ReLU 著手。

總結

現在，我們的模型擁有了人們通常所說的“神經網路”的所有標準組件：

一組節點，類似於神經元，位於層中。
一組權重，表示每個神經網路層與其下方的層之間的關係。下方的層可能是另一個神經網路層，也可能是其他型別的層。
一組偏差，每個節點一個偏差。
一個啟用函式，對層中每個節點的輸出進行轉換。不同的層可能擁有不同的啟用函式。

警告：神經網路不一定始終比特徵組合好，但它確實可以提供適用於很多情形的靈活替代方案。

-------------------------------------------------------

以上整理轉載在谷歌出品的機器學習速成課程點選開啟連結侵刪！

Google---機器學習速成課程(十二)- 神經網路簡介 (Introduction to Neural Networks)

神經網路簡介 (Introduction to Neural Networks)神經網路是更復雜版本的特徵組合。實質上，神經網路會學習適合您的相應特徵組合。學習目標對神經網路有一定的瞭解，尤其是瞭解以下方面：隱藏層啟用函式---------------------------

Google---機器學習速成課程(七)- 特徵組合 (Feature Crosses)

特徵組合 (Feature Crosses)特徵組合是指兩個或多個特徵相乘形成的合成特徵。特徵的相乘組合可以提供超出這些特徵單獨能夠提供的預測能力。學習目標瞭解特徵組合。在 TensorFlow 中實施特徵組合。--------------------------------

MLCC筆記 - Google機器學習速成課程 - 筆記匯總

cati ner 基礎知識使用 live -i 正則化復雜 soft MLCC筆記 - Google機器學習速成課程 https://www.cnblogs.com/anliven/p/6107783.html MLCC簡介前提條件和準備工作完成課程的下一步 M

機器學習演算法篇--卷積神經網路基礎（Convolutional Neural Network）

假設輸入影象為如圖中右側的 5 × 5 矩陣，其對應的卷積核為一個 3 × 3 的矩陣。同時，假定卷積操作時每做一次卷積，卷積核移動一個畫素位置，即卷積步長為1。第一次卷積操作從影象 (0, 0) 畫素開始，由卷積核中引數與對應位置影象像素逐位相乘後累加作為一次卷積操作結果，即 1×1+2×0+3×1

機器學習筆記（十二）：TensorFlow實戰四（影象識別與卷積神經網路）

1 - 卷積神經網路常用結構 1.1 - 卷積層我們先來介紹卷積層的結構以及其前向傳播的演算法。一個卷積層模組，包含以下幾個子模組：使用0擴充邊界(padding) 卷積視窗過濾器（filter）前向卷積反向卷積（可選） 1.1

Google官方機器學習速成課程

TOC 前提條件和準備工作在開始機器學習速成課程之前，請先閱讀下面的前提條件和準備工作部分，以確保您已做好完成所有單元所需的準備工作。前提條件機器學習速成課程並不會假定或要求您預先掌握機器學習方面的任何知識。但是，為了能夠理解課程中介紹的概念並完成練習，您最好滿足以下前

機器學習筆記（十二）：TensorFlow實現四（影象識別與卷積神經網路）

1 - 卷積神經網路常用結構 1.1 - 卷積層我們先來介紹卷積層的結構以及其前向傳播的演算法。一個卷積層模組，包含以下幾個子模組：使用0擴充邊界(padding) 卷積視窗過濾器（filter）前向卷積反向卷積（可選） 1.1.2 - 邊界填充

AI - Google的機器學習速成課程

Google的機器學習速成課程機器學習速成課程（MLCC，machine-learning crash-course）：https://developers.google.com/machine-learning/crash-course/ 機器學習術語表：https://developers.

谷歌機器學習速成課程---降低損失 (Reducing Loss)：隨機梯度下降法

計算機器 OS 隨機梯度下降法術語表表示機器學習放心使用在梯度下降法中，批量指的是用於在單次叠代中計算梯度的樣本總數。到目前為止，我們一直假定批量是指整個數據集。就 Google 的規模而言，數據集通常包含數十億甚至數千億個樣本。此外，Google 數據集通常

機器學習速成筆記（二）：訓練與損失

訓練模型通過有標籤樣本來學習（確定）所有的權重和偏差的理想值。損失是對槽糕預測的懲罰，損失是一個數值，模型的預測完全正確，則損失為零，反之，模型的預測越槽糕，損失越大。平方損失：一種常見的損失函式，線性迴歸模型就是使用該平方損失均方誤差：每個樣本的平均平方損失，計算均方誤差，要算出

機器學習（三十二）——t-SNE, Adaboost

t-SNE（續） SNE 在介紹t-SNE之前，我們首先介紹一下SNE（Stochastic Neighbor Embedding）的原理。假設我們有資料集X，它共有N個數據點。每一個數據點xixi的維度為D，我們希望降低為d維。在一般用於視覺化的條

機器學習筆記（十二）：聚類

目錄 1）Unsupervised learning introduction 2）K-means algorithm 3）Optimization objective 4）Random initialization 5）Choosing the number of clus

機器學習實戰（十二）降維（PCA、SVD）

目錄 0. 前言學習完機器學習實戰的降維，簡單的做個筆記。文中部分描述屬於個人消化後的理解，僅供參考。本篇綜合了先前的文章，如有不理解，可參考：如果這篇文章對你有一點小小的幫助，請給個關注喔~我會非常開心的~ 0

機器學習筆記之十二——SVM原理及推導

svm（support vector machine）是一種二分類演算法，它的目標在於尋找一個能將兩種點分離的直線或平面或超平面。如圖（來自wiki）：圖中的紅線將兩邊資料點分開，這條線就是分割直線，同樣的，在三維座標軸中，將兩邊資料點分開的平面，稱為分割平面；更高維的空間座標軸，

【機器學習PAI實踐十二】機器學習演算法基於信用卡消費記錄做信用評分

背景如果你是做網際網路金融的，那麼一定聽說過評分卡。評分卡是信用風險評估領域常用的建模方法，評分卡並不簡單對應於某一種機器學習演算法，而是一種通用的建模框架，將原始資料通過分箱後進行特徵工程變換，繼而應用於線性模型進行建模的一種方法。評分卡建模理論常

吳恩達機器學習筆記（十二）-支援向量機

第十三章支援向量機（SVM）優化目標支援向量機在學習複雜的非線性方程時能夠提供一種更為清晰個更加強大的方式。先回顧一下邏輯迴歸的相關概念，看如何進行改動可以得到支援向量機。邏輯迴歸的假設函式為

機器學習筆記（十二）——馬爾科夫模型

馬爾科夫模型是一種概率圖模型，它描述了一類重要的隨機過程(隨機過程又稱為隨機函式，是隨時間而隨機變化的過程)。我們常常需要考察一個隨機變數序列，這些隨機變數序列並不是相互獨立的，每個隨機變數的值都依賴於這個序列前邊的狀態。如果一個系統有N個有

機器學習筆記（參考吳恩達機器學習視訊筆記）08_神經網路的學習

8 神經網路的學習 8.1 神經網路的代價函式神經網路的訓練樣本有m個，每個包含一組輸入x和一組輸出訊號y，L表示神經網路層數，表示每層的neuron個數（表示輸出層神經元個數），代表最後一層中處理單元的個數。將神經網路的分類定義為兩種情況：二類分類和多類分類。二類分類：=

機器學習筆記（參考吳恩達機器學習視訊筆記）07_神經網路介紹

7 神經網路介紹當特徵太多時，無論是線性迴歸還是邏輯迴歸模型計算的負荷會非常大。這時需要神經網路。神經網路是一種很古老的演算法，它最初產生的目的是製造能模擬大腦的機器。神經網路是計算量有些偏大的演算法。然而大概由於近些年計算機的執行速度變快，才足以真正執行起大規模的神經網路。類似於神

機器學習與深度學習系列連載：第二部分深度學習（十三）迴圈神經網路 1（Recurre Neural Network 基本概念）

迴圈神經網路 1（Recurre Neural Network 基本概念）迴圈神經網路的特點： • RNNs 在每個時間點連線引數值，引數只有一份 • 神經網路出了輸入以外，還會建立在以前的“記憶”的基礎上 • 記憶體的要求與輸入的規模有關當然，他的深度不只有一層：

Google---機器學習速成課程(十二)- 神經網路簡介 (Introduction to Neural Networks)

神經網路簡介 (Introduction to Neural Networks)

啟用函式

常見啟用函式

總結

相關推薦