機器學習第4周

阿新 • • 發佈：2018-11-16

神經網路

背景-非線性假設的缺陷
神經元和大腦
模型展示1
模型展示2
直觀例子1
直觀例子2
多元分類

背景-非線性假設的缺陷

特徵量增加過快
非線性處理擁有多個特徵的資料集是非常棘手的，如果將輸入特徵變為二次，如：將 $x_{1} 、$

x 2 、 x 3 x_1、x_2、x_3

$x_{1} 、 x_{2} 、 x_{3}$ 變為 $x_1^2、x_2^2、x_3^2、x_1x_2、x_1x_3、x_2x_3$ ，特徵種類從三個變為六個。
具體的，如果將n個輸入特徵變為二次，則特徵種類有 $C_n^2$ （ $n(n+1)/2$ ），特徵種類數量的增長估計為 $o(n^2/2)$ 。
實際處理問題複雜
如果處理一幅50*50畫素的照片，將有2500個輸入特徵，如果將輸入特徵變為二次，則有約三百萬個輸入特徵，特徵的增長量非常大，因此很容易造成過擬合、計算效率低等問題？
神經網路的出現提供了對於輸入特徵過多的另一種解決方法。

神經元和大腦

神經網路對我們自己的大腦如何工作的模仿是有限的，但是由於計算機硬體的進步，關於神經網路的研究熱情最近有了較大的回升。

有證據表明大腦只使用一種“學習演算法”來實現其所有不同的功能。科學家們已經嘗試切割（在動物大腦中）耳朵和聽覺皮層之間的連線，並將視神經與聽覺皮層重新連線，發現聽覺皮層確實學會了去“看”。

這個原則被稱為“神經可塑性”，並有許多例子和實驗證據。神經網路演算法正是源於這一原則，構建一個自主學習世間萬物的演算法。

模型展示1

以一個神經元為計算單元的話，將輸入（樹突）作為電輸入（尖峰）進行處理，再將處理後的電輸入引導至輸出（軸突）。
在我們的模型中，樹突相當於輸入特徵 $x_1、\dots、x_n$ ，軸突相當於輸出特徵（假設函式的計算結果）。
$x_0$ （對應 $\theta_0$ ）作為額外的偏置單元，取值為1。
神經網路中同樣採用邏輯函式（S型函式）進行假設。
機器學習中的模型引數 $\theta$ 在神經網路中被稱為“權重”。
簡單展示如下：
$\begin{bmatrix}x_0 \\ x_1 \\ x_2 \end{bmatrix} \rightarrow \begin{bmatrix}\ \ \end{bmatrix} \rightarrow h_\theta(x)$
輸入節點（第1層）進入另一個節點（第2層）時，以假設函式為輸出。
第1層和第2層分別稱為輸入層和輸出層，它們之間的中間層可稱為隱藏層，第2層若為隱藏層，其中的節點 $a_0^2、\dots、a_0^n$ ，也被稱為激勵單元。具體展示如下：
$\begin{bmatrix}x_0 \\x_1 \\x_2 \\x_3\end{bmatrix} \rightarrow \begin{bmatrix}a_1^{(2)} \\a_2^{(2)} \\a_3^{(2)} \\\end{bmatrix} \rightarrow h_\theta(x)$

-激勵單元由以下式子獲得：
$a_1^{(2)} = g(\Theta_{10}^{(1)}x_0 + \Theta_{11}^{(1)}x_1 + \Theta_{12}^{(1)}x_2 + \Theta_{13}^{(1)}x_3) \\ a_2^{(2)} = g(\Theta_{20}^{(1)}x_0 + \Theta_{21}^{(1)}x_1 + \Theta_{22}^{(1)}x_2 + \Theta_{23}^{(1)}x_3) \\ a_3^{(2)} = g(\Theta_{30}^{(1)}x_0 + \Theta_{31}^{(1)}x_1 + \Theta_{32}^{(1)}x_2 + \Theta_{33}^{(1)}x_3) \\ h_\Theta(x) = a_1^{(3)} = g(\Theta_{10}^{(2)}a_0^{(2)} + \Theta_{11}^{(2)}a_1^{(2)} + \Theta_{12}^{(2)}a_2^{(2)} + \Theta_{13}^{(2)}a_3^{(2)})$

機器學習第4周

神經網路

背景-非線性假設的缺陷

神經元和大腦

模型展示1

機器學習第4周

吳恩達機器學習第5周Neural Networks（Cost Function and Backpropagation）

機器學習第5周

Coursera-吳恩達-機器學習-第九周-程式設計作業-Anomaly Detection and Recommender Systems

Coursera-吳恩達-機器學習-第九周-測驗-Recommender Systems

Coursera 機器學習第9周作業2

吳恩達神經網路和深度學習第4周程式設計作業

機器學習第九周（二）--構建異常檢測系統

機器學習第2周程式設計作業

機器學習第5周！

機器學習第4篇：資料預處理（sklearn 插補缺失值）

《機器學習》（周誌華）第4章決策樹筆記理論及實現——“西瓜樹”

（二）《機器學習》（周誌華）第4章決策樹筆記理論及實現——“西瓜樹”——CART決策樹

201621123030《Java程序設計》第4周學習總結

第4周學習總結

20165105 《Java程序設計》第4周學習總結

20165323 第4周學習總結

學號 2017-2018-20172309 《程序設計與數據結構》第4周學習總結

20172301 2017-2018-2 《程序設計與數據結構》第4周學習總結

20172319 2018.03.27-04.05 《Java程序設計》第4周學習總結

機器學習第4周

神經網路

背景-非線性假設的缺陷

神經元和大腦

模型展示1

相關推薦