Udacity機器學習筆記——深度學習（2）

感知器

感知器或者神經元是神經網路的基礎單元，它們對輸入的資料進行判斷，比如說輸入一個學生的學業成績和考試成績，然後感知器根據這兩個值來判斷該學生是否被某大學錄取。那麼，感知器是根據什麼規則來對這兩個值進行比較從而得出結論的呢？感知器更加關注學生的學業成績還是考試成績呢？這裡就需要引入權重的概念。
分別引入兩個權重，分別於學業成績和考試成績進行相乘，權重越大，那麼說明對應的成績也就更加重要。一開始，這兩個權重是隨機的，那麼感知器訓練通過學習，基於上一次的分類結果的誤差不斷地調整權重，從而獲知什麼樣的成績會被大學所錄取。用數學符號表示就是：
$w_{grades} \cdot x_{grades} + w_{test} \cdot x_{test}$
如果由m個輸入，相應地得到下面的式子：
$\sum_{i=1}^{m} w_{i} \cdot x_{i}$
最後，上面的相加式子變成一個輸出結果，通過將該式子作為一個啟用函式的輸入而得到。一個最簡單的啟用函式就是Heaviside step function，階躍函式：
$f(h) = \begin{cases} 0& \quad \text {if $h<0$}, \\ 1& \quad \text {if $h \ge 0$}. \end {cases}$
將上面介紹的相加式子帶入該函式，並且引入偏差，可以得到感知器的公式：
$f(x_{1}, x_{2}, ..., x_{m}) = \begin{cases} 0& \quad \text {if $b+\sum w_{i} \cdot x_{i} < 0$}, \\ 1& \quad \text {if $b+\sum w_{i} \cdot x_{i} \ge 0$}. \end {cases}$
根據感知器的公式，我們可以推斷出一組適合AND神經元的權重和偏差。例如，當兩個輸入值都為1時，可以設定 $w_{1}$ 和 $w_{2}$ 分別為 1，設定 $b$ 為-2，那麼僅當兩個輸入值都為1的情況，才可以得到 $b+\sum w_{i} \cdot x_{i} \ge 0$ 的結果，此時式子等於0。

import pandas as pd


weight1 = 1.5
weight2 = 1.0
bias = -2.0

test_inputs = [(0,0), (0,1), (1,0), (1,1)]
correct_outputs = [False, False, False, True]
outputs = []

for test_input, correct_output in zip(test_inputs, correct_outputs):
    linear_combination = weight1*test_input[0] + weight2*test_input[1]+bias
    output = int(linear_combination >= 0)
    is_correct_string = 'Yes' if output == correct_output else 'No'
    outputs.append([test_input[0], test_input[1], linear_combination, output, is_correct_string])

num_wrong = len([output[4] for output in outputs if output[4] == 'No'])
output_frame = pd.DataFrame(outputs, columns=['Input 1', 'Input 2', 'Linear Combination', 'Activation Output', 'Is Correct'])
if not num_wrong:
    print('Nice! You got it all correct. \n')
else:
    print('You got {} wrong. Keep trying! \n'.format(num_wrong))
print(output_frame.to_string(index=False))

通過修改weight1和weight2，以及bias的值，還有correct_outputs的值，可以相應地得到OR和NOT，以及XOR神經元。

梯度下降

梯度下降是幫助尋找到最小化成本函式的權重和偏重的方法。定義成本函式為：
$C(w,b) \equiv \frac{1} {2n} \sum_{x} \| y(x)-a \|^{2}$
假設 $v=(w,b)$
$\Delta C \approx \nabla C \cdot \Delta v$
$\Delta v = - \eta \nabla C$
$\eta$ 稱之為學習率，是個小的正數。
從而可以得到：
$v \rightarrow v'= v - \eta \nabla C$
展開可以得到：
$w_{k} \rightarrow w'_{k} = w_{k} - \eta \frac {\partial{C}} {\partial w_{k}}$
$b_{l} \rightarrow b'_{l} = b_{l} - \eta \frac {\partial{C}} {\partial b _{l}}$

Udacity機器學習筆記——深度學習（2）

Udacity機器學習筆記——深度學習（2）

感知器

梯度下降

《C語言深度剖析》學習筆記----記憶體管理（2）

Python機器學習筆記：SVM（2）——SVM核函式

此文獻給正打算入門大資料的朋友：大資料學習筆記1000條（2）

splash3.2學習筆記——HTTP API（2）

JavaWeb學習筆記之XML（2）

前端學習筆記Vue篇（2）

Udacity機器學習筆記——深度學習（2）

Udacity機器學習筆記——深度學習（1）

20180813視頻筆記深度學習基礎上篇（1）之必備基礎知識點深度學習基礎上篇（2）神經網絡模型視頻筆記：深度學習基礎上篇（3）神經網絡案例實戰和深度學習基礎下篇

《機器學習實戰》筆記第二章（2）

深度學習模型相關知識（2）

吳恩達老師機器學習筆記異常檢測（一）

機器學習筆記—svm演算法（上）

splash3.2學習筆記——HTTP API（1）

深度學習cs231n之knn學習的一些記錄（2）

深度學習之PyTorch實戰（2）——神經網路模型搭建和引數優化

吳恩達老師機器學習筆記異常檢測（二）

機器學習筆記之SVM（SVR）演算法

深度學習筆記——深度學習框架TensorFlow（二）

深度學習筆記——深度學習框架TensorFlow之DNN深度神經網路的實現（十四）