cs231n斯坦福基於卷積神經網路的CV學習筆記（二）神經網路訓練細節

阿新 • • 發佈：2018-12-14

五，神經網路

注意點part1

例項：邏輯迴歸二層神經網路訓練函式
使用權重w和偏差值biase計算出第一個隱含層h，然後計算損失，評分，進行反向傳播回去
多種常用啟用函式（一般預設max（0，x）），如sigmoid函式具有飽和區梯度0，非零點中心，計算x複雜等缺點，max(Relu)函式也有缺點（非中心對稱，初始化不佳（如-10）無法啟用，注意學習速率不要太高），leaky Relu優化max（0.01x，x），其中0.01為α修正引數可調，maxout集合Lrelu，Relu的優點，只是引數變多了。
少量資料可用L-BFGS優化，資料量大的一般用不到
神經網路的深度（層數，資料越複雜越多越好，簡單則不需要太多）和寬度

（各層神經元數）

注意點part2

資料預處理可用PCA,SVD等方法 . 權重初始化，待深入，很重要，如Batch Nomalization
神經網路隱藏層（hidden layer）
訓練資料要過飽和Overfit
超引數調整學習速率，正則化引數（以及差量），更新方式
Track the ratio of weight updates / weight magnitudes:

訓練神經網路的四個步驟（樣本（標準化，初始化權重等），向前傳播（得到損失），向後傳播（得到每個權重的梯度），用梯度更新【梯度下降】引數（w等））

訓練神經網路的四個步驟

– 啟用函式提供了更多的非線性的資料儲存（處理）方式。

在這裡插入圖片描述

下面所講在這裡插入圖片描述

– 1，其他引數更新方法，針對SGD更新較慢（y軸快水平慢，波動式前進）,但一般還是預設用SGD

1,moumentum更新，收斂更快（mu為超引數，v為速度（可初始化為0））好
2 nestero momentum (Nag)好好 3，adaGrad update（一般在凸問題中用，回停止學習-0）針對不同方向的梯度調整快慢（補償）–通過分母（梯度平方），大慢小快 3.2改進版（不會停止學習） 1e-7是平滑因子，只是未來防止它變0 4，另一種 5，Adam更新（結合MOMENTEUM和RMSprop-like）很好，可以經常採用

在這裡插入圖片描述 beta是超引數0.9，0.995

1.2，優化學習速率（超引數，可用衰減函式控制（一階函式））

在這裡插入圖片描述

其他優化方法

在這裡插入圖片描述二階函式，求出梯度（碗的曲率），知道怎麼走就不需要學習速率更新就知道怎麼到達最低點了，收斂（但hessian矩陣太大求逆計算量巨大，而基本不採用）再優化（資料集不大時可用）一般也不用

總結：一般都用Adam來優化

在這裡插入圖片描述

隨機失活dropput（regularization），簡單但是效果機器號

在這裡插入圖片描述好方法，可以防止過擬合等 P=0.5

梯度檢查gradient checking

自學

卷積神經網路

詳解見下一章

cs231n斯坦福基於卷積神經網路的CV學習筆記（二）神經網路訓練細節

五，神經網路注意點part1 例項：邏輯迴歸二層神經網路訓練函式使用權重w和偏差值biase計算出第一個隱含層h，然後計算損失，評分，進行反向傳播回去多種常用啟用函式（一般預設max（0，x）），如sigmoid函式具有飽和區梯度0，非零點中心，計算x複

NetWork Science網路科學學習筆記（三）隨機網路

本次筆記內容為Network Science Book的第三章節：隨機網路相關的內容這次的第二張圖片有部分公式在轉jpg的時候丟掉了減號，不知道是什麼原因，因為目前要加數學公式，要添截圖直接用Ma

計算機網路-網路層學習筆記（二）

地址解析協議ARP 主要作用：已知IP的情況下，找到硬體地址。 RARP：知道硬體地址找IP。現已包含在DHCP中。 IP地址32位；硬體地址48位。地址解析協議ARP在ARP快取記憶體中存放一個從IP地址到硬體地址的對映表。並時常動態更新。以銜接IP地址與硬體地址。每個主機都有

Kubernetes學習筆記（二）：網路原理

Kubernetes網路模型 Kubernetes網路模型設計的一個基礎原則是：每個Pod都擁有一個獨立的IP地址，而且假定所有Pod都在一個可以直接連通的、扁平的網路空間中。所以不管它們是否執行在同一個Node（宿主機）中，都要求它們可以直接通過對方的

利用tensorflow實現簡單的卷積神經網路——遷移學習小記（二）

一、什麼是神經網路（CNN）卷積神經網路（Convolutional Neural Network，簡稱CNN），是一種前饋神經網路，人工神經元可以影響周圍單元，可以進行大型影象處理。卷積神經網路包括卷積層和池化層。卷積神經網路是受到生物思考方式的啟發的MLPs（多

斯坦福cs231n學習筆記（11）------神經網路訓練細節（梯度下降演算法大總結/SGD/Momentum/AdaGrad/RMSProp/Adam/牛頓法）

神經網路訓練細節系列筆記：通過學習，我們知道，因為訓練神經網路有個過程: <1>Sample 獲得一批資料； <2>Forward 通過計算圖前向傳播，獲得loss； <3>Backprop 反向傳播計算梯度，這

斯坦福cs231n學習筆記（8）------神經網路訓練細節（資料預處理、權重初始化）

神經網路訓練細節系列筆記：這一篇，我們將繼續介紹神經網路訓練細節。一、Data Preprocessing（資料預處理）如圖是原始資料，資料矩陣X有三種常見的資料預處理形式，其中我們假定X的大小為[N×D]（N是資料的數量，D是它們的維數

深度學習筆記（四）——神經網路和深度學習（淺層神經網路）

1.神經網路概覽神經網路的結構與邏輯迴歸類似，只是神經網路的層數比邏輯迴歸多一層，多出來的中間那層稱為隱藏層或中間層。從計算上來說，神經網路的正向傳播和反向傳播過程只是比邏輯迴歸多了一次重複的計算。正向傳播過程分成兩層，第一層是輸入層到隱藏層，用上標[1]來表示；第二層是隱藏層到輸出層，用上標

神經網路系列學習筆記（一）

ANN tutorial: http://adventuresinmachinelearning.com/neural-networks-tutorial/ https://www.cs.toronto.edu/~jlucas/teaching/csc411/lectures/tut5_handout.p

吳恩達深度學習筆記（3）-神經網路如何實現監督學習？

神經網路的監督學習(Supervised Learning with Neural Networks) 關於神經網路也有很多的種類，考慮到它們的使用效果，有些使用起來恰到好處，但事實表明，到目前幾乎所有由神經網路創造的經濟價值，本質上都離不開一種叫做監督學習的機器學習類別，讓我們舉例看看。

【Python】搭建你的第一個簡單的神經網路_準備篇_NN&DL學習筆記（二）

前言本文為《Neural Network and Deep Learning》學習筆記（二），可以轉載但請標明原文地址。本人剛剛入門、筆記簡陋不足、多有謬誤，而原書精妙易懂、不長篇幅常有柳暗花明之處，故推薦閱讀原書。《Neural Network and Deep Learning

機器學習筆記（六）神經網路引入及多分類問題實踐

一、神經網路引入我們將從計算機視覺直觀的問題入手，提出引入非線性分類器的必要性。首先，我們希望計算機能夠識別圖片中的車。顯然，這個問題對於計算機來說是很困難的，因為它只能看到畫素點的數值。應用機器學習，我們需要做的就是提供大量帶標籤的圖片作為訓練集，有的圖片是一輛車，有的圖片不是一輛車，最終我們

Tensorflow 學習筆記（二）: 深層神經網路

Tensorflow 學習筆記（二）: 深層神經網路前言本文是閱讀《TensorFlow：實戰Google深度學習框架》第四章提煉出來的筆記。同時我在github找到這本書作者提供的配套原始碼，發現和書相比多了一些例子（code），推薦結合書一起使用！深度學習與深層神

吳恩達機器學習筆記（5）—— 神經網路

本教程將教大家如何快速簡單的搭起一個自己的部落格，並不會系統的教會你如何建站，但是可以讓掌握建站的基礎對以後web學習有一定的幫助。購買一個域名域名就相當於地址，我們就是通過域名來訪問我們的網站，現在萬網和騰訊雲都有廉價域名賣，首年大概1-5元一年吧。

機器學習（西瓜書）學習筆記（四）---------神經網路

1. 神經元模型神經網路/人工神經網路：由具有適應性的簡單單元組成的廣泛並行互連的網路。神經網路學習：機器學習和神經網路兩個學科交叉的部分。 Neural Networks中的基本單元：神經元。從電腦科學的角度，NN就是一個包含了大量引數的數學模型，該模型由若干個函式相互代入而

機器學習筆記（七）神經網路

神經網路神經網路神經元模型感知機與多層網路多層前饋神經網路（multi-layer feedforward neural networks）誤差逆傳播（error BackPropagation

UFLDL 教程學習筆記（一）神經網路

UFLDL（Unsupervised Feature Learning and Deep Learning）Tutorial 是由 Stanford 大學的 Andrew Ng 教授及其團隊

scikit-leran學習筆記（3）---神經網路模型（有監督的）

1.Multi-layer Perceptron 多層感知機 MLP是一個監督學習演算法，圖1是帶一個隱藏層的MLP模型左邊層是輸入層，由神經元集合{xi|x1,x2,…,xm},代表輸入特徵，隱藏層的每個神經元將前一層的的值通過線性加權求

周志華《Machine Learning》學習筆記（6）--神經網路

上篇主要討論了決策樹演算法。首先從決策樹的基本概念出發，引出決策樹基於樹形結構進行決策，進一步介紹了構造決策樹的遞迴流程以及其遞迴終止條件，在遞迴的過程中，劃分屬性的選擇起到了關鍵作用，因此緊接著討論了三種評估屬性劃分效果的經典演算法，介紹了剪枝策略來解決原生決

Deep Learning 學習筆記（二）：神經網路Python實現

多層神經網路的Python實現。程式碼先貼上，程式設計的東西不解釋。程式碼中出現的SupervisedLearningModel、NNLayer和SoftmaxRegression，請參考上一篇筆記：Deep Learning 學習筆記（一）——softmax

cs231n斯坦福基於卷積神經網路的CV學習筆記（二）神經網路訓練細節

五，神經網路

訓練神經網路的四個步驟（樣本（標準化，初始化權重等），向前傳播（得到損失），向後傳播（得到每個權重的梯度），用梯度更新【梯度下降】引數（w等））

– 啟用函式提供了更多的非線性的資料儲存（處理）方式。

– 1，其他引數更新方法，針對SGD更新較慢（y軸快水平慢，波動式前進）,但一般還是預設用SGD

1.2，優化學習速率（超引數，可用衰減函式控制（一階函式））

其他優化方法

總結：一般都用Adam來優化

隨機失活dropput（regularization），簡單但是效果機器號

梯度檢查gradient checking

卷積神經網路

相關推薦