七月演算法深度學習筆記4 -- CNN與常用框架

阿新 • • 發佈：2019-01-08

這套筆記是跟著七月演算法五月深度學習班的學習而記錄的，主要記一下我再學習機器學習的時候一些概念比較模糊的地方，具體課程參考七月演算法官網：

http://www.julyedu.com/

神經網路的結構

神經網路包含輸入層，輸出層，及中間的隱層

神經網路在做說明事情呢？

從邏輯迴歸到神經元--感知機：

X1,X2為輸入，z為一個線性的輸出，當z<0時，函式逐漸趨近0，z>0函式趨近1.於是，得到一個分類器，對應到神經網路中，如右圖。於是，邏輯迴歸被畫成一個非常簡單的感知機，函式a叫做激勵函式。z通過函式a得到的是一個概率。

在網路中加入一個隱層，構成淺層神經網路

對於多個隱層的網路叫做深度神經網路

神經網路為什麼優於其他分類之器

LR或者SVM做的事情，是為了找到分介面，將不同類別分開，如：

這類演算法對特徵的要求很高，要求特徵具有較高的可區分性

但是，如果樣本分佈不規則，即特徵區度底，則傳統學習方法很難給出好的結果

如圖，由如下兩個類別需要分類

神經網路的做法：

找兩組引數，一組能做出上面一條直線，另一組做出下面的直線，如下圖2

將這個and操作作為與或門分類的最後一層，連線這兩層，則可以得到

從神經網路來看，加了一個隱層使得網路能完成上面的樣本可分。

神經網路可以對平面做任何切分：

神經網路不在乎樣本點在空間上如何分佈。網路自己學習特徵。但是如上圖，可能會出現過擬合，後文會提到神經網路會用dorpout控制過擬合。

2. CNN卷積神經網路

CNN與傳統神經網路的關係

1. 依舊保持了層級結構

2. 層的動能和形式發生了變化

DATA : 資料輸入層

CONV:卷積層

RELU:激勵層

POOLING：池化層

FC: 全連線層

2.1 資料輸入層 Input Layer

三種常用的影象資料處理方式

i:去均值：把輸入資料各個維度都中心化到0；

ii: 歸一化：幅度歸一化到同樣的範圍

iii:PCA/白話： PCA降維，白化是對資料每個特徵軸上的幅度歸一化

對於CNN,只對影象做去均值處理

取均值與歸一化

區相關與白化

2.2 卷積計算層/ CONV layer

區域性關聯。每個神經元看做一個filter

視窗(receptive field)滑動,filter對區域性資料計算，

輸入資料是個32*32*3結構，其中圓圈的個數表示該層神經元的個數。在CONV中，神經元就是濾波器。每個濾波器劃過影象得到該層的輸出。

conv由三個重要的引數：

深度/depth：神經元的個數
步長/stride：滑動過程中一次跳過幾個畫素
填充值/zero-padding：在影象外圍加邊（補0）

舉例：

該網站由詳細的關於CNN的介紹。

上圖中，影象有三個通道，濾波器也由3個通道。

CONV作用：

引數共享機制:對同一個神經元（filter）而言，無論劃到哪裡，權值是相同的。即假設每個神經元連線資料窗的權重是固定的

關於引數共享：

固定每個神經元連線權重,可以看做模板，每個神經元只關注一個特性

需要估算的權重個數減少: AlexNet 1億 => 3.5w

一組固定的權重和不同視窗內資料做內積: 卷積

2.3 激勵層（ReLU）

把卷積層輸出結果做非線性對映

激勵函式作用：不是所有的值都需要向後傳播。

不同的激勵函式：

sigmoid:

Sigmoid函式的問題在於，求偏導數的過程中，靠近1或0的位置求導結果為0。使得引數的調整無法進行，收斂很慢。

Tanh:

ReLU

ReLU(The Rectified Linear Unit/修正線性單元)
收斂快,求梯度簡單,較脆弱

若輸出為負，則陷入飽和。

Leaky ReLU

指數線性單元ELU

Maxout

計算是線性的,不會飽和不會掛
多了好些引數
兩條直線拼接

實際經驗

不要用sigmoid
首先試RELU,因為快,但要小心點
如果2失效,請用Leaky ReLU或者Maxout
某些情況下tanh倒是有不錯的結果,但是很少

2.3 池化層 / Pooling layer

夾在連續的卷積層中間
壓縮資料和引數的量,減小過擬合

下采樣過程。

max pooling

Pooling 一般夾在若干卷積層之間，用於壓縮資料量，同時減少過擬合。

2.5 全連線層：FC layer

兩層之間所有神經元都有權重連線
通常全連線層在卷積神經網路尾部

全連線層的計算量非常大。

一般CNN的結構：

INPUT
[[CONV -> RELU]*N -> POOL?]*M
[FC -> RELU]*K
FC

3. CNN的訓練過程：

Loss function非凸

BP演算法利用鏈式求導法則,逐級相乘直到求解出dW和db。

CNN利用SGD/隨機梯度下降,迭代和更新W和b

4. fine-tuning

fine-tuning:使用已用於其他目標,預訓練好模型的權重或者部分權重,作為初始值開始訓練

原因：

自己從頭訓練卷積神經網路容易出現問題
fine-tuning能很快收斂到一個較理想的狀態

做法：

複用相同層的權重,新定義層取隨機權重初始值
調大新定義層的的學習率,調小複用層學習率

參考資料：

七月演算法：http://www.julyedu.com/

圖片來自於課程PPT

七月演算法深度學習筆記4 -- CNN與常用框架

這套筆記是跟著七月演算法五月深度學習班的學習而記錄的，主要記一下我再學習機器學習的時候一些概念比較模糊的地方，具體課程參考七月演算法官網： http://www.julyedu.com/ 神經網路的結構神經網路包含輸入層，輸出層，及中間的隱層神經網路在做說明事情呢？

七月演算法深度學習筆記6--CNN推展案例:影象檢測、NeuralStyle

這套筆記是跟著七月演算法五月深度學習班的學習而記錄的，主要記一下我再學習機器學習的時候一些概念比較模糊的地方，具體課程參考七月演算法官網：影象相關任務 1. 物體的識別和定位對於一張給定的圖片，判定圖片中的物體屬於那個類別對於輸入圖片，輸出物體所在的位置。

深度學習演算法基礎和常用框架 | CNN與常用框架

神經網路與卷積神經網路層級結構資料處理訓練演算法優缺點實際搭建與訓練CNN 典型CNN 訓練與fine-tuning 常用框架與應用常用框架廣泛應用基礎 LR SVM只能做到這種程度，核函式

七月演算法機器學習筆記6 -- 工作流程與模型優化

這套筆記是跟著七月演算法四月機器學習班的學習而記錄的，主要記一下我再學習機器學習的時候一些概念比較模糊的地方，具體課程參考七月演算法官網：http://www.julyedu.com/ 特徵工程總

深度學習筆記4-tensorflow和pytorch

深度學習筆記4-tensorflow和pytorch TensorFlow由谷歌大腦開發，並且在谷歌公司中廣泛地應用於研究和生產需求。PyTorch是Torch框架的表親，Torch是基於lua開發的，在Facebook公司裡被廣泛使用。（1） TensorFlow被許多研究人員和

Google深度學習筆記 TensorFlow實現與優化深度神經網路

全連線神經網路 Linear Model 載入lesson 1中的資料集將Data降維成一維，將label對映為one-hot encoding def reformat(dataset, labels): datas

深度學習筆記(4)：1.1-1.3 邊緣檢測(edge detection)

第四課開始，我們開始學習卷積神經網路。 1.1 計算機視覺(computer vision) 深度學習在計算機視覺方面的應用非常振奮人心，一方面是該應用使許多不可能變成了可能，另一方面是深度學習在計算機視覺方面的應用能夠給深度學習在其他方面的應用帶來一些方法的改進和思考，

深度學習筆記4：卷積層的實現

卷積層的推導卷積層的前向計算如下圖，卷積層的輸入來源於輸入層或者pooling層。每一層的多個卷積核大小相同，在這個網路中，我使用的卷積核均為5*5。如圖輸入為28*28的影象，經過5*5的卷積之後，得到一個(28-5+1)*(28-5+1) = 24*24、的map。卷積層2的每個map是不同卷

深度學習筆記（2）--slim框架

今天我發現一個tensorlfow框架--slim 它包裝了一些基本的tensorflow的操作：比如說卷積： layers=sli.conv2d(self.X,num_outputs=32,k

Hadoop學習筆記4之HDFS常用命令

1.檢視${Hadoop_HOME}/bin/hadoop指令碼的hadoop命令幫助資訊列印可知：hadoop version //檢視版本hadoop fs //檔案系統客戶端hadoop jar //執行jar包hadoop classpat

Python學習筆記：import與常用內建庫

模組 Python模組實質為py檔案，Python在importpy模組時預設會在sys.path所包含的路徑中去尋找，搜尋失敗時會出錯。匯入整個模組假設有一個module.py檔案，程式碼如下： var=1 def func():

40 Oracle深度學習筆記——全庫備份常用

全庫備份常用如下：需要在MOUNT模式下進行， backup database format'E:\rman_bk\df_%t_%s_%p.bak'; 多通道備份如下： RUN { ALLOCATE CHANNEL C1 DEVICE TYPE DISKFORMAT '

CNN與常用框架

1. 神經網路 1.1 神經網路——是什麼？　　神經網路沒有一個嚴格的正式定義。它的基本特點，是試圖模仿大腦的神經元之間傳遞，處理資訊的模式。還是有些抽象，那麼看看下面這張圖。　　　　輸入層和輸出層之間有多個隱層hidden layer，輸入層、輸出層和隱層都有若干個節

資料結構與演算法學習筆記 4 （2018.10.08）

漸進分析：大o記號回到原先的問題：隨著問題規模的增長，計算成本如何增長？注意：這裡更關心足夠大的問題，注重考察成本的增長趨勢漸進分析：在問題的規模足夠大後，計算成本如何成長？ Asymptomatic analysis ：當

深度學習筆記——理論與推導之概念，成本函式與梯度下降演算法初識（一）

前情提要一、神經網路介紹概念：Learning ≈ Looking for a Function 框架（Framework）： What is Deep Learning? 深度學習其實就是一個定義方法、判斷方法優劣、挑選最佳的方法的過程：

深度學習筆記-卷積神經網路CNN與迴圈神經網路RNN有什麼區別？

CNN與RNN本質的不同就是所基於的假設不同，由於核心假設的不同，導致實現方式的差異。 CNN 首先理解什麼叫做卷積，或者說為什麼要翻譯為卷積神經網路。卷積的定義：https://baike.baidu.com/item/%E5%8D%B7%E7%A7%AF/94110

Coursera deeplearning.ai 深度學習筆記1-4-Deep Neural Networks-深度神經網路原理推導與程式碼實現

在掌握了淺層神經網路演算法後，對深度神經網路進行學習。 1. 原理推導 1.1 深度神經網路表示定義：L表示神經網路總層數，上標[l]代表第l層網路，n[l]代表第l層的節點數，a[l]

MySql 基礎學習筆記 1——概述與基本數據類型：整型： 1）TINYINT 2)SMALLINT 3) MEDIUMINT 4)INT 5)BIGINT 主要是大小的差別圖浮點型：命令

where float 函數名 src ron 編碼方式永遠 -m mas 一、CMD中經常使用mysql相關命令 mysql -D, --database=name //打開數據庫 --delimiter=name //指定分隔符 -h, --host=na

深度學習 Deep Learning UFLDL 最新Tutorial 學習筆記 4：Debugging: Gradient Checking

style inline add tom radi posit math size tutorial 1 Gradient Checking 說明前面我們已經實現了Linear Regression和Logistic Regression。關鍵在於代價函數Cost Fun

Spark學習筆記4：數據讀取與保存

讀取數據 chapter byte hadoop tar .lib 文件中 api sequence Spark對很多種文件格式的讀取和保存方式都很簡單。Spark會根據文件擴展名選擇對應的處理方式。 Spark支持的一些常見文件格式如下：　1、文本文件　　　使用文件

七月演算法深度學習筆記4 -- CNN與常用框架

相關推薦