深層CNN的調參經驗 | A practical theory for designing very deep convolutional neural networks

阿新 • • 發佈：2018-11-10

A practical theory for designing very deep convolutional neural networks

兩個前提假設：

1.對於每一個卷積層，其學習更復雜表示的能力應該被保證
2.最高層的感受野應該不大於影象範圍

Why deep?

更深：只增加了線性複雜度，但是模型的學習效果卻提升了很多

模型結構

Alt text

1.feature level：怎樣加入更深的網路

本質上為帶限制的優化問題

兩個限制：

1.每一層的c-value不應該過小（c-value表示的是學習複雜pattern的能力）
2.最高層的感受野應該不大於影象範圍

2.classifier level

common做法：
兩層全連線加上每層dropout

效果更好：
將input feature map降取樣至small size(5*5至 8*8)，然後使用兩層5*5的卷積層，最後max pooling加上dropout

3.第一個限制：capacity of learning

3.1 卷積層的作用：

composing more complex patterns from input patterns

Alt text
（a）中生成pattern AB
（b）中卷積層不能很好的學習到pattern AB和他們的關係
解決：
+ 1.使用更大的卷積層
+ 2.通過stride=2降取樣來降低響應距離

3.2 沒有降取樣的CNN，當層數變深時學習效率變低的原因：

隨著層數加深，pattern size其實在逐漸增大，有意義的空間關係也在增大，當大部分input patterns的空間關係大於卷積層的filter size，卷積層就無法學到新的複雜patterns

3.3 Measure

Alt text

3.第二個限制：necessity of learning

增加的layers是為了學習新的patterns，當感受野到達input的邊界時，無法學習到新的patterns，同時層數的加深會引起過擬合，導致效果變差。

深層CNN的調參經驗 | A practical theory for designing very deep convolutional neural networks

A practical theory for designing very deep convolutional neural networks 兩個前提假設： 1.對於每一個卷積層，其學習更復雜表示的能力應該被保證 2.最高層的感受野應該不大於影象範圍

A Beginner's Guide To Understanding Convolutional Neural Networks Part One 筆記

不同 there level cto all guid line feature 函數原文鏈接：https://adeshpande3.github.io/adeshpande3.github.io/A-Beginner‘s-Guide-To-Understanding-

神經網路CNN訓練心得--調參經驗

1.樣本要隨機化，防止大資料淹沒小資料2.樣本要做歸一化。關於歸一化的好處請參考：為何需要歸一化處理3.啟用函式要視樣本輸入選擇(多層神經網路一般使用relu)4.mini batch很重要，幾百是比較

深度神經網路-keras-調參經驗

keras搬磚系列-調參經驗 1，觀察loss勝於觀察準確率，loss設計要比較合理，對比訓練集和驗證集的loss 2，relu可以很好的防止梯度彌散的問題，當然最後一層啟用函式儘量別用relu，如果分類則用softmax 3，BatchNorm 可以大大加快訓練速度和模型的

深度學習訓練的小技巧，調參經驗。總結與記錄。

經常會被問到你用深度學習訓練模型時怎麼樣改善你的結果呢？然後每次都懵逼了，一是自己懂的不多，二是實驗的不多，三是記性不行忘記了。所以寫這篇部落格，記錄下別人以及自己的一些經驗。 Ilya Sutskever（Hinton的學生）講述了有關深度學習的見解及實用建議：獲取

Forex Algorithmic Trading: A Practical Tale for Engineers

As you may know, the Foreign Exchange (Forex, or FX) market is used for trading between currency pairs. But you might not be aware that it's the most liqui

A new theory for phantom limb pain points the way to more effective treatment

Phantom limb pain is a poorly understood phenomenon, in which people who have lost a limb can experience severe pain, seemingly located in that missing pa

A Practical Model for Subsurface Light Transport 中文翻譯

A Practical Model for Subsurface Light Transport 一個次表面光傳輸的實用模型 Henrik Wann Jensen Stephen R. Marschner Marc Levoy Pat Hanrahan 斯坦福大學注：這裡

《The Design of a Practical System for Fault-Tolerant Virtual Machines》論文研讀

# VM-FT 論文研讀 **說明**：本文為論文 **《The Design of a Practical System for Fault-Tolerant Virtual Machines》** 的個人理解，難免有理解不到位之處，歡迎交流與指正。 **論文地址**：[VM-FT 論文](https

A Sensitivity Analysis of Convolutional Neural Networks for Sentence Classification

引言 Ye Zhang在2016年掛在arXiv上的論文，從名字大概可以看出來，這是一篇CNN調參指南。概述模型方面用的是單層CNN，主要是CNN用做文字分類方面的研究，模型結構如下所示：上述模型來自Convolutional Neural Networks for

MSCNN論文解讀-A Unified Multi-scale Deep Convolutional Neural Network for Fast Object Detection

多尺度深度卷積神經網路進行快速目標檢測：兩階段目標檢測器，與faster-rcnn相似，分為an object proposal network and an accurate detection network. 文章主要解決的是目標大小不一致的問題，尤其是對小目標的檢測，通過多

吳恩達Coursera深度學習課程 course4-week1 Convolutional Neural Networks & CNN Application 作業

Paper Review: fpgaConvNet--A Framework for Mapping Convolutional Neural Networks on FPGAs

注：本文中所有的圖片均擷取自原文作者的論文和講稿。基本資訊題目：fpgaConvNet：一個將CNN對映到FPGA上的平臺作者：Stylianos I. Venieris， Christos-Savvas Bouganis 機構：Imperial College Londo

A Simple Framework for Designing Choices

Software is usually designed as a choose-your-own-adventure affair. To complete tasks, users move through an application by making a series of choices base

Convolutional Neural Networks for Beginners: Practical Guide with Python and Keras

Convolutional Neural Networks for Beginners: Practical Guide with Python and KerasAt this point, we are ready to deal with another type of neural networks,

吳恩達深度學習程式設計作業（4-1）- Convolutional Neural Networks & CNN Application

吳恩達Coursera課程 DeepLearning.ai 程式設計作業系列，本文為《卷積神經網路》部分的第一週“卷積神經網路基礎”的課程作業。 Part 1：Convolutional Neural Networks: Step by St

卷積神經網路：Convolutional Neural Networks(CNN)

卷積神經網路是一種多層神經網路，擅長處理影象特別是大影象的相關機器學習問題。卷積網路通過一系列方法，成功將資料量龐大的影象識別問題不斷降維，最終使其能夠被訓練。CNN最早由Yann LeCun提出並應用在手寫字型識別上（MINST）。LeCun提出的網路稱為LeNet，其網路結構如下：這是一個最典

CNN網路二值化--XNOR-Net： ImageNet Classification Using Binary Convolutional Neural Networks

XNOR-Net: ImageNet Classification Using Binary Convolutional Neural Networks 本文主要是簡化CNN網路，使得CNN網路能夠在CPU實時跑起來，但是會犧牲一些精度。本文提出了兩個不同

基於pytorch的CNN、LSTM神經網絡模型調參小結

shu 結合手動 ces hid open ont 16px nbsp （Demo）這是最近兩個月來的一個小總結，實現的demo已經上傳github，裏面包含了CNN、LSTM、BiLSTM、GRU以及CNN與LSTM、BiLSTM的結合還有多層多通道CNN、LSTM

[調參]CV煉丹技巧/經驗

轉自：https://www.zhihu.com/question/25097993 我和@楊軍類似, 也是半路出家. 現在的工作內容主要就是使用CNN做CV任務. 幹調參這種活也有兩年時間了. 我的回答可能更多的還是側重工業應用, 技術上只限制在CNN這塊. 先說下我的觀點, 調參就是tria

深層CNN的調參經驗 | A practical theory for designing very deep convolutional neural networks

A practical theory for designing very deep convolutional neural networks

兩個前提假設：

Why deep?

模型結構

1.feature level：怎樣加入更深的網路

兩個限制：

2.classifier level

3.第一個限制：capacity of learning

3.1 卷積層的作用：

3.2 沒有降取樣的CNN，當層數變深時學習效率變低的原因：

3.3 Measure

3.第二個限制：necessity of learning

相關推薦