經典神經網路學習（四）——ResNet

阿新 • • 發佈：2018-12-23

今天看的ResNet網路，主要參考了一下幾篇文章：

ResNet是在2015年ImageNet上大由MSRA何凱明團隊提出的Residual Networks。在ImageNet的classification、detection、localization以及COCO的detection和segmentation上均斬獲了第一名的成績，而且Deep Residual Learning for Image Recognition也獲得了CVPR2016的best paper，實在是實至名歸。

1.ResNet意義

隨著網路的加深，出現了訓練集準確率下降的現象，我們可以確定這不是由於Overfit過擬合造成的(過擬合的情況訓練集應該準確率很高)；所以作者針對這個問題提出了一種全新的網路，叫深度殘差網路，它允許網路儘可能的加深，其中引入了全新的結構如下圖所示：

其中ResNet提出了兩種mapping：一種是identity mapping，指的就是上圖中”彎彎的曲線”，另一種residual mapping，指的就是除了”彎彎的曲線“那部分，所以最後的輸出是 y=F(x)+x （即將原始所需要學的函式H(x)轉換成F(x)+x）
identity mapping顧名思義，就是指本身，也就是公式中的x，而residual mapping指的是“差”，也就是y−x，所以殘差指的就是F(x)部分。

兩種ResNet設計

這兩種結構分別針對ResNet34（左圖）和ResNet50/101/152（右圖），一般稱整個結構為一個”building block“。其中右圖又稱為”bottleneck design”，目的一目瞭然，就是為了降低引數的數目，第一個1x1的卷積把256維channel降到64維，然後在最後通過1x1卷積恢復，整體上用的引數數目：1x1x256x64 + 3x3x64x64 + 1x1x64x256 = 69632，而不使用bottleneck的話就是兩個3x3x256的卷積，引數數目: 3x3x256x256x2 = 1179648，差了16.94倍。
對於常規ResNet，可以用於34層或者更少的網路中，對於Bottleneck Design的ResNet通常用於更深的如101這樣的網路中，目的是減少計算和引數量（實用目的）。

ResNet的基本思想是引入了能夠跳過一層或多層的“shortcut connection”，如上圖所示

我們可以清楚的”實線“和”虛線“兩種連線方式，
實線的的Connection部分(”第一個粉色矩形和第三個粉色矩形“)都是執行3x3x64的卷積，他們的channel個數一致，所以採用計算方式：
y=F(x)+x
虛線的的Connection部分(”第一個綠色矩形和第三個綠色矩形“)分別是3x3x64和3x3x128的卷積操作，他們的channel個數不同(64和128)，所以採用計算方式：
y=F(x)+Wx
其中W是卷積操作，用來調整x的channel維度的；

ResNet的具體結構：

經典神經網路學習（四）——ResNet

今天看的ResNet網路，主要參考了一下幾篇文章： https://blog.csdn.net/wspba/article/details/56019373 https://blog.csdn.net/lanran2/article/details/79057994 http:

對抗神經網路學習（四）——WGAN+爬蟲生成皮卡丘影象(tensorflow實現)

一、背景 WGAN的全稱為Wasserstein GAN, 是Martin Arjovsky等人於17年1月份提出的一個模型，該文章可以參考[1]。WGAN針對GAN存在的問題進行了有針對性的改進，但WGAN幾乎沒有改變GAN的結構，只是改變了啟用函式和loss函式，以及擷取權重，卻得到了非常好

經典神經網路學習（一）——AlexNet

AlexNet網路是AlexNet在2012年ImageNet大賽上一舉奪魁隨後一炮而紅，開啟了深度學習時代的網路。Alexnet一共包含8個層，其中5個卷積層，3個全連線層，用softMAx實現1000類分類。 AlexNet網路結構圖： AlexNet網路結構圖

經典神經網路學習（三）——VGG net

1.簡介 VGGNet由牛津大學的視覺幾何組（Visual Geometry Group）和Google DeepMind公司的研究員共同提出，是ILSVRC-2014中定位任務第一名和分類任務第二名。其突出貢獻在於證明使用很小的卷積（3*3），增加網路深度可以有效提升模型的效果，而且VGGNe

經典神經網路學習（二）——Google net系列

Googe Inception Net首次出現在ILSVRC2014的比賽中(和VGGNet同年)，以較大的優勢獲得冠軍。那一屆的GoogleNet通常被稱為Inception V1，Inception V1的特點是控制了計算量的引數量的同時，獲得了非常好的效能-top5錯誤率6.67%, 這主要歸

迴圈神經網路系列（四）基於LSTM的MNIST手寫體識別

我們知道迴圈神經網路是用來處理包含序列化資料的相關問題，所有若要利用迴圈神經網路來解決某類問題，那麼首先要做的就是將原始資料集序列化，然後處理成某個深度學習框架所接受的資料輸入格式（比如Tensorflow). 1.資料預處理我們知道MNIST資料集中的每張圖片形

神經網路學習（4）————自組織特徵對映神經網路（SOM）以及python實現

一、自組織競爭學習神經網路模型（無監督學習）（一）競爭神經網路在競爭神經網路中，一層是輸入層，一層輸出層，輸出層又稱為競爭層或者核心層。在一次輸入中，權值是隨機給定的，在競爭層每個神經元獲勝的概率相同，但是最後會有一個興奮最強的神經元。興奮最強的神經元戰勝了其他神

神經網路學習（3）————BP神經網路以及python實現

一、BP神經網路結構模型 BP演算法的基本思想是，學習過程由訊號的正向傳播和誤差的反向傳播倆個過程組成，輸入從輸入層輸入，經隱層處理以後，傳向輸出層。如果輸出層的實際輸出和期望輸出不符合

神經網路學習（2）————線性神經網路以及python實現

一、線性神經網路結構模型在結構上與感知器非常相似，只是神經元啟用函式不同，結構如圖所示：若網路中包含多個神經元節點，就可形成多個輸出，這種神經網路可以用一種間接的方式解決線性不可分的問題，方法是用多個線性含糊對區域進行劃分，神經結構和解決異或問題如圖所示： &nbs

深度卷積神經網路學習（一）

卷積神經網路的基礎模組為卷激流包括卷積（用於維數拓展）、非線性（洗屬性、飽和、側抑制）、池化（空間或特徵型別的聚合）和批量歸一化（優化操作，目的是為了加快訓練過程中的收斂速度，同事避免陷入區域性最優）等四種操作。下面簡單介紹這四種操作。 1、卷積：利用卷積核對輸入影象進行處

對抗神經網路學習（十）——attentiveGAN實現影像去雨滴的過程(tensorflow實現)

一、背景 attentiveGAN是Rui Qian等人於17年11月份提出的一種模型。《Attentive Generative Adversarial Network for Raindrop Removal from A Single Image》在generator網路中引入

對抗神經網路學習（九）——CartoonGAN+爬蟲生成《言葉之庭》風格的影像(tensorflow實現)

一、背景 cartoonGAN是Yang Chen等人於2018年2月提出的一種模型。該模型針對漫畫風格影象生成做了進一步研究，提出了新的GAN網路結構和兩種損失函式，相較於之前的漫畫風格生成的GAN模型，cartoonGAN的生成漫畫風格的影象質量有了明顯提高。本實驗通過自己爬取《言葉之

對抗神經網路學習（八）——DeblurGAN實現運動影象的去模糊化(tensorflow實現)

一、背景 DeblurGAN是Orest Kupyn等人於17年11月提出的一種模型。前面學習過，GAN可以儲存影像的細節紋理特徵，比如之前做過的SRGAN可以實現影象的超解析度，因此，作者利用這個特點，結合GAN和多元內容損失來構建DeblurGAN，以實現對運動影象的去模糊化。本試驗的

對抗神經網路學習（七）——SRGAN生成超解析度影像(tensorflow實現)

一、背景 SRGAN(Super-Resolution Generative Adversarial Network)即超解析度GAN，是Christian Ledig等人於16年9月提出的一種對抗神經網路。利用卷積神經網路實現單影像的超解析度，其瓶頸仍在於如何恢復影象的細微紋理資訊。對於GAN

對抗神經網路學習（六）——BEGAN實現不同人臉的生成(tensorflow實現)

一、背景 BEGAN，即邊界平衡GAN（Boundary Equilibrium GAN），是DavidBerthelot等人[1]於2017年03月提出的一種方法。傳統的GAN是利用判別器去評估生成器生成的圖片和真實圖片的資料分佈是否一致，而BEGAN則代替了這種概率估計的方法，作者認為只要分

MATLAB神經網路學習（1）：單層感知器

　　單層感知器由一個線性組合器和一個二值閾值元件組成。　　輸入是一個N維向量 x=[x1,x2,...,xn]，其中每一個分量對應一個權值wi，隱含層輸出疊加為一個標量值：　　　　　　　　　　　　　　　　　　　　　　　　隨後在二值閾值元件中對得到的v值進行判斷，產生二值輸出：　　　

計算機網路學習（四）——鏈路層

鏈路層的主題部分在主機的網路介面卡中實現。提供的服務有：成幀（把網路層資料封裝成鏈路層）、鏈路接入、可靠交付和差錯檢測。 1.差錯檢測奇偶校驗一維奇偶校驗在d個數據位元後附加一個校驗位使得這d+1個位元中1的個數為偶數。二維奇偶校驗把這d個數據分為i行j列，對每行每列

卷積神經網路學習（一）——基本卷積神經網路搭建

#!/usr/bin/env python # -*- coding:utf-8 -*- import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data # numb

Keras學習（四）——CNN卷積神經網路

本文主要介紹使用keras實現CNN對手寫資料集進行分類。示例程式碼： import numpy as np from keras.datasets import mnist from keras.utils import np_utils from keras.models impo

深度學習（四）卷積神經網路入門學習(1)

卷積神經網路入門學(1)作者：hjimce卷積神經網路演算法是n年前就有的演算法，只是近年來因為深度學習相關演算法為多層網路的訓練提供了新方法，然後現在電腦的計算能力已非當年的那種計算水平，同時現在的訓練資料很多，於是神經網路的相關演算法又重新火了起來，因此卷積神經網路就又活