CNN影象分類-經典網路摘要

阿新 • • 發佈：2018-12-31

一、LeNet-5-------1998年

由LeCun在1998年提出，用於手寫數字分類

（1）提出了權重共享、特徵圖的概念

（2）啟用函式：雙曲正切

（3）網路權重初始化：均勻分佈

（4）訓練：BP+SGD

二、AlexNet------2012年

（1）使用ReLU啟用函式，減小梯度消失、防止過擬合，並加快了訓練速度

（2）資料增強：對影象進行裁剪、翻轉、變換等操作

（3）將SGD改為了動量SGD

（4）添加了dropout機制

三、ZF-Net------2013年

主要貢獻：ZF-Net其實就是在AlexNet的基礎上進行了微調，但它的貢獻是將CNN訓練的過程進行了視覺化（反捲積），使得其解釋性大大增強，這個思想後來在語義分割上得到了發揚光大。

四、VGG-----2014年

VGG經典的有VGG16和VGG19，圖中標紅。VGG的拓展性很強，遷移到其他圖片資料集上泛化性也很好，現在也經常用或者改

主要創新：卷積全部採用3X3的小卷積核（因為研究發現兩個3x3的卷積感受野大小等價於一個5x5的，三個等價於一個7x7的，所以完全可以用小的卷積核代替大的，這樣大大減少了引數），感受野而定計算可以參考我的另一篇部落格：https://blog.csdn.net/wodemimashi125/article/details/81562982

五、GoogleNet----2014

神經網路發展到現在已經取得了很大的成功，改進的思路就集中在增大網路的規模（深度、寬度），但單純的這樣做導致了兩個問題：一是容易過擬合，二是計算量大大的增加。針對這個問題，GoogleNet引入了Inception模組。

GoogleNet結構

Inception模組有幾種演進，Inception V1借鑑了NIN網路1x1卷積的思想，採用多個不同大小卷積核並行的方法，並在前面加1x1卷積減少輸入特徵圖的個數。Inception V2則進一步將5x5的卷積核用兩個3x3的替代，降低網路引數。Inception V3再進一步將nxn的卷積核分解為1xn和nx1這種非對稱結構，其實是把二維卷積改成了兩個一維卷積。

六、ResNet-----2015

隨著CNN結構的不斷加深，網路越來越難以訓練，出現了退化現象（網路加深，訓練集的效能反而變差，這不是過擬合）。這個時候ResNet出現了。主要創新是殘差模組的思想。

不斷的堆疊殘差模組，形成了類似下面的結構

ResNet34層網路示例

利用殘差思想，使得我們能夠訓練超深的網路。後面幾年CNN就沒有出現大的革新了。

CNN影象分類-經典網路摘要

一、LeNet-5-------1998年由LeCun在1998年提出，用於手寫數字分類（1）提出了權重共享、特徵圖的概念（2）啟用函式：雙曲正切（3）網路權重初始化：均勻分佈（4）訓練：BP+SGD 二、AlexNet------2

「Deep Learning」ILSVRC2012-2017影象分類經典卷積網路

分道揚鑣說的是牛津大學VGG設計的網路和谷歌設計的網路在表徵能力的增強上採用不同的思路。殊途同歸說的是兩者的分類效能差不多，前者是亞軍，後者是冠軍。VGGNet-16和-19是基於網路加深會增強表徵能力的思路，如圖6。可是，在訓練上帶來了不少麻煩，比如需要先訓練淺網路和再逐漸加深，如果要end2end

keras+CNN影象分類

我們的深度學習資料集包括1,191張口袋妖怪影象，（存在於口袋妖怪世界中的動物般的生物，流行的電視節目，視訊遊戲和交易卡系列）。我們的目標是使用Keras和深度學習訓練卷積神經網路，以識別和分類這些神奇寶貝。我們將認識到的口袋妖怪包括： Bulbasaur（234影象） Charma

詳解tensorflow訓練自己的資料集實現CNN影象分類

利用卷積神經網路訓練影象資料分為以下幾個步驟1.讀取圖片檔案2.產生用於訓練的批次3.定義訓練的模型（包括初始化引數，卷積、池化層等引數、網路）4.訓練1 讀取圖片檔案def get_files(filename): class_train = [] label_trai

TensorFlow小試牛刀(1):CNN影象分類

深度學習不能只是一味的看paper，看原始碼，必須要親自動手寫程式碼。最近好好學了下TensorFlow，順便自己寫了一個簡單的CNN來實現影象分類，也遇到了不少問題，但都一一解決，也算是收穫滿滿。重在實現，不在結果。首先我使用的資料集是CIFAR-10

CNN影象分類中類別數量確定

影象分類中最終將影象分為多少類，一般是由CNN結構中最後一個全連線層（FC）神經元個數確定，即要將影象分為多少類最後一個全連線層就為多大，例如VGG、ResNet等，與最後的softmax無關。 Le

基於深度卷積神經網路的高光譜遙感影象分類---PCA+2D-CNN(偽空譜特徵)

論文地址基於深度卷積神經網路的高光譜遙感影象分類西華大學學報同時利用高光譜影象的光譜資訊和空間資訊的深度卷積神經網路分類模型。基於深度學習到的深度特徵，用邏輯迴歸分類器進行分類訓練。高光譜影象面臨的挑戰

CNN經典網路學習（我也很無奈因為要改網路結構）

ResNet50：深度學習——殘差神經網路ResNet在分別在Keras和tensorflow框架下的應用案例 ღ( ´･ᴗ･` )比心 https://blog.csdn.net/ghw15221836342/article/details/79801627 使用Keras

生成對抗網路（GAN）應用於影象分類

　　近年來，深度學習技術被廣泛應用於各類資料處理任務中，比如影象、語音和文字。而生成對抗網路（GAN）和強化學習（RL）已經成為了深度學習框架中的兩顆“明珠”。強化學習主要用於決策問題，主要的應用就是遊戲，比如deepmind團隊的AlphaGo。因為我的研究方向是影象的有監督分類問題，

實戰keras——用CNN實現cifar10影象分類

原文：https://blog.csdn.net/zzulp/article/details/76358694 import keras from keras.datasets import cifar10 from keras.models import Sequenti

神經網路學習引入-影象分類的基本概述

1. Motivation動機儘管影象分類聽起來很簡單，但是它在現實中有大量的應用場景。許多明顯是計算機視覺的任務都可以被簡化成影象分類問題。 2.挑戰圖片分類問題主要存在的挑戰有：多視角問題(viewpoint variation)：同一個物體的不同角度看到的圖片大小

影象分類網路模組化,深度化,輕量化

Residual Network在深度網路變得越來越深的情況下，研究員發現的第一個問題就是退化現象，網路越深，對計算資源的要求就越高，並且當深度達到一定程度後，增加網路層數不但沒有準確性上的提升，反而出現了退化。解決或降低退化現象的第一款神器就是ResNet。ResNet引入了殘差網路結構(Residual

影象分類之：經典機器學習 Battle 深度學習

本文寫於2018.08.31，生日前夕。前段時間，有個朋友和我提到，自己最近正打算用機器來判別圖片中的場景是古鎮還是園林，所以我這一期特地寫了一篇文章，來描述影象的分類演算法。由於最近工作略忙，所以文章斷斷續續寫了好久，終於在自己生日前夕完成，希望可以有所幫助，這樣我就

深度學習 --- CNN的變體在影象分類、影象檢測、目標跟蹤、語義分割和例項分割的簡介（附論文連結）

以上就是卷積神經網路的最基礎的知識了，下面我們一起來看看CNN都是用在何處並且如何使用，以及使用原理，本人還沒深入研究他們，等把基礎知識總結完以後開始深入研究這幾個方面，然後整理在寫成部落格，最近的安排是後面把自然語言處理總結一下，強化學習的總結就先往後推一下。再往後是系統的學習一下演算法和資料

TensorFlow CNN對CIFAR10影象分類2

下載python version import os os.environ['TF_CPP_MIN_LOG_LEVEL']='2' import tensorflow as tf import numpy as np def unpickle(file):

機器學習之BP神經網路演算法實現影象分類

BP 演算法是一個迭代演算法，它的基本思想為：(1) 先計算每一層的狀態和啟用值，直到最後一層（即訊號是前向傳播的）；(2) 計算每一層的誤差，誤差的計算過程是從最後一層向前推進的（這就是反向傳播演算法名字的由來）；(3) 更新引數（目標是誤差變小），迭代前面兩

keras CNN對CIFAR10影象分類

from keras.datasets import cifar10 from keras.utils import np_utils from keras.models import Sequential from keras.layers import Conv2D, D

cs231n 卷積神經網路與計算機視覺 1 基礎梳理與KNN影象分類

本導論主要介紹了影象分類問題及資料驅動方法。影象分類問題 image classification 影象的分類問題簡單來說就是對選擇一個給定label的過程。如下圖：此圖片為248×400畫素的圖片，對電腦來說他是一個248 x 400 x 3的3維陣列，其中的

利用Tensorflow構建CNN影象多分類模型及影象引數、資料維度變化情況例項分析

本文以CIFAR-10為資料集，基於Tensorflow介紹了CNN(卷積神經網路)影象分類模型的構建過程，著重分析了在建模過程中卷積層、池化層、扁平化層、全連線層、輸出層的運算機理，以及經過運算後圖像尺寸、資料維度等引數的變化情況。 CIFAR-10資料

簡單影象分類與識別CNN,Tensorflow,Cifar10(吳恩達Deep Learning)

簡介因最近在學習深度學習，看了網易雲課堂吳恩達的深度學習工程師和李巨集毅的機器學習的課程，對卷積神經網路還是不是很理解。自己在網上搜教程，深度學習的入門程式《MNIST手寫數字識別》,照著寫了一遍跑了一遍。於是在網上下載了cifar資料集, 隨便搭建了一個卷