影象語義分割(1)-FCN:用於語義分割的全卷積神經網路

阿新 • • 發佈：2019-01-14

論文地址：Fully Convolutional Networks for Semantic Segmentation
[Long J , Shelhamer E , Darrell T . Fully Convolutional Networks for Semantic Segmentation[J]. IEEE Transactions on Pattern Analysis & Machine Intelligence, 2014, 39(4):640-651.]
論文實現：github程式碼

1. 創新

接收任意尺寸輸入的全卷積網路
使用反捲積的上取樣
融合深層粗糙特徵和淺層精細特徵的跳躍結構

2.模型提出

為什麼可以將CNN轉化為FCN？
全連線層可以看作卷積層，其中，feature map 1x1，向量長度為通道數。
為什麼需要上取樣？
端到端的密集預測需要輸入和輸出的尺寸一致，而提取特徵圖的過程中影象畫素降低，感受野變大，輸出尺寸與輸入不一致。
為什麼需要跳躍結構進行跨層特徵融合？
深層的特徵對應全域性的語義資訊，淺層的特徵對應著目標的位置資訊，語義分割二者都需要考慮，所以引入了跳躍結構。

3.模型架構

3.1 調整分類網路至全卷積以進行稠密預測

將全連線層替換為卷積層，如圖：
在這裡插入圖片描述

3.2 使用反捲積的上取樣

為了還原影象的尺寸，文章中提出了三種方法，即稀疏濾波(Shift-and-stitch)、雙線性插值、和反捲積， 並採用了反捲積的方法。反捲積是與卷積操作相反的計算，比如下圖是普通的卷積，4x4 Input、3x3 KernelSize、0 pad、1 stride：
在這裡插入圖片描述
反捲積將卷積還原：2x2 Input、3x3 KernelSize、0 pad、1 stride，如圖：

在TensorFlow框架中，反捲積過程如下：

3.3 跨層結構(skip architecture)

首先貼上論文中的結構圖：
在這裡插入圖片描述
首先是基礎的五步操作：

Input $\rightarrow$ n convs + 1 max Pooling $\rightarrow$ poo1:: $\frac{1}{2}$ Input
pool1 $\rightarrow$ n convs + 1 max Pooling $\rightarrow$ poo2:: $\frac{1}{4}$ Input
pool2 $\rightarrow$ n convs + 1 max Pooling $\rightarrow$ poo3:: $\frac{1}{8}$ Input
pool3 $\rightarrow$ n convs + 1 max Pooling $\rightarrow$ poo4:: $\frac{1}{16}$ Input
pool4 $\rightarrow$ n convs + 1 max Pooling $\rightarrow$ poo5:: $\frac{1}{32}$ Input
應用跳躍結構得到三種不同的模型：
直接對 pool5 進行 32x 上取樣後，將得到的特徵圖扔給Softmax分類器，得到密集預測結果 $\rightarrow$ FCN-32s
對 pool5 進行 2x 上取樣得到與 pool4 尺寸一樣的上取樣特徵，並於 pool4 逐點相加得到特徵圖，對此特徵圖進行 16x 上取樣，將得到的特徵圖扔給Softmax分類器，得到密集預測結果 $\rightarrow$ FCN-16s
對 pool5 進行 2x 上取樣得到與 pool4 尺寸一樣的上取樣特徵，對此特徵進行 2x 上取樣得到與 pool3 尺寸一樣的上取樣特徵，並於 pool3 逐點相加得到特徵圖，對此特徵圖進行 8x 上取樣，將得到的特徵圖扔給Softmax分類器，得到密集預測結果 $\rightarrow$ FCN-8s

4. 訓練

4.1 StageWise Training

將經典分類網路初始化，棄用全連線層為卷積層
從特徵小圖 16x16x4096 預測分割小圖 16x16x21，之後上取樣為大圖。反捲積步長為32
融合pool4，反捲積步長16
融合pool3，反捲積步長8，得到效果最好的FCN-8s

4.2 其他細節

使用資料增強方式對最終結果影響不大(需要思考一波為什麼和這種效果與GAN的聯絡)；增加有效標註數量提升了最終的效能
引數：20 mini batch；固定學習率；動量 0.9；weight decay
微調：對整個網路進行微調對效能的提升不大，因為直接微調後幾層就會達到前者70%左右的效能
沒有類別平衡策略

影象語義分割(1)-FCN:用於語義分割的全卷積神經網路

論文地址：Fully Convolutional Networks for Semantic Segmentation [Long J , Shelhamer E , Darrell T . Fully Convolutional Networks for Semantic Segmen

使用全卷積神經網路FCN，進行影象語義分割詳解(附程式碼實現)

一.導論在影象語義分割領域，困擾了電腦科學家很多年的一個問題則是我們如何才能將我們感興趣的物件和不感興趣的物件分別分割開來呢？比如我們有一隻小貓的圖片，怎樣才能夠通過計算機自己對影象進行識別達到將小貓和圖片當中的背景互相分割開來的效果呢？如下圖所示：而在2015年

10分鐘看懂全卷積神經網路（ FCN ）：語義分割深度模型先驅

大家好，我是為人造的智慧操碎了心的智慧禪師。今天是10月24日，既是程式設計師節，也是程式設計師

全卷積神經網路影象分割(U-net)-keras實現

最近在研究全卷積神經網路在影象分割方面的應用，因為自己是做醫學影象處理方面的工作，所以就把一個基於FCN（全卷積神經網路）的神經網路用 keras 實現了，並且用了一個醫學影象的資料集進行了影象分割。全卷積神經網路大名鼎鼎的FCN就不多做介紹了，這裡有一篇很好的博文 http://www.c

深度學習1——深度學習（四）卷積神經網路入門學習(1)

卷積神經網路入門學(1) 轉載自：hjimce的專欄 - 部落格頻道 - CSDN.NET 原文地址：http://blog.csdn.NET/hjimce/article/details/47323463 作者：hjimce 卷積

深度學習筆記（基礎）——（六）全卷積神經網路（FCN）

通常CNN在卷積層之後會接上若干個全連線層，將卷積層產生的特徵圖（Feature Map）對映成一個固定長度的特徵向量進行分類。以AlexNet為代表的經典CNN結構適合於影象級的分類和迴歸任務，因為它們最後都期望得到整個輸入影象的一個數值描述，如AlexN

全卷積神經網路FCN-TensorFlow程式碼精析

這裡解析所有程式碼並加入詳細註釋注意事項：FCN.py# coding=utf-8 from __future__ import print_function import tensorflow as tf import numpy as np import Tensor

【學習筆記1】吳恩達_卷積神經網路_第一週卷積神經網路（1）

一、卷積神經網路 1.邊緣檢測不同的語言中表示卷積的函式不同，在Python中為在tensorflow裡為濾波器：垂直、水平邊緣檢測。 Sobel filter:其優點在於增加了中間一行元素的權重，即影象中間的畫素點提高，會使結果的魯棒（robust）性提高。

FCN（全卷積神經網路）

原文連結： http://mp.weixin.qq.com/s?__biz=MzI1NTE4NTUwOQ==&mid=2650324665&idx=1&sn=3022e7e75a4bad0acdde36fe3edf565e&scene=5&a

全卷積神經網路FCN詳解(附帶Tensorflow詳解程式碼實現)

基於卷積神經網路特徵圖的二值影象分割

目標檢測是當前大火的一個研究方向，FasterRCNN、Yolov3等一系列結構也都在多目標檢測的各種應用場景或者競賽中取得了很不錯的成績。但是想象一下，假設我們需要通過影象檢測某個產品上是否存在缺陷，或者通過衛星圖判斷某片海域是否有某公司的船隻

全卷機神經網路影象分割(U-net)-keras實現

全卷積神經網路醫學影象分割框架醫學影象分割主要有兩種框架，一個是基於CNN的，另一個就是基於FCN的。基於CNN 的框架這個想法也很簡單，就是對影象的每一個畫素點進行分類，在每一個畫素點上取一個patch，當做一幅影象，輸入神經網路進行訓練，舉個例子：

卷積神經網路應用之影象分割

FNC FNC主要做的是基於畫素的影象分割預測。其做法是先按照傳統的CNN結構得到feature map，將傳統的全連線層替換成相應的卷積層。如最後一層特徵圖尺寸為5∗5∗5125∗5∗512，對應的全連線層的尺寸為4096，則需要5∗5∗512∗40

cs231n 卷積神經網路與計算機視覺 1 基礎梳理與KNN影象分類

本導論主要介紹了影象分類問題及資料驅動方法。影象分類問題 image classification 影象的分類問題簡單來說就是對選擇一個給定label的過程。如下圖：此圖片為248×400畫素的圖片，對電腦來說他是一個248 x 400 x 3的3維陣列，其中的

卷積神經網路CNN（1）——影象卷積與反捲積（後卷積，轉置卷積）

1.前言傳統的CNN網路只能給出影象的LABLE，但是在很多情況下需要對識別的物體進行分割實現end to end，然後FCN出現了，給物體分割提供了一個非常重要的解決思路，其核心就是卷積與反捲積，所以這裡就詳細解釋卷積與反捲積。對於1維的卷積，公式（離散

卷積神經網路的基礎知識及應用——識別、檢測、分割

本文轉載自 http://blog.csdn.net/myarrow/article/details/51878004；源作者:MyArrow 1. 基本概念 1）CNN：Convolutional Neural Networks 2）FC：Fully Connected

TensorFlow實現用於影象分類的卷積神經網路（程式碼詳細註釋）

這裡我們採用cifar10作為我們的實驗資料庫。首先下載TensorFlow Models庫，以便使用其中提供的CIFAR-10資料的類。 git clone https://github.com/tensorflow/models.git cd mo

cs231n 卷積神經網路與計算機視覺 1 基礎梳理與KNN影象分類

本導論主要介紹了影象分類問題及資料驅動方法。影象分類問題 image classification 影象的分類問題簡單來說就是對選擇一個給定label的過程。如下圖：此圖片為248×400畫素的圖片，對電腦來說他是一個248 x 400 x 3

DeepLearning.ai作業:(4-1)-- 卷積神經網路（Foundations of CNN）

title: ‘DeepLearning.ai作業:(4-1)-- 卷積神經網路（Foundations of CNN）’ id: dl-ai-4-1h tags: dl.ai homework categories: AI Deep Learning d

DeepLearning.ai筆記:(4-1)-- 卷積神經網路（Foundations of CNN）

title: ‘DeepLearning.ai筆記:(4-1)-- 卷積神經網路（Foundations of CNN）’ id: dl-ai-4-1 tags: dl.ai categories: AI Deep Learning date: 2018-09-

影象語義分割(1)-FCN:用於語義分割的全卷積神經網路

1. 創新

2.模型提出

3.模型架構

3.1 調整分類網路至全卷積以進行稠密預測

3.2 使用反捲積的上取樣

3.3 跨層結構(skip architecture)

4. 訓練

4.1 StageWise Training

4.2 其他細節

相關推薦