影象語義分割(4)-SegNet:深度全卷積編解碼結構

阿新 • • 發佈：2019-01-14

論文地址：
SegNet: A Deep Convolutional Encoder-Decoder Architecture for Image Segmentation
[Badrinarayanan V , Kendall A , Cipolla R . SegNet: A Deep Convolutional Encoder-Decoder Architecture for Scene Segmentation[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2017:1-1.]
論文實現：

github程式碼

1. 概述

1.1 解決的問題

影象語義分割中max pooling等Subpooling方法縮小了特徵圖尺寸，導致資訊丟失
影象分割模型的主要結構(編解碼)

1.2 提出新方法

Encoder—Decoder
新的上取樣方式unpool with indices

1.3 得到的效果

精度上與FCN相差不大，而且Deconv方法效果更好
在儲存和時間效率上SegNet效果大大改善，這也對應了SegNet的初衷，道路物體語義資訊理解(自動駕駛)

2.模型關鍵架構

在這裡插入圖片描述

2.1 Encoder-Decoder架構

FCN語義分割網路中的編解碼結構如下：

Encoder：使用pool操作和卷積操作，特徵圖尺寸縮小，通道數增加 $\rightarrow$ SubSample
Decoder: 使用Deconv特徵圖尺寸增加 $\rightarrow$ UpSample
在SegNet中做了如下改進：
Encoder：VGG網路直接去掉三層全連線層，模型引數大幅度減小，模型規模大幅下降。每一次卷積後加依次Batch Normalization。
Decoder：每一個Encoder對應一個Decoder並提出新的upSample方式，unpool with indices

2.2 Unpool 反池化上取樣方式

記錄下maxPooling在對應Kerner的座標，反池化過程中，將一個元素根據Kernerl放大，其他位置元素補0，如下圖所示：
在這裡插入圖片描述

影象語義分割(4)-SegNet:深度全卷積編解碼結構

論文地址： SegNet: A Deep Convolutional Encoder-Decoder Architecture for Image Segmentation [Badrinarayanan V , Kendall A , Cipolla R . SegNet: A Dee

影象語義分割(12)-重新思考空洞卷積: 為弱監督和半監督語義分割設計的簡捷方法

論文地址：Revisiting Dilated Convolution: A Simple Approach for Weakly- and Semi- Supervised Semantic Segmentation 1. 摘要儘管弱監督分割方法的精度有所提升，但是和全

影象語義分割(5)-DeepLabV2: 使用深度卷積網路、空洞卷積和全連線條件隨機場進行影象語義分割

論文地址：DeepLab: Semantic Image Segmentation with Deep Convolutional Nets, Atrous Convolution, and Fully Connected CRFs 論文程式碼：工程連結 1. 簡介 Dee

影象語義分割(2)-DeepLabV1: 使用深度卷積網路和全連線條件隨機場進行影象語義分割

論文地址：SEMANTIC IMAGE SEGMENTATION WITH DEEP CONVOLUTIONAL NETS AND FULLY CONNECTED CRFS 論文程式碼：工程連結1 工程連結2 1. 提出問題首先明確一個概念-high level task

DeepLab：深度卷積網路，多孔卷積和全連線條件隨機場的影象語義分割 Semantic Image Segmentation with Deep Convolutional Nets, Atro

深度卷積網路，多孔卷積和全連線條件隨機場的影象語義分割 Taylor Guo, 2017年5月03日星期三摘要本文的主要任務是深度學習的影象語義分割，主要有3個方面的貢獻，有重要的實踐價值。首先，用上取樣濾波器進行卷積，或“多孔卷積”,

基於深度學習的影象語義分割技術概述之4常用方法 5.4未來研究方向

https://blog.csdn.net/u014593748/article/details/72794459 本文為論文閱讀筆記，不當之處，敬請指正。 A Review on Deep Learning Techniques Applied to Semantic Segmen

[深度學習]從全卷積網路到大型卷積核：深度學習的語義分割全指南

語義分割一直是計算機視覺中十分重要的領域，隨著深度學習的流行，語義分割任務也得到了大量的進步。本文首先闡釋何為語義分割，然後再從論文出發概述多種解決方案。本文由淺層模型到深度模型，簡要介紹了語義分割各種技術，雖然本文並沒有深入講解語義分割的具體實現，但本文簡要地概述了每一篇重要

深度學習（9）——無監督語義分割之全卷積域適應網路（譯文）

無監督語義分割之全卷積域適應網路摘要深度神經網路的最新進展令人信服地證明了在大型資料集上學習視覺模型的高能力。然而，收集專家標記的資料集尤其是畫素級註釋是一個非常昂貴的過程。一個吸引人的選擇是渲染合成數據（例如，計算機遊戲）並自動生成基礎事實。然而，簡單地

[深度學習] FCN 全卷積網路語義分割

FCN 全卷積網路 Fully Convolutional Networks for Semantic Segmentation 今天實驗室停電，無聊把原來的一個分享PPT發上來語義分割語義分割是計算機視覺中的基本任務，也是計算機視覺的熱點，在語義分割中我們

影象語義分割(1)-FCN:用於語義分割的全卷積神經網路

論文地址：Fully Convolutional Networks for Semantic Segmentation [Long J , Shelhamer E , Darrell T . Fully Convolutional Networks for Semantic Segmen

10分鐘看懂全卷積神經網路（ FCN ）：語義分割深度模型先驅

大家好，我是為人造的智慧操碎了心的智慧禪師。今天是10月24日，既是程式設計師節，也是程式設計師

基於深度學習的影象語義分割技術概述之4常用方法

本文為論文閱讀筆記，不當之處，敬請指正。 A Review on Deep Learning Techniques Applied to Semantic Segmentation:原文連結 4 深度學習影象分割的常用方法深度學習在多種高階計算機視

語義分割中的深度學習方法全解：從FCN、SegNet到各代DeepLab

語義分割是什麼？語義分割方法在處理影象時，具體到畫素級別，也就是說，該方法會將影象中每個畫素分配到某個物件類別。下面是一個具體案例。△ 左邊為輸入影象，右邊為經過語義分割後的輸出影象。該模型不僅要識別出摩托車和駕駛者，還要標出每個物件的邊界。因此，與分類目的不同，相關模型要具

基於全卷積的影象語義分割—《Fully Convolutional Networks for Semantic Segmentation》

兩年前，我曾想做一個自動摳“人”的系統，目標是去除路人甲或者自動合成照片。當時“井底之蛙”般搞了一個混合高斯模型，通過畫素聚類的方式來摳“人”。這個模型，每跑一張小圖片需要幾分鐘，摳出來的前景“噪音”很嚴重，完全沒辦法使用。最後這個通過“摳人”去除路人甲的專案告吹。兩年後的今

（譯）從全卷積網路到大型卷積核：深度學習的語義分割全指南

機器之心：By路雪 2017年7月14日什麼是語義分割？　　語義分割指畫素級地識別影象，即標註出影象中每個畫素所屬的物件類別。如下圖：　　　　左：輸入影象，右：該影象的語義分割　　除了識別車和騎車的人，我們還需要描繪出每個物體的邊界。因此，與影象分類

使用全卷積神經網路FCN，進行影象語義分割詳解(附程式碼實現)

一.導論在影象語義分割領域，困擾了電腦科學家很多年的一個問題則是我們如何才能將我們感興趣的物件和不感興趣的物件分別分割開來呢？比如我們有一隻小貓的圖片，怎樣才能夠通過計算機自己對影象進行識別達到將小貓和圖片當中的背景互相分割開來的效果呢？如下圖所示：而在2015年

[深度學習]Semantic Segmentation語義分割之SegNet(3)

論文全稱：《SegNet: A Deep Convolutional Encoder-Decoder Architecture for Image Segmentation》論文地址：https://arxiv.org/abs/1511.00561 論文程式碼： python

轉：全卷積網路（FCN）與影象分割

學習收藏。從影象分類到影象分割卷積神經網路（CNN）自2012年以來，在影象分類和影象檢測等方面取得了巨大的成就和廣泛的應用。 CNN的強大之處在於它的多層結構能自動學習特徵，並且可以學習到多個層次的特徵：較淺的卷積層感知域較小，學習到一些區域性區域的特徵；較深

基於深度學習的影象語義分割演算法綜述（截止20180715）

這篇文章講述卷積神經網路在影象語義分割（semantic image segmentation）的應用。影象分割這項計算機視覺任務需要判定一張圖片中特定區域的所屬類別。這個影象裡有什麼？它在影象中哪個位置？更具體地說，影象語義分割的目標是將影象的每個畫素所

使用深度學習技術的影象語義分割最新綜述

http://abumaster.com/2017/07/10/%E4%BD%BF%E7%94%A8%E6%B7%B1%E5%BA%A6%E5%AD%A6%E4%B9%A0%E6%8A%80%E6%9C%AF%E7%9A%84%E5%9B%BE%E5%83%8F%E8%AF

影象語義分割(4)-SegNet:深度全卷積編解碼結構

1. 概述

1.1 解決的問題

1.2 提出新方法

1.3 得到的效果

2.模型關鍵架構

2.1 Encoder-Decoder架構

2.2 Unpool 反池化上取樣方式

相關推薦