[論文閱讀筆記]U-Net: Convolutional Networks for Biomedical Image Segmentation

阿新 • • 發佈：2019-02-20

摘要

大意是說，普遍認為深度網路需要大量已標籤資料集，這個網路(U-Net)可以依靠資料增強來事先少量資料集訓練網路。而且，這個網路訓練得很快，運用GPU執行，512*512的圖片只需要不用一秒即可。
該網路屬於端對端網路，即輸入圖片，輸出分割開的圖片。贏得了2015年ISBI競賽。

介紹

卷積神經網路已經存在很久了，但因為缺少可用的訓練資料集而沒被大量使用，直到ImageNet資料集（百萬張圖片）的出現。
傳統的卷積網路的目標是分類，即對每個圖片給予一個標籤。但是對於很多視覺任務，特別是醫療影象方向，目標應該包括定位，以及對每個畫素塊給予一個標籤。而且，醫療影象的訓練集都不大。
大概也就介紹了一些傳統的影象分割演算法，如滑動視窗，以及U-Net借鑑的前身FCN之類的，併為比較難的分割的情況（彼此接觸的同類物體）提議了一種方法。

網路架構

U-Net

網路架構就如上圖，可以描述為由收縮路徑（左邊）和擴張路徑組成。收縮路徑和傳統的卷積網路一樣，由卷積核尺寸為 $3 * 3$ 的無填充卷積，每次卷積後都經過ReLU函式作用，以及尺寸為 $2 * 2$ ，步距為2的最大池組成。這個最大池化就是下采樣的過程，下采樣後就將channels變為2倍。擴張路徑由 $2 * 2$ 的上卷積，上卷積的output channels為原先的一半，再與對應的特徵圖（裁剪後）串聯起來（得到和原先一樣大小的channels），再經過兩個尺寸為 $3 * 3$ 的卷積及經過ReLU作用。相應的裁剪特徵圖是必須的，因為在我們卷積的過程中會有邊界畫素的丟失。在最後一層通過卷積核大小為 $1 * 1$

的卷積作用得到想要的目標種類。在這個網路中，有23個卷積層。
為了保證輸出分段對映的無縫拼接，需要謹慎的選擇輸入圖片的尺寸，以保證所有的Max Pooling操作應用於有偶數的x-size和偶數的y-size的圖層。

訓練

該論文是基於Caffe，使用動量為0.99的SGD，損失函式為交叉熵，訓練輸入圖片與它們對應的分割圖片（輸入圖片和最後的圖片的尺寸不一樣）。該訓練模型和傳統的訓練模型沒什麼不同，都是注意權重初始化隨機，資料增強等。

[論文閱讀筆記]U-Net: Convolutional Networks for Biomedical Image Segmentation

摘要大意是說，普遍認為深度網路需要大量已標籤資料集，這個網路(U-Net)可以依靠資料增強來事先少量資料集訓練網路。而且，這個網路訓練得很快，運用GPU執行，512*512的圖片只需要不

《U-Net: Convolutional Networks for Biomedical Image Segmentation》學習筆記

1. 總述在15年的文章：《U-Net: Convolutional Networks for Biomedical Image Segmentation》中提出了一種基於少量資料進行訓練的網路的模型，得到了不錯的分割精度，並且網路的速度很快。對於分割一副5

醫學影象分割--U-Net: Convolutional Networks for Biomedical Image Segmentation

這裡我們將 FCN 修改為 U-Net，主要是上取樣階段，我們同樣也有許多特徵通道，這樣網路可以傳遞更多的 context 資訊到 higher resolution 網路層 in the upsampling part we have also a

[論文閱讀筆記]Two-Stream Convolutional Networks for Action Recognition in Videos

Karen Simonyan Andrew Zisserman Visual Geometry Group, University of Oxford fkaren,[email protected] 論文貢獻：提出了結合空

【CV論文閱讀】Two stream convolutional Networks for action recognition in Vedios

論文的三個貢獻（1）提出了two-stream結構的CNN，由空間和時間兩個維度的網路組成。（2）使用多幀的密集光流場作為訓練輸入，可以提取動作的資訊。（3）利用了多工訓練的方法把兩個資料集聯合起來。 Two stream結構視屏可以分成空間與時間兩個部

論文筆記《Fully Convolutional Networks for Semantic Segmentation》

FCN 的全稱是Fully Convolutional Networks，即全卷積網路。通常的CNN是在若干個卷積層之連線上若干個全連線層，將卷積層產生的特徵圖對映成一個固定長度的特徵向量。例如，AlexNet就是五個卷積層後面連線三個全連線層，它在Imagenet資料集上的輸出就是一個1000

[論文閱讀筆記] metapath2vec: Scalable Representation Learning for Heterogeneous Networks

## [論文閱讀筆記] metapath2vec: Scalable Representation Learning for Heterogeneous Networks --- ## 本文結構 1. 解決問題 2. 主要貢獻 3. 演算法原理 4. 參考文獻 --- ### (1) 解決問題 **解決

[論文閱讀筆記] node2vec Scalable Feature Learning for Networks

## [論文閱讀筆記] node2vec：Scalable Feature Learning for Networks --- ## 本文結構 1. 解決問題 2. 主要貢獻 3. 演算法原理 4. 參考文獻 --- ### (1) 解決問題由於DeepWalk的隨機遊走是完全無指導的隨機取樣，即隨機

VGGnet論文總結（VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION）

lrn cli 共享融合 loss sca 得到同時 works VGGNet的主要貢獻：　　1、增加了網絡結構的深度　　2、使用了更小的filter（3*3） 1 introduction 這部分主要說明了，由於在所有的卷積網絡上使用了3*3的filter，所以使

FCN筆記（Fully Convolutional Networks for Semantic Segmentation）

width height training 註意 die str 指標 his repl FCN筆記（Fully Convolutional Networks for Semantic Segmentation）（1）FCN做的主要操作 (a)將之前分類網絡的全連接

論文閱讀筆記《The Contextual Loss for Image Transformationwith Non-Aligned Data》（ECCV2018 oral）

github 區域偏移 org nbsp 修改 transfer style 但是目錄：相關鏈接方法亮點相關工作方法細節實驗結果總結與收獲相關鏈接論文：https://arxiv.org/abs/1803.02077 代碼：https://

ECCV 2018 論文閱讀筆記——Acquisition of Localization Confidence for Accurate Object Detection

目標檢測涉及到目標分類和目標定位，但很多基於 CNN 的目標檢測方法都存在分類置信度和定位置信度不匹配的問題。針對這一問題，一種稱之為 IoU-Net 的目標檢測新方法被提出，在基準方法的基礎上實現了顯著的提升。該論文已被將於當地時間 9 月 8

論文閱讀筆記: 2016 cvpr Convolutional Pose Machines（轉載）

出自https://blog.csdn.net/u010579901/article/details/79606257 論文閱讀筆記: 2016 cvpr Convolutional Pose Machines 部落格論文地址

人臉識別網路mobilefacenet,的改進介紹論文閱讀筆記：MobileFaceNets: Efficient CNNs for Accurate RealTime Face Verification on Mobile Devices

轉原論文閱讀筆記：MobileFaceNets: Efficient CNNs for Accurate RealTime Face Verification on Mobile Devices

VGG學習筆記-Very Deep Convolutional Networks for Large-Scale Image Recognition

主要是針對論文，進行了自我解讀，抽絲而成，請大家多多指教。摘要在這項工作中，主要研究卷積網路Convolutional networks (ConvNets)深度在大規模的影象識別環境下對準確性的影響。主要貢獻是使用非常小的

論文閱讀筆記——《Crafting a Toolchain for Image Restoration by Deep Reinforcement Learning》

這篇論文是CVPR 2018 (Spotlight)，是本人團隊小夥伴餘可的作品~ 程式碼連結：https://github.com/yuke93/RL-Restore 專案主頁：http://mmlab.ie.cuhk.edu.hk/projects/RL-Restore/ 論文連

論文閱讀 | FPN：Feature Pyramid Networks for Object Detection

語義 alt bubuko 獨立 margin dual eat 方法神經網絡論文地址：https://arxiv.org/pdf/1612.03144v2.pdf 代碼地址：https://github.com/unsky/FPN 概述 FPN是FAIR發表在CV

【論文閱讀】Deeply-Recursive Convolutional Network for Image Super-Resolution

開發十年，就只剩下這套架構體系了！ >>>

論文閱讀：Attention to Scale: Scale-aware Semantic Image Segmentation

注意力機制其實就是對feature map做加權，且加權的權重在訓練的時候學習的。很多語義分割網路融合了多尺度（多解析度）的特徵，但方法不盡相同。一種常見的結構是SPP（Spatial Pooling Pyramid），另一種方法則是使用不同解析度的分

論文閱讀筆記二十四：Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition（SPPNet CVPR2014）

分享圖片介紹 bin con strong map com 提高 https 論文源址：https://arxiv.org/abs/1406.4729 tensorflow相關代碼：https://github.com/peace195/sppnet 摘要

[論文閱讀筆記]U-Net: Convolutional Networks for Biomedical Image Segmentation

摘要

介紹

網路架構

訓練

相關推薦