1. 程式人生 > >語義分割之Dilated Convolution個人總結

語義分割之Dilated Convolution個人總結

1. 空洞卷積

在這裡插入圖片描述 如圖,表示dilation=2時的空洞卷積。

空洞卷積的好處: (1) 正常情況下,為了獲得較大的感受野我們可以選擇大卷積核或者進行pooling操作。選擇大卷積核會增加引數量,而pooling會損失影象的解析度資訊。因此,選擇空洞卷積既可以獲得更大的感受野,又不增加引數量,同時也不會損失解析度資訊。 (2) 空洞卷積是一種稀疏取樣,可以去除影象上的冗餘資訊(並不是所有資訊都必須用到) 在這裡插入圖片描述 這是論文中的一張圖,(a)正常3x3卷積,(b) dilation=2的3x3卷積, © dilation=4的3x3卷積。文中說經過了(a)(b)©卷積,一個畫素的感受野是15,下面是具體過程(反算感受野)。 在這裡插入圖片描述

2. 多尺度聚合

在這

本文除了應用了空洞卷積,還提出了一個"多尺度聚合模組"。 主要是串聯不同dilation的卷積,同時保持size和depth都不變(depth = num_classes)。 由於使用了不同的dilation,可以取樣不同尺度範圍內的資訊,然後串聯。因此這裡稱為多尺度聚合。

不管是空洞卷積,還是多尺度聚合,都是作為一種模組,可以應用各種網路或任務中。