ESPNet
ESPNet: Efficient Spatial Pyramid of Dilated Convolutions for Semantic Segme
2019/03/11 Author:Yu Zhang
此篇論文為ECCV2018中的一篇論文,作者介紹了一個既快又效果說得過去的網路架構,用於語義分割當中。此網路可以達到每秒112幀,比目前有效的輕型網路如MobileNet,ShuffleNet, ENet等等都要快,還好,在只降低8%精度的條件下,比PSPNet小180倍,速度快22倍。
那麼作者是怎麼做到的呢?
上圖為ESP的架構,看起來非常複雜,但其實操作很簡單,首先使用逐點卷積將通道數進行縮減,縮減後送入空洞卷積金字塔,通過不同rate的空洞卷積獲得更大感受野並進行融合,引數非常少。具體通道及rate以及拼合策略如圖所示。拼合策略與普通空洞卷積特徵融合的方法不同,這裡為了避免gridding artifacts現象,採用了逐級相加的策略。
設計的分割網路如下圖:設計了一個輕量級的編碼解碼網路架構
在cityscapes測試集上能達到60.3的準確率,已經不錯了。 同時作者做了特別多的實驗,感興趣的可以到原文中去看。