曠世提出類別正則化的域自適應目標檢測模型，緩解場景多樣的痛點 | CVPR 2020

阿新 • • 發佈：2020-06-23

> 論文基於DA Faster R-CNN系列提出類別正則化框架，充分利用多標籤分類的弱定位能力以及圖片級預測和例項級預測的類一致性，從實驗結果來看，類該方法能夠很好地提升DA Faster R-CNN系列的效能來源：曉飛的演算法工程筆記公眾號 **論文: Exploring Categorical Regularization for Domain Adaptive Object Detection** ![](https://upload-images.jianshu.io/upload_images/20428708-25755fe209405307.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240) * **論文地址：[https://arxiv.org/pdf/2003.09152.pdf](https://arxiv.org/pdf/2003.09152.pdf)** * **論文程式碼：[https://github.com/Megvii-Nanjing/CR-DA-DET](https://github.com/Megvii-Nanjing/CR-DA-DET)** # Introduction *** 由於標註成本大，在訓練好檢測演算法後，面對差異較大的新場景(類別不變)，若想獲取大量的帶標註圖片進行再訓練是很不方便的。對於這種情況，無監督的域自適應方法能夠靈活地自適應新場景，從包含豐富標註資訊的源域轉移到無標註的目標域。其中，域自適應方法中比較有代表性的是Donamin Adaptive(DA) Faster R-CNN系列，利用對抗訓練來對齊圖片和例項的分佈，使得模型能夠做到域不變性，具體可以看上一篇介紹。但是這些方法大都把無法轉化的背景內容也進行了對齊，而且在例項對齊時，沒有從包含較多低質量的proposal集合中識別出難樣本。為了解決上面的問題，論文提出類別正則化框架，幫助DA Faster R-CNN專注於對齊跨域中的關鍵區域和重要目標。論文的主要貢獻如下： * 提出新的類別正則化框架，作為域自適應目標檢測演算法的外掛，不需要額外的標註和超引數。 * 設計了兩個正則化模組，分別用於榨取卷積分類器的弱定位能力以及影象級別預測和例項級別預測間的類別一致性，能夠幫助分類器專注於對齊目標相關區域以及難對齊例項。 * 對多種域轉移場景進行實驗，驗證論文提出的方法的有效性。從實驗結果來看，類別正則化框架能夠提出DA Faster R-CNN系列方法的效能，並在基礎資料集上達到SOTA。 # Approach *** ### Framework Overview ![](https://upload-images.jianshu.io/upload_images/20428708-bdf6099ef0566259.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240) 論文方法的整體架構如圖2，在DA Faster R-CNN基礎上添加了ICR(image-level categorical regularization)和CCR(categorical consistency regularization)，能夠更好地對齊域間的關鍵區域和重要例項。 ### Image-Level Categorical Regularization ICR的主要目的是提高主幹網路的目標特徵提取能力，同時降低背景的啟用。結構如圖2b所示，ICR使用源域資料進行有監督訓練，對主幹網路的特徵輸出進行全域性池化，再使用多標籤分類器($1\times 1$卷積)進行分類，損失函式使用標準交叉熵多標籤損失： ![](https://upload-images.jianshu.io/upload_images/20428708-b85adeef44cbdb18.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240) $C$為類別總數，$y^c$為GT標籤，$\hat{y}^c$為預測標籤，$y^c=1$表示圖片至少包含一個類別$c$物體。 ![](https://upload-images.jianshu.io/upload_images/20428708-be1dcac9ef6b04c9.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240) ICR模組利用多標籤分類器的弱定位能力，能夠有監督地引導主幹網路只啟用類相關特徵。如圖3所示，類相關的特徵會有較高的啟用值。在影象級對齊時，能夠對齊域間關鍵區域，同時，由於背景沒有參與到影象級多標籤分類器中，能夠有效減少擬合不可對齊的源背景的可能性。 ### Categorical Consistency Regularization CCR負責發現難對齊例項，調整例項級對齊損失的權重，基於兩點考慮： * 由於不能區分前景和後景，例項對齊模組可能被低質量背景proposal佔據。 * 新增的影象級分類器和例項檢測head是互補的，前者負責獲取所有影象級上下文資訊，後者使用精確的RoI特徵，當兩者預測不一致時，該例項就是難樣本。基於以上考慮，論文采用影象級預測和例項級預測的類別一致性作為目標分類難易程度的判斷，並在目標域中使用該一致性作為正則因子，調節難對齊樣本在例項對齊中的權重。假定$\hat{p}^{c}_j$為預測第$j$個例項為類別$c$的概率，$\hat{y}^c$為例項預測包含類別$c$的概率，類別一致性的計算為 ![](https://upload-images.jianshu.io/upload_images/20428708-ea147c4b5af894e2.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240) 使用公式5來加權例項級對抗損失 ![](https://upload-images.jianshu.io/upload_images/20428708-4e95b533b7a1bb03.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240) 需要注意，僅對目標域的檢測head預測為前景的例項使用公式5加權，源域的所有例項和目標域的背景例項均使用$d_j=1$，前者因為是有監督的，而後者則是因為不重要。 ### Integration with DA Faster R-CNN Series 將論文提出的方法加入到DA Faster R-CNN中，ICR為直接加入，CCR為對原損失的修改，最終的損失函式為 ![](https://upload-images.jianshu.io/upload_images/20428708-c2fd85463fd7bbc0.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240) 論文也對比了另外一種主流的DA -Faster改進SW-Faster，該方法使用弱全域性對齊模型來提升DA-Faster的強影象對齊模組，直接加入ICR和CCR，最終的損失函式為 ![](https://upload-images.jianshu.io/upload_images/20428708-2368f8463b1770c5.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240) # Experiments *** ### Comparison Results Faster R-CNN(Source)僅使用源域訓練，Faster R-CNN(Oracle)僅使用目標域訓練。 * ##### Weather Adaptation ![](https://upload-images.jianshu.io/upload_images/20428708-57026d921f623009.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240) 這裡對比模型對天氣的自適應性。 * ##### Scene Adaptation ![](https://upload-images.jianshu.io/upload_images/20428708-348062a0629d3758.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240) 這裡對比模型對不同城市的場景的自適應性。 * ##### Dissimilar Domain Adaptation ![](https://upload-images.jianshu.io/upload_images/20428708-ab9ab7aa0df555f0.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240) 這裡對比模型對真實圖片和卡通圖片的自適應性。 ### Visualization and Analyses ![](https://upload-images.jianshu.io/upload_images/20428708-51da8c8e47f57a03.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240) 對前面對比實驗的目標域測試圖片進行了視覺化。 ![](https://upload-images.jianshu.io/upload_images/20428708-6d2595f8f9741126.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240) 將特徵降維並可視化，藍點為源域樣本，紅點為目標域樣本，可以看到論文的方法能夠讓域間的同分類例項距離更近。論文也計算了域間距離，使用Earth Movers Distance (EMD) 測量，SW-Faster, SW-Faster-ICR and SW-FasterICR-CCR的結果分別是8.84、8.59和8.15。 # CONCLUSION *** 論文基於DA Faster R-CNN系列提出類別正則化框架，充分利用多標籤分類的弱定位能力以及圖片級預測和例項級預測的類一致性，從實驗結果來看，類該方法能夠很好地提升DA Faster R-CNN系列的效能。 > 如果本文對你有幫助，麻煩點個贊或在看唄～更多內容請關注微信公眾號【曉飛的演算法工程筆記】 ![work-life balance.](https://upload-images.jianshu.io/upload_images/20428708-7156c0e4a2f49bd6.png?imageMogr2/auto-orient/strip%7CimageView2/2

曠世提出類別正則化的域自適應目標檢測模型，緩解場景多樣的痛點 | CVPR 2020

曠世提出類別正則化的域自適應目標檢測模型，緩解場景多樣的痛點 | CVPR 2020

Domain Adaptive Faster R-CNN：經典域自適應目標檢測演算法，解決現實中痛點，程式碼開源 | CVPR2018

正則化筆記

[轉] [機器學習] 常用數據標準化（正則化）的方法

【轉】正則化相關鏈接

簡單解釋一下正則化

正則化

Regularized least-squares classification（正則化最小二乘法分類器）取代SVM

邏輯回歸的正則化

9月5日正則化總結筆記

改善深層神經網絡：超參數調試、正則化及優化

stacked generalization 堆積正則化堆積泛化加權特征線性堆積

機器學習中的正則化

吳恩達-深度學習-課程筆記-8: 超參數調試、Batch正則化和softmax( Week 3 )

TensorFlow 過擬合與正則化(regularizer)

斯坦福大學公開課機器學習： advice for applying machine learning | regularization and bais/variance（機器學習中方差和偏差如何相互影響、以及和算法的正則化之間的相互關系）

ng機器學習視頻筆記（五） ——過擬合與正則化

正則化的其他方法

正則化--Lambda

單細胞數據初步處理 | drop-seq | QC | 質控 | 正則化 normalization

曠世提出類別正則化的域自適應目標檢測模型，緩解場景多樣的痛點 | CVPR 2020

相關推薦