目標檢測（十六）--MS-CNN

阿新 • • 發佈：2019-01-05

A Unified Multi-scale Deep Convolutional Neural Network for Fast Object Detection

Multi-stage Object Detection with Group Recursive Learning

Subcategory-aware Convolutional Neural Networks for Object Proposals and Detection

最新看篇關於多尺度下快速目標檢測的論文，是UCSD大學的SVCL實驗室和IBM研究院一起研究的結果。

這篇文章主要解決多尺度同時存在時的檢索問題，設計了MSCNN網路，提出了兩點創新和幾點技巧：

（1）針對多尺度問題：

類似於FCNT跟蹤方法，該文章也是觀察到了卷積網路不同層得到的特徵特點的不同，對不同層的特徵採用不同的利用方式。比如conv-3的低網路層，有更小的感受野，可以進行小目標的檢測；而高層如conv-5，對於大目標的檢測更加準確。對於不同的輸出層設計不同尺度的目標檢測器，完成多尺度下的檢測問題。

注：　在卷積神經網路中，感受野的定義是卷積神經網路每一層輸出的特徵圖（feature map）上的畫素點在原始影象上對映的區域大小。點選開啟連結

（2）針對速度問題：

使用特徵的上取樣代替輸入影象的上取樣步驟。設計一個去卷積層，來增加特徵圖的解析度，使得小目標依然可以被檢測出來。這裡使用了特徵圖的deconvolutional layer

（去卷積層）來代替input影象的上取樣，可以大大減少記憶體佔用，提高速度。

作者說：去卷積層一直用於分隔和邊緣檢測，我們第一次用它加速和提高檢測率。

文章的網路結構類似RCNN，分為proposal提取和目標檢測，兩個部分獨立進行。

proposal子網路和目標檢測子網路結構圖分別如下：

注：中間有色部分可以看成CNN trunk(cnn 主幹線），一些層延伸了分支，分支由單檢測層構成，通過分支的proposal判斷為最終proposal。

技巧一：Conv4-3上面有一個緩衝卷積層，因為這一次更靠近主幹線的底層（接近輸入圖），更影響梯度導致學習過程不穩定，緩衝卷積層能防止檢測分支的梯度直接反向傳播回主幹線層。

實驗細節：

資料擴充套件：在KITTI資料集中，大多數目標很小，候選集差別很大，而最大目標尺寸過小，故把原始影象隨機縮放成多個規模。

精調：影象背景區域消耗計算記憶體，故在1000*600的大圖裡裁剪448*448的含目標圖片，是12G視訊記憶體夠用

訓練技巧： booststrapping 和multi-task loss 使訓練在早期迭代過程不穩定，採用兩步走，

第一步：隨機取樣，以學習率0.00005迭代10000次，生成模型

第二部：用生成的模型初始化第二層，自舉，以初始學習率0.00005迭代，每迭代一萬次學習率下降十倍，一共迭代 25000次。

實驗過程與結果：

文章主要在KITTI和Caltech Pedestrian資料集上進行了MSCNN的測試，因為這兩個資料集中包含許多小目標。

作者對proposal網路部分和目標檢測部分的實驗結果分別進行了全部系統的分析和對比，這裡僅僅將在KITTI上的檢測結果展示：

目標檢測（十六）--MS-CNN

A Unified Multi-scale Deep Convolutional Neural Network for Fast Object Detection Multi-stage Object Detection with Group Recursive L

人臉識別之人臉檢測（十六）--Cascade CNN

轉自：https://blog.csdn.net/xzzppp/article/details/51692907 論文：A Convolutional Neural Network Cascade for FaceDetection 1、簡介 CascadeCN

目標檢測（十八）--FPN

這篇論文是CVPR2017年的文章，採用特徵金字塔做目標檢測，有許多亮點，特來分享。論文：feature pyramid networks for object detection 論文連結：https://arxiv.org/abs/1612.03144 論文概述

運動目標跟蹤（十六）--OAB，SemiT,BSBT跟蹤

原文： http://blog.csdn.net/ikerpeng/article/details/18985573 文章：on-line boosting and vision 這是cvpr2006年的文章，非常經典的一篇文章。還有原始碼和資料集下面記錄一下我讀這篇文

目標檢測（十）——SSD

SSD: Single Shot MultiBox Detector 　　針對YOLO類演算法的定位精度問題，2016年12月北卡大學教堂山分校的Wei Liu等提出SSD演算法，將YOLO的迴歸思想和Faster R-CNN的anchor box機制結合

目標檢測（Object Detection）原理與實現(六)

基於形變部件模型（Deformable Part Models）的目標檢測上節說了基於cascade的目標檢測，cascade的級聯思想可以快速拋棄沒有目標的平滑窗（sliding window）,因而大大提高了檢測效率，但也不是沒缺點，缺點就是它僅僅

全棧JavaScript之路（十六）HTML5 HTMLDocument 類型的變化

complete 文檔出了 content ldoc 之路 stat javascrip safari HTML5 擴展了 HTMLDocument, 添加了新的功能。 1.document.readState = ‘loading‘ || ‘complet

（十六）Hibernate中的延遲加載

pan nco exce bsp fetch gin turn list logs 一、什麽是延遲加載為了節省Hibernate加載對象的性能節銷，在Hibernate中真正需要用到這個對象時，才會發出 SQL語句來抓取這個對象。這一個過程稱為延遲加

文件系統命令（十六）

空間 fdisk parted 文件系統命令：du，df，fdisk，parted，blkid，lsblk16.1.du功能：估算文件空間使用情況語法： du [OPTION]... [FILE]... du [OPTION]... --files0-from=F常用選項：

OpenCV探索之路（十六）：圖像矯正技術深入探討

double gb2 教科書長方形 strong fine open lines 導致剛進入實驗室導師就交給我一個任務，就是讓我設計算法給圖像進行矯正。哎呀，我不太會圖像這塊啊，不過還是接下來了，硬著頭皮開幹吧！那什麽是圖像的矯正呢？舉個例子就好明白了。我的好朋友小

【轉】 JMeter學習（十六）JMeter函數學習

blog 自動當前 3.2 add 函數的調用瀏覽器 con 保存 JMeter函數是一些能夠轉化在測試樹中取樣器或者其他配置元件的域的特殊值。一個函數的調用就像這樣：${_functionName(var1,var2,var3)}，-functionName匹配函數名

selenium測試（Java）--下載文件（十六）

void nload when ati quit new selenium max separate 下載文件需要在Firefox 的profile屬性中配置一些參數，如下面的代碼： package com.test.download; import java.io.F

Python學習筆記（十六）拓展庫Scipy

mage http 十六 .cn 學習筆記 eight -1 images 分享 Python學習筆記（十六）拓展庫Scipy

java（十六） CSS

java cssCSSCSS是層疊樣式表（Cascading Style Sheets），用來定義網頁的實現效果，可以解決html代碼對樣式定義的重復，提高了後期樣式代碼的可維護性，並增強了網頁的現實效果功能。簡單說：css將網頁內容和顯示樣式進行了分離，提高了顯示功能。那麽，css和html是如何在網頁