港中大、商湯開源目標檢測工具包mmdetection，對比Detectron如何？

阿新 • • 發佈：2018-10-31

參加 2018 AI開發者大會，請點選 ↑↑↑

近日，香港中文大學-商湯聯合實驗室開源了基於 PyTorch 的檢測庫——mmdetection。上個月，商湯和港中大組成的團隊在 COCO 比賽的物體檢測（Detection）專案中奪得冠軍，而 mmdetection 正是基於 COCO 比賽時的 codebase 重構。

商湯稱，這個開源庫提供了已公開發表的多種視覺檢測核心模組。通過這些模組的組合，可以迅速搭建出各種著名的檢測框架，比如 Faster RCNN，Mask RCNN，和 R-FCN 等，以及各種新型框架，從而大大加快檢測技術研究的效率。

目前，mmdetection 的第一個版本已經實現了 RPN，Fast R-CNN，Faster R-CNN，Mask R-CNN，近期還計劃放出 RetinaNet 和 Cascade R-CNN。

專案地址：

https://github.com/open-mmlab/mmdetection

此次專案的參與者，香港中文大學陳愷博士稱，相比 FAIR 此前開源的 Detectron，mmdetection 有以下幾大優勢：

編者注：Detectron 是 FAIR 用於實現最先進的目標檢測演算法（包括 Mask R-CNN）的軟體系統。該系統基於深度學習框架 Caffe 2 ，由 Python 編寫而成。（《Mask R-CNN 原始碼終上線，Facebook 開源目標檢測平臺—Detectron》）

Performance 稍高：

由於 PyTorch 官方 model zoo 裡面的 ResNet 結構和 Detectron 所用的 ResNet 有細微差別（mmdetection 中可以通過 backbone 的 style 引數指定），導致模型收斂速度不一樣，所以我們用兩種結構都跑了實驗，一般來說在 1x 的 lr schedule 下 Detectron的會高，但 2x 的結果 PyTorch 的結構會比較高。

640?wx_fmt=jpeg

訓練速度稍快：Mask R-CNN 差距比較大，其餘的很小。採用相同的 setting，Detectron 每個 iteration 需要 0.89s，而 mmdetection 只需要 0.69s。Fast R-CNN 比較例外，比 Detectron 的速度稍慢。另外在我們的伺服器上跑 Detectron 會比官方 report 的速度慢 20% 左右，猜測是 FB 的 Big Basin 伺服器效能比我們好？

所需視訊記憶體稍小：視訊記憶體方面優勢比較明顯，會小 30% 左右。但這個和框架有關，不完全是 codebase 優化的功勞。一個讓我們比較意外的結果是現在的 codebase 版本跑 ResNet-50 的 Mask R-CNN，每張卡（12 G）可以放 4 張圖，比我們比賽時候小了不少。

易用性更好：基於 PyTorch 和基於 Caffe2 的 code 相比，易用性是有代差的。成功安裝 Detectron 的時間，大概可以裝好一打的 mmdetection 吧。

當然，陳愷博士也承認 Detectron 也有一些明顯優勢，“作為第一個全面的 detection codebase，加上 FAIR 的金字招牌，關注人數和使用者很多（雖然吐槽也比較多），release 的模型也比較全面。我們也在努力擴充 model zoo，奈何人力和算力還是有很大差距，所以還需要時間。”

與 mmdetection 一起開源的還有一個基礎庫——mmcv。據陳愷博士介紹， mmcv 基礎庫主要分為兩個部分：一部分是和 deep learning framework 無關的一些工具函式，比如 IO/Image/Video 相關的一些操作；另一部分是為 PyTorch 寫的一套訓練工具，可以大大減少使用者需要寫的程式碼量，同時讓整個流程的定製變得容易。

專案地址：

https://github.com/open-mmlab/mmcv

實際上，mmdetection 和 mmcv 都同屬於香港中文大學多媒體實驗室的 Open-MMLab 計劃。港中大助理教授林達華稱，啟動 Open-MMLab 計劃，是希望在一個統一的程式碼架構上，逐步開放實驗室積累的演算法和模型，為計算機視覺的研究社群貢獻自己的一分力量。以下是簡單說明：

1. 這是一個純粹的學術開源計劃，所開放的都是已經公開發表的演算法和模型（包括我們自己和其它研究組提出的代表性演算法），不涉及任何的商業化技術。

2. 我們希望這個計劃能夠降低演算法復現的難度，和不必要的重複實驗與訓練，從而讓使用者能夠專注於新問題的提出、新思路的探索，而不需要花費主要精力用於已有演算法元件的細節除錯。

3. 我們在開放的 codebase 中會對現有的主流演算法框架進行重構，把它們分解為可複用的元件。希望未來的研究者可以基於這些元件，能迅速建立新的演算法框架原型，加快探索的進度。

4. 我們希望 Open-MMLab 成為一個學術交流和探討的渠道。

參考資料：

https://www.zhihu.com/question/294578141

https://zhuanlan.zhihu.com/p/47011261

【完】

2018 AI開發者大會

◆

只講技術，拒絕空談

◆

2018 AI開發者大會是一場由中美人工智慧技術高手聯袂打造的AI技術與產業的年度盛會！是一場以技術落地為導向的乾貨會議！大會設定了10場技術專題論壇，力邀15+矽谷實力講師團和80+AI領軍企業技術核心人物，多位一線經驗大咖帶你將AI從雲端落地。

即刻點選「閱讀原文」或者識別海報二維碼報名參會，立享7折優惠票價（更有定量學生票）!

大會日程以及嘉賓議題請檢視下方海報

（點選檢視大圖）

640?wx_fmt=jpeg

點選「閱讀原文」，檢視大會更多詳情。2018 AI開發者大會——擺脫焦慮，擁抱技術前沿。

港中大、商湯開源目標檢測工具包mmdetection，對比Detectron如何？

港中大、商湯開源目標檢測工具包mmdetection，對比Detectron如何？

2019秋招內推--阿裏、百度、商湯、去哪、360

清華&商湯開源超高精度邊緣感知人臉對齊演算法清華&商湯開源超高精度邊緣感知人臉對齊演算法

清華&商湯開源超高精度邊緣感知人臉對齊演算法

如何高效進行大規模分類？港中文聯合商湯提出新方法

Linux系統10個開源漏洞檢測工具

深度學習實戰（1）--手機跑目標檢測模型（YOLO，從DarkNet到Caffe再到NCNN完整打通）

從R-CNN到RFBNet,深度目標檢測5年縱覽，文章+程式碼讓你從入門到精通(轉)

深度學習實戰教程（1）--手機上跑目標檢測模型（YOLO，從DarkNet到Caffe再到NCNN完整打通）

目標檢測數據增強，旋轉方法

PIoU Loss：傾斜目標檢測專用損失函式，公開超難傾斜目標資料集Retail50K | ECCV 2020 Spotlight

Windows和Linux記憶體檢測工具：Valgrind，Visual Leak Detector，CppCheck， Cpplint

我收集的一些目標檢測、跟蹤、識別標準測試視頻集和圖像數據庫

第二十五節，目標定位、特征點檢測依據目標檢測

第十八節、基於傳統圖像處理的目標檢測與識別(HOG+SVM附代碼)

學習筆記-目標檢測、定位、識別（RCNN，Fast-RCNN, Faster-RCNN，Mask-RCNN，YOLO，SSD 系列）

目標檢測之RCNN、Fast RCNN 、Faster RCNN技術演進與對比

深度學習目標檢測經典模型比較（RCNN、Fast RCNN、Faster RCNN）

CVPR 2017、2018 - 目標檢測文章

第十九節、基於傳統影象處理的目標檢測與識別(詞袋模型BOW+SVM附程式碼)

港中大、商湯開源目標檢測工具包mmdetection，對比Detectron如何？

相關推薦