1. 程式人生 > >港中大、商湯開源目標檢測工具包mmdetection,對比Detectron如何?

港中大、商湯開源目標檢測工具包mmdetection,對比Detectron如何?

640?wx_fmt=jpeg

參加 2018 AI開發者大會,請點選 ↑↑↑


近日,香港中文大學-商湯聯合實驗室開源了基於 PyTorch 的檢測庫——mmdetection。上個月,商湯和港中大組成的團隊在 COCO 比賽的物體檢測(Detection)專案中奪得冠軍,而 mmdetection 正是基於 COCO 比賽時的 codebase 重構。


商湯稱,這個開源庫提供了已公開發表的多種視覺檢測核心模組。通過這些模組的組合,可以迅速搭建出各種著名的檢測框架,比如 Faster RCNN,Mask RCNN,和 R-FCN 等,以及各種新型框架,從而大大加快檢測技術研究的效率。


目前,mmdetection 的第一個版本已經實現了 RPN,Fast R-CNN,Faster R-CNN,Mask R-CNN,近期還計劃放出 RetinaNet 和 Cascade R-CNN。


專案地址:

https://github.com/open-mmlab/mmdetection


此次專案的參與者,香港中文大學陳愷博士稱,相比 FAIR 此前開源的 Detectron,mmdetection 有以下幾大優勢:


編者注:Detectron 是 FAIR 用於實現最先進的目標檢測演算法(包括 Mask R-CNN)的軟體系統。該系統基於深度學習框架 Caffe 2 ,由 Python 編寫而成。(《Mask R-CNN 原始碼終上線,Facebook 開源目標檢測平臺—Detectron》)


Performance 稍高:

由於 PyTorch 官方 model zoo 裡面的 ResNet 結構和 Detectron 所用的 ResNet 有細微差別(mmdetection 中可以通過 backbone 的 style 引數指定),導致模型收斂速度不一樣,所以我們用兩種結構都跑了實驗,一般來說在 1x 的 lr schedule 下 Detectron的會高,但 2x 的結果 PyTorch 的結構會比較高。


       640?wx_fmt=jpeg      

訓練速度稍快:Mask R-CNN 差距比較大,其餘的很小。採用相同的 setting,Detectron 每個 iteration 需要 0.89s,而 mmdetection 只需要 0.69s。Fast R-CNN 比較例外,比 Detectron 的速度稍慢。另外在我們的伺服器上跑 Detectron 會比官方 report 的速度慢 20% 左右,猜測是 FB 的 Big Basin 伺服器效能比我們好?


所需視訊記憶體稍小:視訊記憶體方面優勢比較明顯,會小 30% 左右。但這個和框架有關,不完全是 codebase 優化的功勞。一個讓我們比較意外的結果是現在的 codebase 版本跑 ResNet-50 的 Mask R-CNN,每張卡(12 G)可以放 4 張圖,比我們比賽時候小了不少。


易用性更好:基於 PyTorch 和基於 Caffe2 的 code 相比,易用性是有代差的。成功安裝 Detectron 的時間,大概可以裝好一打的 mmdetection 吧。


當然,陳愷博士也承認 Detectron 也有一些明顯優勢,“作為第一個全面的 detection codebase,加上 FAIR 的金字招牌,關注人數和使用者很多(雖然吐槽也比較多),release 的模型也比較全面。我們也在努力擴充 model zoo,奈何人力和算力還是有很大差距,所以還需要時間。”


與 mmdetection 一起開源的還有一個基礎庫——mmcv。據陳愷博士介紹, mmcv 基礎庫主要分為兩個部分:一部分是和 deep learning framework 無關的一些工具函式,比如 IO/Image/Video 相關的一些操作;另一部分是為 PyTorch 寫的一套訓練工具,可以大大減少使用者需要寫的程式碼量,同時讓整個流程的定製變得容易。


專案地址:

https://github.com/open-mmlab/mmcv


實際上,mmdetection 和 mmcv 都同屬於香港中文大學多媒體實驗室的 Open-MMLab 計劃。港中大助理教授林達華稱,啟動 Open-MMLab 計劃,是希望在一個統一的程式碼架構上,逐步開放實驗室積累的演算法和模型,為計算機視覺的研究社群貢獻自己的一分力量。以下是簡單說明:


1. 這是一個純粹的學術開源計劃,所開放的都是已經公開發表的演算法和模型(包括我們自己和其它研究組提出的代表性演算法),不涉及任何的商業化技術。


2. 我們希望這個計劃能夠降低演算法復現的難度,和不必要的重複實驗與訓練,從而讓使用者能夠專注於新問題的提出、新思路的探索,而不需要花費主要精力用於已有演算法元件的細節除錯。


3. 我們在開放的 codebase 中會對現有的主流演算法框架進行重構,把它們分解為可複用的元件。希望未來的研究者可以基於這些元件,能迅速建立新的演算法框架原型,加快探索的進度。


4. 我們希望 Open-MMLab 成為一個學術交流和探討的渠道。


參考資料:

https://www.zhihu.com/question/294578141

https://zhuanlan.zhihu.com/p/47011261



【完】


2018 AI開發者大會

只講技術,拒絕空談


2018 AI開發者大會是一場由中美人工智慧技術高手聯袂打造的AI技術與產業的年度盛會!是一場以技術落地為導向的乾貨會議!大會設定了10場技術專題論壇,力邀15+矽谷實力講師團和80+AI領軍企業技術核心人物,多位一線經驗大咖帶你將AI從雲端落地。


即刻點選「閱讀原文」或者識別海報二維碼報名參會,立享7折優惠票價(更有定量學生票)!


大會日程以及嘉賓議題請檢視下方海報

(點選檢視大圖)

640?wx_fmt=jpeg

640?wx_fmt=jpeg


點選「閱讀原文」,檢視大會更多詳情。2018 AI開發者大會——擺脫焦慮,擁抱技術前沿。