Mask R-CNN官方實現“又”來了!基於PyTorch,訓練速度是原來2倍
來自官方的Mask R-CNN實現終於“又”來了!PyTorch官方Twitter今天公佈了一個名為 Mask R-CNN Benchmark 的專案。
10個月前Facebook曾釋出過名叫 Detecron 的專案,也是一款影象分割與識別平臺,其中也包含Mask R-CNN。不過它是基於Caffe 2深度學習框架編寫的。這一次,在Caffe2專案併入PyTorch半年之後,Facebook換上了更受歡迎的PyTorch框架。
除了更改框架,Mask R-CNN Benchmark相比它的“前輩”Detectron,訓練速度提高了一倍。
△ Detecron效果輸出圖
Mask R-CNN Benchmark是一個完全由PyTorch 1.0寫成,快速、模組化的Faster R-CNN和Mask R-CNN元件。該專案旨在讓使用者更容易地建立一種模組,實現對圖片中物品的識別與分割。
負責這一專案的Facebook AI工程師Francisco Massa還在個人Twitter發了張自拍照,並使用新工具對圖片中的物品進行了識別,尷尬的是好像有些物件被識別錯誤:
△ Francisco Massa自拍照
第三方專案
在Facebook官方推出Mask R-CNN Benchmark之前,程式員們一直希望能用更流行的PyTorch取代Caffe 2實現Mask R-CNN,今年7月GitHub上有一名印度小哥完成任務。
另外,商湯和香港中文大學的多媒體實驗室也開源了一個類似專案: mmdetection 。它支援 Faster R-CNN 、 Mask R-CNN 、 RetinaNet 等等,相比Facebook的Detecron有5%到20%的效能提升。這個模型還在2018年的COCO Detection競賽中拿下了冠軍。
那麼今天Facebook釋出的Mask R-CNN Benchmark相比前兩者有哪些優點呢?
亮點
● PyTorch 1.0編寫: RPN 、 Faster R-CNN 和 Mask R-CNN 均可實現,達到甚至超出Detectron的準確度
● 快速:訓練速度是Detectron的 2倍 ,比mmdetection高 30% 。
● 視訊記憶體效率更高:大約比mmdetection少使用500MB視訊記憶體
● 支援 多GPU 訓練與推斷
● 支援以CPU進行推斷
● 支援影象批處理:可分批分GPU對多圖進行推斷
● 提供預訓練模型:針對幾乎所有引用Faster RCNN和Mask RCNN的架構
PyTorch官方Twitter轉發了該專案,並希望mmdetection等專案都能使用一下。
安裝小貼士
使用Mask R-CNN Benchmark需要安裝以下元件:
● PyTorch 1.0
● orchvision
● cocoapi
● yacs
● matplotlib
● OpenCV(可選)
R-CNN發展歷史
R-CNN是卷積神經網路(CNN)在影象識別領域的應用,Facebook AI研究團隊在這條到道路上做出了頗多貢獻,其中不得不提一位大神: Ross Girshick 。他發明了RCNN,又提出速度更快的 Fast R-CNN 。
2016年,微軟研究院提出了Faster R-CNN,降低了在邊框搜尋上的運算量,進一步提高了演算法的速度。
2017年,Facebook AI研究團隊又再次提出了 Mask R-CNN :通過新增與現有分支並行的物件掩碼(object mask)分支,以增強Faster RCNN在邊框識別上的效能。
原文釋出時間為:2018-10-25
本文作者:曉查
本文來自雲棲社群合作伙伴“ ofollow,noindex">機器學習演算法與Python學習 ”,瞭解相關資訊可以關注“ 機器學習演算法與Python學習 ”。