Mask R-CNN官方實現“又”來了！基於PyTorch，訓練速度是原來2倍

PyTorch · 發表 2018-10-26 13:53:06

摘要：來自官方的Mask R-CNN實現終於“又”來了！PyTorch官方Twitter今天公佈了一個名為 Mask R-CNN Benchmark 的專案。 10個月前Facebook曾釋出過名叫 Detecron 的專案，也是一款影象分割與識別平臺，其中也包含Mask R-C...

來自官方的Mask R-CNN實現終於“又”來了！PyTorch官方Twitter今天公佈了一個名為 Mask R-CNN Benchmark 的專案。

10個月前Facebook曾釋出過名叫 Detecron 的專案，也是一款影象分割與識別平臺，其中也包含Mask R-CNN。不過它是基於Caffe 2深度學習框架編寫的。這一次，在Caffe2專案併入PyTorch半年之後，Facebook換上了更受歡迎的PyTorch框架。

除了更改框架，Mask R-CNN Benchmark相比它的“前輩”Detectron，訓練速度提高了一倍。

△ Detecron效果輸出圖

Mask R-CNN Benchmark是一個完全由PyTorch 1.0寫成，快速、模組化的Faster R-CNN和Mask R-CNN元件。該專案旨在讓使用者更容易地建立一種模組，實現對圖片中物品的識別與分割。

負責這一專案的Facebook AI工程師Francisco Massa還在個人Twitter發了張自拍照，並使用新工具對圖片中的物品進行了識別，尷尬的是好像有些物件被識別錯誤：

△ Francisco Massa自拍照

第三方專案

在Facebook官方推出Mask R-CNN Benchmark之前，程式員們一直希望能用更流行的PyTorch取代Caffe 2實現Mask R-CNN，今年7月GitHub上有一名印度小哥完成任務。

另外，商湯和香港中文大學的多媒體實驗室也開源了一個類似專案： mmdetection 。它支援 Faster R-CNN 、 Mask R-CNN 、 RetinaNet 等等，相比Facebook的Detecron有5%到20%的效能提升。這個模型還在2018年的COCO Detection競賽中拿下了冠軍。

那麼今天Facebook釋出的Mask R-CNN Benchmark相比前兩者有哪些優點呢？

亮點

● PyTorch 1.0編寫： RPN 、 Faster R-CNN 和 Mask R-CNN 均可實現，達到甚至超出Detectron的準確度

● 快速：訓練速度是Detectron的 2倍，比mmdetection高 30% 。

● 視訊記憶體效率更高：大約比mmdetection少使用500MB視訊記憶體

● 支援 多GPU 訓練與推斷

● 支援以CPU進行推斷

● 支援影象批處理：可分批分GPU對多圖進行推斷

● 提供預訓練模型：針對幾乎所有引用Faster RCNN和Mask RCNN的架構

PyTorch官方Twitter轉發了該專案，並希望mmdetection等專案都能使用一下。

安裝小貼士

使用Mask R-CNN Benchmark需要安裝以下元件：

● PyTorch 1.0

● orchvision

● cocoapi

● yacs

● matplotlib

● OpenCV（可選）

R-CNN發展歷史

R-CNN是卷積神經網路（CNN）在影象識別領域的應用，Facebook AI研究團隊在這條到道路上做出了頗多貢獻，其中不得不提一位大神： Ross Girshick 。他發明了RCNN，又提出速度更快的 Fast R-CNN 。

2016年，微軟研究院提出了Faster R-CNN，降低了在邊框搜尋上的運算量，進一步提高了演算法的速度。

2017年，Facebook AI研究團隊又再次提出了 Mask R-CNN ：通過新增與現有分支並行的物件掩碼（object mask）分支，以增強Faster RCNN在邊框識別上的效能。

原文釋出時間為：2018-10-25

本文作者：曉查

本文來自雲棲社群合作伙伴“ ofollow,noindex">機器學習演算法與Python學習 ”，瞭解相關資訊可以關注“ 機器學習演算法與Python學習 ”。

Mask R-CNN官方實現“又”來了！基於PyTorch，訓練速度是原來2倍

您可能也會喜歡…