1. 程式人生 > >Mask-RCNN中的損失函式

Mask-RCNN中的損失函式

對每個ROI來說,多工損失函式如下:

這裡寫圖片描述

mask分支對於每個RoI有Km2 維度的輸出。K個(類別數)解析度為m*m的二值mask。
因此作者利用了a per-pixel sigmoid,並且定義 Lmask 為平均二值交叉熵損失(the average binary cross-entropy loss).
對於一個屬於第k個類別的RoI, Lmask 僅僅考慮第k個mask(其他的掩模輸入不會貢獻到損失函式中)。這樣的定義會允許對每個類別都會生成掩模,並且不會存在類間競爭。

這裡寫圖片描述