1. 程式人生 > >計算機視覺處理的三大任務(待續)

計算機視覺處理的三大任務(待續)

計算機視覺處理的三大任務:分割、定位、檢測
目前主要是通過ILSVBRC來作為評鑑標準,Classification+Localization Task,cls+bbox+seg+object Detection。對於實現終極目標檢測一般採用的思路是:(1)將其理解為迴歸問題,但是問題是如果影象中的興趣區域的目標個數不一樣,要定位座標數量也是不一樣這就導致出現來分類問題中的多分類,這種多分類成了樹狀結構計算的時間複雜度變高。
接下來經典的思路是RCNN,輸入一張影象定位出2k個物體候選框。然後採用CNN強大的特徵提取功能得到特徵向量維數4096維,接著採用SVM對候選框進行分類識別