1. 程式人生 > >影象分類,目標檢測,語義分割的FC的區別

影象分類,目標檢測,語義分割的FC的區別

還有半個月就要過年啦,提前給大夥拜個年哈哈,快放假了又進入了划水的階段啥都不太想幹,但是就算是划水也不能中斷思考啊,誰讓咱是搞技術的呢,過去的幾個月裡把語義分割,目標檢測和影象分類都稍微瞭解了一下,因為是入門階段所以聊得東西都比較簡單,這篇部落格就聊一聊這幾個任務在全連線層上的不同。

首先講一下影象分類,我們都知道分類是所有深度學習任務的基礎,就拿vgg16這個網路打個比方,當輸入影象的crop_size是227的時候,batchsize是32,fc6層的output是4096時,那麼fc6層的輸出向量緯度是4906*512*7*7,512是pool5層的輸出向量緯度,就是輸出了512個特徵圖每個特徵圖的大小是7*7.

再講一下目標檢測,就以faster rcnn為例子,faster rcnn先檢測出最優的300個目標視窗,然後fc層就將這300個目標作為300個影象再進行影象分類。

最後講一下語義分割,比如說deeplab和FCN語義分割呢是畫素級別的分割,簡單說就是將每一個畫素作為一個影象進行分類。

就先這樣啦,再有多的理解再補充