1. 程式人生 > >FasterRCNN:提升網路的分類精度海康威視

FasterRCNN:提升網路的分類精度海康威視


    我們發現,對於圖中的全域性上下文網路分支,訓練時如果採用隨機初始化,效能提升非常有限。如果用預訓練的引數初始化,在ImageNet DET驗證集上可以得到超過3個點的效能提升。對於ResNets,RoIPooling後面的conv5有9層卷積。而Faster R-CNN finetune時一般初始學習速率又會設得比較小(0.001)。這就導致從頭訓練這9層卷積比較困難。因此,這裡預訓練顯得尤為重要。另外,[2]還把全域性上下文特徵同時用於分類和Bounding Box迴歸。我們發現全域性上下文特徵對於Bounding Box迴歸沒有幫助,只對分類有幫助。

4. 訓練技巧
    a)       平衡取樣。很多資料集存在樣本不均衡的問題,有些類別特別多,有些類別特別少。訓練模型時,從一個影象列表中依次讀取樣本訓練。這樣的話,小類樣本參與訓練的機會就比大類少。訓練出來的模型會偏向於大類,即大類效能好,小類效能差。平衡取樣策略就是把樣本按類別分組,每個類別生成一個樣本列表。訓練過程中先隨機選擇1個或幾個類別,然後從各個類別所對應的樣本列表中隨機選擇樣本。這樣可以保證每個類別參與訓練的機會比較均衡。在PASCAL VOC資料集上,使用平衡取樣效能可以提升約0.7個點。