1. 程式人生 > >目標檢測網路之 YOLOv3

目標檢測網路之 YOLOv3

yolo-idea

yolo-idea

本文逐步介紹YOLO v1~v3的設計歷程。

YOLOv1基本思想

YOLO將輸入影象分成SxS個格子,若某個物體 Ground truth 的中心位置的座標落入到某個格子,那麼這個格子就負責檢測出這個物體。

yolo-grid-predict

yolo-grid-predict

每個格子預測B個bounding box及其置信度(confidence score),以及C個類別概率。bbox資訊(x,y,w,h)為物體的中心位置相對格子位置的偏移及寬度和高度,均被歸一化.置信度反映是否包含物體以及包含物體情況下位置的準確性,定義為Pr(Object)×IOUtruthpred,Pr(Object){0,1}