1. 程式人生 > >NMS—非極大值抑制演算法的理解

NMS—非極大值抑制演算法的理解

一、概念

在目標檢測中,得到多個候選框及其置信度得分。非極大值抑制演算法(NMS)對多個候選框,去除重合率大的冗餘候選框,得到最具代表性的結果,以加快目標檢測的效率。

二、例項

以下圖人臉檢測為例,目標:消除重合率大且多餘的候選框,保留某個區域的一個最優的候選框。

非極大值抑制演算法(NMS)抑制冗餘的框, 抑制的過程是一個迭代-遍歷-消除的過程。

這裡寫圖片描述

1)將所有框的得分排序,選中最高分及其對應的框

a) 假設圖中有A:0.75、B:0.98 、C:0.83、D:0.67、E:0.81

b) 將置信度升序排序為D:0.67、A:0.75、E:0.81、C:0.83、B:0.98

c) 選中得分最高的B:0.98

2)遍歷其餘的框,如果和當前最高分框的重疊面積(IOU)大於一定閾值,我們就將框刪除。

a)由B:0.98對其餘A、C、D、E框計算IOU,B與A、C的IOU>閾值,刪除A、C框。

b)第一輪得到B:0.98、D:0.67、E:0.81

這裡寫圖片描述

3) 從未處理的D、E框中繼續選一個得分最高的,重複上述過程。

a) 刪除D框,保留E

b) 最後保留B、E框

這裡寫圖片描述

三、Python程式碼

#候選框boxes為5列,分別是[x1 y1 x2 y2 score],score為置信度得分
#threshold: IOU閾值
def py_nms(dets, thresh):

    #取出候選框左上角和右下角座標以及置信度得分
    x1 = dets[:, 0]
    y1 = dets[:, 1]
    x2 = dets[:, 2]
    y2 = dets[:, 3]
    scores = dets[:, 4]
    
    #計算每一個框的面積
    areas = (x2 - x1 + 1) * (y2 - y1 + 1)
    #按照置信度升序排列
    order = scores.argsort()[::-1]

    keep = []
    #迴圈直至所有框處理完成
    while order.size > 0:
        i = order[0]
        keep.append(i)
        #計算當前置信度最大矩形框與其他矩形框的重疊面積
        xx1 = np.maximum(x1[i], x1[order[1:]])
        yy1 = np.maximum(y1[i], y1[order[1:]])
        xx2 = np.minimum(x2[i], x2[order[1:]])
        yy2 = np.minimum(y2[i], y2[order[1:]])
        w = np.maximum(0.0, xx2 - xx1 + 1)
        h = np.maximum(0.0, yy2 - yy1 + 1)
        inter = w * h
        
        #計算IOU
        ovr = inter / (areas[i] + areas[order[1:]] - inter)

        #保留所有重疊面積小於閾值的框
        inds = np.where(ovr <= threshold)[0]
        order = order[inds + 1]