1. 程式人生 > >目標檢測演算法基礎知識(二)-卷積神經網路知識

目標檢測演算法基礎知識(二)-卷積神經網路知識

1.什麼是filter 通常一個6x6的灰度影象,構造一個3*3的矩陣,在卷積神經網路中稱之為filter,對6x6的影象進行卷積運算。

2.什麼是padding 假設輸出影象大小為nn與過濾器大小為ff,輸出影象大小則為(n−f+1)∗(n−f+1)(n−f+1)∗(n−f+1)(n-f+1)(n-f+1)。 這樣做卷積運算的缺點是,卷積影象的大小會不斷縮小,另外影象的左上角的元素只被一個輸出所使用,所以在影象邊緣的畫素在輸出中採用較少,也就意味著你丟掉了很多影象邊緣的資訊,為了解決這兩個問題,就引入了padding操作,也就是在影象卷積操作之前,沿著影象邊緣用0進行影象填充。對於33的過濾器,我們填充寬度為1時,就可以保證輸出影象和輸入影象一樣大。

padding的兩種模式: Valid:no padding 輸入影象nn,過濾器ff,輸出影象大小為:(n−f+1)∗(n−f+1) Same:輸出影象和輸入影象一樣大

3.卷積步長 卷積步長是指過濾器在影象上滑動的距離,前兩部分步長都預設為1

4.最大池化和平均池化 最大池化思想很簡單,把44的影象分割成4個不同的區域,然後輸出每個區域的最大值,這就是最大池化所做的事情。其實這裡我們選擇了22的過濾器,步長為2。在一幅真正的影象中提取最大值可能意味著提取了某些特定特徵,比如垂直邊緣、一隻眼睛等等。 平均池化和最大池化唯一的不同是,它計算的是區域內的平均值而最大池化計算的是最大值。在日常應用使用最多的還是最大池化