1. 程式人生 > >《小超教你寫論文》第三篇-Caltech Pedestrain Benchmark,很利於研究的行人檢測資料庫介紹

《小超教你寫論文》第三篇-Caltech Pedestrain Benchmark,很利於研究的行人檢測資料庫介紹

《小超教你寫論文》系列第三篇-Caltech PedestrianBenchmark介紹(小弟認為,目前最好用的資料庫)

這裡是《小超教你寫論文》系列第三篇。眾所周知,做ComputerVision研究最重要的是資料庫。由於CV主要處理圖片和視訊,所以資料容量會非常大,又由於CV研究多是目的依賴型,所以不同場景同一演算法的performance可能會差很多,因此一個內容豐富且國際通用的資料庫就很重要。

如果你真在做有關行人檢測的研究,無論你現在是用的INRIA資料庫還是PASCAL資料庫,我都建議你使用Caltech PedestrianBenchmark資料庫,它是由Caltech(加州理工,夢想中的學校,泰晤士報排名世界第一,高於牛津,斯坦福,哈佛)的一個視覺小組整理的,有著豐富的標註,也極具挑戰性。

下面對Caltech Pedestrian Benchmark做個簡單介紹,更詳細內容可以參照2012年的PAMI

為了形成資料庫,作者收集了僅10小時的30Hz視訊(約百萬幀),視訊在市區場景下行駛的汽車上的相機拍攝。而後從10小時的視訊中,作者選取了137分鐘,約250000幀影象,裡面約含2300個單獨行人,作者標註了350000個BBs(bounding box)。完成整個工作耗費了作者400小時時間,外國研究人員的努力令人膽顫啊,小弟已跪拜。

通過上面,我們可以看到此資料庫資料量還是可以的(目前最大),那麼型別是否足夠豐富呢,作者在文章中有著詳細介紹,這裡轉述一下。

1.尺寸方面

  一般的資料庫中行人大小在100pixel左右,如INRIA平均279,ETH平均90,而真正在實際應用中,根據圖1的scene geometry,以時速55Km/h計算,我們可以算的pedestrian在30到80pixel之間才能給司機提供足夠預警時間。而30到80畫素的行人正是Caltech的最主要行人資料,在其中佔到69%,且benchmark的平均行人高度為48,符合實際情況。

2.遮擋方面

一般資料庫中,只給出正當後的標註,而Caltech他們不但標出了遮擋的行人,還標出了可見部分和整體部分。這樣,我們就可以將資料庫根據遮擋情況分為不同的型別,如沒遮擋,部分遮擋,嚴重遮擋等進行研究。

3位置方面

這個方面的統計資料,對於演算法研究沒有很重要意義,但是對於實際應用是種啟示。因為如果實際application中真的裝在車上,那麼行人在27度視場角情況下,一般分佈在視場中部。

之所以推薦這個資料庫,除了資料庫本身特點外,還因為作者用此資料庫測試了幾乎全部主流行人檢測演算法,且測試結果放在了網站上,非常方便我們進行對比。

另外,既然是將寫文章的系列,最終還是要回到寫文章上。寫文章最重要的不是確定演算法,或是提出模型,最重要的是尋找問題和切入點。那麼,行人檢測,或是此資料上的研究有哪些問題和切入點呢?作者為了促進研究,也給我們總結了7點,小弟竊取出來,大家一起研究啊。

1.小尺寸 換句話說,就是低解析度。由以上可知,在實際應用中,低解析度是很重要且必須解決的問題,但由於以前資料庫的原因,大多研究集中在較高解析度的行人部分,有了Caltech資料庫,希望大家能看重並解決這個問題。

2.遮擋     遮擋問題由來已久,研究也不少。但以前沒有資料庫將遮擋問題做出這麼詳細的分類,因此,Caltech資料庫的出現更方便了大家的研究。

3運動     自古,檢測和跟蹤不分家,兩者還可以互相促進。還記得有大神在HOG之後直接提出HOF,利用能表示運動的光流場來作為特徵。行人,Pedestrian,不是Human,特徵之一就是motion。能利用motion最為特徵,是很好的創新點。

4短時整體 與3中思想一樣,雖然檢測不同於跟蹤,但若能結合兩者特徵,從幾幀,即從短時整體的角度去看待問題,一定會有不小的收穫哦。

5上下文    馬克思主義哲學說,萬事萬物都是有聯絡的。找到其中的聯絡,我們就能有更強的能力,整體和部分,內部和外界,過去和現在和未來,找到聯絡,找到上下文,就能取得更好的效果。

6新型特徵   特徵是一種模型,愛因斯坦說所有模型都是錯誤的。所以,小弟敢說,所有特徵都是不完美的,一定有更好的特徵存在。當然,大家都知道這有多難,但你想想,一個新穎的特徵,能直接將你送到學術頂尖位置,想想都爽。。。。這個創新點,很好很強大,你們努力吧,小弟自認資質愚鈍,這個方面就不想了

7資料     現在,大部分研究都是基於INRIA資料庫的,作者希望大家能使用Caltech資料庫。將你的演算法在新的資料庫上試試,思考一下結果的問題和原因,說不定能發現演算法缺陷,或迸發出新的想法呢。

好了,《小超教你寫論文》系列第三篇就寫到這了,總之,強烈向所有做行人檢測的人推薦Caltech資料庫。第四篇本來準備寫第一篇文章對應的程式碼實現及解析呢,但現在想想沒有時間了,還是趕緊想想自己文章的創新點和演算法吧。所以,下一篇,應該是新文章的創新點探索分析講解。

忘了說了,資料庫在作者網站上有,網址在文中連結的PAMI文章中有。