1. 程式人生 > >Google Brain與牛津大學主持最新《計算機視覺前沿》報告 總結

Google Brain與牛津大學主持最新《計算機視覺前沿》報告 總結

       該報告將ANN在CV的應用分為2大階段,時間節點是2012年。Befrore 2012 and enter CNNs。

       Before 2012,multi-step approach。該類主要是以編碼的方式提取human engineered features。提取特徵的出發點包括四個方面:                                                                                                 

1. Histogram of image pixel intensities   

                              

2. Bag of Visual Words

                                            

3. Histogram of Oriented Gradients

                                                  

兩個階段進行對比,則有

       該報告中一個主要的觀點是:While CNNs have provided stunning gains in accuracy, there appear to be other properties that are desirable to measure given a representation. Accuracy alone may not be sufficient.

為此,提出了其他指標作以輔助。

       上述指標主要為AI界通識性的問題,具體可以解釋如下:

問題是:Can we train more compact representations with comparable accuracy?

同時,報告指出了CV的關鍵挑戰,

可以解釋如下:

-Less progress as soon as task deviates from the ImageNet template

-Domain adaptation - training set is not representative of data in real life.

最後,貼上這一部分的總結

最後,說一下自己的感受,從PPT並未看出這份報告太有價值的部分,也有很大可能是沒有聽現場報告,所以覺得很空。

Ps: 一直以來想寫Blog總結一下自己的收穫,但是總感覺這是一件time-consuming的事情。所以,這篇處女座寫的也很焦躁,希望自己一步步可以寫出更好的內容。