1. 程式人生 > >後ImageNet時代李飛飛視覺基因組重磅計劃

後ImageNet時代李飛飛視覺基因組重磅計劃

儘管在感知的任務上(例如影象分類)計算機有很多進展,但是在認知的任務上(例如影象描述和問答),計算機表現的不怎麼樣。如果我們不僅僅訴求識別出影象,而要深究我們視覺世界的意義,那麼認知是最核心的任務。被用於解決圖片內容豐富的認知任務的模型,依然使用給感知任務設計的相同資料集來訓練。要在認知任務中獲得成功,模型需要理解物件和物體之間的互動和關係。當問道:“這個人正在騎著什麼交通工具?”的時候,計算機需要識別出圖片中的物體,以及裡面的關係“騎行”(人、馬車)和“拉車”(馬、馬車),這樣才能正確回答“這個人正坐著馬車”。