1. 程式人生 > >計算機視覺經典任務分類

計算機視覺經典任務分類

一、經典任務

計算機視覺領域中和目標有關的經典任務有三種:分類、檢測和分割。其中分類是為了告訴你「是什麼」,後面兩個任務的目標是為了告訴你「在哪裡」,而分割任務將在畫素級別上回答這個問題。


二、幾種專業名詞的含義

目標檢測,搜尋系統感興趣的目標區域;

目標跟蹤,捕獲感興趣區域的運動軌跡;

目標分類,將被跟蹤目標分為人,汽車或其他移動物體;

目標行為識別,對跟蹤目標進行行為識別。

立體視覺匹配,是一種從平面圖像中恢復深度資訊的技術。

光流,是指影象灰度模式的表面運動,是三維運動場在二維影象平面上的投影。

場景流,是空間中場景運動形成的三維運動場。兩者在視訊跟蹤與監控,自主機器人導航,三維視訊壓縮與顯示等領域有著廣泛的應用。

三、KITTI資料集(非常重要)

對於KITTI資料集,該資料集用於評測立體影象(stereo),光流(optical flow),視覺測距(visual odometry),3D物體檢測(object detection)和3D跟蹤(tracking)等計算機視覺技術在車載環境下的效能。

四、幾種深度學習演算法含義

FCNN:全卷積網路:並行,迭代

CNN:FCNN基礎上加入空間結構引數共享

RNN:FCNN基礎上加入時間結構引數共享

五、論文彙總總結

       1、機器學習,深度學習在影象,語音等富媒體的分類和識別上取得了非常好的效果,所以各大研究機構和公司都投入了大量的人力做相關的研究和開發。值得我們學習。

       2、光流法,場景流法,立體視覺匹配對於視訊處理有至關重要的功能。

       3、KITTI官網上有大量關於光流,場景流和立體視覺匹配演算法以及對比,我們可以借鑑並加以引用。

六、論文以及原始碼常用網站

七、幾個搜原始碼的國內網站:

八、有關人工智慧比較好的開源社群

廖雪峰Python教程: