計算機視覺經典任務分類
一、經典任務
計算機視覺領域中和目標有關的經典任務有三種:分類、檢測和分割。其中分類是為了告訴你「是什麼」,後面兩個任務的目標是為了告訴你「在哪裡」,而分割任務將在畫素級別上回答這個問題。
二、幾種專業名詞的含義
目標檢測,搜尋系統感興趣的目標區域;
目標跟蹤,捕獲感興趣區域的運動軌跡;
目標分類,將被跟蹤目標分為人,汽車或其他移動物體;
目標行為識別,對跟蹤目標進行行為識別。
立體視覺匹配,是一種從平面圖像中恢復深度資訊的技術。
光流,是指影象灰度模式的表面運動,是三維運動場在二維影象平面上的投影。
場景流,是空間中場景運動形成的三維運動場。兩者在視訊跟蹤與監控,自主機器人導航,三維視訊壓縮與顯示等領域有著廣泛的應用。
三、KITTI資料集(非常重要)
對於KITTI資料集,該資料集用於評測立體影象(stereo),光流(optical flow),視覺測距(visual odometry),3D物體檢測(object detection)和3D跟蹤(tracking)等計算機視覺技術在車載環境下的效能。
四、幾種深度學習演算法含義
FCNN:全卷積網路:並行,迭代
CNN:FCNN基礎上加入空間結構引數共享
RNN:FCNN基礎上加入時間結構引數共享
五、論文彙總總結
1、機器學習,深度學習在影象,語音等富媒體的分類和識別上取得了非常好的效果,所以各大研究機構和公司都投入了大量的人力做相關的研究和開發。值得我們學習。
2、光流法,場景流法,立體視覺匹配對於視訊處理有至關重要的功能。
3、KITTI官網上有大量關於光流,場景流和立體視覺匹配演算法以及對比,我們可以借鑑並加以引用。
六、論文以及原始碼常用網站
七、幾個搜原始碼的國內網站:
八、有關人工智慧比較好的開源社群
廖雪峰Python教程: