計算機視覺是一個專注於分析並深層次理解影象和視訊資料的人工智慧領域。計算機視覺領域最常見的問題包括:

① 影象分類

影象分類是教模型去識別給定的影象的一種計算機視覺任務。例如,訓練一個模型去識別公共場景下的多個物體(這可以應用於自動駕駛)。

② 目標檢測

目標檢測是教模型從一系列預定義的類別中檢測出某一類別的例項,並用矩形框框注出來的一種計算機視覺任務。例如,利用目標檢測來構建人臉識別系統。模型可以在圖片中檢測出每張臉並畫出對應的矩形框(順便說下,影象分類系統只能識別出一張圖片中是否有臉的存在,而不能檢測出臉的位置,而目標檢測系統就可以)。

③ 影象分割

影象分割是訓練模型去標註類的每一個畫素值,並能大致確定給定畫素所屬的預定義類別的一種計算機視覺任務。

顯著性檢測

顯著性檢測是訓練模型產生最顯著區域的一種計算機視覺任務。這可以用於確定視訊中廣告牌的位置。需要詳細瞭解計算機視覺?請閱讀 https://sigmoidal.io/dl-computer-vision-beyond-classification/