1. 程式人生 > >掃盲記-第一篇

掃盲記-第一篇

方式 bound 標記 語義 一個 pix 輸出 復雜 區別

superpixels(超像素)

超像素於2003年提出,是指具有相似紋理、顏色、亮度等特征的相鄰像素構成的有一定視覺意義的不規則像素塊。它利用像素之間特征的相似性將像素分組,用少量的超像素代替大量的像素來表達圖片特征,很大程度上降低了圖像後處理的復雜度,所以通常作為分割算法的預處理步驟。第一次聽說這個超像素很容易理解錯誤,以為是在普通的像素基礎上繼續向微觀細分,這樣理解就恰好理解反了。其實,超像素是一系列像素的集合,這些像素具有類似的顏色、紋理等特征,距離也比較近。需要註意的是,超像素很可能把同一個物體的不同部分分成多個超像素。

Semantic Segmentation(語義分割)

語義分割還是比較常見的,就是把圖像中每個像素賦予一個類別標簽(比如汽車、建築、地面、天空等),常采樣不同顏色進行區別,如草地(淺綠)、人(紅色)、樹木(深綠)、天空(藍色)等標簽,用不同的顏色來表示。不過這種分割方式存在一些問題,比如一個像素被標記為紅色,若代表這個像素所在的位置是一個人,但是如果有兩個都是紅色的像素,這種方式就無法判斷它們是屬於同一個人還是不同的人,也就是說語義分割只能判斷類別,無法區分個體

Instance Segmentation(實例分割)

實例分割方式類似於物體檢測,物體檢測一般輸出的是 bounding box,而實例分割輸出的是一個蒙版-mask。實例分割與語義分割不同,它不需要對每個像素進行標記,它只需要找到感興趣物體的邊緣輪廓就行,比如一幅圖中的人就是感興趣的物體,每個人都用不同的顏色的輪廓標記,因此可以很容易區分出單個個體。

Panoptic Segmentation(全景分割)

全景分割是語義分割和實例分割的結合體。將每個像素劃分為一類,如果一種類別裏有多個實例,會用不同的顏色進行區分,很清楚的知道哪個像素屬於哪個類中的哪個實例,因此可以通過蒙版-mask的顏色很容易分辨出不同的實例。

超分辨率技術

超分辨率技術(Super-Resolution, SR是指從觀測到的低分辨率圖像重建出相應的高分辨率圖像,在監控設備、衛星圖像和醫學影像等領域都有重要的應用價值。

掃盲記-第一篇