1. 程式人生 > >【ENVI入門系列】13.遙感影象監督分類

【ENVI入門系列】13.遙感影象監督分類

目錄

遙感影象監督分類    

1.概述    

2.詳細操作步驟    

第一步:類別定義/特徵判別    

第二步:樣本選擇    

第三步:分類器選擇    

第四步:影像分類    

第五步:分類後處理    

第六步:精度驗證  

1.概述

監督分類,又稱訓練分類法,用被確認類別的樣本像元去識別其他未知類別像元的過程。它就是在分類之前通過目視判讀和野外調查,對遙感影象上某些樣區中影像地物的類別屬性有了先驗知識,對每一種類別選取一定數量的訓練樣本,計算機計算每種訓練樣區的統計或其他資訊,同時用這些種子類別對判決函式進行訓練,使其符合於對各種子類別分類的要求,隨後用訓練好的判決函式去對其他待分資料進行分類。使每個像元和訓練樣本作比較,按不同的規則將其劃分到和其最相似的樣本類,以此完成對整個影象的分類。

遙感影像的監督分類一般包括以下6個步驟,如下圖所示:


圖1.1 監督分類步驟

本課程以Landsat tm5資料Can_tmr.img為資料來源,學習ENVI中的監督分類過程。

2.詳細操作步驟

第一步:類別定義/特徵判別

根據分類目的、影像資料自身的特徵和分類區收集的資訊確定分類系統;對影像進行特徵判斷,評價影象質量,決定是否需要進行影像增強等預處理。這個過程主要是一個目視檢視的過程,為後面樣本的選擇打下基礎。

啟動ENVI5.1,開啟待分類資料:can_tmr.img。以R:TM Band 5,G: TM Band 4,B:TM Band 3波段組合顯示。

通過目視可分辨六類地物:林地、草地/灌木、耕地、裸地、沙地、其他六類。

第二步:樣本選擇

(1)在圖層管理器Layer Manager中,can_tmr.img圖層上右鍵,選擇"New Region Of Interest",開啟Region of Interest (ROI) Tool面板,下面學習利用選擇樣本。

1)在Region of Interest (ROI) Tool面板上,設定以下引數:

  • ROI Name:林地
  • ROI Color:

    圖2.1 Region of Interest (ROI) Tool面板上設定樣本引數

    2)預設ROIs繪製型別為多邊形,在影像上辨別林地區域並單擊滑鼠左鍵開始繪製多邊形樣本,一個多邊形繪製結束後,雙擊滑鼠左鍵或者點選滑鼠右鍵,選擇Complete and Accept Polygon,完成一個多邊形樣本的選擇;

    3)同樣方法,在影象別的區域繪製其他樣本,樣本儘量均勻分佈在整個影象上;

    4)這樣就為林地選好了訓練樣本。

    注:1、如果要對某個樣本進行編輯,可將滑鼠移到樣本上點選右鍵,選擇Edit record是修改樣本,點選Delete record是刪除樣本。

    2、一個樣本ROI裡面可以包含n個多邊形或者其他形狀的記錄(record)。

    3、如果不小心關閉了Region of Interest (ROI) Tool面板,可在圖層管理器Layer Manager上的某一類樣本(感興趣區)雙擊滑鼠。

(2)在影象上右鍵選擇New ROI,或者在Region of Interest (ROI) Tool面板上,選擇工具。重複"林地"樣本選擇的方法,分別為草地/灌木、耕地、裸地、沙地、其他5類選擇樣本;

(3)如下圖為選好好的樣本。

圖2.2訓練樣本的選擇

(4)計算樣本的可分離性。在Region of Interest (ROI) Tool面板上,選擇Option>Compute ROI Separability,在Choose ROIs面板,將幾類樣本都打勾,點選OK;

(5)表示各個樣本型別之間的可分離性,用Jeffries-Matusita, Transformed Divergence引數表示,這兩個引數的值在0~2.0之間,大於1.9說明樣本之間可分離性好,屬於合格樣本;小於1.8,需要編輯樣本或者重新選擇樣本;小於1,考慮將兩類樣本合成一類樣本。

圖2.3樣本可分離性計算報表

注:1、在圖層管理器Layer Manager中,可以選擇需要修改的訓練樣本。

2、在Region of Interest (ROI) Tool面板上,選擇Options > Merge (Union/Intersection) ROIs,在Merge ROIs面板中,選擇需要合併的類別,勾選Delete Input ROIs。

圖2.4 Merge ROIs面板

(6)在圖層管理器中,選擇Region of interest ,點選右鍵,save as,儲存為.xml格式的樣本檔案。

注:1、早期版本的感興趣檔案格式為.roi,新版本的為.xml,新版本完全相容.roi檔案,在Region of Interest (ROI) Tool面板上,選擇File>Open開啟.xml或.roi檔案。

2、新版本的.xml樣本檔案(感興趣區檔案)可以通過,File>Export>Export to Classic選單儲存為.roi檔案。

第三步:分類器選擇

根據分類的複雜度、精度需求等確定哪一種分類器。目前ENVI的監督分類可分為基於傳統統計分析學的,包括平行六面體、最小距離、馬氏距離、最大似然,基於神經網路的,基於模式識別,包括支援向量機、模糊分類等,針對高光譜有波譜角(SAM),光譜資訊散度,二進位制編碼。下面是幾種分類器的簡單描述。

  • 平行六面體(Parallelepiped)

根據訓練樣本的亮度值形成一個n維的平行六面體資料空間,其他像元的光譜值如果落在平行六面體任何一個訓練樣本所對應的區域,就被劃分其對應的類別中。

  • 最小距離(Minimum Distance)

利用訓練樣本資料計算出每一類的均值向量和標準差向量,然後以均值向量作為該類在特徵空間中的中心位置,計算輸入影象中每個像元到各類中心的距離,到哪一類中心的距離最小,該像元就歸入到哪一類。

  • 馬氏距離(Mahalanobis Distance)

計算輸入影象到各訓練樣本的協方差距離(一種有效的計算兩個未知樣本集的相似度的方法),最終技術協方差距離最小的,即為此類別。

  • 最大似然(Maximum Likelihood)

假設每一個波段的每一類統計都呈正態分佈,計算給定像元屬於某一訓練樣本的似然度,像元最終被歸併到似然度最大的一類當中。

  • 神經網路(Neural Net)

指用計算機模擬人腦的結構,用許多小的處理單元模擬生物的神經元,用演算法實現人腦的識別、記憶、思考過程。

  • 支援向量機(Support Vector Machine)

支援向量機分類(Support Vector Machine或SVM)是一種建立在統計學習理論(Statistical Learning Theory或SLT)基礎上的機器學習方法。SVM可以自動尋找那些對分類有較大區分能力的支援向量,由此構造出分類器,可以將類與類之間的間隔最大化,因而有較好的推廣性和較高的分類準確率。

  • 波譜角(Spectral Angle Mapper)

它是在N維空間將像元與參照波譜進行匹配,通過計算波譜間的相似度,之後對波譜之間相似度進行角度的對比,較小的角度表示更大的相似度。

……

第四步:影像分類

基於傳統統計分析的分類方法引數設定比較簡單,在Toolbox/Classification/Supervised Classification能找到相應的分類方法。這裡選擇支援向量機分類方法。在toolbox中選擇/Classification/Supervised Classification/Support Vector Machine Classification,選擇待分類影像,點選OK,按照預設設定引數輸出分類結果。

圖2.5 支援向量機分類器引數設定

圖2.6 支援向量機分類結果

第五步:分類後處理

包括更改類別顏色、分類後統計、小斑塊處理、柵矢轉換等,這部分專門有一節課講解。在此不做敘述。

第六步:精度驗證

對分類結果進行評價,確定分類的精度和可靠性。有兩種方式用於精度驗證:一是混淆矩陣,二是ROC曲線,比較常用的為混淆矩陣,ROC曲線可以用圖形的方式表達分類精度,比較抽象。

真實參考源可以使用兩種方式:一是標準的分類圖,二是選擇的感興趣區(驗證樣本區)。兩種方式的選擇都可以通過主選單->Classification->Post Classification->Confusion Matrix或者ROC Curves來選擇。

真實的感興趣區驗證樣本的選擇可以是在高解析度影像上選擇,也可以是野外實地調查獲取,原則是獲取的類別參考源的真實性。由於沒有更高解析度的資料來源,本例中就把原分類的TM影像當作是高解析度影像,在上面進行目視解譯得到真實參考源。

(1)在Data Manager中,分類樣本上右鍵選擇Close,將分類樣本從軟體中移除

(2)直接利用ROI工具,跟分類樣本選擇的方法一樣,即重複第二步,在TM圖上選擇6類驗證樣本。

注:可直接File>open,開啟can_tm-驗證樣本.roi。

圖2.7選擇驗證樣本

(3)在Toolbox中,選擇/Classification/Post Classification/Confusion Matrix Using Ground Truth ROIs,選擇分類結果,軟體會根據分類程式碼自動匹配,如不正確可以手動更改。點選OK後選擇報表的表示方法(畫素和百分比),點選OK,就可以得到精度報表。

圖2.8 驗證操作面板

圖2.9分類精度評價混淆矩陣

下面對混淆矩陣中的幾項評價指標進行說明:

  • 總體分類精度

等於被正確分類的像元總和除以總像元數。被正確分類的像元數目沿著混淆矩陣的對角線分佈,總像元數等於所有真實參考源的像元總數,如本次精度分類精度表中的Overall Accuracy = (1849/2346) 78.8150%。

  • Kappa係數

它是通過把所有真實參考的像元總數(N)乘以混淆矩陣對角線(XKK)的和,再減去某一類中真實參考像元數與該類中被分類像元總數之積之後,再除以像元總數的平方減去某一類中真實參考像元總數與該類中被分類像元總數之積對所有類別求和的結果。

 Kappa計算公式

  • 錯分誤差

指被分為使用者感興趣的類,而實際屬於另一類的像元,它顯示在混淆矩陣裡面。本例中,林地有419個真實參考像元,其中正確分類265,12個是其他類別錯分為林地(混淆矩陣中林地一行其他類的總和),那麼其錯分誤差為12/419=2.9%。

  • 漏分誤差

指本身屬於地表真實分類,當沒有被分類器分到相應類別中的像元數。如在本例中的耕地類,有真實參考像元465個,其中462個正確分類,其餘3個被錯分為其餘類(混淆矩陣中耕地類中一列裡其他類的總和),漏分誤差為3/465=0.6%

  • 製圖精度

是指分類器將整個影像的像元正確分為A類的像元數(對角線值)與A類真實參考總數(混淆矩陣中A類列的總和)的比率。如本例中林地有419個真實參考像元,其中265個正確分類,因此林地的製圖精度是265/419=63.25%。

  • 使用者精度

是指正確分到A類的像元總數(對角線值)與分類器將整個影像的像元分為A類的像元總數(混淆矩陣中A類行的總和)比率。如本例中林地有265個正確分類,總共劃分為林地的有277,所以林地的使用者精度是265/277=95.67%。

注:監督分類中的樣本選擇和分類器的選擇比較關鍵。在樣本選擇時,為了更加清楚的檢視地物型別,可以適當的對影象做一些增強處理,如主成分分析、最小噪聲變換、波段組合等操作,便於樣本的選擇;分類器的選擇需要根據資料來源和影像的質量來選擇,比如支援向量機對高解析度、四個波段的影像效果比較好。

本課操作步驟總結

第一步:類別定義/特徵判別
啟動ENVI5.1,開啟待分類資料:window---available bands lists----file---open image file---開啟can_tmr.img。以R:TM Band 5,G: TM Band 4,B:TM Band 3波段組合顯示---Load RGB.
通過目視可分辨六類地物:林地、草地/灌木、耕地、裸地、沙地、其他六類。


第二步:樣本選擇
(1)在圖層管理器Layer Manager中,can_tmr.img圖層上右鍵,overlay---選擇"New Region Of Interest",開啟Region of Interest (ROI) Tool面板,下面學習利用選擇樣本。
New Region----ROI name的名字可以修改,中文輸入後回車----ROI_Type---window選擇ZOOM---繪製樣本右鍵閉合------對六類地物分別選取樣本


第三步:樣本驗證:

 定量:option---Compute ROI Separability(計算ROI的可分離性)---OK---select all items---OK---分離的值大於1.8是合格的小於1.4考慮合併,小於1.8考慮從新選樣本,一般裸地和草地容易混淆

變性:file---Export ROIs to n-D Visualizer---OK---select all items---OK---根據n-D Visualizer視窗的顏色把容易混淆的合併或刪除,在視窗圈選區域,改變類別顏色選Class----items 1:20-----選擇要改變的顏色-----option---Export ALL---從新樣本驗證直到符合要求