1. 程式人生 > >基於深度卷積神經網路的高光譜遙感影象分類---PCA+2D-CNN(偽空譜特徵)

基於深度卷積神經網路的高光譜遙感影象分類---PCA+2D-CNN(偽空譜特徵)

論文地址

基於深度卷積神經網路的高光譜遙感影象分類西華大學學報

同時利用高光譜影象的光譜資訊和空間資訊的深度卷積神經網路分類模型。基於深度學習到的深度特徵,用邏輯迴歸分類器進行分類訓練。

高光譜影象面臨的挑戰:

Hughes現象:在高光譜遙影像中,當訓練樣本數目有限時,分類精度隨著影象波段數目的增加先增加,在達到一定極值後,分類精度隨著波段數目的增加而下降。

同物異譜

異物同譜

現有方法:隨機森林、決策樹、神經網路、支援向量樹

我的方法:fcn_2d、fcn_3d、3D_CNN、2D_CNN、unet這5種方法,目前已知cnn是用來做影象分類的,而剩下三種都是做影象分割的,這個轉化,還是需要說清楚的。Pixel to pixel畫素級別的方法

傳統方法只考慮光譜資訊,未考慮到空間資訊(相鄰的畫素很有可能屬於同一類)

提取光譜:

提取空間特徵:Gabor紋理特徵、灰度共生矩陣、小波變換特徵提取、支援向量機….

提出一種同時考慮畫素光譜資訊和空間資訊的深度卷積神經網路框架。 該框架主要步驟如下:首先利用主成分分析法對高光譜遙感影象進行光譜特徵提取,消除特徵之間的相關性,並降低特徵維數,獲得清晰的空間結構;然後利用深度卷積神經網路對輸入的樣本進行空間特徵提取;最後通過學習到的高階特徵進行邏輯迴歸訓練。

深度卷積網路:

包括卷積層、下采樣(downsample)、全連線層、softmax分類器、啟用函式

在FCN中還有上取樣(upsample),是對應的,下采樣包括meanpooling(均值取樣)、maxpooling(最大池化取樣)、overlapping(重疊取樣)、L2pooling(均方取樣)、Localcontrsatnormalization(歸一化取樣)、stochasticpooling(隨機取樣)、def-pooling(形變約束採用)

上取樣的有兩種,目前採用的就是比較簡單的又放回抽樣,每次成倍增加樣本數量。

核心思想就是將稀疏連線、權值共享以及池取樣這三種思想結合起來,從而獲得某種程度上的位置、尺度、形變的不變性。對輸入資料在空間和時間上有很強的魯棒性。卷積層完成特徵提取,使特徵訊號增強,並降低噪聲,下采樣利用區域性影象相關性原理對影象進行自抽樣,減少資料維度的同事有保留有用資訊。

資料預處理:二維輸入,提取主要的光譜資訊,高光譜資料的內在資料結構為三維張量,為了與DCNN的輸入保持一致,必須將高光譜影象分解成patches,其中每個patch包含一個特定畫素的光譜和空間資訊,將所獲得的包含特定畫素的光譜和空間資訊patches作為DCNN的輸入,然後利用DCNNS分層構建高階特徵。

模型結構:


實驗結果及分析:

The University of Pavia資料集

610*340畫素

空間解析度是1.3m/pixel,共包含115個波段,其波長範圍為0.43到0.86,但由於噪聲和大氣吸收等因素,12個波段被剔除,103個波段被保留。包括9個類別。

其中9%為訓練樣本,剩餘的標記資料作為測試集。

從103個波段中提取3個波段作為光譜特徵,這3個波段至少包含了98%的原始影象的資訊。(感覺這一下子變成了三基色的影象,沒什麼區別了)

實驗評價指標:

總體精度OA:正確分類樣本的百分比

平均精度AA:每類中正確分類樣本的百分比的平均值

KAPPA係數(k):判斷影象一致性的程度

視覺化卷積過程

迭代次數和精度之間的關係

混淆矩陣