1. 程式人生 > >基於深度學習的遙感影象分類總概

基於深度學習的遙感影象分類總概

部落格轉載自:https://blog.csdn.net/qq_40116035/article/details/81414835
傳統的分類方法分兩種:監督分類和非監督分類。監督分類要求對所要分類的地區必須要有先驗的類別知識,即先要從所研究地區中選擇出所有要區分的各類地物的訓練區,用於建立判別函式。常用的監督分類方法有:K近鄰法、馬氏距離分類、最大似然法等方法。監督分類方法主要有:均值、方法等。研究者對非監督分類產生的類別較難控制監督分類,結果通常不理想。
近年來,分類方法逐漸向機器學習的方向發展。傳統機器學習方法,如Smolensky的受限玻爾茲曼機(Restricted Boltzmann Machine, RBM)[2]、Olshausen和Field的稀疏編碼(Sparse Coding, SC[3])等,大都使用淺層結構,處理有限數量的樣本。當目標物件具有豐富含義時,基於這些淺層結構學習到的特徵表達,在處理複雜的分類問題時,表現效能及泛化能力均有明顯不足。2006年,Hinton等[4]基於人腦學習的思想提出了一種深度神經網路的機器學習方法。深度神經網路(Deep Neural Network,DNN)也稱深度學習(Deep Learning),已成為一種從海量影象資料中直接學習影象特徵表達的強大框架。從計算機視覺的角度提取遙感影象資訊,能夠極大地提高含有大量未知資訊的遙感影象分類的精度。因此,深度學習成為遙感影象分類研究中的熱點。
2 深度學習典型方法和遙感應用
深度學習具有特徵學習和深層結構兩個特點,有利於遙感影象分類精度的提升。特徵學習能夠根據不同的應用自動從海量資料中學習到所需的高階特徵表示,更能表達資料的內在資訊。深層結構通常擁有多層的隱層節點,包含更多的非線性變換,使得擬合複雜模型的能力大大增強。遙感影象中深度學習分類演算法主要可以分監督學習和非監督學習(見圖1)。本文將對DBN、CNN、SAE三種典型的深度學習方法進行論述,並分析上述方法在遙感影象分類中的應用現狀。
2.1深度置信網路(DBN)
深度置信網路(Deep Boltzmann Machine,DBM)是受限玻爾茲曼機(Restricted Boltz Mann machine,RBM)的一種改進網路。RBM是由玻爾茲曼機(Boltz Mann machine,BM)簡化而來。
BM屬於無監督學習(見圖2),其引數空間的每種情況都通過能量函式這一對映法則指向能量域中的一個能量。RBM是一種狀態隨機的網路模型(見圖3),單層內的各單元間無連線,而層間的單元全連線。
雖然RBM能夠很好地解析複雜資料,但是對於複雜度更高的資料或需要更深層次的解析時,需要引入多層次的網路模型,即深度置信網(DBN)。DBN由多層的RBM和一層分類器組成(見圖4)。其訓練過程分為兩步.第一步是對DBN進行網路預訓練,對每層的RBM進行無監督學習;第二步是監督學習網路調整。對無監督學習階段得到的特徵資訊進行總結、歸納、取捨,最後達到一個較好的識別水平。
圖4 深度置信網(DBN)
目前深度信念網路(DBN)應用遙感資料主要有高光譜遙感、合成孔徑側視雷達、高解析度遙感,但主要是經典資料集,需要進一步拓展不同遙感資料應用、不同行業應用。呂啟等[8]利用深度信念網路應用於極化合成孔徑雷達影象分類中,當層數為3、各隱含層節點數為64時,總體分類精度最高,達到77%,好於支援向量機與傳統神經網路方法。劉大偉[9]採用深度信念網路(DBN)採用光譜-紋理特徵對美國佐治亞州亞特蘭市北部一住宅小區的高解析度影像6種地類進行分類。鄧磊等[13]利用深度信念網路解決了極化SAR影象分類中存在海量特徵利用率低、特徵選取主觀性強的問題。方法首先進行海量分類特徵提取,獲得極化類、輻射類、空間類和子孔徑類四類特徵構成的特徵集;然後在特徵集基礎上選取樣本並構建特徵向量,用以輸入到深度置信網路模型之中;最後利用深度置信網路的方法對海量分類特徵進行逐層學習抽象,獲得有效的分類特徵進行分類。採用AIRSAR資料進行實驗,分類結果精度達到91.06%。通過與經典Wishart監督分類、邏輯迴歸分類方法對比,表現了深度置信網路方法在特徵學習方面的突出優勢,驗證了方法的適用性。
2.2深度自動編碼(SAE)
深度自編碼器(Stacked Auto-Encoder, SAE)是改進的自動編碼器(Auto-Encoder, AE)。
AE是由編碼器和解碼器兩部分組成。編碼器將輸入資料對映到特徵空間,解碼器將特徵映射回資料空間,完成對輸入資料的重建。通過最小化重建誤差的約束,學習從輸入到特徵空間的對映關係。為避免輸入簡單複製為重建後的輸出,對AE增加一定的約束條件可變換為不同的形式。
SAE是由AE逐層疊加而成的,它通過對觀測資料進行編碼、解碼特徵表達,來獲得簡潔而有效的特徵,並深度捕獲隱藏在資料內部的規則;為充分利用資料類別、模式等隱含資訊,同樣要對其模型引數進行監督的微調。Liu等[5]構建了wac DAE(小波深度自動編碼器)對光學遙感影象進行山崩自然災害分類研究,該網路先進行小波變換和去噪等預處理,包含1個輸入層、2層隱藏層和1層輸出層,隱藏層節點數固定為100。700張遙感影象作為訓練集500張遙感影象作為測試集。實驗結果表明,wac DAE有利於山崩識別。邢晨[14]利用自編碼器的深度學習網路模型對高光譜遙感影象進行分類。王巧玉[15]採用海量的未標記樣本對網路進行無監督的訓練,從而提取資料深層、抽象的特徵資訊;再將堆疊降噪自編碼器與Soft max分類器組合以形成一個深層分類網路,採用有標記的樣本對網路進行微調。
2.3卷積神經網路(CNN)
卷積神經網路(CNN)是通過模仿生物視覺的處理過程而構建的多階段Hubel-Wiesel
結構。CNN的實質是輸入到輸出的對映關係。在學習之前,輸入和輸出之間沒有明確的數學模型,CNN通過學習大量的輸入與輸出之間的對映,對卷積網路加以訓練,從而建立模型。
2.3.1卷積神經網路內容
CNN的基本網路結構由輸入層、卷積層(convolutional layer)、池化層(pooling layer,也稱取樣層)、全連線層及輸出層構成。其中卷積層、池化層、全連線層有不同的功能。
(1)卷積層。卷積層由多個特徵面(Feature Map)組成,每個特徵面由多個神經元組成,它的每一個神經元通過卷積核與上一層特徵面的區域性區域相連。卷積核是n×n的矩陣。首先從影象中隨機選取一小塊局域作為訓練樣本,從該小塊樣本中學習到一些特徵,然後將這些特徵作為濾波器,與原始整個影象作卷積運算,從而得到原始影象中任一位置上的不同特徵的啟用值。在CNN結構中,深度越深、特徵面數目越多。但並不是深度越深越好,在實際應用中應適當選取網路深度、特徵面數目來實現CNN的應用。
(2)池化層。池化層在卷積層之後。卷積層是池化層的輸入層,卷積層的一個特徵面與池化層中的一個特徵面唯一對應,且池化層的神經元也與其輸入層的區域性接受域相連,不同神經元區域性接受域不重疊。卷積層和池化層交替設定。如果選擇影象中的連續範圍作為池化區域,同時只對相同的隱含神經元產生的卷積特徵使用池化,則這些池化後的特徵單元具有平移不變性。即使原始影象中的物體產生了一個較小的平移,依然 可以得到相同的池化特徵,分類器也依然能夠輸出相同的分類結果。
(3)全連線層。在CNN結構中,經多個卷積層和池化層後,連線著1個或1個以上的全連線層。全連線層可以整合卷積層或者池化層中具有類別區分性的區域性資訊。為了提升CNN網路效能,全連線層每個神經元的激勵函式一般採用ReLU函式。最後一層全連線層的輸出值被傳遞給一個輸出層,可以採用soft max邏輯迴歸(soft max regression)進行分類。對於一個具體的分類任務,選擇一個合適的損失函式是十分重要的。
2.3.2卷積神經網路的優化
自AlexNet提出後,深度學習領域的研究發展極其迅速,基本上每年甚至每幾個月都會出現新一代的技術。新的技術往往伴隨著新的網路結構,更深的網路的訓練方法等,並在影象識別等領域不斷創造新的準確率記錄。卷積神經網路改進與優化的主要模型分別包括AlexNet、VGG、GoogleNet、ResNet等,採取技術不斷優化,網路深度擴大,Top-5錯誤率在減少。
lexNet是一個8層的卷積神經網路,前5層是卷積層,後3層為全連線層,其中最後一層採用softmax進行分類。該模型採用Rectified linear units(ReLU)來取代傳統的Sigmoid和tanh函式作為神經元的非線性啟用函式,並提出了Dropout方法來減輕過擬合問題。
Google Net首次出現在ILSVRC 2014的比賽中(和VGGNet同年),就以較大優勢取得了第一名。那屆比賽中的Inception Net通常被稱為Inception V1,它最大的特點是控制了計算量和引數量的同時,獲得了非常好的分類效能——Top-5錯誤率6.67%,只有AlexNet的一半不到。Inception V1有22層深,比AlexNet的8層或者VGGNet的19層還要更深。但其計算量只有15億次浮點運算,同時只有500萬的引數量,僅為AlexNet引數量(6000萬)的1/12,卻可以達到遠勝於AlexNet的準確率,可以說是優秀並且非常實用的模型。
在2015年年底揭曉的ImageNet計算機視覺識別挑戰賽ILSVRC 2015的結果中,來自微軟亞洲研究院團隊所提出的深達152層的深層殘差網路(ResNet)以絕對優勢獲得影象檢測、影象分類和影象定位3個專案的冠軍,其中在影象分類的資料集上取得了3.57%的錯誤率。同年Long等提出的用於影象語義分割的全卷積神經網路(fully convolu- tional neural net-works,FCN)[16]開闢來影象分割的新領域。該網路所有層都是卷積層,並採取反捲積操作,將低解析度圖片進行上取樣,生成同分辨率的分割圖片。2016年,Dai等提出區域全卷積神經網路(R-FCN)[17]。
2.3.3CNN在遙感影象分類領域應用
CNN對卷積核引數的學習訓練是通過梯度反向傳播演算法實現的,該演算法是一種有監督學習演算法。其同一平面上的神經元權值相等,能夠並行學習、高效率地處理遙感影象。杜敬[10]利用最大穩定極值區域對無人機遙感影像進行影像分割得到識別目標子區,然後採用共7層CNN模型(1層輸入層、2層卷積層、2層取樣層、1層全連線層、1層輸出層)對水體進行識別,識別率達到95.36%。吳正文[18]研究了卷積神經網路的網路結構設計和引數優化對於影象分類的一般性規律。曹林林等[19]建立的卷積神經網路模型應用於昆明城區2007年高解析度遙感影象(Quickbird)地表7種類型劃分,總體精確達98.21%,降低了因影象平移、比例縮放、傾斜或者其他形式的變形而引起的誤差。
3 存在問題與建議
基於深度學習對遙感影象分類在準確性、實用性、通用性等方面離大規模實際應用的要求還有一定差距。主要問題有演算法自身問題、遙感影象引發的問題和應用上出現的問題三大類,下面本文將針對這些問題給出一些建議。
3.1演算法自身的問題和建議
3.1.1 引數多
卷積神經網路的引數眾多,但是目前的相關設定大多基於經驗和實踐,引數的量化分析與研究是卷積神經網路的一個有待解決的問題。深度學習中典型方法在遙感領域應用有初步成果,需要利用現有成果進行遙感影象處理規範建設。例如,如何均值處理、歸一化來進行遙感資料規範。
3.1.2 網路結構
目前的趨勢是網路越深,卷積神經網路的測試效果越好,部分網路甚至深達上千層。隨著網路的加深,過擬合和網路退化問題顯得更加嚴重。相比於人和其他動物的視覺機理,傳輸過程也不可能高達數百層。卷積神經網路需要優化結構設計,尋找更高效的神經元和結構單元。對人腦功能的模擬程度不完善。現有的深度學習技術模仿了人腦的層次結構和稀疏性,但模擬化程度不高。對大腦視覺皮層稀疏響應這種非常經濟的響應機制的模擬程度不夠。
3.2遙感影象特徵的應用問題和解決
3.2.1 降維問題
高光譜影象有很大的資料量,並且資料的維數通常很高,因為高維數所產生的資訊冗餘,導致高光譜遙感影象豐富的資訊難以被有效利用。單一的降維方式已經不能滿足遙感影象的需求,需要探索更適合高光譜遙感影象的分類演算法。
3.2.2遙感資料樣本
在實際應用中,遙感影象的資料的採集和標定是較困難的,獲取的已標定的訓練樣本集較小,因此在選取深度學習網路時需要合理的考慮遙感影象的特點,選取適合小樣本、高維資料分析的網路模型。卷積神經網路需要動輒百萬級的訓練樣本,卷積神經網路對百萬級樣本訓練過程也極為漫長,如何從小量的資料中生成良好的神經網路將是未來的研究方向。例如目前深度信念網路(DBN)應用主要用經典資料集,進一步拓展不同遙感資料應用,可以選擇小樣本構建的方法。
此外遷移學習也可以解決遙感資料樣本少的問題。在髙光譜遙感資料中,通常不同時間段拍攝的資料的光譜分佈會有所不同,遷移學習則只利用有標籤的時間段的資料,對無標籤的其他時間段的資料進行分類,大大提高了資料的可利用性,節省了對所有資料標籤的人力物力。
3.2.3遙感影象解析度問題
高光譜影象其空間解析度較低,其某些像元可能存在混合像元的現象,導致高光譜遙感影象中不同地物的像元資訊不一定具有較大的區分度,且由於採集過程的失誤也會產生相同地物的像元資訊不一致性的特點。因此可以考慮一些非線性變換的方法提取其光譜特徵,以及可以考慮加入直接的光譜特徵,例如光譜吸收特徵、光譜吸收指數及導數光譜等。
3.2.4遙感影象特徵沒有充分利用
遙感影象涵蓋的紋理特徵、光譜特徵和空間特徵都可以單獨作為影象分類的依據,然而影象的這些特徵資訊在影象分類時尚未充分利用。對提取的這3類特徵進行多角度充分利用,並將其共同作為分類依據,結合深度神經網路的訓練模型,來提高遙感影象的分類精度,成為了該領域目前的研究熱點。
3.3模型實際應用問題和建議
3.3. 1計算速度
遙感大資料內部的複雜高階統計特性需要高容量的深度模型來深度發掘。對應海量資料,還需要提供更高速的硬體,如多GPU混合異構的平行計算體系結構等。隨著網路層次的加深,儲存空間的需求也更大,演算法並行化加速處理以及網路壓縮也是今後研究的重點方向。對於遙感影像可採用影象分塊等資料並行處理技術提升演算法執行速度。對於遙感影像演算法,則可進一步考慮演算法的任務並行性,合理設定任務並行粒度進行演算法設計。
3.3.2演算法應用問題
遙感影象分類將有利於減災應急、交通監管、漁業海事,乃至無人機和機器人等民用系統智慧化水平的核心技術發展;如何利用深度學習進行遙感影象動態監測,如何應用綜合網路於不同遙感影象融合並提高識別精度,值得進一步研究。
4關鍵技術和解決方案
4.1結合非監督方法降維
針對高光譜影象資料的維數高的問題,提出適合高光譜遙感影象的降維分類演算法。可以考慮結合非監督分類的方法,如K-means等聚類方法,先進行聚類再進行各個類別降維提取特徵分類的方法。例如基於MFCM和KPCA的多光譜影象特徵提取方法。結合遙感資料的特點,對KPCA方法的輸入資料方法進行了改進,先用MFCM方法對原始資料進行聚類,然後將獲得的聚類中心作為輸入樣本,提取多光譜影象的非線性的特徵,消除影象間存在的高階相關性。
4.2遷移學習解決樣本問題
現在深度網路的訓練不僅需要大量的標籤資料,並且需要很久的時間來訓練。網路的訓練需要更加有效地利用無標籤資料,相信也是今後的研充重點。而與遷移學習的結合是利用無標籤資料的一個很好的方向。
不同時間段、不同角度拍攝的遙感資料的會有所不同,遷移學習可只利用有標籤的部分的資料,對無標籤的其他時間段的資料進行分類。將兩個不同分佈的資料變換到相同的特徵空間中,即可用其中一種分佈的資料作為訓練資料,對另一種分佈的資料進行分類,整個操作也可在這個相同的特徵空間中進行。這也是遷移學習要發展的方向。
例如多時相高光譜遙感影象分類問題,在優化的多層感知器演算法中,加入源域資料和目標域資料的類心對齊策略,通過深度學習網路對兩個域資料做非線性變換,達到變換後兩個域資料特徵相似的目的,從而使得網路具有遷移學習的能力。
4.3利用遙感影象空間特徵
針對遙感影象空間結構特徵等被忽略的問題。可以在資料訓練樣本集中採用組合鄰域光譜向量的方式,將所有訓練樣本的鄰域資訊考慮進去,使得在提取特徵的過程中即能夠獲取樣本的光譜特徵,也能夠融入其空間結構特徵,實現資料融合。
也可以考慮構造融合空間資訊的分類器。例如在分類遙感影象時,使用高光譜影象的像元向量作為網路的訓練樣本後,採用構造融合空間資訊的分類器進行分類。可以提高了高光譜遙感影象的分類精度。
5 結論和展望
本文首先介紹了遙感影象分類中的深度學習原理,然後對遙感影象分類在深度學習方面應用研究現狀做出闡述,並分析了其中存在的問題。根據問題提出瞭解決辦法和關鍵技術。最後總結了深度神經網路對遙感影象分類的發展趨勢。
目前遙感影象的時間解析度和空間解析度的不斷提升,併產生大量的多尺度遙感影像。遙感影象分類是分析遙感資料的重要手段。
未來,在森林防火、軍事戰略、交通管理等方面,建立基於深度學習對多尺度遙感影像影象分類的模型將是一個發展方向。在實時交通、無人駕駛等方面,需要及時的進行遙感影象獲取和影象分類。基於任務的端到端卷積神經網路的設計(如:Faster R-CNN,FCN等)有助於提升網路的實時性,是目前的發展趨勢之一。提高海量資料的訓練速度和效率以及加快發展更高速的硬體也是研究的重點。
深度神經網路為遙感影象分類開闢了一片新天地。提高了精確制導、武器防禦、海情監控等軍事系統和減災應急、交通監管、漁業海事等民用系統智慧化水平。基於深度學習的遙感影像影象分類對大量未標記的遙感影象資料分類,將對遙感影象分類的深入發展做出更大的貢獻。