董朋欣
(長(zhǎng)安大學(xué)理學(xué)院 陜西·西安 710064)
遙感是根據(jù)電磁波理論,在光譜和空間兩個(gè)方向維度對(duì)目標(biāo)地物進(jìn)行立體成像的綜合性探測(cè)技術(shù)。高光譜遙感則是利用成像光譜儀在可見(jiàn)光到短波紅外范圍內(nèi)對(duì)地物進(jìn)行持續(xù)遙感成像,獲取地物空間信息和光譜信息的遙感技術(shù),其波段通道狹窄且連續(xù),高分辨率特性明顯,在農(nóng)作物、濕地環(huán)境、地球礦物、城市地物、軍事偽裝等領(lǐng)域得到廣泛應(yīng)用。2019年11月3日,我國(guó)高分七號(hào)對(duì)地觀測(cè)衛(wèi)星在太原衛(wèi)星發(fā)射中心成功發(fā)射,并表示2020年8月20日正式投入使用,其衛(wèi)星測(cè)繪相機(jī)分辨率達(dá)到亞米級(jí),這標(biāo)志著高空間、高時(shí)間、高光譜分辨率的時(shí)代正在到來(lái)。
高光譜遙感圖像的分類一直以來(lái)都是遙感科學(xué)領(lǐng)域的研究重點(diǎn),但高維度的數(shù)據(jù)和相鄰波段的高度冗余,對(duì)高光譜圖像的分類提出挑戰(zhàn)。不同地表物都有自己獨(dú)特的特性,如何快速精確的對(duì)地物進(jìn)行分類,關(guān)鍵就是如何有效提取出能代表地物信息的判別性特征,這是高光譜圖像分類的關(guān)鍵,也是遙感信息技術(shù)研究的重點(diǎn)。
特征提取是指利用線性或非線性變換,將原始高維數(shù)據(jù)特征轉(zhuǎn)換為更能反映原始數(shù)據(jù)本質(zhì)或進(jìn)行數(shù)據(jù)區(qū)分的低維數(shù)據(jù)特征,是一種改變光譜物理意義或統(tǒng)計(jì)意義的降維技術(shù)。高光譜圖像的特征提取方法按照是否線性空間,分為線性特征提取和非線性特征提取。
線性特征提取又稱子空間學(xué)習(xí),旨在根據(jù)一定的性能目標(biāo),將原始空間數(shù)據(jù)通過(guò)線性變換投影到低維子空間的過(guò)程,該類算法使數(shù)據(jù)的潛在分布更加凸顯,使用簡(jiǎn)單,有效減少數(shù)據(jù)存儲(chǔ)和數(shù)據(jù)冗余。主要代表算法有主成分分析(PCA)、線性判別分析(LDA)和獨(dú)立成分分析(ICA)。
主成分分析(PCA)又稱主分量分析,是一種尋找數(shù)據(jù)分布最優(yōu)子空間的降維統(tǒng)計(jì)方法?;驹硎抢谜蛔儞Q設(shè)法將一組分量相關(guān)的初始數(shù)據(jù)作某種線性組合,重新轉(zhuǎn)換成一組線性不相關(guān)的低維新數(shù)據(jù),其中在所有變換中,選取方差最大(方差越大包含的信息越多)的線性組合變量,即稱為第一主成分,如第一主成分未能表示初始數(shù)據(jù)的全部信息,然后再選取方差次大的線性組合變量,即為第二主成分,依次類推。由于前面主成分所含的方差較多,只有幾乎為零的少量方差含在后幾個(gè)主成分中,于是忽略貢獻(xiàn)幾乎為零的高階主成分特征,只保留貢獻(xiàn)較大的前幾個(gè)低階主成分,實(shí)現(xiàn)對(duì)數(shù)據(jù)特征的降維處理。
線性判別分析(LDA)要求數(shù)據(jù)符合高斯分布,是一種可以利用物體類別先驗(yàn)知識(shí)進(jìn)行有監(jiān)督學(xué)習(xí)的降維技巧。主要思想是將高維原始空間在低維空間上進(jìn)行映射,使映射后各類別的類間散度最大、類內(nèi)散度最小,即映射后不同類別的數(shù)據(jù)盡可能相距較大,而相同類別的數(shù)據(jù)盡可能聚在一起。與無(wú)監(jiān)督降維方式的PCA算法不同,LDA是使變換后的數(shù)據(jù)獲取最好的分類性,而PCA是獲取最大的發(fā)散性,但兩者都在尋找最佳解釋數(shù)據(jù)的變量線性組合。
獨(dú)立成分分析(ICA)又稱盲源分離,起初被應(yīng)用于“雞尾酒會(huì)”場(chǎng)景。ICA模型認(rèn)為混合觀測(cè)數(shù)據(jù)可以由多個(gè)相互獨(dú)立的源數(shù)據(jù)線性組合而成,即n維觀測(cè)數(shù)據(jù)X服從模型X=AS,其中A為混合矩陣,S為相互獨(dú)立的m維(mn)源信號(hào)(源信號(hào)為非高斯或者只有一個(gè)成分是高斯分布)。ICA核心就是要解混,找到一個(gè)解混矩陣W(A的逆矩陣)對(duì)觀測(cè)信號(hào)X進(jìn)行線性變換,獲得相互獨(dú)立的源信號(hào)S,即S=A1X=WX。
非線性特征提取是將高維數(shù)據(jù)在低維空間上進(jìn)行非線性變換映射,該類算法能更好的提取數(shù)據(jù)分布特征,但計(jì)算復(fù)雜度大。主要代表算法有核主成分分析(KPCA)、等距映射(ISOMAP)、棧式自編碼(SAE)和卷積神經(jīng)網(wǎng)絡(luò)(CNN)。
核主成分分析(KPCA)是對(duì)PCA算法的非線性推廣,用于處理線性不可分的樣本集。通過(guò)引入核函數(shù),把線性不可分的原始空間投影至高維的特征空間,從而達(dá)到線性可分的情況,再采用PCA算法對(duì)特征空間處理降維,這是一個(gè)先升維后降維的過(guò)程,核方法解決了不可分問(wèn)題,提取到了數(shù)據(jù)潛在的非線性分布特征。其中常見(jiàn)的核包括Sigmoid核、雙曲正切核、多項(xiàng)式核等。
等距映射(ISOMAP)是流形學(xué)習(xí)中非線性降維方法的一種,它的核心是將原始數(shù)據(jù)映射到低維空間之后依舊保留流形上點(diǎn)對(duì)之間的測(cè)地線距離(即相對(duì)距離關(guān)系),換句話說(shuō)投影前后,距離近的點(diǎn)還要是近,距離遠(yuǎn)的點(diǎn)還要是遠(yuǎn)。等距映射是基于圖論中測(cè)地線的理論,把帶權(quán)圖的測(cè)地距離作為流形映射的幾何描述,希望得到一個(gè)保持流形結(jié)構(gòu)的低維嵌入,保留非線性樣本的本質(zhì)幾何結(jié)構(gòu),是一種無(wú)監(jiān)督學(xué)習(xí)方法。
棧式自編碼(SAE)是由多層自編碼器堆棧形成的網(wǎng)絡(luò)模型。傳統(tǒng)自編碼由輸入層、隱藏層和輸出層組成,分為編碼和解碼兩個(gè)部分,其中輸入層到隱藏層為編碼,隱藏層到輸出層為解碼。棧式自編碼就是將原始數(shù)據(jù)作為輸入訓(xùn)練自編碼器,并去除其解碼過(guò)程,然后把前一層自編碼的輸出(即隱藏層特征)作為下一層自編碼的輸入,依次類推。本質(zhì)上就是利用逐層貪婪訓(xùn)練的思想,對(duì)數(shù)據(jù)做非線性轉(zhuǎn)換,進(jìn)行無(wú)監(jiān)督訓(xùn)練。
表1:Indian Pines地區(qū)各方法分類精度
圖1:Indian Pines地區(qū)各方法分類結(jié)果。(a)原圖;(b)實(shí)際地物;(c)SVM;(d)PCA-SVM;(e)ICA-SVM;(f)SAE-SVM;(g)Resnet-SVM;(h)3D-CNN
表2:University of Pavia地區(qū)各方法分類精度
圖2:University of Pavia地區(qū)各方法分類結(jié)果。(a)原圖;(b)實(shí)際地物;(c)SVM;(d)PCA-SVM;(e)ICA-SVM;(f)SAE-SVM;(g)Resnet-SVM;(h)3D-CNN
卷積神經(jīng)網(wǎng)絡(luò)(CNN)類似于人工神經(jīng)網(wǎng)絡(luò)的多層感知器,是一種前潰式監(jiān)督學(xué)習(xí)網(wǎng)絡(luò),常用來(lái)分析視覺(jué)圖像。其本質(zhì)上是一種輸入到輸出的映射,網(wǎng)絡(luò)結(jié)構(gòu)主要包括數(shù)據(jù)輸入層、卷積層、ReLU激勵(lì)層、池化層、全鏈接層。CNN通過(guò)采用局部連接、參數(shù)共享和降采樣等方法優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu),解決了感知器全連接和梯度發(fā)散的問(wèn)題,使其適應(yīng)性更強(qiáng),可處理高維數(shù)據(jù)圖像,并且可以挖掘出數(shù)據(jù)的局部特征和全局特征,可以識(shí)別位移、縮放及扭曲不變性的圖像。其代表性網(wǎng)絡(luò)有Alex-Net、VGG、Resnet等。
為了對(duì)各方法進(jìn)行有效驗(yàn)證,選用IndianPines和University of Pavia兩組遙感圖像數(shù)據(jù)進(jìn)行分類實(shí)驗(yàn),并利用線性方法(PCA、ICA)和非線性方法(SAE、Resnet、3D-CNN)對(duì)高光譜圖像進(jìn)行特征提取,同時(shí)輸入支持向量機(jī)(SVM)分類器實(shí)現(xiàn)不同地物間的分類。本文還采用兩個(gè)評(píng)估指標(biāo)(整體分類精度OA、Kappa系數(shù))進(jìn)行對(duì)比分析。
實(shí)驗(yàn)一在Indian Pines數(shù)據(jù)集上進(jìn)行驗(yàn)證,共16類地物(如草地、農(nóng)田等),由波長(zhǎng)為0.4-2.5,大小為145pixel×145pixel的像素點(diǎn)組成,去除受水汽等干擾因素的20個(gè)波段,用剩余的200個(gè)光譜波段進(jìn)行實(shí)驗(yàn)。實(shí)驗(yàn)隨機(jī)選取每類標(biāo)記樣本的10%作為訓(xùn)練樣本,其余樣本用作測(cè)試。表1列出各類樣本在6種算法下的分類精度,圖1為各類樣本在6種算法下的分類結(jié)果圖。
圖3:訓(xùn)練樣本數(shù)量對(duì)各分類方法的影響。(a)Indian Pines;(b)University of Pavia
實(shí)驗(yàn)二驗(yàn)證的是University of Pavia地區(qū)的數(shù)據(jù)集,該數(shù)據(jù)由空間分辨率為1.3m,大小為610pixel×340pixel的像素點(diǎn)組成,波長(zhǎng)在0.43-0.86 m之間,共9種地物(如樹(shù)、瀝青道路、牧場(chǎng)等),包含103個(gè)光譜波段(除去受噪聲影響的12個(gè)波段)。實(shí)驗(yàn)隨機(jī)抽取每類200個(gè)樣本作為訓(xùn)練樣本,其余樣本用作測(cè)試。表2列出各類樣本在6種算法下的分類精度,圖2為各類樣本在6種算法下的分類結(jié)果圖。
實(shí)驗(yàn)結(jié)果表明,僅利用光譜信息對(duì)地物進(jìn)行分類,所得整體分類精度較低、分錯(cuò)的離散點(diǎn)較多;將線性方法(PCA、ICA)提取出的特征進(jìn)行分類,分類結(jié)果得到改善;SAE、Resnet和3D-CNN算法通過(guò)非線性方式提取特征,極大提高了整體分類精度,邊界區(qū)分效果明顯改善,且3D-CNN的分類精度均優(yōu)于其它方法,邊界點(diǎn)區(qū)分效果最為明顯。實(shí)驗(yàn)一,通過(guò)組合線性方式的PCA-SVM算法比僅考慮光譜信息的SVM,分類精度提高了6.5%,融合非線性特征的Resnet-SVM比SVM提高18%,3D-CNN算法比線性方法(PCA、ICA)的分類精度大約提高15%,比SAE-SVM高。實(shí)驗(yàn)二,PCA-SVM分類精度比SVM提高4%,Resnet-SVM比SVM提升5.38%,3D-CNN算法比PCA-SVM、ICA-SVM的整體分類精度提高約9%,高于SAE-SVM和Resnet-SVM算法,且3D-CNN算法中各目標(biāo)類分類精度均達(dá)到95%以上。綜上所述,僅考慮光譜特征進(jìn)行分類的方法弱于線性特征方法,非線性方法優(yōu)于線性方法,非線性算法所提取的地物特征具有較強(qiáng)的判別性,極大改善了分類結(jié)果。
為了驗(yàn)證各方法的有效性,圖3分別展示了不同訓(xùn)練樣本數(shù)量對(duì)各類方法分類精度的影響。結(jié)果顯示,訓(xùn)練樣本數(shù)量與分類樣本整體呈現(xiàn)逐步升高的曲線走勢(shì),非線性特征提取優(yōu)于線性特征提取,更優(yōu)于僅考慮光譜特征的SVM算法。
線性特征提取和非線性特征提取區(qū)別在于將原始數(shù)據(jù)映射到低維空間的過(guò)程中,是選用線性方式進(jìn)行變換還是非線性變換。線性特征提取復(fù)雜度較低,簡(jiǎn)單可處理,容易理解,但所提特征有些欠缺;相比而言,非線性特征提取可以更好的對(duì)數(shù)據(jù)的特有屬性進(jìn)行表征,不足的是算法參數(shù)缺乏理論性的調(diào)參技巧,但非線性提取方法為以后的研究提供了新思路。