韓月,康維新,李慧
哈爾濱工程大學(xué) 信息與通信工程學(xué)院,黑龍江 哈爾濱 150001
高光譜遙感技術(shù)是近年來非常流行的技術(shù)之一,通過遙感平臺形成的圖像具有高光譜分辨率、低空間分辨率的特點(diǎn),這樣就造成了圖像中的一個像元中不僅包含一種純粹地物,往往含有多種地物,稱為混合像元[1][2]。非負(fù)矩陣分解(non-negative matrix factorization, NMF)[3]算法是基于線性光譜混合模型(linear spectral mixture model,LSMM)[4]進(jìn)行展開的,是當(dāng)今較為流行的盲源分離(blind signals separation, BSS)算法之一,廣泛應(yīng)用于圖像處理。NMF最早由Paatero和Tapper[3]發(fā)現(xiàn),此后,Lee和Seung[4]分別介紹和推廣了它的概念。NMF是基于數(shù)據(jù)非負(fù)的條件下進(jìn)行的,這樣能更好的貼合實(shí)際物理意義,使研究更具現(xiàn)實(shí)意義。此后,多種基于NMF的改進(jìn)算法相繼提出,2005年Chen Z[5]提出了平滑約束的非負(fù)矩陣分解,在端元矩陣和豐度矩陣加入平滑約束(CNMF),提高了NMF算法的精度,2007年Miao Li等[6]將最小體積約束加入到非負(fù)矩陣分解(MVC-NMF),提高了分解過程的抗噪性能,2009年Qian Y等[7]提出L1/2稀疏約束的NMF,使解混結(jié)果更稀疏和精確。2014年魏一葦?shù)萚8]提出改進(jìn)的MVC-NMF。有些真實(shí)地物信息通過科學(xué)測量可以獲得,但以上方法都沒有利用真實(shí)地物信息,浪費(fèi)數(shù)據(jù)資源。Tang 等[9]將端元矩陣分成兩部分,一部分代表已知端元,另一部分代表未知端元,但缺點(diǎn)是求解時間長且結(jié)果不稀疏。本文利用已經(jīng)獲得的真實(shí)地物信息作為先驗(yàn)信息對非負(fù)矩陣分解進(jìn)行優(yōu)化,改善利用先驗(yàn)信息求解時間長的缺陷。
W←W·XHT·/WHHT
(1)
H←H·WTX·/WTWH
(2)
隨著高光譜數(shù)據(jù)解混研究的不斷深入,真實(shí)高光譜圖像中的某些特征的先驗(yàn)知識是可以獲得的。在礦區(qū)等多個場景中,鐵、云母石等材料通過現(xiàn)場調(diào)查極易識別,因此它們的光譜特征可以從光譜庫中獲得。由于現(xiàn)今的大多數(shù)分解算法在建立模型時并沒有考慮這些真實(shí)端元的已知條件,造成數(shù)據(jù)浪費(fèi)及解混結(jié)果精度偏低。本文提出基于已知端元約束的非負(fù)矩陣分解的高光譜解混方法則可充分利用已知端元信息。
本文算法根據(jù)文獻(xiàn)[10]建立基本模型為:
(3)
式中:W1、H1分別代表已知端元矩陣和豐度矩陣;W2、H2分別代表未知端元矩陣和豐度矩陣。添加約束后模型為
(4)
由于端元不能隨意確定,當(dāng)現(xiàn)場的測量端元與估計的端元相差太大時也會產(chǎn)生極大的誤差,因此本文將真實(shí)端元與初始化端元之間范數(shù)相對小的數(shù)據(jù)作為已知端元,保證解混結(jié)果的精度。
本文算法步驟如下:
輸入高光譜圖像數(shù)據(jù)X∈RL×N
利用頂點(diǎn)成分分析(vertex component analysis,VCA)和全約束最小二乘(full constraint least square,F(xiàn)CLS)對端元和豐度進(jìn)行初始化,計算真實(shí)端元與初始端元的范數(shù),選出已知端元;根據(jù)式(4)處理數(shù)據(jù);
輸出W,H
2實(shí)驗(yàn)及結(jié)果分析
在高光譜解混中,常見的評價指標(biāo)有光譜角距離(spectral angle distance,SAD)和均方根誤差(root mean square error, RMSE)[13]。SAD表示估計端元與初始端元之間的光譜角距離,RMSE表示端元對應(yīng)的估計豐度信息與真實(shí)豐度之間的均方根誤差。光譜角距離越小,均方根誤差值越小,說明解混效果越好。在合成數(shù)據(jù)中可以同時利用以上兩種評價指標(biāo)來評判解混效果,在真實(shí)高光譜數(shù)據(jù)中,由于缺乏現(xiàn)場真實(shí)地物的分布圖,不能利用RMSE進(jìn)行衡量。
SAD表示為:
(5)
RMSE表示為:
(6)
從美國地質(zhì)勘探局(USGS)測量的光譜數(shù)據(jù)庫選取不同端元合成模擬數(shù)據(jù),此光譜數(shù)據(jù)庫含224個波段,501個端元,波長范圍為0.38~2.5 μm,光譜分辨率達(dá)10 nm。本文選取其中5種端元作為端元矩陣;隨機(jī)生成相應(yīng)的豐度矩陣,同時滿足 “非負(fù)”與“歸一化”雙重約束,且服從 Dirichlet 分布。合成數(shù)據(jù)中含有真實(shí)端元信息和真實(shí)端元分布情況,因此在對解混結(jié)果進(jìn)行評價時采用SAD和RMSE。
2.2.1 不同像元的合成數(shù)據(jù)的實(shí)驗(yàn)
為了對比不同像元個數(shù)的高光譜數(shù)據(jù)對解混結(jié)果的影響,在本次實(shí)驗(yàn)中,利用不同像元個數(shù)分別為20×20、40×40、60×60、80×80、100×100的合成數(shù)據(jù)進(jìn)行對比實(shí)驗(yàn)。當(dāng)實(shí)驗(yàn)達(dá)到最高迭代次數(shù)停止運(yùn)算。本文給出了解混所得端元矩陣的光譜角距離SAD均值和豐度矩陣的均方根誤差RMSE的均值計算結(jié)果。
在這個實(shí)驗(yàn)中,分別進(jìn)行本文算法與其他對比算法對不同像元合成高光譜數(shù)據(jù)的解混,此實(shí)驗(yàn)中,端元矩陣和豐度矩陣均已知,因此實(shí)驗(yàn)得出的SAD和RMSE結(jié)果精度較高。表1和表2分別給出了合成數(shù)據(jù)在不同像元情況下利用本文算法解混與其他對比算法的SAD和RMSE比較。
由表1可以看出,本文算法的SAD數(shù)值始終比其他對比算法要低得多,即解混得到的估計端元與真實(shí)端元信息最為靠近,在80×80像元的情況下,本文算法得出的解混效果最好;由表2可以看出本文算法得出的豐度信息更為接近真實(shí)豐度信息,解混效果最好;由表3可以看出本文提出算法相比其他算法對數(shù)據(jù)解混所需時間是最少的,但是比單純NMF算法時間長,這是因?yàn)镹MF算法模型簡單,且容易陷入局部最優(yōu)。
表1 不同像元合成數(shù)據(jù)解混后SAD比較 (°)
表2 不同像元合成數(shù)據(jù)解混后RMSE比較
表3 不同像元合成數(shù)據(jù)解混所需時間比較 s
2.2.2 不同噪聲的合成數(shù)據(jù)的實(shí)驗(yàn)
為了判斷本文算法的抗噪性能,實(shí)驗(yàn)采用添加不同噪聲的合成數(shù)據(jù)進(jìn)行解混,并與其他算法的解混效果進(jìn)行對比。合成數(shù)據(jù)分別加入25、35、45、55、65 dB的噪聲,當(dāng)實(shí)驗(yàn)達(dá)到要求或到達(dá)最大迭代次數(shù)停止迭代,本文給出了解混所得端元矩陣的光譜角距離SAD均值和豐度矩陣的均方根誤差RMSE的均值計算結(jié)果。
在這個實(shí)驗(yàn)中,分別進(jìn)行本文算法與其他對比算法對添加不同噪聲的合成高光譜數(shù)據(jù)的解混,端元矩陣和豐度矩陣均已知,因此實(shí)驗(yàn)得出的SAD和RMSE結(jié)果精度較高。表4和表5給出了合成數(shù)據(jù)在添加不同噪聲情況下利用本文算法與其他對比算法解混結(jié)果的SAD和RMSE比較。由表4可以看出,本文算法的SAD數(shù)值始終比其他對比算法要低得多,即解混得到的估計端元與真實(shí)端元信息最為靠近,在添加噪聲為65 dB時,本文算法得出的解混效果最好;由表5可以看出隨著噪聲增大,本文算法的解混效果整體呈上升趨勢,得到的估計豐度信息更為接近真實(shí)豐度信息,解混效果最好;由表6可以看出本文提出算法比其他對比約束NMF算法對數(shù)據(jù)解混所需時間更少,但是比單純NMF算法時間長,這是因?yàn)镹MF算法模型簡單,容易陷入局部最優(yōu)。
表4 不同噪聲合成數(shù)據(jù)解混后SAD比較 (°)
表5 不同噪聲合成數(shù)據(jù)解混后RMSE比較
表6 不同噪聲合成數(shù)據(jù)解混所需時間比較 s
真實(shí)數(shù)據(jù)選自1997年AVIRIS在美國內(nèi)達(dá)華州采集的Cuprite地區(qū)的高光譜圖像數(shù)據(jù)。濾除對實(shí)驗(yàn)不利或無用的波段后,高光譜數(shù)據(jù)為X∈RL×N,L=180,N=250×191,即共有188個波段,47 750個像元。根據(jù)實(shí)際測量的地物信息,選取其中8種地物作為真實(shí)端元進(jìn)行解混。由于缺乏真實(shí)場景下的端元分布信息,利用SAD和豐度圖對解混結(jié)果進(jìn)行評價。真實(shí)高光譜解混后豐度如圖1。
(a)地物1 (b)地物2 (c)地物3
(d)地物4 (e)地物5 (f)地物6
(g)地物7 (h)地物8 圖1 真實(shí)高光譜解混后豐度圖
圖2是本文算法和其他對比算法對高光譜解混后的SAD比較。由圖1、2可以看出本文算法得到的解混效果更好。
圖2 各算法解混后SAD比較
通過真實(shí)數(shù)據(jù)解混實(shí)驗(yàn)得到各個算法所需時間分別是42.082 3 s(NMF)、2 412.759 820 s(MVC-NMF)、913.002 5 s(L1/2-NMF)、37.708 0 s(本文算法)。相比可知,本文算法對真實(shí)數(shù)據(jù)解混所需時間更短。
本文在NMF方法來解決高光譜解混問題的基礎(chǔ)上對其進(jìn)行優(yōu)化,添加先驗(yàn)信息約束,使解混結(jié)果更接近真實(shí)情況。根據(jù)實(shí)驗(yàn)數(shù)據(jù)分析,NMF及MVC-NMF算法收斂效果差,L1/2-NMF算法對空間信息利用不足,本文算法克服了以上的缺點(diǎn),使計算過程中有較好的收斂效果,同時很大程度地利用了先驗(yàn)信息。仿真實(shí)驗(yàn)結(jié)果表明,相對于MVC-NMF算法和L1/2-NMF算法,本文提出的算法具有更好的抗噪性能,即使在多個像元情況下,也有較好的解混效果。如何保證算法的穩(wěn)定性值得進(jìn)一步研究。