劉世界,李春來,徐 睿,唐國良,徐 艷,4,吳 兵,王建宇,3*
1. 中國科學院上海技術(shù)物理研究所空間主動光電技術(shù)重點實驗室,上海 200083 2. 中國科學院大學,北京 100049 3. 中國科學院大學杭州高等研究院,浙江 杭州 310024 4. 上??萍即髮W信息科學與技術(shù)學院,上海 201210
光譜相似度是常用于地物分類和識別的概念,從不同的角度看,光譜曲線具有多方面的量化特征,因此光譜相似度度量方式也有很多種,目前的評價方法主要包括基于光譜形狀(shape features,SF)和幅值(amplitude features,AF)兩種信息,基于SF的評價方法有光譜角度匹配(spectral angle mapper,SAM)[1],光譜信息散度(spectral information divergence,SID),光譜相關(guān)系數(shù)(spectral correlation coefficient,SCC),光譜相關(guān)角度(spectral correlation angle,SCA)[2],以及兩兩組合的方式,如SAM-SID,SID-SCA等?;贏F的評價方法主要有歐式距離(euclidean distance,ED)和J-M距離(Jeffries-Matusita distance,JMD)[3]。SF對于光譜曲線的增益的變化比較敏感,AF對光譜曲線的偏置比較敏感,為了能使評價方法同時體現(xiàn)出光譜曲線對于增益和偏置的靈敏性,通??梢詫深惙椒ㄗ鲞m當?shù)娜诤?,如光譜相似尺度(spectral similarity scale,SSS)融合了SCC和ED,歸一化光譜相似度分值(normalized spectral similarity score,NS3)融合了歸一化的SAM和ED[4],光譜泛相似度匹配(spectral pan-similarity measure,SPM)融合了SCC,SID和ED。在實際應(yīng)用中,地物光譜往往具有指紋特性,具體表現(xiàn)為吸收峰或反射峰等,這些特性是對物質(zhì)進行識別和分類的重要信息,但一般該類信息在光譜曲線中所占比重較少,基于SF和AF的評價方法很難體現(xiàn)出其重要性。一方面,壓縮感知作為一項新興理論,在光譜成像領(lǐng)域中已經(jīng)得到了廣泛應(yīng)用,光譜恢復(fù)精度是評價壓縮感知恢復(fù)算法性能的一個重要指標,但是目前還沒有統(tǒng)一的評價方法。光譜恢復(fù)精度可以通過比較恢復(fù)曲線與真值曲線的相似程度來評價,因此可以利用光譜相似度來評價算法的好壞,但基于壓縮感知的信息處理系統(tǒng)更擅長的是恢復(fù)平滑輪廓信息,吸收峰一類信息往往不會得到好的保持,利用SF和AF的評價方法盡管可以很好的反映出算法恢復(fù)信息量的能力,但并不能客觀地反映出對于光譜特征的保真能力。另一方面,基于光譜相似度的分類應(yīng)用中,對于光譜曲線本身輪廓信息的評價難以凸顯光譜指紋特征的作用,由此會降低分類精度,實際上,僅僅少量光譜特征就可以對地物進行有效分類,因此如何突出光譜特征在光譜相似度中的評價極為重要。光譜曲線的一階梯度信息在平滑段的值很小,在具有強烈吸收峰和反射峰的位置則具有很強的幅值,可以直接凸顯出光譜指紋特征,因此,本研究提出了基于一階梯度信息的光譜恢復(fù)精度評價方法。通過該方法可以直觀地反映系統(tǒng)對光譜特征保真能力,同時可以在基于光譜相似度的分類應(yīng)用中提高分類精度。
SAM是基于光譜形狀評價光譜相似度最常用的方法,本文以此為代表分析傳統(tǒng)基于光譜原始信息的光譜相似度評價方法,進而提出MGSAM評價方法。首先分別給出光譜角度匹配(SAM)和梯度光譜角度匹配(gradient SAM,GSAM)的計算公式分別為
(1)
(2)
(3)
(4)
由式(3)和式(4)可以看出,當SAM為0時,MSAM為0.5,此時x1和x2是兩個相互垂直的向量,表明光譜相似度為0。另一方面,由于待比較的兩條光譜曲線往往具有同源性,即通常情況下x1和x2的所有元素同號,此時MGSAM≥0.5。因此在同源光譜比較中,當MSAM和MGSAM取值為0.5時,意味著光譜相似度很低。但在更廣泛的應(yīng)用
圖1 原始光譜曲線與相應(yīng)梯度曲線對比(a): 汞燈特征曲線; (b): 汞燈特征曲線的梯度曲線; (c): 暗電平曲線; (d): 暗電平曲線的梯度曲線Fig.1 Comparison of the original spectral curve with the corresponding gradient curve(a): Mercury lamp characteristic curve; (b): Mercury lamp characteristic curve gradient curve;(c): Dark level curve; (d): Dark level curve gradient curve
中,如物質(zhì)探測等,取值范圍為[0,1],且兩者都是值越接近1,表明x1和x2的相似度越高。
為了說明在光譜相似度評價方法中對于光譜特征保持的體現(xiàn),首先基于汞燈的光譜曲線作分析。汞燈的光譜曲線從紫外到紅外波段都具有明顯的發(fā)射特征,如圖1(a)所示是美國National Institute of Standards and Technology (NIST)公布的光譜曲線,選擇 500~800 nm波段進行分析。
在不同光照強度下,光譜曲線的形狀會根據(jù)光照強度呈倍增關(guān)系,在不同暗背景條件下,光譜曲線會出現(xiàn)相應(yīng)的偏置,好的光譜相似度評價方法要對光譜的倍增和偏置具有一定的魯棒性。由于所用光譜曲線均做了歸一化的后處理,光譜倍增對于 MSAM 和 MGSAM 不會產(chǎn)生影響,可以僅考慮偏置帶來的影響。為簡化并充分說明問題,圖1(a)為暗電平理想常數(shù)為d的理想汞燈光譜曲線模型,通常情況下,光電系統(tǒng)的平均信噪比(SNR)可以達到 100以上,因此將d設(shè)置在[0.001,0.01]之間。為了直觀的體現(xiàn)出偏置對于MSAM和MGSAM的影響,選擇不含有任何光譜特征的暗電平曲線(偏置曲線)作為參考進行對比,如圖1(c)所示。由于梯度不受偏置影響,因此在不同d的條件下,光譜曲線的梯度是相同的,圖1(b)和圖1(d)分別給出了汞燈光譜曲線和暗電平光譜曲線的梯度曲線。
如圖2所示,是分別計算得到的在不同偏置條件下汞燈光譜曲線與偏置曲線的MSAM和MGSAM的結(jié)果??梢钥闯?,隨著偏置的增大,MSAM呈現(xiàn)明顯地增長,且在d=0.1時,其值接近于1,由于偏置曲線不含任何光譜信息,這顯然不能客觀反映出兩者的光譜相似度。另一方面,光譜曲線的梯度并不受偏置的影響,梯度曲線并不會反映偏置信息的存在,因此 MGSAM 的值一直保持不變并且是個較小的值(0.5),即偏置變化對于 MGSAM 沒有影響,且在數(shù)值計算中占據(jù)很小的比重,因此利用MGSAM評價光譜相似度對偏置變化具有很好地魯棒性。
圖2 原始曲線與暗電平曲線的MSAM和MGSAMFig.2 MASM of original curve and dark levelcurve, and corresponding MGSAM
光譜吸收峰深度是評價光電探測系統(tǒng)靈敏度的一個重要指標[5]。如圖3(a),為 ENVI 軟件光譜庫中巴西棕櫚蠟(Carnauba Wax)在0.4~2.5 μm的反射率曲線(藍色曲線),其在1.208,1.388和1.728 μm具有明顯的吸收特征峰。一方面,低靈敏度的光電探測系統(tǒng)會弱化光譜吸收峰的深度,極端情況下,光譜吸收峰會消失。另一方面,在壓縮感知的光電探測系統(tǒng)中,低采樣率條件下僅可以恢復(fù)光譜曲線的大部分輪廓信息,光譜吸收峰等細節(jié)往往得不到充分恢復(fù)。圖3(a)中同時給出了僅僅具有巴西棕櫚蠟光譜曲線輪廓信息的參考曲線(紅色曲線),該曲線是經(jīng)過濾波重采樣得到的,可以認為是上述兩種情況得到的探測或恢復(fù)結(jié)果。
利用MSAM評價光譜曲線相似度時,計算原始曲線和參考曲線得到MSAM=0.99,之所以有如此大的值,是因為兩個對比曲線具有大量的相同或者接近的反射率數(shù)值,而吸收峰僅僅占據(jù)曲線的一小部分,即該數(shù)值雖然能說明參考曲線包含了絕大部分原始曲線信息,但并不能證明細節(jié)信息得到保留。圖3(b)給出了原始曲線和參考曲線的梯度曲線,可以看出,原始曲線在具有強吸收峰位置的梯度具有較大幅值,強化了光譜特征,而輪廓曲線在梯度中保持平穩(wěn)狀態(tài)并且數(shù)值較小。因此利用GMASM進行光譜相似度評價可以
圖3 光譜特征曲線與光譜輪廓曲線以及兩者相應(yīng)的梯度的對比(a): 巴西棕櫚蠟的反射率曲線及其輪廓曲線; (b): 巴西棕櫚蠟的反射率曲線及其輪廓曲線相應(yīng)的梯度Fig.3 Comparison of spectral characteristic curve and spectral contour curve and their corresponding gradients(a): Reflectance curve of carnauba wax and its contour curve;(b): Reflectance curve and contour curve of carnauba wax and their corresponding gradient
突出光譜吸收峰的比重,這里計算得到GMASM=0.72,可以更客觀地反映光譜特征保持結(jié)果。
壓縮感知是一種新的信息處理模型,其基于信號稀疏性的特點,可以在采樣少量數(shù)據(jù)的前提下恢復(fù)獲得全部信息,實現(xiàn)壓縮與采樣同時進行,大大減少了數(shù)據(jù)的存儲和傳輸?shù)膲毫6-7]。在實際應(yīng)用中,所探測目標的光譜曲線本身并不稀疏,但其在頻域中表現(xiàn)出良好的稀疏性,比如在余弦變換域和小波變換域中,稀疏系數(shù)主要集中在低頻部分,該特點在空域中的直觀表現(xiàn)為光譜曲線具有很強的平滑性。壓縮感知在低采樣率條件下,主要恢復(fù)得到的是集中在低頻部分的少量系數(shù),高頻部分系數(shù)因數(shù)值較小而被舍棄,因此最終獲得的曲線往往在平滑部分比較精確,而吸收峰等細節(jié)則容易被丟失。如圖4所示,為在Discrete Cosine Transform(DCT)條件下,利用Iterative Reweighted Least Squares(IRLS)算法在不同采樣率恢復(fù)得到的結(jié)果,并給出了原始曲線的對比。
從圖4中可以看出,在低采樣率(0.1~0.4)條件下,光譜的輪廓信息基本得到了全部恢復(fù),而光譜吸收峰則被弱化甚至丟失,即光譜特征在壓縮感知并沒有得到好的保持。在進行光譜保真度評價時,由于光譜輪廓信息占據(jù)光譜曲線大多數(shù)信息,基于原始曲線的對比勢必會得到高光譜相似度的結(jié)論。如圖5所示,分別給出了真值曲線與恢復(fù)曲線的MSAM和MGSAM,由圖5可以看出,即使在低采樣率條件
圖4 不同采樣率下恢復(fù)光譜曲線與真值曲線的對比Fig.4 Comparison of true value curve recovery and spectrum curve under different sampling rates
圖5 真值曲線與不同采樣率下恢復(fù)曲線的MSAM和MGSAMFig.5 MSAM and MGSAM of truth and recovery curve at different sampling rates
下,MSAM也在0.998以上,該數(shù)值表明絕大多數(shù)光譜信息得到了保持,但顯然沒有反映出光譜特征被丟掉的這一客觀事實。而GMSAM在低采樣率時保持了較小的值,直到光譜特征得到較好的恢復(fù)時,GMSAM的值才逐漸接近于1,充分表明了光譜特征在光譜相似度評價中所起的作用。另一方面,盡管隨著采樣率的提高,MSAM逐漸變大,但不同采樣率間的差異性卻很難反映出光譜特征保真能力。而GMASM 則隨著采樣率的變化具有明顯的變化,且具有較大的差異,可以直觀地反映出壓縮感知系統(tǒng)對于光譜特征的保真能力。
計算光譜匹配度是地物分類常用的方法之一,待分類地物與參考光譜的匹配度本質(zhì)上是計算兩條光譜曲線的相似度[8]。無監(jiān)督分類問題通??梢允褂肒-Means,Hierarchical Clustering等方法,為了說明MGSAM在分類中起的作用可采用如圖6所示的分類方法。
選擇Salinas,Pavia和Indian Pines三個數(shù)據(jù)集,對應(yīng)的類別數(shù)分別為14,9,16。其中標準光譜曲線是在GroundTruth中選擇若干相應(yīng)同類地物光譜曲線的平均值。如圖7所示,可以直觀地看出MGSAM比MSAM取得了更好的分類結(jié)果。同時表1中給出了兩者分類的準確度,可以看出,MGSAM比MSAM具有更高的分類準確度。這是因為MGSAM能更好的體現(xiàn)出光譜特征保真度,有利于在分類過程中對于光譜特征的提取,進而提高分類精度。
圖6 利用MSAM和MGSAM分類的流程Fig.6 Classification process using MSAM and MGSAM
圖7 MSAM和MGSAM的分類結(jié)果Fig.7 Classification results of MSAM and MGSAM
表1 MSAM和MGSAM的分類準確度Table 1 Classification accuracy of MSAM and MGSAM
MGSAM為光譜相似度評價提供了一種新的方法,將光譜曲線的梯度信息納入計算中,增強了光譜吸收峰等“指紋”特征在光譜相似度評價體系中的重要性,可以客觀地反映光譜特征保真度,為基于壓縮感知的光譜成像系統(tǒng)提供了一種準確地光譜保真度評價方法,同時其良好的光譜特征反映能力可以提高地物分類的精度。
MGSAM用光譜曲線一階梯度信息進行光譜特征增強,進而提高光譜特征在評價方法中的重要性,在SAM的基礎(chǔ)上演化而來,基于傳統(tǒng)光譜形狀的評價方法SCC等,以及基于幅值信息的ED評價方法等,同樣可以將梯度信息納入計算因素,以提升光譜特征要素的重要性,這將是未來的重點研究方向之一。