朱玲,李明,秦凱,潘澄雨
(核工業(yè)北京地質研究院 遙感信息與圖像分析技術國家級重點實驗室,北京 100029)
由于受影像場景的復雜性和傳感器空間分辨率的限制,遙感影像中地物對應的純凈像元一般較少[1]。高光譜影像具有光譜分辨率高、空間分辨率相對較低的特點,混合像元更是普遍存在[2]。為提高光譜遙感應用精度,光譜解混成為研究重點。光譜解混過程包括純凈端元提取和豐度求解,不僅局限于星載、機載的高光譜影像的解混,也包括微觀角度的如光譜儀量測的混合光譜解混。
巖石一般是由多種礦物構成的礦物集合體[3],礦物顆粒之間在400~2 500 nm的可見光-近紅外波段容易發(fā)生多重散射[4],其光譜特征是若干組分礦物光譜的綜合反映[5]。礦物的光譜特征與其內在理化特性緊密相關,化學成分和晶體結構特征是礦物端元識別的重要依據(jù),在400~1 300 nm波長范圍內主要表現(xiàn)為Fe、Cu等過渡性金屬元素的電子躍遷;在1 300~2 500 nm波長內主要表現(xiàn)為礦物水分子、羥基、碳酸根、硫酸根等陰離子基團振動過程[6-7]。20世紀七八十年代學者們開始熱衷于巖石樣本光譜特征量測,90年代逐漸開展基于完全波形匹配的巖礦識別,目前巖礦光譜解混已經成為新的研究熱點[8],它是連接遙感技術與地質的關鍵,對礦物勘查、礦物含量定量反演和礦物豐度制圖等都具有重要的指導意義[9]。
光譜混合模型主要有線性和非線性2類[10]?;诨旌夏P偷墓庾V解混算法較多,主要分為基于幾何、統(tǒng)計和稀疏回歸等解混方法,在近20年得到廣泛應用。由于巖石的緊致混合特征,基于線性模型解混的精度往往較低[11],Hapke輻射傳輸模型是非線性解混最常用的模型之一[12],可以把混合礦物的波譜反射率轉換為單次散射反照率(single scattering albedo,SSA),將非線性特征轉變?yōu)榫€性特征進行研究。除了基于模型的解混方法外,神經網絡法、核函數(shù)法和流形學習等基于數(shù)據(jù)驅動的解混方法可以較好地映射礦物光譜的非線性特征,也逐漸獲得關注和應用[13]。
解混實驗對光譜解混精度和效率要求越來越高,光譜解混算法已逐漸向智能化方向轉變。高光譜解混的多種方法已經在實驗室模擬光譜數(shù)據(jù)中得到較好驗證[14],在礦區(qū)的礦物識別和野外地質填圖等方面也得到較好的應用[15-16],除此之外還成功應用于古畫顏料解混[17-18]、月表礦物識別監(jiān)測[19-20]、月球礦物制圖評估[21]等眾多方面。本文在學者們研究的基礎上總結了2種主要的光譜混合模型,系統(tǒng)地介紹了目前存在的多種光譜解混算法和已開展的光譜解混實驗,最后對目前礦物光譜解混存在的問題和未來發(fā)展趨勢進行總結。
光譜混合模型是光譜解混算法的理論基礎。光譜混合方式從本質上可分為線性和非線性混合2種,其主要區(qū)別在于光子是否在地物間發(fā)生多次散射[2]。
線性混合模型(linear mixing model,LMM)即把每一個混合波譜反射率看作為每一個端元光譜反射率和對應組分含量的線性組合。LMM用式(1)表示。
(1)
式中:X表示混合光譜反射率;am表示第m個端元的光譜反射率;em為第m個端元的豐度;A=(a1a2…aM)T為端元光譜矩陣;E=(e1e2…eM)T為端元豐度矩陣;M為端元數(shù);ε為誤差項。
由于光子在地物間發(fā)生多次散射現(xiàn)象,從微觀角度看粒子的混合是非線性的。非線性混合模型的表達式為式(2)。
X=f(A,E)+ε
(2)
式中:f(·)表示端元矩陣A和豐度矩陣E之間的非線性關系。由于模型的不確定性,需要給出確定且合適的非線性模型才能進行光譜混合[2]。Hapke模型[22-23]可以詳細描述礦物混合效應,把礦物反射率轉化為SSA,把非線性混合光譜轉變到線性空間。反射率與SSA的函數(shù)表示見式(3)[12]。
(3)
式中:γ(·)為反射率;μ0=cosi;μ=cose;i為入射角;e為出射角;g為相位角;ω為礦物單次散射反照率;B(g)表示后向散射系數(shù);P(g)為相位函數(shù);H(ω,μ)為各向同性散射函數(shù)。由于模型對參數(shù)要求較高且求解過程較為復雜,為便于計算,對式(3)進行簡化[24],使B(g)=0,P(g)=1,簡化后的模型表示為式(4)。
(4)
H函數(shù)可近似表示為式(5)。
(5)
ω的表達見式(6)。
(6)
式中:em的含義見式(1);ωm為各組分礦物的SSA;ω表示混合礦物的SSA。簡化后的礦物反射率表達式轉換為式(7),可以根據(jù)已知的礦物反射率求解礦物SSA。
(7)
Hapke模型進行改進后的多混合像元模型(multi-mixture pixel,MMP)是把線性和非線性模型相結合構成的非線性混合模型[25],其物理意義是把非線性混合的端元添加到線性混合模型中。Heylen等[3]在MMP模型基礎上把LMM模型和Hapke模型相結合,提出了另外一種緊致混合物的線性混合模型(linear mixture of intimate mixtures,LIM)。LMM模型假設礦物端元在空間上呈棋盤式分布,實際情況中每個棋盤模塊由多個端元構成,LIM則描述了非線性混合特征。通過不同參數(shù)的設置,LIM模型可以轉變?yōu)镸MP或Hapke模型。除了Hapke模型之外,余先川等[2,15]還提出了一種二次散射模型用于描述礦物的混合效應。
目前礦物混合光譜解混算法有很多,基本可以分為模型驅動和數(shù)據(jù)驅動2大類。模型驅動法是基于混合模型理論的,可以分為基于幾何、統(tǒng)計和稀疏回歸的解混方法。數(shù)據(jù)驅動主要包括神經網絡法、核函數(shù)法和流形學習法等方法。
1)基于幾何方法。在端元提取方面,基于純像元的端元識別算法常用的有純端元索引法(pixel purity index,PPI)、頂點成分分析法(vertex component analysis,VCA)和內部體積最大法等。PPI方法將高光譜數(shù)據(jù)在隨機向量方向分別進行投影,把落在兩端數(shù)據(jù)進行標記,標記次數(shù)大于某閾值數(shù)據(jù)作為潛在端元集[26]。內部體積最大法通過選擇最大單形體體積來確定端元,對數(shù)據(jù)降維后,再利用高光譜數(shù)據(jù)凸面單形體的特征尋找具有最大體積的單形體并將其頂點作為端元[27]。VCA 將像元在所有維度進行投影,把投影值最大的像元作為第一個端元,再把高光譜數(shù)據(jù)投影到與已確定端元構成的子空間正交方向上,通過迭代法選取其他端元[28]。PPI算法需要獲取一定的先驗知識,通過人工經驗提取端元,人為因素影響較大,而且隨機向量選取的不確定性對端元提取影響較大;內部體積最大法利用窮舉方法找出端元,計算量較大;VCA和內部體積最大法在端元識別時都需要提前明確端元數(shù)目。上述方法均基于純像元假設,要求高光譜數(shù)據(jù)中存在純像元,在對實際高光譜數(shù)據(jù)解混情況下難以滿足要求。
最小體積單形體法(minimum volume simplex analysis,MVSA)[29]和變元切分增量拉格朗日單形體識別法(simplex identification via variable splitting and augmented Lagrangian,SISAL)[30]是基于最小體積變換的端元識別法。2種方法的原理都是通過尋找一個混合矩陣,該矩陣的列所形成的單形體體積是將高光譜數(shù)據(jù)完全包圍的最小體積的單形體;不同之處在于MVSA方法對初始端元矩陣的選擇非常重要,SISAL法則是采用一系列增廣拉格朗日方法解決最優(yōu)化問題?;谧钚◇w積的方法不再要求純像元假設,但容易受噪聲的影響,估計端元值與實際端元誤差往往較大。
在端元矩陣已知后求解各端元的豐度系數(shù),端元豐度估計依賴于端元光譜的提取。最常用的豐度估計方法有最小二乘法。最小二乘法是基于線性混合模型估計豐度的方法,通過添加不同的約束條件又分為無約束的最小二乘算法(unconstrained least squares,UCLS)、“和為一”約束最小二乘(sum-to-one constrained least squares,SCLS)、“非負”約束最小二乘法(nonnegativity constrained least squares,NCLS)和全約束最小二乘法(fully constrained least squares,F(xiàn)CLS)[31]。
2)基于統(tǒng)計方法。受地物復雜度和高光譜數(shù)據(jù)空間分辨率影響,像元光譜蘊含多種地物信息。當高光譜數(shù)據(jù)為高度混合時,基于幾何的解混方法效果較差,基于統(tǒng)計的方法可以適用于處理高度混合的像元,同時獲得端元矩陣和豐度矩陣。主要的統(tǒng)計方法有獨立成分分析法(independent component analysis,ICA)和非負矩陣分解法(nonnegative matrix factorization,NMF)。ICA算法最早由Jutten等提出[32-33],通過估計分離矩陣使輸出信號接近于輸入信號,但該方法基于LMM約束端元和豐度的相互獨立性,容易得到不正確的端元,在高光譜解混應用方面容易受到約束。Lee等[34]正式提出NMF概念。NMF是一種盲源分離算法,把一個非負數(shù)據(jù)矩陣分解為2個非負矩陣的乘積。該方法不需要純像元的假設,但求解中存在局部最小值問題,一般需要加入端元和豐度約束。把非負矩陣分解和最小體積約束相結合(minimum volume constrained-NMF,MVC-NMF)進行光譜解混的方法可以不依賴于純像元假設,且保證得到的端元矩陣和豐度矩陣是非負的[35]。
ICA與NMF算法在端元和豐度信息完全未知的情況下提取混合像元中的隱含信息,屬于非監(jiān)督的解混算法,2種方法都需要先給出一個目標函數(shù),再通過優(yōu)化算法進行求解?;诮y(tǒng)計學方法可以從混合光譜中直接分離得到的端元矩陣和豐度矩陣,但相比于幾何解混法計算復雜度相對較高,降低了高光譜解混效率。
3)稀疏解混法。基于光譜庫的稀疏解混也是將端元提取和豐度估計聯(lián)合起來進行求解的。用已知的光譜庫作為端元矩陣,光譜庫中光譜數(shù)量遠遠大于實際端元數(shù)量,混合光譜與端元集向量之間具有稀疏關系,這樣就把解混問題轉化為組合優(yōu)化問題,實際是一種稀疏回歸的問題[36]。Iordache等[37]首次提出基于光譜庫的半監(jiān)督的稀疏解混法,把光譜庫引入到線性模型中代替端元集,利用高光譜數(shù)據(jù)與l1范數(shù)結合提出一種基于l1范數(shù)稀疏性約束的快速稀疏解混算法(sparse unmixing via variable splitting augmented Lagrangian,SUnSAL),提高了解混的效率;但由于真實的光譜數(shù)據(jù)與光譜庫中的數(shù)據(jù)存在一定的差異,解混精度并不理想。后期逐漸對稀疏解混算法進行改進,將協(xié)同稀疏約束與稀疏解混算法相結合提出協(xié)作稀疏解混算法(collaborative SUnSAL,CLSUnSAL),對混合高光譜數(shù)據(jù)添加全局行稀疏性[38];利用豐度數(shù)據(jù)的空間連續(xù)性把總變分約束(total variation,TV)與SUnSAL相結合的算法(SUnSAL-TV)考慮數(shù)據(jù)的空間信息,具有較好的魯棒性[39-40]。這些改進后的解混算法比l1稀疏性方法具有更高的解混能力。
此外,學者們還把稀疏約束和NMF相結合,求解效率和精度都有較大的提高,優(yōu)于傳統(tǒng)的NMF解混方法[41-42]。Lin等[43]提出了一種基于礦物單次散射反照率光譜庫稀疏解混算法,利用簡化的Hapke模型把混合礦物反射率轉變?yōu)閱未紊⑸浞凑章?,構建單次散射反照率光譜庫,再與稀疏解混算法相結合求解端元豐度。稀疏解混算法不受端元提取準確性的影響,也不依賴于純像元的假設,但是對光譜庫的依賴性較大,光譜庫中光譜數(shù)量較大,光譜間往往存在較高的相關性,在一定程度上增加了解混的難度。
1)神經網絡解混。20世紀90年代神經網絡開始應用于遙感領域[44],它以神經元數(shù)學模型為基礎可以學習復雜的非線性特征,具有較強的非線性映射能力[45];相比于傳統(tǒng)的手動計算法具有更高的效率,已成功地應用于高光譜混合像元分解。傳統(tǒng)神經網絡結構較為簡單,包括輸入層、隱藏層和輸出層。隱藏層用于提取特征信息,在不需要先驗知識的前提下可以學習數(shù)據(jù)中的復雜關系。利用傳統(tǒng)神經網絡解混時容易出現(xiàn)過擬合問題,由于隱層學習不充分,往往導致特征提取能力不足。此外,特征提取和豐度估計一般也需要分別進行訓練。
深度學習是一種強大的神經網絡學習技術,可以對多層神經網絡進行訓練,其特點是一次無監(jiān)督學習只訓練一層,把訓練結果作為下一層的輸入,而且采用“自上而下”的方法對所有層進行微調,克服了傳統(tǒng)神經網絡的不足。Su等[46]基于深度神經網絡的理論,提出了一種堆棧非負稀疏自編碼解混方法(stacked nonnegative sparse autoencoders,SNSA),用于處理異常值和降低信噪比;通過一系列自動編碼器處理異常值,最后一組編碼器通過稀疏編碼策略用于矩陣分解。Palsson等[47]基于改進的自編碼神經網絡方法,同時進行端元識別和豐度計算,測定了不同的激活函數(shù)和目標函數(shù)在解混方面的性能,并證明該方法對高光譜解混具有較強的魯棒性。Savas等[48]提出了一種端對端的解混算法,并驗證改進后的神經網絡模型適用于高光譜解混。
基于深度學習的解混方法不需要預先分析解混的實際情形與學習數(shù)據(jù)間復雜的非線性關系,求解方便,還具有較強的抗噪性和容錯性。進行高光譜數(shù)據(jù)解混通常也面臨何時停止訓練和隱層層數(shù)設置等問題。目前應用神經網絡對高光譜進行解混的研究還處于探索階段,高光譜解混的案例與傳統(tǒng)方法相比應用較少,在混合礦物光譜解混方面的應用更少。
2)核函數(shù)法。核函數(shù)解混法是利用核函數(shù),把訓練樣本從低維空間的非線性解混問題轉化到高維空間的線性解混問題[49]。采用核函數(shù)法可以將高維空間的內積運算轉換到低維空間的核函數(shù)運算,可以有效地避免較高的特征空間維度。應用該方法需先對數(shù)據(jù)進行預處理,利用核函數(shù)構造核矩陣,再基于相關算法處理核矩陣得到模式函數(shù),然后再進行解混。常用的核函數(shù)非線性解混方法有核正交子空間投影算法(kernel orthogonal subspace projection,KOSP)[50]和核化的全約束最小二乘(kernel-FCLS,KFCLS)[51]。二者都是通過定義全局準則選擇特征向量表征數(shù)據(jù)結構,然后將混合像素投影到特征向量上并利用FCLS進行計算。多核支持向量機(multiple kernel support vector machine,MKSVM)[52],在SVM的基礎上以線性加權組合核函數(shù)代替單核數(shù),采用簡單多核學習方法迭代解算權系數(shù)實現(xiàn)分類,然后通過S型函數(shù)將分類器輸出值轉化為后驗概率,利用后驗慨率實現(xiàn)高光譜影像的非線性解混。
當高光譜數(shù)據(jù)像元包含多種地物信息時,基于核函數(shù)解混方法優(yōu)于傳統(tǒng)的解混方法。但目前基于核函數(shù)的混合像元分解主要集中于對方法的改進優(yōu)化方面,在礦物高光譜解混方面應用核函數(shù)與線性模型相結合處理非線性的光譜混合研究還相對較少。
3)流形學習方法。流形學習是一種非監(jiān)督的機器學習算法,可以處理復雜的高維度數(shù)據(jù)。流形學習的主要思想是假設高維空間給定的樣本集處于同一流形,這樣就把高光譜圖像所在的高維空間映射到低維流形局部鄰域中[53]。由于高光譜影像的高維度特征,在保留數(shù)據(jù)集大部分信息的前提下對輸入的訓練數(shù)據(jù)進行降維處理是實驗的關鍵,該方法可以有效地對高維數(shù)據(jù)進行降維處理,獲取數(shù)據(jù)內部的幾何結構和規(guī)律。流形學習典型代表方法是局部線性嵌入(local linear embedding,LIE)。Roweis等[54]基于局部線性嵌入的思想首次提出了一種約束最小乘方的局部線性加權回歸的建模方法,采用約束最小平方法計算權重系數(shù),通過混合光譜和其端元空間分布進行回歸分析。
流形學習方法計算復雜度較高,難以應用于較大的高光譜圖像,由于流形學習解混方法是挖掘高維數(shù)據(jù)內在關系規(guī)律,僅適用于學習內部較為平坦的低維流形,計算較復雜且速度較慢。雖然流形學習法在非線性解混方面具有較大潛力,但目前在解混方面相關的算法和應用較少。
礦物高光譜解混的算法較多,基于模型驅動的方法理論相對成熟,目前應用較多,隨著人工智能的發(fā)展,基于數(shù)據(jù)驅動解混方法逐步得到關注。多種解混方法在實驗室模擬光譜數(shù)據(jù)和野外礦區(qū)等高光譜影像的巖礦識別、礦區(qū)填圖方面得到了驗證和應用。不過目前眾多實驗主要圍繞Cuprite地區(qū)的AVIRIS高光譜數(shù)據(jù)開展,高光譜影像解混缺乏真實驗證數(shù)據(jù)集。無論是模型驅動法還是數(shù)據(jù)驅動解混法都需要加強在高光譜影像數(shù)據(jù)解混方面的應用。
實驗室實測光譜數(shù)據(jù)解混是重要的解混對象,也是進行高光譜解混的基礎依據(jù)。王亞軍等[55]采集新疆包古圖地區(qū)90個樣本進行粉碎制樣,應用ASD光譜儀在實驗室進行光譜測量,基于光譜匹配方法進行端元識別,應用簡化的Hapke模型把巖石樣品的反射率轉換為SSA,并通過分段濾波以及建立區(qū)域光譜庫的方法提高礦物識別精度。該方法對長石類礦物含量提取精度達到80.5%,對黏土礦物提取精度達到92.36%。趙恒謙等[17]在實驗室選取朱砂、石黃顏料粉末按不同體積比例進行混合量測光譜,用FCLS對混合光譜進行全波段解混,利用比值導數(shù)法對單波段進行解混計算各自豐度值,全波段解混的均方根誤差較大為28%,單波段解混中有20個波段為強線性波段,誤差均在10%以內,解混效果較好。李大朋等[18]基于相同方法對石青和石綠2種礦物顏料進行解混,得到相似的結論,全波段解混反演的石青和石綠豐度值的均方根誤差較高,為19%,單波段解混誤差精度分別有所提高。由于礦物組分的多樣性和復雜性,采用實測方法進行礦物識別難度較大,受到數(shù)據(jù)樣本量的限制,難以驗證基于數(shù)據(jù)驅動的多種解混方法的解混效果。
在驗證高光譜解混方法時,普遍采用光譜模擬數(shù)據(jù)。對不同類型的混合礦物波譜模擬有利于解決實際問題,如對典型蝕變礦物混合波譜的模擬,既建立蝕變帶礦物波譜模擬理論基礎,同時又為礦床蝕變信息提取的研究提供理論依據(jù);對月壤表面混合礦物光譜的模擬有利于反演月表典型的礦物含量,對月球資源利用具有重要的指導意義[20]。余先川等[2,15]利用美國地質調查局礦物光譜庫中天然堿、瀉利鹽和黝簾石3種地物光譜數(shù)據(jù),根據(jù)光譜線性混合模型和二次散射模型分別生成2組模擬數(shù)據(jù);利用VCA提取端元,分別用FCLS和非線性變換后的FCLS進行解混得到豐度系數(shù),2組數(shù)據(jù)的端元識別光譜與真實光譜相關系數(shù)均在0.99以上,但當?shù)匚锓植紡碗s情況加重時,基于線性模型的解混效果變差,基于二次散射的非線性解混效果提升,而且非線性模型具有更好的抗噪性。
基于Hapke模型與線性模型相結合進行解混的實驗較多。把單斜輝石、斜方輝石、斜長石、橄欖石和鈦鐵礦5種礦物端元非線性混合的反射光譜轉換為SSA,隨機生成混合像元,采用FCLS方法進行解混并與真實值進行比較分析,得出單斜輝石、斜方輝石和斜長石3種端元礦物反演含量與真實含量相關系數(shù)分別為0.85、0.78和0.66,橄欖石和鈦鐵礦的反演結果相關系數(shù)相對較差為0.54和0.23[20]。把Hapke模型與多種線性解混算法相結合對模擬的火星表面的巖礦樣本和在可見光-近紅波段內衛(wèi)星采集的樣本進行解混時[56],對于模擬的已知的二元、三元混合光譜解混精度在5%~10%誤差以內,但對于未知端元的多端元光譜解混誤差達到了25%。林紅磊等[4]從美國布朗大學Relab光譜庫中選取混合礦物光譜轉變?yōu)镾SA光譜庫,以半監(jiān)督方式基于SSA稀疏解混模型得到礦物的豐度,與真實含量相比反演結果的平均絕對誤差為3.12%,線性擬合相關系數(shù)的均值為0.997 7,非線性稀疏解混具有較高的精度。對石英和明礬石按照已知的比例進行混合,利用LIM、MMP、LMM和Hapke模型分別進行解混,Hapke模型獲取的豐度系數(shù)與真實比例最為接近,LIM、MMP具有相似結果,LMM模型獲取的結果與真實比例差異最大[3]。
目前高光譜解混在礦物識別和礦區(qū)填圖等方面也取得了較好的應用。對不同礦區(qū)或月球表面的巖礦樣本組分及含量的分析有助于研究巖石成因、地質構造、巖漿演化、歷史演變等重要課題[57]。
美國內華達州Cuprite地區(qū)的AVIRIS高光譜數(shù)據(jù)是學者研究的熱點,對該地區(qū)礦物填圖研究已經取得較大進展。余先川等[15]利用VCA方法提取6種礦物端元,并證明基于二次散射的非線性模型的填圖結果顯著優(yōu)于LMM模型解混的填圖結果,而且每個像元所填礦物種類為3時填圖結果更優(yōu)。在對AVIRIS高光譜數(shù)據(jù)進行解混時,Heylen等[3]采用重建誤差驗證解混結果,結果表明LIM和MMP模型獲取相對重建誤差比LMM模型獲取的重建誤差好,但Hapke模型對像元的重建誤差要高于LMM模型,證明Hapke模型對于AVIRIS數(shù)據(jù)高光譜解混并不是最理想的解混模型。
林娜等[49]采用核函數(shù)方法對AVIRIS高光譜數(shù)據(jù)解混時,證明基于該方法的解混結果明顯優(yōu)于傳統(tǒng)的NCLS和FCLS等解混方法;以明礬石和高嶺石為例,核化的正交子空間投影、核化的非約束的最小二乘和核化的全約束最小二乘獲取的均方根均值誤差分別為0.61%、0.315和0.17%,在未核化情況下誤差分別為2.7%、0.92和0.3%,誤差明顯增大。Heylen等[58]應用等距映射算法,把AVIRIS高光譜數(shù)據(jù)流映射到低維非線性空間,使用改進的內部體積最大法提取端元,并利用單形體體積的比值來計算端元豐度;該方法與利用傳統(tǒng)的內部體積最大法提取端元、FCLS計算的豐度結果進行比較,在端元數(shù)量設置為14時,利用傳統(tǒng)的內部體積最大法提取的高嶺石、蒙脫石和明礬石與USGS光譜庫的光譜比較,光譜角誤差分別為0.056、0.048和0.043,利用改進的方法在端元數(shù)量為16時計算的光譜角分別為0.070、0.049和0.056,2種方法端元提取效果相似,但改進后的方法在高光譜降維處理方面計算效率顯著提升。
利用端對端的改進后的自編碼網絡對AVIRIS的12種礦物解混的平均光譜角誤差為0.095[48];利用SNSA方法對AVIRIS數(shù)據(jù)集進行解混時,SNSA、內部體積最大法、VCA和MVC-NMF的光譜角誤差分別為0.088 9、0.105 1、0.098 9和0.090 1[46],實驗證明神經網絡具有比傳統(tǒng)解混方法更高的解混精度。除此之外,張霞等[59]使用協(xié)同稀疏解混對火星Eberswalde撞擊坑三角洲進行礦物豐度反演,得到斜長石豐度為51%、高鈣輝石豐度為29%、低鈣輝石豐度為6%和鋰蒙脫石豐度為10%,獲得了較好的解混結果。
通過對混合模型、解混算法和目前已開展的解混實驗分析,概括總結如下。
1)線性模型物理意義簡單,易于理解和計算,應用最為廣泛;對于礦物粒子而言,Hapke 模型可以詳細描述混合特征?;诨旌夏P偷慕饣旆椒ū容^成熟,如VCA等端元識別算法和FCLS豐度求解算法依然是當前較為常用的解混方法,這種線性解混方法對礦物光譜解混精度往往較低,不能滿足研究需求。近年來,把Hapke模型與線性解混相結合進行光譜解混的研究和應用逐漸增多,可以明顯提高光譜解混精度,但是對參數(shù)要求較高,模型計算往往較為復雜。傳統(tǒng)解混算法一般是基于模型驅動的非監(jiān)督算法,解混結果的好壞對混合像元數(shù)量、噪聲干擾、特征的選取、算法設計這幾個因素的依賴性很大,任意一個因素都有可能對最終解混結果產生較大的影響。把線性與非線性混合模型相結合以提高解混精度、降低噪聲干擾等是基于模型驅動算法方面需要進一步深入研究的方向。
2)基于數(shù)據(jù)驅動的解混方法可以降低計算復雜性,提高解混效率,已經逐漸應用于礦物高光譜解混。雖然流形學習和核函數(shù)法具有較強的非線性映射能力,但目前在光譜解混方面仍然處于起步階段,應用于礦物解混的研究較少。神經網絡可以學習復雜的非線性關系,具有較強的抗噪性和容錯性,近年來基于神經網絡解混的研究逐漸增多,由于深度神經網絡訓練的可監(jiān)督性、較強的泛化性能、優(yōu)于傳統(tǒng)算法的抗噪能力和提取復雜特征等優(yōu)點,已經成為學者關注的焦點,在非線性光譜解混方面取得一定的成果,但是目前處于探索階段。未來提高流形學習的抗噪性、深刻探究內部的數(shù)學理論以及對核函數(shù)算法進行改進、降低求解復雜度等是進一步深入探究的方向,對混合礦物高光譜解混將會產生重要影響。應用神經網絡進行礦物高光譜解混也存在一些需要解決的問題:端元數(shù)目的不確定性增加了端元識別的難度;基于數(shù)據(jù)驅動的解混方法需要大量的標簽數(shù)據(jù),目前缺乏大量的標簽數(shù)據(jù);對于深度神經網絡的隱層物理意義理解不足,隱藏層層數(shù)的設定不明確等。因此,建立大量優(yōu)質的標簽數(shù)據(jù)庫、深入地挖掘神經網絡內部的物理含義、在端元數(shù)目未知情況下訓練深度神經網絡等是未來應用深度學習進行礦物解混的重要研究方向。