鄭愷雯 李慧 范仙如 梁鋒娜 陳小玲
摘 要:高光譜遙感技術(shù)是一門致力于區(qū)分同一地物不同類別并進(jìn)行相關(guān)分析的新興技術(shù)。其中端元提取是混合像元分解中關(guān)鍵的第一步。本文對(duì)端元提取算法進(jìn)行了分類闡述,分別介紹了窮舉法、投影法、迭代法的典型算法,并比較了3種算法之間的優(yōu)缺點(diǎn),以期為高光譜遙感應(yīng)用提供參考。
關(guān)鍵詞:窮舉法;投影法;迭代法;端元提取
中圖分類號(hào):TP79 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1671-2064(2019)09-0198-02
0 引言
高光譜遙感技術(shù)是利用很窄而又連續(xù)的光譜通道對(duì)地物持續(xù)遙感成像的技術(shù),包含了地物豐富的地表特征[1]。與傳統(tǒng)遙感技術(shù)相比,高光譜遙感可以區(qū)別同一地物的不同類別,如水稻與小麥等[2]。
高光譜遙感具有光譜分辨率高的特點(diǎn),在空間分辨率的限制與復(fù)雜地物的影響下,導(dǎo)致高光譜影像中普遍存在混合像元[3]。在基于高光譜影像識(shí)別與分類時(shí),首先要對(duì)影像進(jìn)行混合像元分解[4]。端元提取算法較多,傳統(tǒng)的方法是以監(jiān)督分類為主導(dǎo),隨著科學(xué)技術(shù)的進(jìn)步,當(dāng)代學(xué)者采用一系列自動(dòng)的非監(jiān)督分類算法進(jìn)行端元光譜的自動(dòng)提取[5]。
自動(dòng)提取端元的算法,總體可以分為3類:窮舉算法、投影算法和迭代算法[6]。本文就端元提取算法參考大量文獻(xiàn),對(duì)現(xiàn)當(dāng)代常用的算法進(jìn)行歸類分析,綜合討論各算法的運(yùn)用原理以及優(yōu)缺點(diǎn)。
1 窮舉算法
窮舉算法利用已知的部分條件如端元的個(gè)數(shù)信息對(duì)高光譜數(shù)據(jù)進(jìn)行逐一驗(yàn)證,直到全部結(jié)果毫無遺漏驗(yàn)證完畢為止[7]。由于高光譜遙感的光譜分辨率高,導(dǎo)致高光譜遙感在運(yùn)用窮舉算法進(jìn)行端元提取時(shí),速度較為緩慢,嚴(yán)重影響運(yùn)行速率。
1.1 N-FINDR算法
據(jù)鄭麗等人介紹,N-FINDR算法將高光譜遙感影像的全部數(shù)據(jù)歸放至多維空間中,構(gòu)成的凸集的頂點(diǎn)位置就是所要提取的端元位置[8]。
以兩個(gè)波段組成的二維空間平面為例,如圖1所示,三個(gè)端元在二維空間中的散點(diǎn)圖以三角形的形式存在,而端元的位置則位于三角形的三個(gè)頂點(diǎn)處,三角形所圍成的平面內(nèi)則是三個(gè)端元的混合像元。以此類推,N-FINDR算法的主要目的就是在多維空間中尋找能夠構(gòu)成最大單形體的頂點(diǎn)位置。由于高光譜遙感影像的波段數(shù)眾多,所以首先要對(duì)影像進(jìn)行降維處理。
N-FINDR算法是基于“純像元存在于高光譜遙感影像中”的假設(shè)提出來的,受初始化端元性質(zhì)的影響極大。據(jù)李志飛等學(xué)者介紹,原始N-FINDR算法采用全局搜索的方式,對(duì)影像數(shù)據(jù)進(jìn)行多次遍歷,嚴(yán)重影響了影像的處理效率,不利于大批量處理光譜數(shù)據(jù)[9]。針對(duì)N-FINDR算法的一系列缺陷,SGA算法逐步發(fā)展成熟。
1.2 SGA算法
單體增長(SGA)算法是在多維空間中尋找一系列頂點(diǎn)數(shù)不同且體積最大的單形體,并逐一提取單形體的頂點(diǎn)作為端元。SGA算法是N-FINDR算法的改進(jìn),王茂之等表示,SGA算法先找到“體積”最大的單體的兩個(gè)端點(diǎn),再遍歷其他像元,尋找其他端元的所在位置,直到找到指定數(shù)量的端元為止。SGA的實(shí)現(xiàn)步驟可參考文獻(xiàn)[10]。
與N-FINDR算法相比,該算法不存在“純像元”的限制,且運(yùn)算速度會(huì)略有提高。但通過上述步驟的介紹可以得知,該算法的運(yùn)算速度取決于循環(huán)的次數(shù),即初始化設(shè)置的端元個(gè)數(shù)。
2 投影算法
投影算法主要基于端元是凸面單形體的頂點(diǎn),位于單形體邊界這一事實(shí)[3]。與窮舉算法不同的是,投影算法通過找尋點(diǎn)與點(diǎn)之間的距離、點(diǎn)與超平面之間的距離、點(diǎn)與凸面單形體間的距離等最大距離方式來判定端元位置。
2.1 PPI算法
鄭麗指出,PPI以凸面幾何學(xué)為基礎(chǔ),將N維空間中的光譜特征作為像元純度指數(shù)的載體[8]。對(duì)高光譜數(shù)據(jù)降維后的主要成分組成的特征空間中進(jìn)行像元投影測試,對(duì)每個(gè)像元疊加位于測試向量兩端的次數(shù)。根據(jù)所有像元由純像元為頂點(diǎn)的凸面幾何體包圍的特點(diǎn),投影在測試向量兩端越多次數(shù)的像元越有較大的端元可能性[11],被記錄的測試向量兩端的次數(shù)即為PPI。以兩測試向量為例,如圖2,在測試向量X,Y所組成的二維平面空間內(nèi),所有像元均投影在測試向量上時(shí),被投影到向量兩端的點(diǎn)被記錄下來,像元A、B、C的PPI指數(shù)分別為2,1,1。以此類推,被投影到測試向量兩端的次數(shù)越多,其PPI越大,越容易被認(rèn)為是純像元的可能性越大。
PPI指數(shù)的工作原理十分簡單,但也存在明顯的缺陷。該指數(shù)只能簡單地確定純像元的位置,而且通過以上算法過程分析,PPI指數(shù)確定的端元位置仍然充滿不確定性,這與測試向量的選擇、特征空間的分布狀況等有極大的關(guān)系。
2.2 VCA算法
頂點(diǎn)成分分析(VCA)算法具有良好的理論基礎(chǔ),并取得了相對(duì)較好的效果,是提取端元的一種較為重要與常用的手段之一[12]。VCA算法的基本思想為,在線性混合模型下,觀測向量集合組成一個(gè)凸面單形體,將凸面單形體內(nèi)的數(shù)據(jù)反復(fù)正交投影到超平面上,最大的投影向量即為端元。該算法的具體實(shí)現(xiàn)步驟可參考文獻(xiàn)[12]。
與PPI算法一樣,VCA算法也是一種端元逐次提取算法,前面所提取的端元不會(huì)影響后續(xù)端元的提取。該算法可以有效的避免在端元數(shù)目估計(jì)不正確的情況下,端元之間的相互干擾,提高了計(jì)算算法較為簡單,大大提高了算法的計(jì)算速度。
3 迭代算法
迭代法是一種重復(fù)計(jì)算的算法。迭代法運(yùn)用了計(jì)算機(jī)運(yùn)算速度快、適合重復(fù)工作的特點(diǎn),使計(jì)算機(jī)對(duì)一組指令不斷重復(fù),在舊值的基礎(chǔ)上推算出新值[4]。該算法適用于處理數(shù)據(jù)量大的高光譜數(shù)據(jù)。
3.1 SMACC算法
逐次最大角凸錐分析(SMACC)算法是一種基于迭代算法自動(dòng)尋找最大凸面單形體頂點(diǎn),自動(dòng)獲取端元,并提供端元豐度圖像的方法[13]。該方法的最終目的是尋找最大凸椎體的頂點(diǎn),獲得端元,并對(duì)遙感影像進(jìn)行分解和分類。
凸錐的一個(gè)基本性質(zhì)是:一個(gè)b維向量,如果擁有c-1(c為組分?jǐn)?shù))個(gè)分量為0,其他分量均為非負(fù)值,則該向量為凸錐的角點(diǎn)[13]。關(guān)于SMACC的工作原理,具體可看考文獻(xiàn)[13]。
與傳統(tǒng)的CCA算法相比,SMACC算法在選擇最佳頂點(diǎn)時(shí),添加了一定的規(guī)則限制,利用計(jì)算機(jī)技術(shù)自動(dòng)提取出符合條件的最佳角點(diǎn),比CCA算法更加有說服力。但SMACC算法作為CCA算法的改進(jìn)。
3.2 IEA算法
據(jù)吳波等人介紹,誤差迭代分析(IEA)算法的本質(zhì)是根據(jù)分塊矩陣的原理,對(duì)混合像元線性分解后得到的殘存誤差進(jìn)行分析歸類,并定位到端元所在的光譜位置,并按照一定的閾值范圍來確定最終端元的光譜特征[14]。與上述方法不同的是,此方法不需要降維,而是直接給定一個(gè)初試化向量,根據(jù)初始化向量得到的殘差圖像選擇端元,再進(jìn)行重復(fù)循環(huán),以此類推,直到求出所有端元為止[8]。
該算法從純數(shù)學(xué)的理論出發(fā),最大的缺點(diǎn)就是沒有考慮端元的空間關(guān)系與端元間的相互獨(dú)立[14]。端元的空間分布情況不是均勻的,實(shí)際上具有一定的形狀和積聚性,空間分布的不均勻性對(duì)迭代誤差算法的精度有很大的影響作用。
4 結(jié)論與展望
(1)窮舉法:側(cè)重于遍歷尋找降維后各光譜數(shù)據(jù)間使凸面單形體體積最大的頂點(diǎn)作為像元。雖然用該方法提取的端元信息精度較高,但是運(yùn)算量大,且運(yùn)用的降維算法對(duì)選取的端元有一定的影響。(2)投影法:側(cè)重?cái)?shù)據(jù)在波段所組成的特征空間中的投影。投影方式的不同,端元提取的效果也不盡相同。該算法相對(duì)而言,大多數(shù)的投影算法以尋找投影后在特征向量上的兩端點(diǎn)或距離遠(yuǎn)近關(guān)系等特點(diǎn)來確定端元所在位置,其運(yùn)算量較小,是一種快速提取像元的方法。(3)迭代法:根據(jù)給定的初始值,不斷進(jìn)行迭代分析,直到找到所需的全部端元為止,是迭代算法的一大特點(diǎn)。該算法可以解決窮舉法的降維問題,但初始值對(duì)后續(xù)端元的提取有很大的影響。
參考文獻(xiàn)
[1] 湯毅,萬建偉,許可,等.地物空間分布特性的高光譜遙感圖像解混算法[J].紅外與毫米波學(xué)報(bào),2014,33(05):560-570.
[2] 杜培軍,夏俊士,薛朝輝,等.高光譜遙感影像分類研究進(jìn)展[J].遙感學(xué)報(bào),2016,20(02):236-256.
[3] 田珊珊,楊敏華.高光譜影像端元提取算法研究與分析[J].山東農(nóng)業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版),2018,49(05):847-851.
[4] 董安國,韓雪,龔文娟.基于單體擴(kuò)張的端元提取算法[J].紅外技術(shù),2016,38(11):947-952.
[5] A I, Chang. C. Unsupervised Hyperspectral Image Analysis with Projection Pursuit[J]. IEEE Trans. Geoscience and Remote Sensing,2000,38(6):2529-2538.
[6] 郭山,袁路,孫衛(wèi)東.基于特征端元提取的像元分解方法[J].高技術(shù)通訊,2008,18(10):1035-1040.
[7] 徐元進(jìn),胡光道.窮舉法在高光譜遙感圖像地物識(shí)別中的應(yīng)用[J].四川大學(xué)學(xué)報(bào)(工程科學(xué)版),2007(S1):168-173.
[8] 鄭麗.端元提取算法的研究綜述[J]. 湖北第二師范學(xué)院學(xué)報(bào),2015,32(02):20-23.
[9] 李志飛,楊敏華.一種基于N-FINDR的優(yōu)化端元提取算法[J].測繪地理信息,2017,42(05):70-73.
[10] 齊建成,朱述龍,朱寶山,等.圖像端元全自動(dòng)提取方法研究[J].海洋測繪,2009,29(02):16-19.
[11] 王茂芝,徐文皙,王璐,等.高光譜遙感影像端元提取算法研究進(jìn)展及分類[J].遙感技術(shù)與應(yīng)用,2015,30(04):616-625.
[12] 何曉寧,曹建農(nóng),高坡,等.基于頂點(diǎn)成分分析法的端元提取改進(jìn)算法[J].測繪通報(bào),2013(07):30-34.
[13] 褚海峰,翟中敏,趙銀娣,等.一種多/高光譜遙感圖像端元提取的凸錐分析算法[J].遙感學(xué)報(bào),2007(04):460-467.
[14] 吳波,張良培,李平湘.高光譜端元自動(dòng)提取的迭代分解方法[J].遙感學(xué)報(bào),2005(03):286-293.