蘇紅軍,姚文靜,吳曌月
河海大學(xué) 地球科學(xué)與工程學(xué)院,南京 211100
高光譜遙感能夠連續(xù)記錄數(shù)百個光譜波段,光譜分辨率很高,同時,大量連續(xù)的窄波段信息為區(qū)分具有同譜異物現(xiàn)象的地物提供了便利(童慶禧等,2006)。分類是高光譜遙感應(yīng)用的重要處理過程,高效可靠的分類方法是實現(xiàn)這一過程的首要前提。但高光譜遙感分類存在著波段維數(shù)高、標記樣本少以及信息冗余等挑戰(zhàn)(杜培軍等,2016;彭江濤等,2020;武復(fù)宇等,2020;蘇紅軍,2022)。近年來,高分五號GF?5(Gaofen?5)高光譜遙感影像的應(yīng)用越來越廣泛(孫偉偉等,2020;張立福等,2022),新出現(xiàn)的表示模型可以利用少量樣本的線性組合重構(gòu)影像實現(xiàn)分類,在一定程度上緩解了“維數(shù)災(zāi)難”問題。因此,充分發(fā)揮表示模型的優(yōu)勢成為高光譜遙感分類中的重要研究內(nèi)容,也是當前高光譜遙感分類的研究熱點。
目前,基于表示模型的高光譜遙感分類方法可以分為以下3 類:第一類方法是稀疏表示分類SRC(Sparse Representation Classification),它假設(shè)每個高光譜像元可以由過完備字典原子的線性組合稀疏表示,再根據(jù)重構(gòu)誤差確定待測試像元的類別(Wright 等,2009)。例如,Yu等(2020)提出了一種利用非局部空間相似度和局部光譜相似度的新方法,并基于群組稀疏表示對高光譜影像分類,有效地利用了數(shù)據(jù)的空譜信息。當訓(xùn)練樣本數(shù)量有限時,Cui 等(2020)提出了一種樣本偽標記方法,利用稀疏表示選擇干凈的樣本然后擴展訓(xùn)練集,并通過實驗證明了生成的樣本具有很高的可信度。SRC 雖然能在高光譜分類中取得不錯的效果,但是求解稀疏性約束l1范數(shù)的計算復(fù)雜度較高。
第二類方法是協(xié)同表示分類CRC(Collaborative Representation Classification),其基本思想是利用所有訓(xùn)練樣本的線性組合來表示每個待分類樣本,然后根據(jù)最小重構(gòu)誤差判斷像素的類別(Jia 等,2015)。Su 等(2018)充分挖掘影像的局部結(jié)構(gòu)信息,提出利用區(qū)域塊中的空間相關(guān)特征對高光譜影像進行協(xié)方差矩陣協(xié)同表示分類。考慮到單一分類器的效果不夠理想,Su 等(2020)又提出了一種基于切空間協(xié)同表示的集成學(xué)習(xí)方法用于高光譜分類,將若干個基分類器通過集成學(xué)習(xí)共同對測試影像進行分類。CRC 中l(wèi)2范數(shù)約束的訓(xùn)練樣本間“合作性”的表示可以獲得更高的分類精度,而且l2范數(shù)可以通過最小二乘法求解,計算效率更高。
第三類方法是低秩表示分類(Liu 等,2013)。低秩表示LRR(Low?rank Representation)模型簡單,在高光譜遙感分類中受到了廣泛的關(guān)注。例如,考慮到數(shù)據(jù)內(nèi)部的局部相關(guān)性,Wang 等(2019)引入了一種新的結(jié)合空間和光譜特征的距離度量來探索像素的局部相似性,有效地改進了經(jīng)典的LRR 算法。為了提高高光譜影像的分類效果,Sun等(2019)提出了一種基于LRR 的空間光譜核方法,可以識別目標像素的自適應(yīng)鄰域。
上述分析表明,在高光譜遙感影像的表示分類中,SRC 雖然能夠很好地解決數(shù)據(jù)量大、波段維數(shù)高等問題,但是l1范數(shù)求解比較復(fù)雜,計算成本高;CRC 雖然有效地提高了計算效率,但是它沒有考慮數(shù)據(jù)的全局結(jié)構(gòu),破壞了內(nèi)部相關(guān)性;LRR 可以很好的表征數(shù)據(jù)的全局結(jié)構(gòu)和影像內(nèi)部的時空相關(guān)性,而且模型簡單,計算成本低。在低秩優(yōu)化求解時,通常用核范數(shù)代替秩函數(shù),但是兩者的偏差會使分類結(jié)果存在一定的誤差。而且LRR 通過線性表示待測試影像實現(xiàn)分類,當數(shù)據(jù)為非線性結(jié)構(gòu)時,分類效果可能不太理想。因此,如何更好地解決低秩優(yōu)化問題和處理非線性數(shù)據(jù)的分類問題,成為高光譜遙感影像低秩表示分類中急需解決的難題。
因此,本文提出了一種新的基于彈性網(wǎng)絡(luò)的低秩表示方法ENLRR(Low?rank Representation based on Elastic Net),在LRR 的基礎(chǔ)上,引入統(tǒng)計學(xué)中的彈性網(wǎng)絡(luò)思想,利用系數(shù)矩陣的核范數(shù)和F?范數(shù)代替秩函數(shù)進行低秩優(yōu)化求解。為了拓展ENLRR 方法對非線性數(shù)據(jù)的處理性能,先利用鄰域濾波核函數(shù)將原數(shù)據(jù)映射到高維特征空間,再利用ENLRR 方法進行分類,提出了改進的基于彈性網(wǎng)絡(luò)的核低秩表示方法即KENLRR (Kernel ENLRR),有效地解決了非線性數(shù)據(jù)的分類問題。本文提出的ENLRR 方法和KENLRR 方法主要有以下優(yōu)勢:
(1)ENLRR 方法在構(gòu)建目標函數(shù)時,利用系數(shù)矩陣的核范數(shù)和F?范數(shù)進行低秩優(yōu)化求解。核范數(shù)相當于系數(shù)矩陣奇異值的l1范數(shù),可以保證稀疏性,使測試影像由盡可能少的訓(xùn)練樣本線性表示。F?范數(shù)相當于奇異值的l2范數(shù),可以使算法更穩(wěn)定。而且基于LRR 的框架進行分類,能夠保證數(shù)據(jù)的全局結(jié)構(gòu)和內(nèi)在相關(guān)性,結(jié)合高光譜影像光譜分辨率高的優(yōu)勢,有效減少了分類過程中的同譜異物現(xiàn)象。
(2)KENLRR 方法在ENLRR 方法的基礎(chǔ)上引入核方法,通過鄰域濾波核函數(shù)將原始數(shù)據(jù)映射到高維特征空間,使得原本在低維空間中線性不可分的數(shù)據(jù)可以通過高維空間中的向量內(nèi)積運算變得線性可分。而且鄰域濾波核函數(shù)中引入了一個空間窗口,可以在鄰域空間中計算相鄰像素的相似性,從而獲取影像的空間信息,實現(xiàn)空譜聯(lián)合分類。
為了解決LRR 在高光譜遙感分類中的低秩優(yōu)化問題和非線性數(shù)據(jù)的分類問題,本文提出了ENLRR 方法和KENLRR 方法,算法的示意圖如圖1所示。
圖1 提出算法的示意圖Fig.1 The framework of proposed methodology
Liu等(2013)提出的LRR模型為
式中,X是原始數(shù)據(jù)矩陣,E是噪聲矩陣,Z是系數(shù)矩陣。矩陣秩的最小化是一個NP?hard問題,為了對秩函數(shù)進行松弛,Liu 等(2013)利用核范數(shù)代替秩函數(shù)求解低秩優(yōu)化問題如下:
然而,核范數(shù)和矩陣的秩有一定的偏差。為了使模型更加穩(wěn)定可靠,引入了統(tǒng)計學(xué)中的彈性網(wǎng)絡(luò)思想(Zou 和Hastie,2005),聯(lián)合l1范數(shù)和l2范數(shù)作為約束項。其中,l1范數(shù)約束可以確保得到稀疏解,l2范數(shù)約束可以保證算法的穩(wěn)定性。
式中,xi代表第i個待分類樣本,δ是一個指示算子,可以把訓(xùn)練樣本集合A中不屬于i類的原子對應(yīng)的Z中的所有元素置為零,即保證第i類對應(yīng)元素不變,其他類元素均為零。
盡管ENLRR 算法可以在高光譜遙感影像分類中取得較好的效果,但是它很難處理一些線性不可分的高維數(shù)據(jù)。為了解決該問題,可以通過機器學(xué)習(xí)中的核方法將原始數(shù)據(jù)映射到高維特征空間中,從而使得低維空間中線性不可分的數(shù)據(jù)可以通過高維特征空間中的內(nèi)積運算變得線性可分。核方法是解決高維數(shù)據(jù)和少量訓(xùn)練樣本分類問題的有力工具(Baudat 和Anouar,2000)。如圖2 所示,在二維空間中給定的數(shù)據(jù)集很難通過投影或其他方式線性區(qū)分,如果引入一個映射,將二維空間映射到三維空間,那么在高維空間中只需要一個簡單的平面就可以將原本難以區(qū)分的數(shù)據(jù)集很好地區(qū)分開。
圖2 核方法示意圖Fig.2 The schematic diagram of kernel method
給定(xi,yi),i=1,2,…,n,x,y∈X,X?Rn,非線性映射函數(shù)Φ 可以將輸入空間X映射到高維希爾伯特空間F,其中F?Rm,n?m,根據(jù)核函數(shù)定義有
為了證明本文提出的ENLRR 算法和KENLRR算法在解決低秩優(yōu)化問題和處理非線性數(shù)據(jù)分類問題方面的有效性,實驗部分分別采用超光譜數(shù)字圖像收集實驗儀器HYDICE (Hyperspectral Digital Imagery Collection Experiment)、機載高光譜制圖儀HYMAP(Hyperspectral Mapper)以及可見短波紅外高光譜相機AHSI(Advanced Hyperspectral Imager)采集的3 組高光譜遙感影像數(shù)據(jù)進行驗證和分析。
實驗采用Washington DC 數(shù)據(jù)、Purdue Campus數(shù)據(jù)、黃河口濕地數(shù)據(jù)等3組高光譜數(shù)據(jù),每類隨機選取若干數(shù)量的樣本作為訓(xùn)練集,其余樣本作為測試集。每組實驗重復(fù)5次,計算精度的平均值作為最終的結(jié)果。為了說明本文提出的算法的有效性,采用支持向量機SVM(Melgani 和Bruzzone,2004)、K近鄰算法KNN(Altman,1992)、極限學(xué)習(xí)機ELM(Huang 等,2006)、低秩表示LRR、多特征低秩表示MFLRR(Zhang 等,2018)、基于低秩稀疏分解的低秩表示LSLRR(Chen 等,2012)以及核低秩表示KLRR(Sun 等,2020)這7 種算法作為對比。采用類別精度CA(Class Accuracy)、總體精度OA (Overall Accuracy)、平均精度AA(Average Accuracy)和Kappa 系數(shù)這4 種評價指標來衡量算法的有效性。本文實驗均是在MATLAB R2017a、Windows 7(64?bit)系統(tǒng)進行操作。
第一組實驗數(shù)據(jù)是由HYDICE傳感器獲取的華盛頓特區(qū)的高光譜影像,空間分辨率為2.8 m,覆蓋了可見光到近紅外區(qū)域(0.4—2.4 μm)的210個光譜波段,去除水吸收波段后,剩余191個波段的數(shù)據(jù)用于實驗分析。影像大小為266×304,共包含7 類地物(Huang 和Zhang,2008)。該實驗區(qū)域的假彩色影像圖和地面樣本數(shù)據(jù)分布圖如圖3 所示,樣本分布如表1 所示??梢钥闯?,Washington DC實驗區(qū)域?qū)儆诘湫偷某鞘袇^(qū)域,7 個類別的地物分布格局比較規(guī)則,整體呈現(xiàn)有規(guī)律的塊狀分布。為了兼顧算法的精度與效率,每類隨機選取20 個訓(xùn)練樣本進行實驗,圖4(a)—4(i)展示了不同方法的分類結(jié)果,可以看出KENLRR 算法的分類效果最好,可以準確刻畫各類地物的分布格局,而ENLRR算法對陰影的識別效果較差。
圖3 Washington DC假彩色影像圖與地面樣本數(shù)據(jù)分布圖Fig.3 False color image and ground truth distribution map of Washington DC
圖4 Washington DC不同算法的分類圖Fig.4 Classification maps for different algorithms of Washington DC
表1 Washington DC的樣本分布Table 1 Sample distribution of Washington DC
各種方法的精度如表2所示??梢钥闯觯瑢τ赪ashington DC 數(shù)據(jù),KENLRR 的分類精度最高,總體精度OA 最高為99.84%,ENLRR 的總體精度OA 為97.65%。相比于LRR 算法,ENLRR 算法和KENLRR 算法的總體精度OA 分別提高了4.55%和6.74%,平均精度AA 分別提高了5.77%和8.60%,Kappa 系數(shù)分別提高了0.0543 和0.0807,證明了提出算法的有效性。而且KENLRR 的類別精度很高,尤其是對于水體、小徑、樹木、陰影和屋頂,可以完全將它們與其他地物區(qū)分。從各項評價指標來看,提出的KENLRR 算法分類效果最好,ENLRR算法次之,表明在低秩表示模型中引入彈性網(wǎng)絡(luò)思想和核方法可以有效地提高分類精度。分類結(jié)果的標準誤差如表3所示,可以看出ENLRR和KENLRR具有較小的標準誤差,說明了分類結(jié)果的可靠性。
表2 Washington DC分類精度Table 2 Classification accuracy of Washington DC
表3 3組數(shù)據(jù)集的分類標準誤差Table 3 Classification standard errors of three datasets
第二組實驗數(shù)據(jù)是由HYMAP 傳感器采集的普渡大學(xué)西拉法葉校區(qū)高光譜影像,空間分辨率約3.5 m,覆蓋了可見光到近紅外區(qū)域(0.4—2.4 μm)的128個光譜波段,去除水吸收波段后,剩余126個波段的數(shù)據(jù)用于實驗。影像大小為377×512,一共包含6 類地物(Huang 和Zhang,2008)。該實驗區(qū)域的假彩色影像圖和地面樣本數(shù)據(jù)分布圖如圖5所示,樣本分布如表4 所示??梢钥闯觯琍urdue Campus 實驗區(qū)域?qū)儆诰幼^(qū),綠地面積較大,道路呈交錯的網(wǎng)狀分布,地物分布在整體上的關(guān)聯(lián)性不強。每類隨機選取20 個訓(xùn)練樣本進行實驗,圖6(a)—6(i)分別展示了不同算法的分類結(jié)果??梢钥闯?,圖6(i)中的KENLRR 算法分類效果最好,并且對各類地物的識別效果均比較好。而ENLRR 算法的分類效果不太理想,尤其是對于道路、陰影和土壤等地物,容易將它們與其他地物混分。
圖5 Purdue Campus假彩色影像圖與地面樣本數(shù)據(jù)分布圖Fig.5 False color image and ground truth distribution map of Purdue Campus
圖6 Purdue Campus不同算法的分類圖Fig.6 Classification maps for different algorithms of Purdue Campus
表4 Purdue Campus的樣本分布Table 4 Sample distribution of Purdue Campus
表5 展示了每類選取20 個樣本時各種方法的精度。對于Purdue Campus 數(shù)據(jù),KENLRR 的分類精度最高,總體精度OA 最高為98.06%,ENLRR的總體精度OA 為88.98%。相比于LRR 算法,ENLRR 和KENLRR 的總體精度OA 分別提高了14.22%和23.30%,平均精度AA分別提高了15.97%和29.09%,Kappa系數(shù)分別提高了0.1773和0.2915,表明提出的算法具有較好的穩(wěn)定性。尤其是對于道路、土壤和屋頂?shù)鹊匚?,提出的KENLRR 算法可以保持較高的識別精度,而其他算法的效果不理想。分類標準誤差如表3 所示,可以看出ENLRR 和KENLRR 的標準誤差很小,進一步證明了算法的可靠性。
表5 Purdue Campus分類精度Table 5 Classification accuracy of Purdue Campus
第三組實驗數(shù)據(jù)是由GF5_AHSI傳感器采集的位于山東省東營市的黃河口濕地高光譜數(shù)據(jù)(Jiao等,2019;Ren 等,2020),空間分辨率約30 m,覆蓋了可見光到短波紅外共330 個連續(xù)的光譜波段。去除45 個水吸收波段后,剩余285 個波段的數(shù)據(jù)參與實驗,影像大小為1185×1324,一共有21 類地物,具體的樣本信息如表6 所示。實驗區(qū)域的假彩色影像圖和地面樣本數(shù)據(jù)分布見圖7,可以看出,黃河口濕地屬于典型的濱海濕地,河流縱橫交錯,形成明顯的網(wǎng)狀結(jié)構(gòu),各種地物呈塊狀分布。每類隨機選取10 個像元作為訓(xùn)練樣本參與分類,圖8(a)—8(i)分別展示了不同算法的分類結(jié)果,可以看出,KENLRR 算法在準確區(qū)分地物方面表現(xiàn)最好。特別是對于魚塘、水稻、建筑、玉米、淺海、蘆葦、淡水草本沼澤、水生植被等地物,LRR 等方法的識別能力較弱,而KENLRR 可以很好地將它們與其他地物區(qū)分。因為建筑、玉米、淡水草本沼澤和水生植被等地物的標記樣本較少,核方法可以較好地處理小樣本分類問題。魚塘、水稻和蘆葦?shù)鹊匚锏姆植驾^為分散,KENLRR 可以通過計算鄰域空間中像素的相似性獲取空間信息實現(xiàn)較好的分類效果。
圖7 黃河口濕地假彩色影像圖與地面樣本數(shù)據(jù)分布圖Fig.7 False color image and ground truth distribution map of Yellow River Delta
圖8 黃河口濕地不同算法的分類圖Fig.8 Classification maps for different algorithms of Yellow River Delta
表6 黃河口濕地的樣本分布Table 6 Sample distribution of Yellow River Delta
表7 展示了每類選取10 個訓(xùn)練樣本時各種方法的精度對比。對于黃河口濕地數(shù)據(jù),KENLRR算法的總體精度OA 最高為96.63%,ENLRR 算法的總體精度OA 為89.68%。相比于LRR 算法,ENLRR 算法和KENLRR 算法的總體精度OA 分別提高了8.45%和15.40%,平均精度AA 分別提高了13.00%和23.10%,Kappa 系數(shù)分別提高了0.0916和0.1671。分類結(jié)果的標準誤差如表4 所示,提出的ENLRR 和KENLRR 的標準誤差均比較小,其中KENLRR的標準誤差最小為1.5247。各種精度評價指標證明了ENLRR 算法和KENLRR 算法的有效性和穩(wěn)定性。
表7 黃河口濕地分類精度Table 7 Classification accuracy of Yellow River Delta
在提出的ENLRR 算法和KENLRR 算法中,精度主要與4 個參數(shù)有關(guān):訓(xùn)練樣本的數(shù)量、λ1、λ2和σ。其中,λ1是約束系數(shù)矩陣核范數(shù)的參數(shù),λ2是約束系數(shù)矩陣F?范數(shù)的參數(shù),σ是鄰域濾波核函數(shù)的參數(shù)。為了進一步研究算法的性能,本文分析了這4個參數(shù)對分類結(jié)果的影響。
選取一組不同數(shù)量的像元作為訓(xùn)練樣本,研究樣本尺寸對精度的影響,3 組數(shù)據(jù)集的總體精度OA 變化趨勢如圖9 所示,可以看到,對于3 組數(shù)據(jù),提出的KENLRR 算法的精度最高,而且隨著訓(xùn)練樣本數(shù)量的增加,總體精度OA 呈現(xiàn)上升趨勢。對于Washington DC 數(shù)據(jù),當每類選取60個像元作為訓(xùn)練樣本時,KENLRR 的總體精度OA 最高為99.85%。當樣本數(shù)量達到20 個時,總體精度OA 上升趨勢減慢,說明樣本數(shù)量對精度的影響降低。當訓(xùn)練樣本數(shù)量超過20 個時,Purdue Campus數(shù)據(jù)的分類精度增長速度變慢,當訓(xùn)練樣本數(shù)量為60 時,總體精度OA 最高可達98.92%。對于黃河口濕地數(shù)據(jù),當每類選取30 個訓(xùn)練樣本時,總體精度OA最高可達98.93%。而當每類訓(xùn)練樣本數(shù)量超過10個后,總體精度OA上升的速度變慢。所以對3組數(shù)據(jù)集來說,最佳的訓(xùn)練樣本大小分別是20、20、10。
圖9 不同訓(xùn)練樣本數(shù)量下3組數(shù)據(jù)的總體分類精度Fig.9 Classification OA of three groups of datasets with different number of training samples
本節(jié)研究λ1對精度的影響,3組數(shù)據(jù)集的總體精度OA 變化如圖10 所示??梢钥闯鯡NLRR 和KENLRR 對λ1不敏感,當λ1變化時,總體精度OA趨于穩(wěn)定,說明算法對λ1具有魯棒性。而LRR 和MFLRR的精度隨λ1的增大而減小。對于Washington DC數(shù)據(jù),ENLRR的總體精度OA最高可達97.65%,KENLRR 的總體精度OA 最高可達99.84%。對于Purdue Campus 數(shù) 據(jù),ENLRR 的 總 體 精 度OA 最 高為88.98%, KENLRR 的總體精度OA 最高為98.06%,在ENLRR 算法的基礎(chǔ)上提高了9.08%。對于黃河口濕地數(shù)據(jù),ENLRR 的總體精度OA 最高為89.68%,KENLRR 的總體精度OA 最高為96.63%。
圖10 λ1對3組數(shù)據(jù)集總體分類精度的影響Fig.10 The effect of λ1 on three groups of datasets
本節(jié)研究參數(shù)λ2對精度的影響,3組數(shù)據(jù)集上ENLRR 算法和KENLRR 算法的總體精度OA 變化曲線分別如圖11 (a) —11 (f) 所示。對于Washington DC 數(shù)據(jù),ENLRR 的精度隨著λ2的增大而減小,總體精度OA 在λ2=1E?4 時取得最大值97.65%。KENLRR 的精度隨著λ2的增大逐漸增加,在λ2=1E?2 時總體精度OA 取得最大值99.84%。對于Purdue Campus數(shù)據(jù),ENLRR的精度隨著λ2的增加逐漸減小,當λ2的值為1E?4 時,總體精度OA的最大值為88.98%。KENLRR 的精度隨著λ2的增大逐漸增加,在λ2=1E?2 時總體精度OA 取得最大值98.06%。對于黃河口濕地數(shù)據(jù),隨著λ2的增大,ENLRR 的精度減小,在λ2=1E?4時總體精度OA 取得最大值89.68%。KENLRR 的精度隨著λ2的增大而上升,在λ2=1E?2 時總體精度OA 取得最大值96.63%。綜合3 組數(shù)據(jù)集的實驗結(jié)果,在ENLRR算法中,可以將λ2的經(jīng)驗值設(shè)置為1E?4,在KENLRR算法中,可以將λ2的經(jīng)驗值設(shè)置為1E?2。
圖11 ENLRR和KENLRR中λ2對3組數(shù)據(jù)集總體分類精度的影響Fig.11 The effect of λ2 on three groups of datasets in ENLRR and KENLRR
本節(jié)研究KENLRR 算法中參數(shù)σ對精度的影響,3 組數(shù)據(jù)集的總體精度OA 變化曲線如圖12 所示。對于Washington DC 數(shù)據(jù),總體精度OA隨著σ的增大逐漸增加,在0.1處取得最大值99.84%。對于Purdue Campus 數(shù)據(jù),隨著σ的增大,總體精度OA 逐漸上升,在σ=0.1 處取得最大值98.06%。對于黃河口濕地數(shù)據(jù),隨著σ的增大,精度先有所減小然后逐漸增大,在0.1 處取得最大值96.63%。綜合3組數(shù)據(jù)的實驗結(jié)果,在KENLRR算法中,可以將參數(shù)σ的經(jīng)驗值設(shè)置為0.1。
圖12 KENLRR中σ對3組數(shù)據(jù)集總體分類精度的影響Fig.12 The effect of σ on three groups of datasets in KENLRR
為了評價提出的ENLRR 和KENLRR 算法的效率,記錄了3組數(shù)據(jù)集上每種算法的運行時間,如表9 所示,實驗基于Windows 7 64 位操作系統(tǒng),處理器為Intel(R)Xeon(R)CPU E5 2680 2.50 GHz,內(nèi)存大小為64 GB,通過MATLAB R2017a 平臺實現(xiàn)??梢钥闯觯珽NLRR 與KENLRR 在運行時間上與其他算法相差無異,但是精度卻有了很大的提升。ENLRR 的主要計算量在求解式(7),這需要計算n×n矩陣的奇異值分解,時間復(fù)雜度為O(n3+dn2)。KENLRR 的主要計算量在計算核矩陣P、Q和更新變量J,時間復(fù)雜度為O(m2+mm+n3+dn2)。
表9 不同算法的運行時間Table 9 Running time of different methods/s
為了更好地解決低秩優(yōu)化問題和處理非線性數(shù)據(jù)的分類問題,本文提出了ENLRR 算法和KENLRR 算法。ENLRR 將彈性網(wǎng)絡(luò)思想和LRR 相結(jié)合,在構(gòu)建目標函數(shù)時,利用系數(shù)矩陣的核范數(shù)和F?范數(shù)代替秩函數(shù)進行低秩優(yōu)化求解。為了更好地對非線性數(shù)據(jù)進行分類,本文在ENLRR 中引入核方法,提出了改進的KENLRR 算法。利用鄰域濾波核函數(shù)將原始數(shù)據(jù)映射到高維特征空間,然后在特征空間中進行ENLRR 分類,取得更加穩(wěn)定和高效的分類結(jié)果。為了評價提出的ENLRR 算法和KENLRR算法的有效性,本文采用了7種對比算法,對3 組高光譜數(shù)據(jù)集進行實驗。實驗結(jié)果表明,本文提出的算法優(yōu)于其他對比方法,且KENLRR 算法的分類表現(xiàn)最佳,在Washington DC、Purdue Campus 和黃河口濕地3 組數(shù)據(jù)集上的總體分類精度OA 分別達到了99.84%、98.06%和96.63%。與LRR 算法相比,提出的ENLRR 算法和KENLRR 算法在Washington DC 數(shù)據(jù)集上的精度分別提高了4.55%和6.74%,在Purdue Campus 數(shù)據(jù)集上的精度分別提高了14.22%和23.30%,在黃河口濕地數(shù)據(jù)集上的精度分別提高了8.45%和15.40%。但是提出的兩種算法涉及的參數(shù)比較多,如何結(jié)合不同高光譜影像數(shù)據(jù)的特點,選擇合適的參數(shù)組合達到最佳分類效果需要進一步研究。
志 謝 感謝美國普渡大學(xué)D.A.Landgrebe 教授提供了HYDICE 和HYMAP 數(shù)據(jù)集。感謝寧波大學(xué)孫偉偉教授提供了GF-5黃河口濕地數(shù)據(jù)。感謝南京理工大學(xué)吳澤彬教授提供了核函數(shù)相關(guān)代碼。