樊港輝,馬泳, 2,梅曉光, 2*,黃珺, 2,樊凡, 2,李皞
1.武漢大學(xué)電子信息學(xué)院,武漢 430072;2.武漢大學(xué)宇航科學(xué)與技術(shù)研究院,武漢 430079;3.武漢輕工大學(xué)數(shù)學(xué)與計算機學(xué)院,武漢 430023
高光譜圖像(hyperspectral imagery, HSI)是由上百幅窄波段圖像堆疊而成的3維立方體,包含比紅外和多光譜圖像更為豐富的光譜信息,廣泛應(yīng)用于礦物探測、農(nóng)業(yè)和國防(Ma等,2019;Mei等,2019;劉康 等,2020)等領(lǐng)域。異常檢測是高光譜遙感探測領(lǐng)域中的一個重要組成部分,目的在于能自動搜尋場景中潛在的目標,尤其在目標的光譜特性無法獲取的場景下具有十分重要的研究意義和實用價值。
對高光譜異常檢測的算法大致分為基于統(tǒng)計的方法和基于表示的方法兩類?;诮y(tǒng)計的方法(Reed和Yu,1990;李普煌 等,2018)從概率統(tǒng)計的角度對背景進行建模,通過計算各樣本點與模型分布的擬合程度判斷是否為異常樣本?;诒硎镜姆椒?Xu等,2016;朱德輝 等,2020)針對背景和異常各自的特點,通過優(yōu)化理論求解滿足這些特點的矩陣,從而分離出異常。這兩類方法模型簡單、易于理解,探測效果較好且計算量較小,但仍存在以下問題:1)算法的探測效果取決于模型假設(shè)是否符合真實場景的統(tǒng)計分布,當不相符時會導(dǎo)致模型失效(Imani,2017);2)只利用了原始數(shù)據(jù)的淺層特征(如均值、協(xié)方差矩陣等),沒有利用更深層次的特征。此外,Chang等人(2019)指出波段冗余現(xiàn)象,尤其對于高維數(shù)據(jù),會進一步降低異常與背景之間的可分性。高光譜數(shù)據(jù)一般包含上百波段,數(shù)據(jù)冗余導(dǎo)致的異常探測性能下降效應(yīng)尤為明顯。
自編碼器(autoencoder,AE)作為一種無監(jiān)督的神經(jīng)網(wǎng)絡(luò)模型,通過最小化重構(gòu)誤差獲得更抽象、深層的特征,已成功應(yīng)用于高光譜圖像處理相關(guān)領(lǐng)域(Su等,2019;Shi等,2019)。在高光譜異常檢測方面,自編碼器更傾向于學(xué)習(xí)到能代表背景樣本的低維特征,而忽略小部分代表異常的樣本,故可通過樣本重構(gòu)誤差對樣本分類。然而,高光譜圖像不僅包含光譜信息,同時也包含空間信息,具有圖譜合一的特點。上述方法只利用了高光譜圖像數(shù)據(jù)的光譜維,而拋棄了目標像素間的空間關(guān)系,限制了算法的探測性能。針對以上問題,學(xué)者對AE進行改進。Lu 等人(2020)鑒于流形能保持相似樣本之間在低維子空間的相似性,將流形約束嵌入到AE的損失函數(shù)中,從而保證AE學(xué)到的低維表示能保持原數(shù)據(jù)之間的相似性關(guān)系。Xie等人(2019)基于光譜約束下的對抗自編碼器,利用像素點的8鄰域表示該數(shù)據(jù)點,并利用對抗自編碼器重構(gòu)原始數(shù)據(jù)樣本,通過重構(gòu)誤差篩選出場景中可能存在的異常。上述方法在一定程度上利用了圖像的空間信息,提高了算法在高光譜異常檢測方面的性能,但對噪聲較為敏感,對微弱目標的檢測能力不高。同時,絕大多數(shù)基于AE的異常檢測算法將整幅高光譜圖像視為訓(xùn)練樣本,可能致使AE學(xué)習(xí)到異常的一些特征,不能很好地分離出異常。
鑒于上述分析,本文提出一種基于空域協(xié)同自編碼器的高光譜異常檢測算法,框架如圖1所示。首先,為了引入空域信息,借助塊圖模型以突出弱小目標。具體來說,通過主成分分析(principal component analysis,PCA)對原始圖像進行降維處理并分塊展開,利用低秩稀疏矩陣分解算法得到稀疏部分,經(jīng)重構(gòu)得到異常檢測的空間響應(yīng)D1。在光譜域上,為了給AE提供更純凈的背景訓(xùn)練集,將D1得到的先驗探測結(jié)果用于指導(dǎo)純凈樣本集的構(gòu)建,經(jīng)篩選構(gòu)建出的訓(xùn)練集更適合于高光譜異常檢測任務(wù)。由該樣本集訓(xùn)練AE得到光譜域的探測結(jié)果D2。為了將空域信息融合進探測結(jié)果,利用D1構(gòu)建了一種加權(quán)方式,進一步突出目標、抑制背景,得到最終探測結(jié)果D。本文的創(chuàng)新點主要體現(xiàn)在:1)針對AE模型存在的對訓(xùn)練集的強噪聲和異常樣本敏感問題,提出從空域角度篩選并構(gòu)建樣本集的策略。引入紅外圖像處理中的塊圖模型以抑制背景,保證構(gòu)建樣本集內(nèi)盡可能只包含背景而不包含異常。2)設(shè)計了一種非負權(quán)重以進一步抑制背景,該權(quán)重在保留異常響應(yīng)的同時懲罰背景響應(yīng)。同時,該非負權(quán)重還將空域信息引入到最終的探測結(jié)果,增大了異常與背景之間的區(qū)分度,進一步提升了自編碼器算法的異常檢測性能。
圖1 本文算法流程圖
z=g(1)(W(1)x+b(1))
(1)
式中,W和b分別為自編碼器的權(quán)重和偏置,g(·)為某種非線性激活函數(shù),本文設(shè)置為sigmoid函數(shù)。在訓(xùn)練階段,以重構(gòu)誤差為代價函數(shù),利用梯度下降法及反向傳播算法更新權(quán)重及偏置參數(shù),直至滿足迭代終止條件。在測試階段,由于AE學(xué)習(xí)占比更大的背景的特征,對異常的重構(gòu)結(jié)果通常較差。因此,可以利用重構(gòu)誤差作為準則判斷某輸入樣本是否屬于異常。然而,傳統(tǒng)的基于AE的異常檢測算法利用所有樣本構(gòu)建訓(xùn)練集,其中包含異常樣本。因此,為進一步降低殘差,自編碼器會學(xué)習(xí)異常樣本的特征,從而降低背景和異常之間的區(qū)分度。同時,傳統(tǒng)的AE沒有考慮高光譜圖像的圖譜合一特性,丟失了空域信息,進一步限制了算法的性能。
針對傳統(tǒng)自編碼器存在的上述問題,本文提出從空域的角度篩選純凈背景像元的策略。由于背景存在非局部自相似性,而目標具有稀疏特性。Gao等人(2013)利用紅外圖像數(shù)據(jù)具有的這種結(jié)構(gòu),提出紅外塊圖(infrared-patch image,IPI)模型,將紅外小目標檢測問題轉(zhuǎn)化為低秩稀疏矩陣的求解問題。實驗表明,IPI模型在信雜比增益(gain of signal-to-clutter ratio,GSCR)和背景抑制因子(background suppress factor,BSF)兩個指標上明顯優(yōu)于傳統(tǒng)紅外小目標檢測算法,如最大中值濾波器、局部對比度方法等(王好賢 等,2019)。受此啟發(fā),本文將塊圖模型引入高光譜異常檢測算法,用于得到異常像素的空間響應(yīng),如圖2所示。首先,為避免高光譜數(shù)據(jù)維度過大導(dǎo)致的計算量問題,對高光譜圖像在光譜域進行PCA處理并取前3維,PCA前3維保留了圖像大部分空域信息。然后,在空域上通過滑窗取出圖像塊并展開成列后拼接成矩陣P。記窗口大小為a,移動步長設(shè)為b,且a>b。借助背景圖像的非局部自相似性以及異常像素點的稀疏特性,這個矩陣可以看做是包含背景的低秩矩陣L與包含小目標的稀疏矩陣S之和。最后,通過重構(gòu)稀疏部分S,得到異常檢測結(jié)果。
圖2 塊圖模型及求解過程
上述問題可轉(zhuǎn)化為優(yōu)化問題的求解,其數(shù)學(xué)形式表示為
s.t.P=L+S
(2)
s.t.P=L+S
(3)
(4)
式中,〈·〉為矩陣內(nèi)積操作符,Y為拉格朗日乘子,μ為正的懲罰因子。最小化式(4)可通過ADMM(alternative direction method of multipliers)算法迭代求解。求解過程如下:
1)固定其他參數(shù),更新L。目標函數(shù)為
(5)
該問題的解可由奇異值閾值(singular value thresholding,SVT)算子(Cai等,2010)得到。
2)固定其他參數(shù),更新S。目標函數(shù)為
(6)
該問題可由軟閾值算子(Donoho,1995)求解。
3)固定其他參數(shù),通過梯度上升法更新Y,具體為
Y=Y+μ(P-L-S)
(7)
迭代更新求解目標函數(shù)式(5)—(7),直至收斂。
自編碼器以重構(gòu)誤差為判決準則,原理簡單且易實現(xiàn),在數(shù)據(jù)異常偵測方面的性能與傳統(tǒng)算法相當,甚至優(yōu)于傳統(tǒng)算法。但自編碼器對高強度噪聲及異常數(shù)據(jù)較為敏感,在訓(xùn)練階段需要純凈的背景光譜數(shù)據(jù)。同時,傳統(tǒng)的AE框架沒有考慮空域信息,進一步約束了算法的探測性能。為避免自編碼器的上述缺陷,本文從空域角度篩選背景樣本,并引入塊圖模型抑制背景,用于指導(dǎo)自編碼器背景訓(xùn)練集的構(gòu)建。具體來說,首先從空域角度出發(fā),利用塊圖模型得到空域異常響應(yīng)結(jié)果D1。按D1各像元值由低到高從原始高光譜數(shù)據(jù)集中選擇占比為k×100%的樣本作為AE的訓(xùn)練樣本集。由于塊圖模型具備優(yōu)良的背景抑制能力,指導(dǎo)選擇出的樣本有更高的置信度為背景,相比于隨機選取訓(xùn)練樣本具有更明顯的優(yōu)勢。簡單起見,k值固定為50,即選取一半樣本作為AE的訓(xùn)練集。自編碼器利用塊圖模型指導(dǎo)選擇出的樣本集進行訓(xùn)練,并以重構(gòu)誤差作為判斷準則,得到光譜域的探測結(jié)果D2。
為了進一步提升算法的探測性能,充分利用塊圖模型在空域的結(jié)果,構(gòu)造權(quán)重w,滿足
w=1-e-10·d
(8)
式中,d為樣本點在塊圖模型探測結(jié)果D1對應(yīng)坐標位置處的響應(yīng)值。w隨空域響應(yīng)d的變化曲線如圖3所示??梢园l(fā)現(xiàn),d值越小,該樣本點有越大概率為背景,對應(yīng)的權(quán)重越小;d值越大,該樣本越可能為異常,權(quán)重逐漸趨近于1。因此,權(quán)重w可進一步抑制背景,增大異常與背景之間的區(qū)分度。
圖3 w隨空域響應(yīng)d的變化曲線
綜上,得到權(quán)重矩陣W,最終的探測結(jié)果D為
D=W°D2
(9)
式中,“°”為Hadamard積。
本文提出的基于矩陣分解和自編碼器的高光譜異常檢測算法總體流程如下:
輸入:高光譜圖像H∈RM×N×L;塊圖模型相關(guān)參數(shù)λ、a和b;自編碼器相關(guān)參數(shù)nhid和k。
1)對高光譜圖像H從光譜域進行PCA并取前3維,按圖2構(gòu)建塊圖模型;
2)迭代求解問題(5)—(7),得到稀疏部分S,重構(gòu)后在光譜維求平均,得到空域異常響應(yīng)D1;
3)由D1選擇值最小的k×100%個像元對應(yīng)的光譜數(shù)據(jù)作為自編碼器的訓(xùn)練集,更新網(wǎng)絡(luò);
4)將高光譜圖像逐像素投入訓(xùn)練好的自編碼器,以重構(gòu)殘差為準則得到光譜域異常響應(yīng)D2;
5)由空域響應(yīng)D1構(gòu)造權(quán)重矩陣W;
6)由式(9)得到最終探測結(jié)果D。
圖4 3組高光譜數(shù)據(jù)集的偽彩圖像及其異常真值圖
影響算法探測性能的相關(guān)參數(shù)主要包括調(diào)節(jié)因子λ、圖像塊尺寸a及滑動步長b、隱含層的節(jié)點個數(shù)nhid以及選取的主成分個數(shù)p。在驗證各參數(shù)的影響之前,將D1進行濾波器尺寸為3 × 3的最大值濾波。簡單起見,引入圖像塊相關(guān)參數(shù)c,設(shè)置滑動步長b=floor(c×min(M,N)),floor(·)為向下取整符號,圖像塊窗口大小a=2b-1。
2.2.1 調(diào)節(jié)因子λ
由優(yōu)化函數(shù)式(3)可知,調(diào)節(jié)因子λ用于權(quán)衡低秩部分和稀疏部分所占整體信息的多少。λ越大,對S的懲罰越重,低秩部分L占有更多的信息;相反,λ越小,稀疏部分S占有更多的信息。圖5展示了λ分別取10-4、10-2和100時分解得到低秩部分和稀疏部分的結(jié)果。合適的λ能增強稀疏矩陣S對背景的抑制,而過大的λ會丟失目標信息。
圖5 λ取不同值時得到的低秩部分和稀疏部分
為進一步分析λ對最終探測結(jié)果的影響,設(shè)λ從{10-5, 10-4, 10-3, 10-2, 10-1, 100}中選取,參數(shù)c設(shè)置為0.05,nhid設(shè)為100。探測結(jié)果如圖6所示。縱坐標AUC(area under curve)用來衡量優(yōu)劣隨著λ增大,算法探測性能逐漸提升。因為矩陣分解過程中對稀疏部分的懲罰加重,使得矩陣S保留更顯著的目標信息,同時抑制非目標稀疏噪聲。但當λ過大時,對S的懲罰加重,使S丟失目標信息,算法探測性能下降。本文將Sandiego-1和Botanical Garden數(shù)據(jù)集的λ均設(shè)置為10-2,Sandiego-2數(shù)據(jù)集的λ設(shè)置為10-1。
圖6 λ對最終探測性能的影響
2.2.2 圖像塊相關(guān)參數(shù)c
由于不同圖像中目標的大小存在差異,塊圖模型中圖像塊尺寸會影響矩陣分解的求解效果。同時,圖像塊尺寸a和滑動步長b決定所構(gòu)造矩陣的規(guī)模,進而影響塊圖模型背景抑制的能力以及算法的運行效率。本文通過參數(shù)c分析a和b對結(jié)果的影響。c從0.01按0.01遞增直至0.1。算法最終探測結(jié)果如表1所示。從表1的結(jié)果可知,參數(shù)c既影響算法的探測結(jié)果,也影響算法的運行效率。因為圖像塊參數(shù)c影響圖像塊包含目標信息的多少,同時決定了所構(gòu)造矩陣的尺寸。兼顧算法的性能和效率,本文設(shè)置3組數(shù)據(jù)集的參數(shù)c均為0.06。
表1 參數(shù)c對最終探測性能的影響
2.2.3 自編碼器隱含層節(jié)點個數(shù)nhid
自編碼器的隱含層節(jié)點個數(shù)nhid決定了隱空間保留的原始數(shù)據(jù)信息的多少。過少的隱含層節(jié)點個數(shù)會丟失背景的光譜信息,不利于正常樣本點和異常樣本點的分離;而過多的隱含層節(jié)點個數(shù)沒有起到提取有區(qū)分度特征的作用。結(jié)合2.2.1節(jié)和2.2.2節(jié),設(shè)置調(diào)節(jié)因子λ在3個數(shù)據(jù)集上的值分別為10-2、10-1和10-2,圖像塊相關(guān)參數(shù)c均取0.06。設(shè)nhid從{20, 40, 60, 80, 100, 120, 140, 160}中選取,探測結(jié)果如圖7所示。由圖可知,當nhid≥40時,算法的最終探測結(jié)果趨于最佳且相對保持穩(wěn)定,當nhid<40時,探測性能相對較差。因為過小的隱含層節(jié)點個數(shù)導(dǎo)致AE無法有效學(xué)習(xí)到正常樣本的特征,導(dǎo)致正常樣本的重構(gòu)誤差增大,加大了區(qū)分背景和異常目標的難度。簡單起見,本文設(shè)置3組數(shù)據(jù)集的參數(shù)nhid均為100。
圖7 nhid對最終探測性能的影響
2.2.4 選取的主成分個數(shù)p
在塊圖模型中,選取的主成分個數(shù)p決定了所保留的信息量的多少。p值過小,會丟失大量原有信息;p值過大,會增加冗余計算。因此,為探究p不同取值對算法性能和耗時的影響,同時兼顧性能和耗時,設(shè)置p從{1, 2, 3, 5, 10}中選取,探測結(jié)果如表2所示。由表2可知,當選取的主成分個數(shù)為1時,探測性能最低。隨著選取主成分個數(shù)的增加,算法的探測性能變化較小,但耗時增加。因為選取的主成分是用于空域響應(yīng)提取,當個數(shù)達到一定閾值時,得到的空域響應(yīng)保持一致,但由于待分解矩陣的規(guī)模增大,導(dǎo)致耗時增加。兼顧性能和耗時,本文選取的主成分個數(shù)設(shè)置為3。
表2 選取的主成分個數(shù)對算法性能和耗時的影響
為驗證本文提出的基于空域協(xié)同自編碼器的高光譜異常檢測算法的合理性,設(shè)置了多組對比算法進行實驗,通過對比不同算法在3組高光譜數(shù)據(jù)集上AUC值的大小來衡量算法的優(yōu)劣。本文算法通過塊圖模型從空域篩選背景數(shù)據(jù)集,并充分利用空域信息協(xié)同自編碼器以提升算法檢測性能。實驗采用的對比算法包括:1)通過屬性濾波(attribute filter,AF)替代塊圖模型以驗證塊圖模型在空域?qū)Ρ尘耙种品矫娴膬?yōu)勢,稱為AF-AE方法。AF是一種高光譜目標探測的空域算法,并得到廣泛的研究和應(yīng)用(張香萍,2017;Kang等,2017)。2)AER(autoencoder random-sampling)方法。采用隨機采樣的方式選取自編碼器的訓(xùn)練樣本,以得到單獨采用AE模型得到的異常檢測結(jié)果。采樣的樣本個數(shù)與本文算法一致,均為樣本總體的一半。3)D1和D2,這是本文算法中塊圖模型得到的空域異常響應(yīng)及AE得到的光譜域異常檢測結(jié)果。值得注意的是,這里的D2與塊圖模型得到的結(jié)果D1相關(guān)。實驗中通過調(diào)參使上述算法均能達到最優(yōu)的異常檢測性能,利用高光譜數(shù)據(jù)集進行性能評估,探測結(jié)果如表3所示。由表3分析可知,本文算法在3組高光譜數(shù)據(jù)集上均能取得最優(yōu)的探測性能。相比于AF-AE算法,塊圖模型能夠適應(yīng)復(fù)雜的異構(gòu)背景,更適合于對地遙感監(jiān)測及相關(guān)任務(wù)。對比AER和D2的結(jié)果可以發(fā)現(xiàn),經(jīng)過塊圖模型在空域選擇背景樣本集的策略,相比于隨機選取而言在基于AE探測高光譜圖像場景中的異常目標方面具有明顯優(yōu)勢。實驗結(jié)果表明,本文算法充分利用了空域結(jié)果,通過權(quán)重的方式將空域信息融合到最終的探測結(jié)果中,提升了算法的異常檢測性能。
表3 各對比算法在3組數(shù)據(jù)集上的AUC值
為驗證本文算法在高光譜異常檢測中的優(yōu)越性,與高光譜異常檢測領(lǐng)域經(jīng)典的GRX(global Reed-Xiaoli)算法(Reed和Yu,1990)、LSMAD(lrasmd-based Mahalanobis distance method)算法(Zhang等,2016)和AE算法以及兩種最近提出的具有較高異常檢測性能的前沿算法FrFE(fractional Fourier entropy)(Tao等,2019)和FEBPAD(feature extraction and background purification anomaly detector)(Ma等,2021)進行對比。需要說明的是,本節(jié)中AE算法使用整個高光譜數(shù)據(jù)作為訓(xùn)練集,而本文算法參數(shù)按2.2節(jié)設(shè)置。本文算法中自編碼器采用的是軟件自帶的trainAutoencoder()函數(shù)。設(shè)置學(xué)習(xí)步長為0.01,不加任何約束項(權(quán)重約束項系數(shù)和稀疏約束項系數(shù)均設(shè)置為0),迭代次數(shù)為100,batch設(shè)置為50,激活函數(shù)為sigmoid函數(shù)。其余算法參數(shù)均按獲得最佳探測效果設(shè)置。
各算法的探測主觀效果圖如圖8所示??梢钥闯觯魉惴ň茌^為有效地突出目標,并能一定程度上抑制背景。但GRX和LSMAD算法由于沒有提取光譜的高維本質(zhì)特征,其背景抑制效果不明顯。而AE和FEBPAD算法在光譜域所張成的子空間或變換域中提取具有區(qū)分度的特征,但是由于沒有考慮到空域信息,導(dǎo)致算法的異常檢測性能受限。本文提出的基于空域協(xié)同自編碼器的異常檢測算法既提取了光譜的低維本質(zhì)特征,避免數(shù)據(jù)冗余導(dǎo)致的性能下降,同時保留了空域信息,從而可以更好地抑制背景,易于將異常從背景中分離出來。
圖8 不同數(shù)據(jù)集異常檢測主觀效果圖
評價算法性能的參數(shù)為ROC(receiver operating characteristic)曲線圖、AUC值和耗時,實驗結(jié)果如圖9和表4所示。從圖9可知,對于Sandiego-1數(shù)據(jù)集,在低虛警率下,本文算法的探測概率低于LSMAD。但在檢測出所有目標的前提下(探測率為1),所提基于空域協(xié)同自編碼器的異常檢測算法在3組數(shù)據(jù)集上均具有最低的虛警率。從表4可以看出,本文算法的AUC值明顯高于其他算法,這是因為本文算法同時考慮了塊圖模型帶來的空域信息,以及AE得到的低維本質(zhì)光譜特征。結(jié)合3.3節(jié)D2的結(jié)果可以注意到,D2的AUC值高于AE算法的結(jié)果,分析認為,塊圖模型良好的背景抑制能力可以為AE模型提供更為純凈的訓(xùn)練集,從而保證AE模型在重構(gòu)背景樣本的同時避免學(xué)習(xí)到異常樣本的特征。表4同時列出了各種算法的耗時,本文算法雖然耗時較長,但在所列算法中探測性能最佳。
圖9 各種算法在3個數(shù)據(jù)集上的ROC曲線
表4 各算法在3個數(shù)據(jù)集上的AUC值及耗時
值得注意的是,由于本文算法中訓(xùn)練集只占高光譜所有樣本數(shù)的一半,相比用AE算法直接對所有樣本訓(xùn)練,其耗時可縮短一半以上。
本文提出一種基于空域協(xié)同自編碼器的高光譜異常檢測算法。該算法針對AE對訓(xùn)練集中異常樣本敏感的問題,從空域角度出發(fā),利用塊圖模型在背景抑制方面的優(yōu)勢,為自編碼器提供純凈的背景訓(xùn)練集。同時,算法通過構(gòu)造權(quán)重的方式以充分利用塊圖模型包含的空域信息,進一步提升算法的探測性能。該方法主要分為以下3個步驟:1)利用塊圖模型為自編碼器提供純凈的訓(xùn)練樣本;2)通過AE提取高光譜圖像中目標的光譜域信息;3)利用塊圖模型的異常響應(yīng)構(gòu)造權(quán)重以將空域信息融合進探測結(jié)果中。實驗數(shù)據(jù)包含3組不同尺寸的高光譜數(shù)據(jù)集,與經(jīng)典、前沿的高光譜異常檢測算法進行比較分析。實驗結(jié)果表明,本文算法在高光譜異常探測上得到了最高的AUC值,且能以更低的虛警率實現(xiàn)所有異常像元的探測,說明了本文算法的有效性和優(yōu)越性。但同時需要注意,該算法需要調(diào)整的參數(shù)較多,限制了在實際中的進一步應(yīng)用。因此,在下一步研究中將重點關(guān)注如何實現(xiàn)部分參數(shù)的自動調(diào)整。