范澤琳,張永紅,吳宏安
(1.中國測繪科學研究院,北京 100036;2.中南大學 地球科學與信息物理學院,長沙 410083;3.中南大學 有色金屬成礦預測與地質(zhì)環(huán)境監(jiān)測教育部重點實驗室,長沙 410083)
近年來,基于分布式目標(distributed scatters,DS)的研究逐漸成為時序合成孔徑雷達干涉測量(interferometric synthetic aperture radar,InSAR)中的一個熱點問題。分布式目標的有效提取和信息優(yōu)化,能夠輔助發(fā)掘農(nóng)田、荒地、道路等面狀目標上的沉降信息,很好地克服了傳統(tǒng)InSAR技術在非城區(qū)難以提取有效信息的不足,同時也能夠在很大程度上提高城區(qū)的沉降監(jiān)測密度。關于分布式目標的研究,首要的問題在于同質(zhì)點(statistically homogeneous pixels,SHP)的有效提取。同質(zhì)點一旦被識別,即可根據(jù)同質(zhì)點集來對其代表的分布式目標做精細化處理,包括幅度的去噪、相位的優(yōu)化以及相干性的準確估計等[1-4]。目前,同質(zhì)點的識別主要是基于幅度觀測量進行的。早在2011年,Parizzi等人就提出基于幅度序列的非參數(shù)假設檢驗方法在同質(zhì)點識別中的有效性[5]。同年,F(xiàn)erretti等人就將KS(kolmogorov-smirnov)檢驗法應用于同質(zhì)點的識別中[1]。此后,針對KS方法的不足,AD(anderson-darling)檢驗、CM(cramer-von mises)檢驗、BWS(baumgartner-weiβ-schindler)檢驗,以及針對不同適應范圍的自適應雙樣本假設檢驗方法分別被提出[2-3,6-7]。2015年,張正佳等人以幅度影像分割結(jié)果作為先驗知識,在此基礎上再使用非參數(shù)假設檢驗方法提取同質(zhì)點,解決了領域內(nèi)同質(zhì)點盲目搜索的問題[8]。同年,蔣彌等人提出一種在高斯假設背景下的同質(zhì)點快速識別方法:FaSHPS[9],該方法基于鄰域分布參數(shù)估計,使用置信區(qū)間邏輯判斷代替非參數(shù)假設檢驗方法,大大提高了同質(zhì)點的提取效率。除了上述基于幅度觀測值的同質(zhì)點提取方法外,基于原始復數(shù)數(shù)據(jù)的同質(zhì)點提取方法也被提出[10]??梢钥吹?,針對同質(zhì)點提取的研究在過去幾年得到了快速發(fā)展,為分布式目標的研究提供了很好的基礎。接下來,本文對幾種常用的基于幅度觀測值的同質(zhì)點提取算法進行了簡要介紹,并通過實驗進行了深入的對比研究。
對于每個研究像元,我們可以得到N個時序幅度觀測向量。以幅度向量為研究對象,通過非參數(shù)假設檢驗,對研究像元p的幅度序列和參考像元q的幅度序列進行擬合優(yōu)度檢驗(goodness-of-fit test),即可將問題定義為下述零假設[11]:
H0:Fp=Fq
(1)
H1:Fp≠Fq
若在一定顯著性水平下接受零假設,則認為像元p和像元q服從同一分布,即像元p是像元q的同質(zhì)點,反之不是。
對于樣本數(shù)都等于N的2個樣本,其KS統(tǒng)計量定義為:
(2)
式中:FP(x)和Fq(x)分別代表2個樣本的累計概率分布函數(shù);統(tǒng)計量DN則表示樣本間累計概率分布函數(shù)的最大垂直距離[12]。
對于樣本數(shù)都為N的2個樣本,CM檢驗統(tǒng)計量定義為:
(3)
式中:Rp(i)代表由小到大排列的p樣本中第i個元素在p、q合并樣本中的秩;Rq(i)代表由小到大排列的q樣本中第i個元素在合并樣本中的秩[13-14]。
對于樣本數(shù)都為N的2個樣本,AD檢驗的檢驗統(tǒng)計量為:
(4)
式中:Fpq(x)表示合并樣本的累積概率分布函數(shù)[15-16]。
對于樣本數(shù)分別為n、m的2個樣本,BWS檢驗統(tǒng)計量表示為:
(5)
其中,
(6)
式中:Ri表示由小到大排列的第一個樣本(樣本數(shù)為n)中,第i個元素在合并樣本中的秩;Hj表示由小到大排列的第二個樣本(樣本數(shù)為m)中,第j個元素在合并樣本中的秩[17-18]。
蒙特卡羅方法是通過數(shù)學方法隨機生成模擬數(shù)據(jù),來對真實數(shù)據(jù)進行模擬,進而實現(xiàn)了從已知概率分布抽樣的可能。由于SAR幅度數(shù)據(jù)更易服從瑞利分布(Rayleigh distribution)或者威布爾分布(Weibull distribution),因此本文基于2種分布類型開展蒙特卡羅模擬實驗,對幾種非參數(shù)假設檢驗的檢驗功效進行對比。接下來開展3組蒙特卡羅模擬對比實驗,其中非參數(shù)檢驗法的顯著性水平均設置為0.05,實驗次數(shù)設置為10 000次。第一組實驗為區(qū)分2個尺度參數(shù)一致(都為0.8)的威布爾分布,一個形狀參數(shù)固定為0.04,另一個形狀參數(shù)從0.04至1以0.04步長遞增變化(自變量),樣本數(shù)設置為15;第二組實驗為區(qū)分2個參數(shù)不同的瑞利分布,其中一個瑞利分布固定參數(shù)為0.5,另一個瑞利分布的參數(shù)從0.5至1以0.02的步長遞增變化(自變量),樣本數(shù)設置為15;第三組實驗為區(qū)分服從Rayleigh(0.8)和服從Weibull(1,2.7)的2組樣本,自變量為樣本數(shù)目。豎軸表示拒絕原假設的概率,該值越大,表明區(qū)分差異分布的能力越強,實驗對比結(jié)果見圖1。
圖1 KS、CM、AD及BWS檢驗法功效函數(shù)的繪制
通過蒙特卡羅模擬實驗對比發(fā)現(xiàn),BWS檢驗法在3組實驗中均表現(xiàn)最好,即在同等條件下具有最強的識別差異分布的能力,AD檢驗法次之,KS檢驗法最弱,CM檢驗法介于AD檢驗法和KS檢驗法之間。
當一個SAR影像的像元p中不包含主散射體,而是由大量的分布式散射體組成時,該像元內(nèi)所有散射體的向量和近似服從復高斯分布[19],其單視幅度A近似服從期望為μ(p),方差為Var(A(p))的瑞利分布。當分布式目標后向散射持續(xù)保持穩(wěn)定時,時序上的幅度將服從等參數(shù)的瑞利分布,進一步根據(jù)中心極限定律,可得該像元的平均幅度將服從期望為μ(p),方差為Var(A(p))/n的正態(tài)分布。因此,我們可以建立如式(7)的置信區(qū)間。
(7)
(8)
在上一步的基礎上,重新設置一個較小的顯著性水平α1以擴大置信區(qū)間,以區(qū)域增長的方式重復上一過程,保證選到的同質(zhì)點直接或間接與種子點相連,最后獲得參考點p的同質(zhì)點集合Ω[9,21-22]。
基于幅度向量分布相似性檢驗的同質(zhì)點提取算法并未考慮幅度序列實際服從哪種分布類型,研究對象是同一像元在時間序列上的幅度向量,將參考像元幅度向量的分布特征作為以該像元為中心的地物目標的統(tǒng)計分布特征,通過非參數(shù)假設檢驗的方法比較待判斷點與參考點的幅度向量是否服從同一分布,來判斷2個像元是否來源于同一地物目標;而基于鄰域分布參數(shù)估計的同質(zhì)點提取算法是基于原始SLC數(shù)據(jù)復高斯分布的假設,以及在此基礎上推導出的平均幅度的正態(tài)分布特征,將幅度相似性檢驗轉(zhuǎn)換為平均幅度的相似性檢驗,研究對象為基于時間幅度序列得到的平均幅度。并且,為了抑制樣本不足造成的參數(shù)估計偏差,在中間過程中通過初選鄰域內(nèi)的同質(zhì)點對關鍵參數(shù)進行了去偏差處理。前一類算法是基于幅度向量的非參數(shù)假設檢驗,需要計算兩個向量的檢驗統(tǒng)計量;而后一類算法只需要構建置信區(qū)間,即可通過簡單的邏輯運算選取同質(zhì)點,因此時間復雜度大幅降低。
為了對上述兩類算法的選點效果進行深入的對比,接下來選用第一章介紹的幾類非參數(shù)假設檢驗中功效最高的BWS檢驗作為幅度向量分布相似性的檢驗方法,與基于鄰域分布參數(shù)估計的FaSHPS算法進行實驗對比。
本次實驗,選用覆蓋北京國際機場部分區(qū)域的28景單視TerraSAR影像,配準及裁剪后影像大小為1 000像素×1 000像素,分辨率約為1.8 m。選點結(jié)果如表1所示,其中:底圖為28景SAR影像的平均幅度圖,反映了不同的地物類型;綠點表示種子像元;紅點表示以綠點為中心,在15×15像素窗口內(nèi)識別出的同質(zhì)點。在8景影像和28景影像的前提下,F(xiàn)aSHPS的選點結(jié)果和BWS的選點結(jié)果均有著很高的相似度。當影像數(shù)為28時,采用2種選點策略都能夠有效地識別同質(zhì)點,基本不存在同質(zhì)點錯提的現(xiàn)象;而當影像數(shù)為8時,2種選點方式均出現(xiàn)了同質(zhì)點錯誤識別的現(xiàn)象,其中在點3的同質(zhì)點提取結(jié)果中表現(xiàn)的最為明顯。由此說明,影像數(shù)目的減少,將會降低同質(zhì)點識別的準確度,導致錯選的發(fā)生。因此,足夠數(shù)目的影像數(shù)目,是同質(zhì)點正確識別的保障。
依舊采用3.1節(jié)中所用的時序SAR數(shù)據(jù),對研究區(qū)內(nèi)所有像素遍歷的搜索同質(zhì)點。分別使用BWS非參數(shù)檢驗法和FaSHPS選點法識別同質(zhì)點,統(tǒng)計每個像元在固定窗口內(nèi)搜索到的同質(zhì)點個數(shù),如圖2(a)、圖2(b)所示,圖中每個像元的值代表以該像元為中心,在15×15的窗口內(nèi)識別到的同質(zhì)點個數(shù)。與此同時,記錄2次實驗所用的時間。使用BWS非參數(shù)檢驗法遍歷搜素所有像元在固定窗口內(nèi)的同質(zhì)點,共耗時24 438.96 s;而采用FaSHPS選點法的耗時僅為77.55 s,后者速度是前者的315倍。為了更好地對比二者的同質(zhì)點選取數(shù)目,將二者做差處理。差異圖中,大部分像素的同質(zhì)點數(shù)目保持相似,其差異值接近于0。然而,在差異圖中,出現(xiàn)了一系列差異值較大的區(qū)域,在差異圖中呈現(xiàn)醒目的紅色。本文通過參考衛(wèi)星遙感影像,將這些差異較大的區(qū)域主要分為4類:紅圈代表飛機停放處;黑圈代表物流貨物存放區(qū);藍圈代表停車場;以A、B為代表的紅色細長條帶,這些區(qū)域?qū)植荚谘芯繀^(qū)內(nèi)的狹長道路。上述4類區(qū)域都有一個的共同特征,其內(nèi)部的地物經(jīng)常處于變化之中,反射特征不穩(wěn)定。使用BWS選點方式,受到這些變化的影響較小,對應區(qū)域內(nèi)的像素點選取到的鄰域同質(zhì)點數(shù)目與周圍穩(wěn)定區(qū)域內(nèi)的像素點相比,差異較?。欢褂肍aSHPS選點方式,選點結(jié)果受地物變化的影響較大,其選取的同質(zhì)點數(shù)目大幅減少。綜上所述,F(xiàn)aSHPS選點法對于時序上的地物變化更為敏感。
圖2 BWS與FaSHPS選點法全區(qū)域同質(zhì)點識別對比
采用Ferriti等人提出的基于同質(zhì)點識別的幅度自適應均值濾波[2],對原始幅度進行濾波去噪處理,其濾波過程可用下式表示:
(9)
式中:Afilter(p)表示濾波后p像元的幅度;Ω表示以像元p為中心,在搜索窗口內(nèi)識別到的同質(zhì)點集合(包括p像元);Aq表示像元q的幅度。
通過觀察圖3,可以明顯發(fā)現(xiàn)經(jīng)過濾波后的幅度圖都得到了很大程度的優(yōu)化,噪聲明顯減少,地物邊界更為明顯,輪廓更加清晰。為了進一步評估幅度圖的噪聲大小,計算濾波前后幅度圖的信噪比值(signal noise ratio,SNR),SNR的計算公式如式(10)所示[23]:
(10)
圖3 FaSHPS與BWS選點法用于幅度自適應空間濾波
表2 濾波前后幅度圖的信噪比值
本文介紹了目前流行的幾類時序SAR同質(zhì)點識別算法,這些算法可分為基于幅度向量分布相似性檢驗的同質(zhì)點提取算法以及基于鄰域分布參數(shù)估計的同質(zhì)點快速提取法兩大類。文中對這些算法的原理一一進行闡述,并對其選點結(jié)果進行深入分析比較。結(jié)果表明,BWS非參數(shù)檢驗法是基于幅度向量分布相似性檢驗法中識別差異分布效率最高的方法,而FaSHPS算法在計算效率上有著很突出的優(yōu)勢,且FaSHPS算法對于地物在時序上的變化比非參數(shù)假設檢驗法更為敏感。文章最后,根據(jù)同質(zhì)點集合對原始幅度進行均值濾波,得到了較為理想的去噪效果。同質(zhì)點的選取,是分布式目標選取的關鍵步驟,由于篇幅有限,本文僅對上述算法在單視高分辨率SAR影像下的選點效果進行分析比較,對多種分辨率和多視情況下以上選點算法的對比,是接下來需要研究的內(nèi)容。