周宇翀 謝先明
摘 要:提出一種深度學習與聚類分析算法結合的多基線合成孔徑雷達干涉(interferometric synthetic aperture radar, InSAR)高程反演方法。該方法利用深度學習神經網絡對干涉圖截距信息進行分類,作為干涉像元類別屬性判斷的依據(jù),精確獲取干涉像元聚類中心,在此基礎上利用聚類分析算法獲得觀測場景的高程信息。主要步驟如下:首先,獲取干涉圖截距信息,隨后利用深度學習神經網絡對干涉圖截距信息進行分類,獲得干涉像元類別屬性。其次,對網絡預測的同一類別像元截距取其平均作為該類別像元的聚類中心,有效避免傳統(tǒng)算法因對噪聲敏感造成的錯誤分類。最后,利用聚類分析算法對網絡預測聚類中心進行后處理得到觀測場景高程信息。模擬和實測實驗數(shù)據(jù)表明,在不同信噪比的情況下,該方法對不同地形高程反演的均方根誤差比傳統(tǒng)CA算法更小,重建精度更高。
關鍵詞:多基線InSAR;深度學習;聚類分析
中圖分類號:P224;V448.2 DOI:10.16375/j.cnki.cn45-1395/t.2024.02.009
0 引言
合成孔徑雷達干涉(interferometric synthetic aperture radar, InSAR)是一種可以高精度獲取目標地形三維信息的技術[1-2]。傳統(tǒng)的單基線InSAR相位展開技術需要符合相位連續(xù)條件[3-5],因此,多基線InSAR高程反演技術在單基線InSAR的基礎上孕育而生,可以利用多條基線信息來克服相位不連續(xù)條件,高效精準地解決地形突變問題。
近幾十年基于不同策略的多基線InSAR高程反演方法相繼提出,包括以統(tǒng)計思想為代表的最大似然估計(ML)算法[6]、最大后驗(MAP)算法[7]、基于全變分的MAP算法[8],這類算法利用概率密度函數(shù)構建高程反演模型,但高程反演結果對干涉圖的環(huán)境要求較高,同時也受限于基線數(shù)量。以非統(tǒng)計思想為代表的有中國余數(shù)定理(CRT)算法[9]、TSPA算法[10]、聚類分析(CA)算法[11]等。其中,CRT算法要求干涉圖基線條件滿足兩兩互質,并且在純凈環(huán)境下才能準確無誤獲取高程解。TSPA算法是在CRT基礎上獲取全局梯度信息,再結合單基線相位解纏框架來提高噪聲魯棒性。CA算法是根據(jù)多幅干涉圖的截距信息將像素分成不同的類別,再由每個類別的聚類中心點來反演每個類的高程信息,該方法雖然有很高的運行效率但極易受到噪聲影響,對噪聲變化極為敏感。為此,文獻[12]對CA算法做出改進,給出了新的閉式求解公式以及新的濾波方式,進一步提高高程反演的精度與效率。文獻[13]采用匹配三維濾波算法(BM3D)選為圖像濾波的方法,分別對干涉圖、截距圖、聚類圖以及相位展開圖定義不同的度量標準,來應對不同濾波對象的特征信息,該算法擁有先進的去噪性能,同時能保留原始圖像相對完整的像元信息,極大提高高程反演能力。此外,以非線性卡爾曼濾波器為代表[14]的多基線相位解纏算法在高程反演中有著較強的魯棒性。隨著深度學習技術不斷創(chuàng)新發(fā)展[15-16],該項技術已成功運用到相位解纏等領域。文獻[17]把相位解纏問題轉為語義分割問題,利用SegNet網絡間接解纏相位。文獻[18]利用BCNet網絡構建殘差點與枝切線之間非線性映射關系,再優(yōu)化枝切線,最后使用傳統(tǒng)枝切法獲取解纏相位。文獻[19] 把DL引入多基線InSAR高程反演中,利用網絡獲取CA算法的全局梯度信息,與TSPA算法進一步結合,更好地實現(xiàn)高程反演精度。
本文提出一種深度學習與CA算法結合的多基線InSAR高程反演方法(CFAMNetCA)(見圖1)。該方法首先獲取干涉圖截距信息,隨后利用CFAMNet[20]對干涉圖截距信息進行分類,獲取干涉像元的類別屬性。CFAMNet利用類注意力機制增強模塊類之間的相關性來提升網絡預測的準確性,可以有效避免傳統(tǒng)CA算法因對噪聲敏感導致的像元錯誤分類現(xiàn)象。其次,對網絡預測的同一類別像元的截距信息取其平均作為該類別像元的聚類中心,有效避免傳統(tǒng)算法因對噪聲敏感造成的錯誤分類。最后,利用傳統(tǒng)CA方法對網絡預測聚類中心進行后處理,得到觀測場景高程信息。實驗結果表明,該方法能獲得比傳統(tǒng)CA方法更穩(wěn)健的結果。
1 CA算法
在多基線InSAR系統(tǒng)中,同一地區(qū)可由不同基線[Bi]獲取多幅干涉圖。其中纏繞相位[φi(-π≤φi≤π)]、真實相位[?i]以及高程值[hi]之間的關系可以表示為
式中:[ki]為像元的相位模糊數(shù)(為整數(shù));[hi]表示目標地形所對應的高程值;[κ]表示真實相位與高程值之間的轉換因子;[λ]表示雷達工作波長;[R0]表示主天線到目標地面的距離;[θ]為主天線的視角;[Bi⊥]為垂直基線長度,為方便計算,[Bi⊥]可近似為[Bi]。
從式(4)可以看出,某一個像元的相位模糊數(shù)向量[(k1,k2)]可以視為線性方程上的整數(shù)點,其中斜率和截距都是已知的。由此可以得到結論:在無噪聲的環(huán)境下,同一類的像元所構成的直線都是重合的,因此截距的類別就是具有相同相位模糊數(shù)的像元類別。在[k1][-][k2]平面內搜索每個像元對應直線的整數(shù)對[(k1, k2)]就可以準確反演出高程信息。實際上在有噪聲的情況下,纏繞相位[φ1、φ2]都會被影響,但根據(jù)式(4)可看出影響的只是截距部分,因此會導致原本屬于同一類重合的直線會出現(xiàn)上下偏移的現(xiàn)象。雖然會出現(xiàn)偏移,但仍存在某一直線處有聚類現(xiàn)象。所以聚類分析就是找出一個類的中心線并將其視為無噪聲的聚類中心,通過搜尋方法找出滿足條件的相位模糊數(shù),最后反演高程信息。
2 基于深度學習的干涉圖分類網絡
2.1 CFAMNet網絡
CFAMNet結構如圖2所示,由網絡編碼器和解碼器組成,以deeplabv3+網絡結構為骨架,采用多平行空間金字塔池化MASPP(如圖3所示),融合類特征注意力模塊CFAM(如圖4所示),編碼器采用ResNet50進行特征提取,其結構如圖5所示。首先通過卷積核為7*7的卷積和一個3*3的最大池化將原始特征壓縮為原來的1/4;然后通過4個殘差塊依次進行輸出,其中前3個殘差塊通過調整步長將特征圖尺寸依次壓縮為原來的1/2,第4個殘差塊通過融合空洞卷積率為2的空洞卷積來保持特征圖大小不變。每個殘差塊由多個殘差結構組成。殘差結構如圖6所示,它包含2個卷積核為1*1的卷積和一個卷積核為3*3的卷積。殘差結構的引入可有效防止網絡層所造成的梯度爆炸問題,在殘差塊4之后連接MASPP模塊,并在殘差塊3和殘差塊4之后添加CFAM,這些模塊獲得的特征圖可用于提取關于類別和空間上下文的更詳細信息。解碼器在對編碼器獲得的特征圖進行4次上采樣后,與殘差塊1和殘差塊2獲得的特征地圖進行特征融合,并執(zhí)行卷積核為3*3的卷積操作,最后進行4次下采樣來恢復原始圖像大小。
CFAMNet將MASPP和CFAM模塊集成在底層特征中,并將MASPP模塊提取的多尺度信息與CFAM模塊提取的類特征信息相結合,以更好地提取底層細節(jié)。此外,編碼器-解碼器結構的采用有助于恢復從基礎層提取的信息。
2.2 網絡數(shù)據(jù)集
當前沒有公布明確的對多基線InSAR高程反演的數(shù)據(jù)集,故本實驗參照文獻[17],構建連續(xù)和不連續(xù)兩類數(shù)據(jù)集。網絡訓練過程中,把噪聲截距圖(256×256)作為網絡輸入,其對應的純凈聚類信息圖(256×256)作為對應標簽,構建1組數(shù)據(jù)。本文網絡數(shù)據(jù)集由27 000組數(shù)據(jù)構成,具體構建方式如下。
2.2.1 連續(xù)地形數(shù)據(jù)集
1)按照文獻[17]描述方法隨機生成真實高程圖,圖像尺寸為256×256,高程范圍0~180 m,如圖7(a)所示;隨后生成干涉圖以及截距信息圖,見圖7(b)—(d);在純凈環(huán)境中由傳統(tǒng)CA算法根據(jù)截距求出聚類信息作為標簽,見圖7(e)。將添加噪聲的截距圖與純凈的聚類信息一一對應構建1組數(shù)據(jù),共隨機生成5 500組。值得提及的是論文中所有高程圖、干涉圖以及截距信息圖、聚類信息圖以及重建高程誤差圖,橫坐標單位為距離向/像素,左側縱坐標單位為方位向/像素。其中高程圖右側顏色標單位為m,干涉圖右側顏色標單位為弧度,截距信息圖以及聚類信息圖右側顏色標為無量綱。高程誤差直方圖橫坐標表征重建高程誤差(單位為m),左側縱坐標單位為像素。
2)將我國某城部分高程圖轉換為實驗所需高程圖,如圖8(a)所示,隨后生成干涉圖、截距圖和聚類信息圖,見圖8(b)—(e)。共隨機生成6 000組。
2.2.2 不連續(xù)地形數(shù)據(jù)集
1)通過對連續(xù)地形部分區(qū)域置0或重新賦值的方式來獲得不連續(xù)地形高程圖,圖像尺寸為256×256,高程范圍0~180 m,如圖9(a)所示;隨后生成干涉圖、截距圖和聚類信息圖,見圖9(b)—(e)。共隨機生成5 500組。
2)模擬城市地形高程圖,圖像尺寸為256×256,高程范圍0~180 m(見圖10(a));隨后生成干涉圖、截距圖和聚類信息圖,見圖10(b)—(e)。共隨機生成10 000組。
綜上,連續(xù)與不連續(xù)突變地形隨機數(shù)據(jù)集共生成27 000組,用來訓練CFAMNet網絡。
2.3 網絡訓練以及計算機配置
網絡訓練采用自適應矩估計優(yōu)化器,把均方誤差作為損失函數(shù)(MSE),其定義如下,
式中:EMS為MSE值;[yi]為預測值;[yi]為真實值;[n]為圖像像元的數(shù)目。
在本文中,初始學習速率為0.001,模型的訓練次數(shù)為200輪,早停的訓練輪數(shù)為150輪,最小訓練批次為8,訓練時間約為25 h。學習率的下降方式為當驗證集的損失函數(shù)處于5輪沒有下降,學習率以衰減率為0.5的方式進行減少,當驗證集的損失函數(shù)訓練20輪一直沒有下降時意味著模型基本訓練完畢,可以早停,終止訓練。計算機的軟硬件配置參數(shù)見表1。
3 實驗結果分析
本實驗采用兩基線仿真,與傳統(tǒng)兩基線CA算法比較。為驗證CFAMNetCA算法的可行性與有效性,使用歸一化均方根誤差(NRMSE)作為評價標準,計算公式如下,
式中:ENRMS是NRMSE值;[h]是由算法反演的高程值;[h]是真實的高程值;[M、N]分別表示干涉圖方位向和距離向的像元個數(shù);([m, n])表示像元的坐標。實驗所使用的InSAR系統(tǒng)的基本參數(shù)見表2。
3.1 城市地形高程反演實驗
圖11(a)為模擬城市A二維高程圖,圖11(b)—(d)為對應表2所示系統(tǒng)參數(shù)的含噪干涉圖和截距圖,大小為256×256。圖12(a)為模擬城市B二維高程圖,圖12(b)—(d)為對應表2所示系統(tǒng)參數(shù)的含噪干涉圖和截距圖,圖片大小為150×250(由于制作圖片大小與網絡輸入圖片尺寸不匹配,故先對圖片用零填充方式擴展至網絡輸入圖片尺寸大小后再進行網絡預測,隨后對預測結果進行裁剪還原至原尺寸,即可得干涉圖聚類信息圖)。上述干涉圖信噪比(SNR)約為8.05 dB,對這2組干涉圖進行高程反演,結果如圖13—圖14所示。
圖13(a)—(c)為傳統(tǒng)CA算法重建模擬城市A高程圖、高程估計誤差以及其誤差直方圖,圖13(d)為本文CFAMNet網絡預測得到的模擬城市A聚類信息圖,圖13(e)—(g)為本文方法重建高程圖、高程估計誤差以及其誤差直方圖。圖14(a)—(c)為傳統(tǒng)CA算法重建模擬城市B高程圖、高程估計誤差以及其誤差直方圖,圖14(d)為本文CFAMNet網絡預測得到的模擬城市B聚類信息圖,圖14(e)—(g)為本文方法重建高程圖、高程估計誤差以及其誤差直方圖。從圖13—圖14所示的高程反演結果可以看出,傳統(tǒng)CA算法與本文方法都能恢復地形的原始地貌,不同的是傳統(tǒng)CA算法在低信噪比情況下易受噪聲影響,引起錯誤分類,導致聚類中心偏移,其高程重建精度降低,在其高程重建圖中出現(xiàn)了較多的噪聲“毛刺點”。相比于傳統(tǒng)CA算法,本文方法利用網絡預測得到的聚類信息不易被噪聲影響,極大降低了產生錯誤分類的概率,其高程重建圖中噪聲“毛刺點”明顯少于傳統(tǒng)CA算法,從其誤差直方圖來看,本文方法誤差更集中于0附近。表3列出不同信噪比情況下2種算法的均方根誤差對比(實驗10次,取平均值),可以看出本文方法高程重建精度更高。
3.2 不連續(xù)山地高程反演
為進一步驗證算法性能,使用真實的Long's Peaks和Isolation Peaks國家公園實測數(shù)據(jù)進行驗證。圖15(a)為Long's Peaks二維高程圖,圖像大小為458×152,圖15(b)—(d)為根據(jù)表2所示系統(tǒng)參數(shù)生成的含噪干涉圖和截距圖,圖中信噪比約為11.9 dB。圖16(a)為Isolation Peaks二維高程圖,圖像大小為458×157,圖16(b)—(d)為根據(jù)表2所示系統(tǒng)參數(shù)生成的含噪干涉圖和截距圖,圖中信噪比約為11.9 dB。上述2幅地形右側均有明顯突變,并且由于輸入的圖片不匹配網絡輸入圖片尺寸,所以對圖片先用零擴展至合適尺寸,再分割圖片至適合網絡輸入圖片尺寸進行預測,最后對分割圖片預測結果進行合并處理即可得干涉圖聚類信息圖。
圖17(a)—(c)為傳統(tǒng)CA算法重建高程圖、高程估計誤差以及其誤差直方圖,圖17(d)為CFAMNet網絡預測Long's Peaks聚類信息圖,圖17(e)—(g)為本文方法重建高程圖、高程估計誤差以及其誤差直方圖。圖18(a)—(c)為傳統(tǒng)CA算法重建高程圖、高程估計誤差以及其誤差直方圖,圖18(d)為CFAMNet網絡預測Isolation Peaks聚類信息圖,圖18(e)—(g)為本文方法重建高程圖、高程估計誤差以及其誤差直方圖。
從圖17(a)和圖18(a)可以看出,傳統(tǒng)CA算法在上述高程重建圖中存在較多散漫噪聲,尤其是在較大噪聲情況下影響更為顯著,會導致較大誤差,見圖17(b)和圖18(b);本文方法經過網絡預測得到的聚類信息雖然在突變處尚未達到最優(yōu)預測解,但是整體上對地形分類較為準確,相對于傳統(tǒng)CA算法能較為完好地反演出不連續(xù)山地的高程信息,其高程重建圖中散漫噪聲較少,其誤差更集中于0附近,表明本文方法反演結果更接近真實高程圖,見圖17(d)—(g)和圖18(d)—(g)。表4列出不同信噪比下2種算法的均方根誤差對比,可以看出本文算法高程重建精度更高。
4 結論
本文算法把深度學習神經網絡與CA算法相結合,利用CFAMNet來獲取干涉圖、聚類信息圖,可以有效避免傳統(tǒng)CA算法因對噪聲敏感導致的錯誤分類現(xiàn)象,從而改善高程重建精度。模擬城市與實測山地高程重建實驗結果表明:與傳統(tǒng)CA算法相比,本文方法的均方根誤差較小,解纏精度較高,能更有效地解決不連續(xù)地形的高程重建問題。
參考文獻
[1] XU H P,LI S,YOU Y N,et al.Unwrapped phase estimation via normalized probability density function for multibaseline InSAR[J]. IEEE Access,2019,7:4979-4988.
[2] YU H W,LAN Y,YUAN Z H,et al.Phase unwrapping in InSAR:a review[J]. IEEE Geoscience and Remote Sensing Magazine,2019,7(1):40-58.
[3] GOLDSTEIN R M,ZEBKER H A,WERNER C L.Satellite radar interferometry:two-dimensional phase unwrapping[J].Radio Science,1988,23(4):713-720.
[4] ASUNDI A,ZHOU W S. Fast phase-unwrapping algorithm based on a gray-scale mask and flood fill[J]. Applied Optics,1998,37(23):5416-5420.
[5] GHIGLIA D C,ROMERO L A. Robust two-dimensional weighted and unweighted phase unwrapping that uses fast transforms and iterative methods[J]. Journal of the Optical Society of America A,1994,11(1):107-117.
[6] PASCAZIO V,SCHIRINZI G. Multifrequency InSAR height reconstruction through maximum likelihood estimation of local planes parameters[J]. IEEE Transactions on Image Processing,2002,11(12):1478-1489.
[7] FERRAIUOLO G,PASCAZIO V,SCHIRINZI G. Maximum a posteriori estimation of height profiles in InSAR imaging[J]. IEEE Geoscience and Remote Sensing Letters,2004,1(2):66-70.
[8] FERRAIOLI G,SHABOU A,TUPIN F,et al. Multichannel phase unwrapping with graph cuts[J]. IEEE Geoscience and Remote Sensing Letters,2009,6(3):562-566.
[9] 張紅敏,靳國旺,徐青,等. 中國余數(shù)定理在雙基線InSAR相位解纏中的應用[J].測繪學報,2011,40(6):770-777.
[10] YU H W,LAN Y.Robust two-dimensional phase unwrapping for multibaseline SAR interferograms:a two-stage programming approach[J].IEEE Transactions on Geoscience and Remote Sensing,2016,54(9):5217-5225.
[11] YU H W,LI Z F,BAO Z.A cluster-analysis-based efficient multibaseline phase-unwrapping algorithm[J]. IEEE Transactions on Geoscience and Remote Sensing,2011,49(1): 478-487.
[12] YUAN Z H,LU Z,CHEN L F,et al.A closed-form robust cluster-analysis-based multibaseline InSAR phase unwrapping and filtering algorithm with optimal baseline combination analysis[J]. IEEE Transactions on Geoscience and Remote Sensing,2020,58(6):4251-4262.
[13] YUAN Z H,CHEN T J,XING X M,et al.BM3D denoising for a cluster-analysis-based multibaseline InSAR phase-unwrapping method[J]. Remote Sensing,2022,14(8):1836.
[14] 宋明輝,謝先明,徐有邈,等.無味卡爾曼濾波的多基線InSAR高程重建方法[J].測繪科學,2021,46(6):115-122,146.
[15] 林川,曹以雋.基于深度學習的輪廓檢測算法:綜述[J].廣西科技大學學報,2019,30(2):1-12.
[16] 喬亞坤,林川,張貞光.基于深度學習的輪廓檢測模型的交互式解碼網絡[J].廣西科技大學學報,2022,33(1):46-53.
[17] ZHANG J C,TIAN X B,SHAO J B,et al.Phase unwrapping in optical metrology via denoised and convolutional segmentation networks[J]. Optics Express,2019,27(10):14903-14912.
[18] ZHOU L F,YU H W,LAN Y.Deep convolutional neural network-based robust phase gradient estimation for two-dimensional phase unwrapping using SAR interferograms[J]. IEEE Transactions on Geoscience and Remote Sensing,2020,58(7):4653-4665.
[19] ZHOU L F,YU H W,LAN Y,et al.CANet:an unsupervised deep convolutional neural network for efficient cluster-analysis-based multibaseline InSAR phase unwrapping[J]. IEEE Transactions on Geoscience and Remote Sensing,2022,60:1-15.
[20] WANG Z M,WANG J S,YANG K,et al.Semantic segmentation of high-resolution remote sensing images based on a class feature attention mechanism fused with Deeplabv3+[J]. Computers & Geosciences,2022,158:104969.
A multi-baseline InSAR elevation reconstruction method based on deep learning
ZHOU Yuchong1, XIE Xianming*2
(1. School of Automation, Guangxi University of Science and Technology, Liuzhou 545616, China;
2. School of Electronic Engineering, Guangxi University of Science and Technology, Liuzhou 545006, China)
Abstract: A multi-baseline interferometric synthetic aperture radar(InSAR)elevation reconstruction method based on deep learning and cluster analysis is proposed. This method uses deep learning neural network to classify the intercept information of the interferogram as the basis for judging the category attributes of the pixels, and accurately obtains the clustering center of the pixels, and then cluster analysis technique is used to obtain the elevation information of the observed scenes. The main steps are as follows: firstly, the intercept information of interferograms is obtained, and then the deep learning neural network is used to classify the intercept information of the interferograms. Secondly, the intercepts of the pixels classified into the same category predicted by the network are averaged as the clustering center of this category, which effectively avoids the misclassification caused by the traditional technique due to poor noise robustness. Finally, the cluster analysis technique is used to obtain the elevation information of the observed scenes. The simulation and measured experiment results show that the root-mean-square error of the proposed method is smaller and the reconstruction accuracy is higher than that of the traditional CA algorithm under different SNR.
Keywords: multi-baseline InSAR; deep learning; cluster analysis
(責任編輯:黎 婭)
收稿日期:2023-03-07;修回日期:2023-03-23
基金項目:國家自然科學基金項目(62161003,41661092);廣西自然科學基金項目(2018GXNSFAA281196)資助
第一作者:周宇翀,在讀碩士研究生
*通信作者:謝先明,博士,研究員,研究方向:InSAR技術以及多基線InSAR技術應用研究,E-mail:xxmxgm@163.com