丁 苑,郝明磊,行鴻彥,曾祥能
(1.南京信息工程大學(xué) a.氣象災(zāi)害預(yù)報預(yù)警與評估協(xié)同創(chuàng)新中心;b.江蘇省氣象探測與信息處理重點(diǎn)實驗室,南京210044; 2.空軍研究院 戰(zhàn)場環(huán)境研究所,北京 100085)
海面風(fēng)場中風(fēng)速和風(fēng)向的觀測對軍事活動和海上生產(chǎn)作業(yè)有極其重要的影響,尤其是風(fēng)速直接影響海上行動的安全。遙感測量海面風(fēng)速已經(jīng)成為大尺度風(fēng)浪觀測的重要手段,針對特定遠(yuǎn)洋海域,其能夠彌補(bǔ)傳統(tǒng)單點(diǎn)觀測數(shù)據(jù)的缺失。合成孔徑雷達(dá)(Synthetic Aperture Radar,SAR)對海平面粗糙度的變化十分敏感,且其微波成像方式對云霧穿透性強(qiáng),受天氣狀況干擾較小[1],因此廣泛應(yīng)用于海面風(fēng)速的反演。SAR從其成像中根據(jù)不同海面的粗糙度來獲取不同的后向散射信號,并按照該信號與風(fēng)速、風(fēng)向和雷達(dá)入射角之間的數(shù)量關(guān)系,提取出需要的風(fēng)場信息[2-3]。SAR按照其發(fā)射波束振動方向的不同,可以分成水平極化(H)和垂直極化(V),并按照雷達(dá)波束發(fā)射-接收的振動方向可分為同極化方式(HH、VV)和交叉極化方式(VH、HV),不同的極化方式接收到的后向散射強(qiáng)度不同,由此對應(yīng)不同的海面風(fēng)速反演模型。本文結(jié)合以往國際學(xué)者的研究,利用逐步回歸模型和BP神經(jīng)網(wǎng)絡(luò)模型,對我國高分三號(GF-3)交叉極化數(shù)據(jù)用于海面風(fēng)速反演進(jìn)行初步的模型探索。
目前,研究人員利用地球物理模型函數(shù)(Geophysical Model Function,GMF)對海面風(fēng)速進(jìn)行反演[4]。經(jīng)典的C波段單極化GMF模型,最早是由歐洲中長期預(yù)報中心(ECMWF)基于遙感衛(wèi)星ERS-1/2為散射計設(shè)計的CMOD系列函數(shù),且該模型后被證實同樣適用于C波段VV極化的SAR雷達(dá)。CMOD系列函數(shù)是一種半經(jīng)驗?zāi)P?與SAR雷達(dá)后向散射系數(shù)、海面風(fēng)矢量和雷達(dá)入射角等參數(shù)相關(guān),其經(jīng)典表達(dá)式為:
C(u10,θ)cos 2φ)
(1)
由于經(jīng)典模型利用單極化SAR圖像反演風(fēng)速必須提前知道相對風(fēng)向,并將雷達(dá)入射角和圖像處理后得到的歸一化雷達(dá)散射截面(Normalized Radar Cross Section,NRCS)作為已知量輸入函數(shù)模型,通過迭代計算得到海面風(fēng)速[5],因此選擇準(zhǔn)確的輸入風(fēng)向非常必要。目前,在海面風(fēng)場反演研究中,常用的輸入風(fēng)向主要有業(yè)務(wù)化散射計風(fēng)向數(shù)據(jù)、實測浮標(biāo)數(shù)據(jù)以及歐洲的風(fēng)向預(yù)報模式,按照不同風(fēng)速反演精確性的要求選擇不同的輸入風(fēng)向[6]。
全極化SAR具備同時獲取同極化和交叉極化數(shù)據(jù)的能力,比單極化SAR數(shù)據(jù)包含更多的海洋環(huán)境信息,特別是交叉極化數(shù)據(jù),且其可以獲取比同極化數(shù)據(jù)更豐富的海洋表征信息[7]。隨著全球C波段全極化SAR衛(wèi)星的發(fā)射,除了經(jīng)典單極化模型函數(shù)之外,海風(fēng)反演研究工作者也逐步將研究重心轉(zhuǎn)移到對交叉極化數(shù)據(jù)(VH、HV)的研究當(dāng)中[8-9],并研究出一系列新的數(shù)據(jù)規(guī)律。2011年,VACHON等人[10]利用加拿大全極化SAR衛(wèi)星RADARSAT-2影像,統(tǒng)計出加拿大東西海岸的實測浮標(biāo)風(fēng)速,與VH極化的NRCS相結(jié)合建立了C-2PO海面風(fēng)速反演模型:
(2)
該模型認(rèn)為交叉極化數(shù)據(jù)的NRCS與海面風(fēng)速之間是單一的線性關(guān)系,且能夠降低風(fēng)場反演模型的復(fù)雜程度。隨后,文獻(xiàn)[11]利用機(jī)載步進(jìn)微波輻射計(SFMR)獲取風(fēng)速數(shù)據(jù),并建立了將海面風(fēng)速與交叉極化NRCS相結(jié)合的二次函數(shù)模型:
(3)
颶風(fēng)的研究反演過程認(rèn)為相對風(fēng)向?qū)︼L(fēng)速反演具有一定的影響力,且隨著風(fēng)速增加相關(guān)性不斷減弱。文獻(xiàn)[12]在C-2PO模型的基礎(chǔ)上進(jìn)一步分析研究,發(fā)現(xiàn)交叉極化的NRCS與雷達(dá)入射角之間也具有緊密聯(lián)系,據(jù)此提出與風(fēng)速和入射角相關(guān)的C-3PO模型:
(4)
綜合上述學(xué)者的研究,SAR交叉極化數(shù)據(jù)運(yùn)用于海面風(fēng)場反演的研究表明了相較于經(jīng)典單極化模型的優(yōu)越性。但與此同時,運(yùn)用交叉極化數(shù)據(jù)反演海面風(fēng)場的模型仍在學(xué)術(shù)界未有定論,影響交叉極化反演的因素仍有爭論,因此具有進(jìn)一步研究的價值。
2016年,中國發(fā)射了GF-3,該衛(wèi)星是我國第一顆C波段分辨率為1 m的SAR衛(wèi)星。GF-3的發(fā)射極大推動了我國對SAR的成像觀測能力,躋身國際先進(jìn)行列。由于GF-3正式運(yùn)行時間尚短,GF-3數(shù)據(jù)在海面風(fēng)場反演中的應(yīng)用研究仍處于起步階段,準(zhǔn)確地對觀測海域進(jìn)行風(fēng)場反演并驗證結(jié)果,不僅能推進(jìn)后續(xù)海洋探測,還可以使得我國自主發(fā)射收集的SAR衛(wèi)星數(shù)據(jù)在軍事、國防等領(lǐng)域發(fā)揮重要作用[13]。隨著機(jī)器學(xué)習(xí)的迅速發(fā)展,具有自主學(xué)習(xí)能力的人工神經(jīng)網(wǎng)絡(luò)模型應(yīng)用于海洋氣象領(lǐng)域也獲得廣泛關(guān)注,強(qiáng)大的非線性映射能力使其對復(fù)雜應(yīng)用問題具有良好的適應(yīng)性。本文選用80幅GF-3全極化條帶1(QPSI)的交叉極化(VH)數(shù)據(jù),分析風(fēng)速、相對風(fēng)向及雷達(dá)入射角等各因素與提取的NRCS之間的關(guān)系,隨后分別利用逐步回歸模型和BP神經(jīng)網(wǎng)絡(luò)模型進(jìn)一步研究各變量之間的相關(guān)關(guān)系,初步探索我國GF-3交叉極化數(shù)據(jù)的風(fēng)速反演模型。
GF-3具有全極化條帶、精細(xì)條帶、波模式等12種成像模式[14],其空間分辨率為1 m~500 m不等,幅寬為10 km~650 km,常規(guī)入射角為20°~50°。本文研究選擇的是全極化條帶1(QPSI)模式,該模式下的產(chǎn)品是單視復(fù)數(shù)據(jù),SAR圖像標(biāo)準(zhǔn)空間分辨率為8 m,標(biāo)準(zhǔn)成像幅寬為30 km。
原始SAR圖像數(shù)據(jù)存在相干斑噪聲、幾何畸變等問題不能直接用于風(fēng)速反演,需要進(jìn)行圖像預(yù)處理。首先,預(yù)處理操作是輻射定標(biāo),即將像元灰度值按照一定的標(biāo)準(zhǔn)轉(zhuǎn)換成以dB為單位的雷達(dá)后向散射系數(shù),從而建立目標(biāo)NRCS與雷達(dá)影像強(qiáng)度的定量模型關(guān)系。本文利用PIE對GF-3數(shù)據(jù)進(jìn)行逐個像元的輻射定標(biāo)。其次,由于SAR影像的斜視成像機(jī)理,為了獲取其正確空間地理位置信息,需要對圖像進(jìn)行必要的幾何校正[15],使其轉(zhuǎn)換到統(tǒng)一的地理坐標(biāo)系中,具體如圖1所示。由于本文研究的是遠(yuǎn)離陸地的海洋區(qū)域,海面相對陸地起伏較為平緩,可忽略疊掩等造成的幾何畸變,因此本文采用WGS84地心坐標(biāo)系對圖像進(jìn)行橢球體編碼。
圖1 地理編碼示意圖
為了有效抑制SAR圖像中普遍存在的斑點(diǎn)噪聲,對圖像進(jìn)行濾波處理是有效剔除噪聲的方法,基于完全的斑點(diǎn)乘性噪聲模型提出Lee濾波[16],它是經(jīng)典的SAR圖像斑點(diǎn)噪聲濾波方法,但其對于圖像邊緣等細(xì)節(jié)信息方面的保持不理想,因此本文選用改進(jìn)的增強(qiáng)型Lee濾波,可以在減少斑點(diǎn)噪聲的同時,兼顧保持雷達(dá)圖像的紋理信息,其濾波效果如圖2所示。
圖2 改進(jìn)的Lee濾波效果
ERA-Interim海面風(fēng)場資料是由歐洲中期天氣預(yù)報中心(ECMWF)提供的覆蓋全球區(qū)域的大氣分析產(chǎn)品。該產(chǎn)品提供全球1979年1月至2019年3月的海面10 m高的水平(U)、垂直(V)風(fēng)矢量分量,根據(jù)分量計算得出相應(yīng)風(fēng)速、風(fēng)向,后續(xù)數(shù)據(jù)仍在持續(xù)更新中,覆蓋全球0°E~360°E、90°S~90°N[17],且有多種空間分辨率選擇范圍,本文選擇最精細(xì)的0.125°×0.125°分辨率以使得在空間上與GF-3圖像最匹配。在ERA-Interim產(chǎn)品的時間分布上,分為分析數(shù)據(jù)(Analaysis)和預(yù)報數(shù)據(jù)(Forecast)。對于分析數(shù)據(jù),其時間分辨率為6 h(00:00,06:00,12:00,18:00)。在每日00:00與12:00時提供預(yù)報數(shù)據(jù),用戶可根據(jù)需求選擇預(yù)測時間步長,如圖3所示。本文為更準(zhǔn)確地驗證反演結(jié)果,在時間數(shù)據(jù)選取上按照實測優(yōu)于預(yù)測、與SAR圖像采集時間最近為原則選取模式資料。
圖3 ERA-Interim數(shù)據(jù)時間分布
為了更準(zhǔn)確地建立多變量回歸模型,在回歸之前首先對各變量之間的相關(guān)性進(jìn)行分析。根據(jù)單極化業(yè)務(wù)GMF模型的各變量關(guān)系,參考以往研究學(xué)者對RADARSAT-2交叉極化數(shù)據(jù)建立的C-2PO模型,本文對VH雷達(dá)后向散射系數(shù)(σVH)、10 m高風(fēng)速(u10)、相對風(fēng)向(φ)、雷達(dá)入射角(θ)4個變量之間的線性相關(guān)性進(jìn)行分析。
皮爾遜相關(guān)系數(shù)是用來描述2個變量之間線性相關(guān)性的系數(shù),其取值反應(yīng)了兩者的線性相關(guān)程度。該系數(shù)定義為2個變量的協(xié)方差除以標(biāo)準(zhǔn)差,具體表示方法為:
(5)
式(5)定義了總體相關(guān)系數(shù),為進(jìn)一步計算出協(xié)方差和標(biāo)準(zhǔn)差,常用r表示皮爾遜相關(guān)系數(shù):
(6)
皮爾遜相關(guān)系數(shù)r的取值范圍為-1≤r≤1,r>0時表示正相關(guān),r<0時表示負(fù)相關(guān),|r|=0表示不存在線性相關(guān),|r|=1表示完全線性相關(guān),0<|r|<1表示存在不同程度的線性關(guān)系,且|r|≤0.3表示不存在線性相關(guān),0.3<|r|≤0.5表示為低度線性相關(guān),|r|>0.5表示為顯著線性相關(guān)。
利用上述關(guān)系求解得到本文各變量之間的皮爾遜相關(guān)系數(shù),如表1所示。根據(jù)各變量之間的相關(guān)性,可初步判斷方程的因變量與自變量之間的線性關(guān)系,排除多重共線性干擾,為回歸模型的建立提供判斷依據(jù)。
表1 各變量間的皮爾遜相關(guān)系數(shù)
由表1可知,在GF-3交叉極化數(shù)據(jù)中,雷達(dá)后向散射系數(shù)與風(fēng)速呈顯著線性正相關(guān)關(guān)系、與雷達(dá)入射角呈顯著線性負(fù)相關(guān)關(guān)系,且其余各變量之間不存在線性關(guān)系。
多元逐步回歸分析是用于研究因變量y與p個因子x之間的定量統(tǒng)計關(guān)系,其基本應(yīng)用原理是對全部自變量按照其對因變量的顯著性從大到小逐個引入回歸方程。與此同時,對每一個代入的自變量逐個進(jìn)行F檢驗,同時,對所有已經(jīng)引入的自變量進(jìn)行t檢驗。如果當(dāng)前回歸方程由于引進(jìn)了新的自變量而變得不顯著,則剔除該變量[18]。逐步回歸方程形式如下:
y=β0+β1x1+β2x2+…+βpxp
(7)
基于以上變量之間的相關(guān)性分析,將雷達(dá)后向散射系數(shù)(σVH)作為因變量,逐個引入風(fēng)速(u10)、相對風(fēng)向(φ)、雷達(dá)入射角(θ)可作為自變量因子,根據(jù)引入新變量后回歸方程的可決系數(shù)、t檢驗、F檢驗,若檢驗都通過則引入,否則剔除。逐步回歸后,得到如表2的預(yù)測回歸結(jié)果。
表2 逐步回歸結(jié)果
由數(shù)據(jù)分析結(jié)果可知,在逐步回歸過程中,相對風(fēng)向φ變量被剔除,F檢驗與t檢驗均能拒絕原假設(shè),排除了變量間的多重共線性,與相關(guān)性分析結(jié)果具有較好的一致性。因此,最終交叉極化雷達(dá)后向散射系數(shù)的最優(yōu)多元逐步回歸方程為:
σVH=0.343u10-0.227θ-16.502
(8)
根據(jù)最終得到的回歸方程,風(fēng)速反演方程可表示為:
(9)
在逐步回歸的線性模型中,排除了相對風(fēng)向因子,但非線性并不意味著無關(guān)性,不能直接排除相對風(fēng)向因子對風(fēng)速反演的貢獻(xiàn)。在已知風(fēng)速反演與雷達(dá)后向散射系數(shù)、雷達(dá)入射角相關(guān)的情況下,進(jìn)而探究相對風(fēng)向作為非線性因子對風(fēng)速反演的影響。當(dāng)工程中遇到復(fù)雜的非線性系統(tǒng),系統(tǒng)狀態(tài)方程復(fù)雜或無法用數(shù)學(xué)方法直接建模時,可建立人工神經(jīng)網(wǎng)絡(luò)模型表達(dá)這種系統(tǒng)[19],即“黑盒”處理。BP神經(jīng)網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)如圖4所示。
BP神經(jīng)網(wǎng)絡(luò)是一種帶有隱含層的前饋神經(jīng)網(wǎng)絡(luò),其將信號通過輸入層輸入網(wǎng)絡(luò),隨后經(jīng)過中間的隱含層逐層訓(xùn)練計算,再到輸出層輸出結(jié)果,這是網(wǎng)絡(luò)的前向傳遞,每一層的計算結(jié)果只影響與其關(guān)聯(lián)的下一層神經(jīng)網(wǎng)絡(luò)狀態(tài)[19]。如果輸出的結(jié)果不是預(yù)期結(jié)果,網(wǎng)絡(luò)會進(jìn)入反向傳播計算,按照誤差計算規(guī)則改變網(wǎng)絡(luò)權(quán)值的閾值,重復(fù)整個過程直至得到期望輸出結(jié)果。本文選用經(jīng)典的三層BP神經(jīng)網(wǎng)絡(luò)建立2個風(fēng)速預(yù)測模型,第一模型是參考前文的逐步回歸模型,建立以σVH與θ為輸入、u10為輸出訓(xùn)練的神經(jīng)網(wǎng)絡(luò)預(yù)測模型,并將該80組數(shù)據(jù)作為訓(xùn)練樣本,通過BP神經(jīng)網(wǎng)絡(luò)的自適應(yīng)能力預(yù)測海面風(fēng)速。第二模型是在原基礎(chǔ)輸入層上加入φ,隨后將2種模型的訓(xùn)練效果進(jìn)行對比,側(cè)面判斷風(fēng)向φ是否影響海面風(fēng)速的預(yù)測,BP神經(jīng)網(wǎng)絡(luò)模型如圖5所示。
圖5 BP神經(jīng)網(wǎng)絡(luò)模型拓?fù)?/p>
從BP神經(jīng)網(wǎng)絡(luò)模型拓?fù)淇梢悦黠@看出,BP神經(jīng)網(wǎng)絡(luò)在數(shù)學(xué)上表達(dá)的是一種函數(shù)的非線性映射關(guān)系。其中,隱含層神經(jīng)元個數(shù)的設(shè)定通常有如下公式[20-21]:
(10)
其中,n為隱含層的神經(jīng)元數(shù)目,α為輸入層神經(jīng)元數(shù)目,β是輸出層數(shù)目,θ是整數(shù),取值區(qū)間為[1,10]?;诖?2個模型隱含層神經(jīng)元個數(shù)分別設(shè)為5與6。本文的激活函數(shù)選擇Sigmoid函數(shù),訓(xùn)練中選擇基于梯度下降法的Learngdm算法作為權(quán)閾值的學(xué)習(xí)法則,設(shè)置最大訓(xùn)練迭代次數(shù)為1 000次。BP神經(jīng)網(wǎng)絡(luò)模型流程如圖6所示。
圖6 BP神經(jīng)網(wǎng)絡(luò)模型流程
2種模型的訓(xùn)練結(jié)果如圖7、圖8所示。從圖7可以看出,2種BP神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練數(shù)據(jù)、驗證數(shù)據(jù)、測試數(shù)據(jù)的均方誤差都迅速減小并最終收斂,所有集合數(shù)據(jù)對應(yīng)的擬合R值均超過70%,說明建立BP神經(jīng)網(wǎng)絡(luò)預(yù)測海面風(fēng)速是有效的。同時,通過第一模型與第二模型訓(xùn)練效果的對比可看出,相對風(fēng)向的加入并沒有使得模型的訓(xùn)練效果得到顯著提升,從而運(yùn)用排除法基本排除交叉極化數(shù)據(jù)中風(fēng)向因素對風(fēng)速反演的影響。
圖7 迭代訓(xùn)練結(jié)果
圖8 2種BP神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練效果
為評價建立的逐步回歸模型與BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型對海面風(fēng)速的計算效果,本文另取10幅相同模式GF-3圖像作為測試組數(shù)據(jù),分別采用逐步回歸模型、BP第一模型、BP第二模型和C-3PO模型對海面風(fēng)速進(jìn)行反演和驗證。模型以ERA-Interim的風(fēng)場數(shù)據(jù)作為初始風(fēng)向與風(fēng)速驗證數(shù)據(jù),4種模型對測試組SAR圖像數(shù)據(jù)的風(fēng)速反演相對誤差與風(fēng)速反演效果分別如圖9、圖10所示。為更好地體現(xiàn)新模型探究和建立的必要性,本文從宏觀數(shù)據(jù)源到測試樣本誤差進(jìn)行了對比與分析。以ERA-Interim的風(fēng)場數(shù)據(jù)作為初始風(fēng)向與風(fēng)速驗證數(shù)據(jù),用測試數(shù)據(jù)組的平均相對誤差(Average Relative Error,ARE)以及樣本的均方根誤差(Root Mean Square Error,RMSE)作為評價標(biāo)準(zhǔn),結(jié)果如表3所示。
圖9 4種模型對SAR圖像數(shù)據(jù)的風(fēng)速反演相對誤差
圖10 4種模型對SAR圖像數(shù)據(jù)的風(fēng)速反演效果
表3 4種模型的實驗結(jié)果對比
結(jié)果表明,當(dāng)前關(guān)于交叉極化數(shù)據(jù)反演海面風(fēng)速的模型,在數(shù)據(jù)源上使用的主要是國外衛(wèi)星,在初始風(fēng)場數(shù)據(jù)選擇上,C-3PO模型對大量NDBC浮標(biāo)實測數(shù)據(jù)進(jìn)行統(tǒng)計,而我國自主發(fā)射的GF-3運(yùn)行時間尚短且成像區(qū)域能夠匹配的NDBC數(shù)據(jù)很少,該模型不能完全適應(yīng)我國GF-3衛(wèi)星數(shù)據(jù),因此探索建立新模型非常必要,測試數(shù)據(jù)誤差對比也說明了這一點(diǎn)。本文建立的逐步回歸模型對測試樣本的平均相對誤差最小,而BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型的均方根誤差最小,同時,4種模型對GF-3圖像交叉極化數(shù)據(jù)的海面風(fēng)速反演均方根誤差均小于2 m/s,說明模型的建立是顯著有效的。與此同時,BP第二模型在訓(xùn)練效果與測試樣本誤差分析中的效果均未超過第一模型,這些對比排除了風(fēng)向因子對交叉極化數(shù)據(jù)雷達(dá)后向散射系數(shù)的影響,反映了BP神經(jīng)網(wǎng)絡(luò)能夠較好地模擬風(fēng)速影響模型,對風(fēng)速預(yù)測的訓(xùn)練具有較強(qiáng)的自學(xué)習(xí)能力。
本文利用80幅GF-3全極化圖像對GF-3交叉極化數(shù)據(jù)進(jìn)行海面風(fēng)速反演,并初步探索了回歸方程。實驗結(jié)果表明,交叉極化數(shù)據(jù)的雷達(dá)后向散射系數(shù)與海面風(fēng)速、雷達(dá)入射角之間存在線性關(guān)系,與國際學(xué)者的研究具有良好的一致性。同時,將BP神經(jīng)網(wǎng)絡(luò)引入交叉極化數(shù)據(jù)對海面風(fēng)速的反演,一方面說明了神經(jīng)網(wǎng)絡(luò)模型在該領(lǐng)域的良好適用性,為未來將更多的人工智能技術(shù)運(yùn)用于海面風(fēng)場反演提供可能性。另一方面通過2種BP神經(jīng)網(wǎng)絡(luò)模型的對比排除了相對風(fēng)向?qū)C骘L(fēng)速反演的影響,使得風(fēng)速反演不需要依賴于外部風(fēng)向的輸入,極大簡化了反演模型,證明了使用交叉極化數(shù)據(jù)進(jìn)行海面風(fēng)場反演具有單極化數(shù)據(jù)不可替代的優(yōu)越性和發(fā)展?jié)摿ΑkS著高分三號衛(wèi)星的繼續(xù)運(yùn)行和各幅圖像的等效噪聲校準(zhǔn),能夠得到更顯著的數(shù)據(jù)規(guī)律和更精準(zhǔn)的反演模型。后續(xù)將利用遺傳算法來優(yōu)化BP神經(jīng)網(wǎng)絡(luò),進(jìn)一步研究機(jī)器學(xué)習(xí)與深度學(xué)習(xí)在SAR圖像海面風(fēng)場反演領(lǐng)域中的應(yīng)用。