張潔,田杰,王兆徽
(1.國家海洋環(huán)境預報中心,北京100081;2.國家海洋局空間海洋遙感與應用研究重點實驗室,北京100081)
海況偏差(Sea State Bias,SSB)是由于海表面存在波浪引起的,會造成實際的高度計測距大于真實距離的一種誤差[1],因此海況偏差為負值。它是衛(wèi)星雷達高度計測高的主要誤差源之一。按照誤差產生的原因,海況偏差由:電磁偏差、偏斜偏差和跟蹤偏差這3種誤差構成[2]。其中電磁偏差是由于在雷達脈沖與海面相互作用時,海表面波浪的波谷比波峰更多地反射了脈沖,會導致平均反射面低于真實平均海面[3],關于這一點,Gaspar等[4]曾做過相應的研究,發(fā)現(xiàn)平均反射面和真實平均海面之間的高度差為-1%~-4%的有效波高(Significant Wave Height,SWH);另外兩種偏差:偏斜偏差和跟蹤偏差,都是由儀器產生的誤差[5]。星上跟蹤器的作用是確定高度計返回脈沖波形上升沿半功率點的位置,在計算中假設海面的高度概率密度函數(shù)成高斯分布,由于實際波形是非高斯型或是偏斜的,所以產生偏斜和跟蹤偏差,與SWH成正比[6]。高度計海況偏差計算模型從參數(shù)模型發(fā)展到非參數(shù)模型(Nonparametric,NP)[7-9]。參數(shù)模型有BM系列模型(Bias Model)、基于波浪發(fā)展的SSB校正模型和基于波浪統(tǒng)計特征參數(shù)經驗模型。在參數(shù)的選擇方面從單一考慮有效波高和風速到把偽波齡、后向散射截面、涌浪高度、波浪陡度和波周期等因子加入模型。BM海況偏差參數(shù)模型主要有4種:BM1、BM2[4]、BM3[10]和 BM4[4]。廣泛采用的 SSB經驗校正模型是BM4模型[11]。
根據(jù)眾多理論研究以及塔基、風洞等現(xiàn)場的測量[8、12-14]表明:高度計測高誤差ΔR和SSB相關的影響因素不僅有風速、有效波高,還與不同成長階段的波浪相關,這樣就有了基于波浪不同發(fā)展階段的SSB校正模型,即FG模型[8]。該校正模型中,波浪的成長程度用經驗參數(shù)偽波齡(Pseudo Wave Age)來描述[15-16]。FG模型表達式如下:
式中:Hswh是有效波高,ξ是偽波齡,ξm是全球平均偽波齡參數(shù),其值約為2.3[9],偽波齡的計算公式如下:
式中:U為風速。參數(shù)經驗模型都是引入SSB真值進行修正的模型,而SSB真值的獲取來自現(xiàn)場試驗,如利用激光和陸地上塔基雷達試驗,操作起來比較困難。
SSB參數(shù)模型中的海況偏差系數(shù)為常值,對于這一點,許多學者都存在異議。Cheney等[16]對Geosat數(shù)據(jù)按照不同緯度區(qū)間進行研究,發(fā)現(xiàn)海況偏差系數(shù)具有0.2%~1.8%的變化,Zlotnicki等[17]也進行了類似的研究,結果海況偏差系數(shù)變化范圍為2.3%~2.9%。Witter等[18]對Geosat海況偏差進行分析,發(fā)現(xiàn)海況偏差與緯度存在從40°S的2.2%到10°S~40°S的3.2%這樣的關系,同時指出由緯度導致的海況偏差的變化,這一現(xiàn)象的實質是不同緯度區(qū)域存在不同有效波高,而海況偏差系數(shù)的不同則是由有效波高造成的。Labroue等[19]研究也指出有效波高相對于的海況偏差系數(shù)的有較高的影響。因此許多學者展開了SSB非參數(shù)校正模型的研究。Witter等[20]首先提出針對風速影響的海況偏差系數(shù)非參數(shù)校正模型,和參數(shù)模型具有具體的函數(shù)形式不同,非參數(shù)校正模型沒有具體的函數(shù)形式,模型結果就是風速與海況偏差系數(shù)為一一對應,按照風速的大小,即可得到相對應的海況偏差系數(shù)。Chelton[1]認為海況偏差系數(shù)應是非參數(shù)的,并且是風速與有效波高的函數(shù),而非預先假定一個經驗模型,再用衛(wèi)星測高數(shù)據(jù)進行擬合。Chelton[3]和Rodriguez等[20]都對海況偏差非參數(shù)模型進行了研究。
“海洋二號”(HY-2A)衛(wèi)星是我國發(fā)射的首顆海洋動力環(huán)境衛(wèi)星,星上搭載了主、被動微波遙感器(高度計、輻射計和散射計),具有高精度測軌、定軌和全天候、全天時、全球探測能力[21-22]。衛(wèi)星的精確重復周期分為壽命前期和壽命后期,壽命前為14 d,壽命后期為168 d。衛(wèi)星壽命前期的軌道高度為971 km,衛(wèi)星壽命后期的軌道高度是973 km。對全球海面高度的觀測是HY-2A衛(wèi)星的一項重要工作內容。通過HY-2A長時間的數(shù)據(jù)積累,使得其成為全球衛(wèi)星測高體系的重要補充[23]。
由于衛(wèi)星定軌技術的提高,海況偏差取代軌道誤差成為高度計最大的誤差源[24]。Labroue等[19]和Picot等[25]經過研究證明NPSSB模型是目前精度最高的海況校正模型。Jason-2采用的是NPSSB模型計算海況誤差,HY-2A衛(wèi)星高度計采用的是BM4模型計算海況偏差,利用HY-2衛(wèi)星和Jason-2衛(wèi)星海況偏差在交叉點處的數(shù)據(jù)分析,表明HY-2A衛(wèi)星海況偏差在交叉點處的方差是Jason-2的兩倍,且存在-2.5 cm的平均差值[11]。
機器學習是現(xiàn)代智能技術中重要的一個方面,研究從觀測樣本出發(fā)去分析對象,進行預測。其中徑向基函數(shù)(Radial Basis Function,RBF),就是某種沿徑向對稱的標量函數(shù)[26]。通常定義為空間中任一點x到某一中心xc之間歐氏距離的單調函數(shù),其作用往往是局部的,即當x遠離xc時函數(shù)取值很小,可以表示點x和點xc的關系。最常用的徑向基函數(shù)是高斯核函數(shù)。
本文擬研究實現(xiàn)基于長時間序列的HY-2A衛(wèi)星高度計數(shù)據(jù),包括風速、有效波高和海面高度差值,基于高斯核函數(shù)的NPSSB模型算法,將計算結果和SSB參數(shù)模型中具有代表性的BM3和BM4模型的海況偏差校正數(shù)據(jù)進行對比,探究BM3、BM4模型與高斯核函數(shù)NPSSB模型之間的差異。
本文的研究思路如圖1所示,首先收集HY-2A衛(wèi)星高度計二級產品數(shù)據(jù),在經過判斷完整性、解碼、讀取觀測數(shù)據(jù)后,對觀測數(shù)據(jù)進行篩選,包括標識篩選和閾值篩選。對獲取到的質量較好的數(shù)據(jù)進行除SSB外誤差校正,誤差項包括:干濕大氣延遲、電離層延遲、海洋潮汐、海洋負荷潮、地球固體潮、逆大氣壓校正和極潮。以3 d為時間窗口,利用求升軌和降軌交叉點的方法,分別計算每個周期的交叉點處海面高度不符值、風速和有效波高矩陣。結合核函數(shù)NPSSB的相關算法,模擬SSB的值,與BM3和BM4模型結果進行對比。
圖1 流程圖
本研究所需高度計數(shù)據(jù)由國家衛(wèi)星海洋應用中心提供的HY-2A衛(wèi)星高度計二級數(shù)據(jù)產品。二級數(shù)據(jù)為已經過海陸標識和質量控制后的產品數(shù)據(jù)。采集了 0012、0013、0018、0019、0020、0021、0022、0023、0025、0026、0032、0044、0045和0046共14個周期數(shù)據(jù)。
采集數(shù)據(jù)后首先判斷數(shù)據(jù)的完整性、對數(shù)據(jù)進行解碼,然后為了保證高度計衛(wèi)星觀測數(shù)據(jù)的質量,需要對其進行篩選剔除異常,包括標識篩選和閾值篩選。標識篩選是根據(jù)高度計數(shù)據(jù)集中測量參量標記值直接剔除不合格數(shù)據(jù);閾值篩選則是指當測量參數(shù)的值在閾值范圍之外時,說明該點數(shù)據(jù)異常,予以剔除。標識篩選選項和閾值篩選項見表1、2。
2014年以前的合格處方百分比均低于30%,其中2013年、2014年的百分比均低于20%?;葜菔懈鼿p處方合格率基本上逐年上升,由2010年的24.14%上升到2016年的51.41%。見表2、圖3。
經過上述數(shù)據(jù)采集和處理后,統(tǒng)計數(shù)據(jù)量,發(fā)現(xiàn)采集14個周期的原始數(shù)據(jù)量都在9×105左右,經過標識篩選和閾值篩選的后數(shù)據(jù)量在4×105左右,具體數(shù)據(jù)量變化見圖2。
對篩選后得到的數(shù)據(jù)進行除SSB外的偏差訂正,包括:干濕大氣延遲、電離層延遲、海洋潮汐、海洋負荷潮、地球固體潮、逆大氣壓校正和極潮。
表1 數(shù)據(jù)標識篩選標準
表2 數(shù)據(jù)閾值篩選標準
圖2 14個周期原始數(shù)據(jù)量和篩選后數(shù)據(jù)量對比
式中:SSH′是除SSB外的偏差訂正后的海面高度,altitude是衛(wèi)星相對參考面高度,range_ku是衛(wèi)星相對瞬時海面高度,ε代表上述所列各項誤差。
利用HY-2A衛(wèi)星高度計數(shù)據(jù)的time_day和time要素,以3 d為時間窗口,對每個周期的數(shù)據(jù),計算3 d內高度計升、降軌交叉點,最后將一個周期的所有交叉點匯總。
為了避免計算量過大,利用下述判定條件判斷兩個軌道是否有可能交叉。HY-2A衛(wèi)星高度計數(shù)據(jù)中,以pass序號的奇、偶性可以辨別該軌道的升降屬性:奇數(shù)的軌道為升軌,偶數(shù)的是降軌。在確定軌道的升降屬性后,通過以下4個條件判斷升降軌是否有可能形成交叉點:①升軌弧段開始經度大于降軌弧段結束經度;②升軌弧段結束經度小于降軌弧段開始經度;③升軌弧段開始緯度小于降軌弧段開始緯度;④升軌弧段結束緯度大于降軌弧段結束緯度。
對可能交叉的的升降軌弧段求交叉點的方法如圖3所示。首先找到升降軌弧段上距離最近的4個點A1、A2、D1和D2(A表示升軌,D表示降軌),并分別在所在的弧段兩端各擴展5個點,以擴展后的一共24個點進行多項式擬合,求交點,交點處即為交叉點位置。交叉點處的位置信息:經緯和緯度,由這24個點擬合的兩條曲線求交點得到。交叉點風速包括:升軌風速和降軌風速,由升軌和降軌的12個點插值得到。同理可以得到升軌有效波高、降軌有效波高、升軌 SSH′(SSH′A)和降軌 SSH′(SSH′D)。交叉點處的海面高度不符值Δhs按照式(4)計算得到。
圖3 求交叉點示意圖(A表示升軌,D表示降軌)
得到[交叉點經度,交叉點緯度,升軌風速,降軌風速,升軌有效波高,降軌有效波高,Δhs]數(shù)據(jù)集后,需要再進行數(shù)據(jù)篩選,去掉異常值點。理論上我們認為3 d時間內,海面高度變化值應小于20 cm,即:Δhs≤0.2 m,并且高緯度地區(qū)誤差較大,所以當Δhs>0.2 m或者交叉點在高緯度地區(qū)(>60°N或者60°S)時,判定其為異常值點,需要去除。以0012周期為例,通過上述方法,得到的交叉點如圖4所示。
在前人的研究基礎上,我們能夠得知海況偏差可以看做是自變量為風速和有效波高的函數(shù),因此本研究在獲取大量海面高度不符值、風速、有效波高數(shù)據(jù)樣本的基礎上,結合高斯核函數(shù)探尋海況偏差和二者之間的機制,結果并不是給出類似BMSSB參數(shù)模型的函數(shù)表達式,而是利用數(shù)據(jù)樣本之間的規(guī)律,在設定自變量的情況下,給出因變量的值。完整推導公式在下文闡述。
圖4 0012周期(4445—4447 d)交叉點分布(藍色為交叉點、紅色為觀測點)
回歸方程為:
式中:權重值an必須滿足以下條件:
結合海面高度不符值矩陣(yi,x1i,x2i),得到SSB表達式為:
下標1和2對應相同地理位置不同的觀測時間,i表示第i個觀測,假設 φ(x1i)已知,把x用x1i替換,求解φ(x1i):
寫成矩陣形式:
I是n×n的單位矩陣,A的大小也為n×n,其矩陣元素 aij=an(x1j,x2i),φ1=[φ(x11),…,φ(x1n)]T,y=[y1,…,yn]T。此矩陣為奇異矩陣,必須給定φ1一個確定值φ0,則上式可重寫為:
求解得到SSB:
A是權重矩陣,權重大小由xi和x之間的距離比例因子來確定,其表達式為:
式中:K是核函數(shù),hn是帶寬向量,n表示帶寬取決于觀測樣本,在核函數(shù)NPSSB模型中,選擇對稱的高斯核函數(shù):
帶寬的計算公式為:
式中:可以是風速U或者有效波高hswh,σx是x的標準差,C是取決于核函數(shù)的常數(shù),對于高斯核函數(shù),其值為1.06。n是數(shù)據(jù)集的大小。φ0的確定采用下述方法:在符合SSB取值范圍內,任意給定φ0一個值,計算得到φ(U,SWH)的值,最終SSB的值為φ(U ,SWH)的值減去φ0。x11的確定是通過兩步得到:第一步計算一個周期內所有交叉點的U、SWH值的平均值,第二步在交叉點的集合中找到距離U、SWH平均值最近的點,定義為x11。
在求取上述14個周期的[交叉點經度,交叉點緯度,升軌風速,降軌風速,升軌有效波高,降軌有效波高,海面高度不符值]數(shù)據(jù)集后,分別計算各周期的SSB,求平均SSB的值作為核函數(shù)NPSBB模型模擬的結果,通過以下3個方面對模擬的結果進行分析驗證。首先分析核函數(shù)NPSSB的值與有效波高和風速之間的變化關系;再通過計算核函數(shù)NPSSB的標準差評估NP模型對SSB的模擬能力;最后通過與BM3和BM4模型計算的SSB的值進行對比,比較核函數(shù)NPSSB模型和BM系列模型模擬的SSB區(qū)別。
SSB是有效波高和風速的函數(shù),核函數(shù)NPSSB分別隨有效波高和風速的變化情況見圖5。由圖5可知:(1)估計的核函數(shù)NPSSB的值都為負數(shù),這與SSB的定義相符;(2)當風速為固定值時,SSB隨有效波高的變化呈現(xiàn)反比例函數(shù)的關系,隨著有效波高的增大,SSB的絕對值也增大;(3)當有效波高為固定值時,SSB隨風速的改變呈現(xiàn)近似二次函數(shù)的變化趨勢,風速小于約9 m/s時,SSB的絕對值隨著風速的增加而增加,當風速大于9 m/s時,SSB的絕對值隨風速的增加而減小,這與Hevizi實驗結果12 m/s[10]有些偏差。
通過計算核函數(shù)NPSSB的標準差評估NP模型對SSB的模擬能力。標準差由下述公式計算:
式中:N為樣本數(shù)量。計算得到的標準差如圖6所示。
計算核函數(shù)NPSSB模型得到的SSB標準差,發(fā)現(xiàn)標準差范圍在0~12 mm并且呈現(xiàn)從中心向外標準差逐步增大的一個變化趨勢。為了探究核函數(shù)NPSSB模型得到的SSB標準差分布原因,將實驗用到的原始風速和有效波高數(shù)據(jù)按照(0.5 m/s,0.25 m)為間隔,統(tǒng)計風速和有效波高的分布,如圖7所示。對比圖6和圖7發(fā)現(xiàn),NPSSB的標準差的分布同(風速,有效波高)數(shù)據(jù)量的分布類似,二者具有一定的關系,在(風速,有效波高)數(shù)據(jù)量較高的區(qū)域,核函數(shù)NPSSB的標準差值較小,隨著(風速,有效波高)數(shù)據(jù)量的減少,NPSSB的標準差值逐步增加,這是由NP算法的本質導致的。核函數(shù)算法的核心是利用大量樣本去學習自變量和因變量之間的關系,通過訓練,得到自變量和因變量的變化機制,繼而實現(xiàn)對因變量的模擬,樣本的數(shù)量會影響模擬結果的誤差,誤差隨著樣本數(shù)量的增加而減小。
圖5 NPSSB與有效波高和風速之間的關系
圖6 核函數(shù)NPSSB模型得到的SSB標準差(單位:m)
圖7 風速和有效波高數(shù)據(jù)量分布
圖8 BM模型模擬的SSB值
圖9 核函數(shù)NPSSB模型與參數(shù)模型對比
BM3模型的計算公式如下:
BM4模型的計算公式如下:
按照核函數(shù)NPSSB模型的風速和有效波高范圍,計算BM3和BM4模型模擬的SSB值,如下圖所示。我們可以發(fā)現(xiàn),BM3模型和BM4模型模擬的SSB的值隨風速的變化呈現(xiàn)二次函數(shù)的關系,峰值都在12.5 m/s左右。BM3模型SSB隨有效波高的變化與NP模型類似,隨著有效波高的增加,SSB的絕對值也增加;而BM3模型SSB與有效波高呈現(xiàn)二次函數(shù)的關系。
為了比較核函數(shù)NPSSB模型和BM系列參數(shù)模型的區(qū)別,將核函數(shù)NPSSB模型與BM3和BM4模型模擬的SSB的值相減,差值見圖9。其中圖9a為核函數(shù)NPSSB模型與BM3模型的差值,圖9b為核函數(shù)NPSSB模型與BM4模型的差值。我們發(fā)現(xiàn)核函數(shù)NPSSB模型與BM3、BM4模型差不多都存在0~-0.03 m的差值,這與前人的研究結果相符。核函數(shù)NPSSB模型與BM3模型差值的絕對值更大,隨著風速和有效波高的增加,差值的絕對值越大。
對14個周期的HY-2A衛(wèi)星高度計數(shù)據(jù)進行質量控制,包括標識篩選和閾值篩選,對篩選后得到的數(shù)據(jù)進行除SSB外的偏差訂正,以3 d為時間窗口,得到交叉點處海面高度不符值、風速和有效波高數(shù)據(jù)集,對數(shù)據(jù)集進行訓練,創(chuàng)建海況偏差核函數(shù)非參數(shù)模型(NPSSB),并與參數(shù)模型中具有代表性的BM3、BM4模型進行對比。
研究表明:(1)核函數(shù)NPSSB模型模擬的海況偏差為負值,符合海況偏差的定義,并且能夠很好的反映SSB與U、SWH之間的關系:SSB與U呈二次函數(shù)關系,SSB與SWH呈反比例函數(shù)關系;(2)核函數(shù)NPSSB模型對SSB的模擬能力與訓練數(shù)據(jù)集相關,數(shù)據(jù)量越多,模擬能力越好;(3)核函數(shù)NPSSB模型與BM3、BM4模型都存在0~-0.03 m的差值,隨著風速和有效波高的增加,差值的絕對值越大。