苑黎明,張寶強(qiáng),姜 浩,劉 聰
(1. 青島協(xié)同創(chuàng)新研究院,山東 青島 266075;2. 中國人民解放軍 海軍潛艇學(xué)院,山東 青島 266199)
聲吶水聲探測(cè)、水下安全航行、海洋工程和開發(fā)等均利用水聲信號(hào)作為通信、導(dǎo)航和監(jiān)測(cè)手段[1],精確的海水聲速能夠有效提升水聲設(shè)備性能。然而,水聲信號(hào)傳輸受三維溫鹽信息影響[2-4],直接利用聲速儀測(cè)量精確的海水聲速挑戰(zhàn)巨大,通常采用溫鹽深儀和投棄式溫鹽深探頭等間接測(cè)量[5-6]海水溫度、鹽度和壓力等參數(shù)的方法獲取。直接和間接聲速測(cè)量均需要消耗大量資源且效率低下,間接測(cè)量比直接測(cè)量更準(zhǔn)確,但每種設(shè)備有各自的使用條件。海水聲速研究主要有如下幾種方式:Munk 和Wunsch[7]、Cornuelle 等[8]、何利等[9]用聲層析法反演海水聲速剖面;李洪超等[10]、蔡艷輝等[11]和王桂華等[12]結(jié)合球諧函數(shù)和經(jīng)驗(yàn)正交函數(shù)分析方法建立三維聲速場(chǎng);景存[13]利用拋物線方程開展三維聲傳播研究;張林等[14]和笪良龍等[15]基于波束位移射線簡正波理論,建立三維射線-簡正波-拋物線方程模型;胡合歡等[16]基于BP(Back Propagation)神經(jīng)網(wǎng)絡(luò)建立三維聲速場(chǎng)模型。海洋環(huán)境復(fù)雜,其三維溫鹽分布及變化會(huì)影響水聲的傳播過程,利用更接近真實(shí)的海洋水下三維溫鹽狀態(tài)仿真聲速,建立聲速模型,對(duì)海洋研究和水聲設(shè)備應(yīng)用有重要意義。然而,實(shí)時(shí)水下三維溫鹽觀測(cè)資料不足,因此,實(shí)現(xiàn)三維溫鹽信息精確分析反演是海洋環(huán)境保障的關(guān)鍵。
衛(wèi)星遙感資料具有覆蓋全球、分辨率高且獲取及時(shí)等優(yōu)點(diǎn),結(jié)合衛(wèi)星遙感資料的數(shù)值模型、動(dòng)力學(xué)和統(tǒng)計(jì)分析等方法已被廣泛應(yīng)用于水下三維溫鹽信息反演[17-20]。NCOM(Navy Coastal Ocean Model,美國海軍近岸海洋模式)[21]、HYCOM(Hybrid Coordinate Ocean Model,混合坐標(biāo)海洋模式)[22]、ROMs(Regional Ocean Model System,區(qū)域海洋模擬系統(tǒng))[23]等數(shù)值模型均能夠模擬海洋三維溫鹽流變化;李自立等[24]基于海洋動(dòng)力學(xué)基礎(chǔ)結(jié)合表面狀態(tài)參數(shù)提出了三維水動(dòng)力模型反演深層流速和流向信息,Wang 等[25]提出的“i-SQG”動(dòng)力學(xué)方法反演了海洋內(nèi)部溫鹽結(jié)構(gòu),Liu 等[26]和Chen 等[27]分別將該方法應(yīng)用于提取墨西哥灣和西南印度洋水下環(huán)境信息。相比于數(shù)值模型和動(dòng)力學(xué)方法,統(tǒng)計(jì)分析反演三維溫鹽信息的應(yīng)用更為廣泛,Garnes 等[28]基于海面衛(wèi)星數(shù)據(jù)采用最小二乘回歸方法分別反演了墨西哥灣流溫度垂向結(jié)構(gòu)和西北太平洋與西北大西洋溫鹽場(chǎng)[29],F(xiàn)ox 等[30]和Guinehut等[31]利用海面溫度和高度信息重構(gòu)了時(shí)空高分辨率的海洋三維溫度場(chǎng),王喜冬等[32]和何子康等[33]采用最小二乘線性回歸分別反演了南海三維溫鹽結(jié)構(gòu)和孟加拉灣鹽度信息;Maes[34]采用多變量經(jīng)驗(yàn)正交函數(shù)-分解的方法獲取溫鹽變化的耦合模態(tài),并通過線性擬合的方法得到局地化的溫鹽關(guān)系,F(xiàn)ujii 和Kamachi[35-36]將垂向合并的溫鹽經(jīng)驗(yàn)正交函數(shù)EOF 應(yīng)用到三維變分模型中反演三維溫度場(chǎng);朱江等[37]和肖賢俊等[38]基于三維變分框架(3DVAR)估計(jì)海水溫鹽場(chǎng);中國科學(xué)院大氣物理研究所開發(fā)了基于三維變分同化的海洋資料同化系統(tǒng)OVALS(Ocean Variational Analysis System),李云等[39]將OVALS 同化模塊引入西北太平洋三維溫鹽流預(yù)報(bào)系統(tǒng)中,對(duì)溫鹽場(chǎng)的模擬和預(yù)報(bào)均有所改進(jìn)。
數(shù)值模型、動(dòng)力學(xué)方法具有黑箱性和計(jì)算代價(jià)昂貴性,統(tǒng)計(jì)分析方法過于依賴歷史資料且難以捕捉海洋發(fā)展混沌性,近期人工智能技術(shù)發(fā)展迅猛,一定程度上克服了數(shù)值模型、動(dòng)力學(xué)和統(tǒng)計(jì)分析方法弊端,在海洋環(huán)境領(lǐng)域得到廣泛應(yīng)用,如:Ali 等[40]采用人工神經(jīng)網(wǎng)絡(luò)從海面溫度(Sea Surface Temperature,SST)、海面高度(Sea Surface Height,SSH)、海面風(fēng)場(chǎng)(Sea Surface Wind,SSW)評(píng)估阿拉伯海的溫度結(jié)構(gòu);Wu 等[41]基于海表溫度異常和海表高度異常采用自組織神經(jīng)網(wǎng)絡(luò)模型反演了北大西洋海洋內(nèi)部的溫度結(jié)構(gòu);Su 等[42-43]基于衛(wèi)星海面資料提出支持向量機(jī)和地理加權(quán)回歸等方法重構(gòu)了印度洋水下三維溫度場(chǎng);Li 等[44]利用隨機(jī)森林回歸反演水下溫度異常場(chǎng),并指出隨機(jī)森林回歸優(yōu)于支持向量機(jī);楊欣等[45]采用隨機(jī)森林回歸模型反演了不同季節(jié)的海洋次表層溫度場(chǎng);王穎超等[46]基于土壤濕度和海洋鹽度衛(wèi)星(Soil Moisture and Ocean Salinity, SMOS )數(shù)據(jù)采用BP(Back Propagation,反向傳播)神經(jīng)網(wǎng)絡(luò)研究了海面鹽度高精度預(yù)測(cè)模型;聶旺琛等[47]研究了基于果蠅優(yōu)化廣義回歸神經(jīng)網(wǎng)絡(luò)算法的全球三維溫鹽場(chǎng)重構(gòu)技術(shù)。
以往的研究側(cè)重于三維溫鹽模型構(gòu)建及精度(反演數(shù)據(jù)的準(zhǔn)確程度)的評(píng)估,在模型反演的時(shí)效性和反演結(jié)果的應(yīng)用方面未深入探討,本文在前人研究基礎(chǔ)上,對(duì)三維溫鹽人工智能反演模型時(shí)效性及其在聲速仿真應(yīng)用等方面開展了較深入研究?;诤C鏈囟群秃C娓叨荣Y料構(gòu)建了XGBoost 溫度(鹽度)反演模型,實(shí)現(xiàn)水下三維溫鹽信息高時(shí)效、高精度反演,并將反演結(jié)果應(yīng)用于聲速模擬仿真研究。
全球海洋蘊(yùn)藏了豐富的資源,普遍存在物質(zhì)、能量運(yùn)輸和海氣交換,是影響氣候的重要因素。本文研究區(qū)域?yàn)槿蚝S颍?0°15′E~00°15′W,89°45′S~89°45′N)。
本文應(yīng)用的衛(wèi)星遙感資料和Argo(Array for Real-time Geostrophic Oceanography)數(shù)據(jù)具體信息如下。
海 面 溫 度 數(shù) 據(jù)(SST ) (https://www.ncei.noaa.gov/thredds/catalog/OisstBase/NetCDF/V2.1/AVHRR/201704/catalog.html)融合了紅外輻射計(jì)(Advanced Very High Resolution Radiometer,AVHRR)和實(shí)測(cè)數(shù)據(jù),是利用最優(yōu)插值算法(Optimum Interpretation,OI)得到的網(wǎng)格產(chǎn)品。時(shí)間分辨率為1 d,空間分辨率為0.25°×0.25°。
海面高度數(shù)據(jù)(SSH)(https://data.marine.copernicus.eu/product/SEALEVEL_GLO_PHY_L4_MY_008_047/download?dataset=cmems_obs-sl_glo_phy-ssh_my_allsat-l4-duacs-0.25deg_P1D/)是由CMEMS 分發(fā)的高度計(jì)海面高度異常網(wǎng)格延時(shí)產(chǎn)品,其融合了Jason-3、Sentinel-3A、HY-2A、Saral/AltiKa、Cryosat-2、Jason-2、Jason-1、T/P、ENVISAT、GFO、ERS1/2 等多任務(wù)測(cè)量值。時(shí)間分辨率為1 d,空間分辨率為0.25°×0.25°。
Argo 數(shù)據(jù)(ftp://data.argo.org.cn/pub/ARGO/BOA_Argo/NetCDF/)是采用全三維空間多重網(wǎng)格三維變分?jǐn)?shù)據(jù)同化方法得到的網(wǎng)格產(chǎn)品。時(shí)間分辨率為1 個(gè)月,空間分辨率為1°×1°,深度覆蓋0~1 975 m,共58 層,包含溫度、鹽度和混合層深度等要素。
經(jīng)分析SST、SSH 和Argo 數(shù)據(jù)的時(shí)間覆蓋范圍,本文選取了2004 年1 月至2020 年5 月的數(shù)據(jù)進(jìn)行分析,為保障模型的訓(xùn)練效率和精度,需要對(duì)數(shù)據(jù)進(jìn)行預(yù)處理:一是統(tǒng)一處理時(shí)空分辨率,將SST 和SSH 數(shù)據(jù)進(jìn)行月平均、將Argo 數(shù)據(jù)進(jìn)行Nearest 空間插值,分別得到每月0.25°×0.25°的SST、SSH 和Argo 數(shù)據(jù);二是去除氣候態(tài)季節(jié)的影響,SST、SSH、Argo 溫度和Argo 鹽度數(shù)據(jù)分別移除2004 年1 月至2019 年12 月各自不同月份的平均氣候態(tài)場(chǎng),得到各參量的異常值(SSTA、SSHA、Argo-TA 和Argo-SA)。
為了保證三維溫鹽反演模型的時(shí)效和精度,本研究首先利用10 m 和70 m 深度的數(shù)據(jù)進(jìn)行隨機(jī)森林回歸(Random Forest, RF)、XGBoost(Extreme Gradient Boosting)模型訓(xùn)練(2004 年 1 月至2018 年12 月)和測(cè)試(2019 年1 月至2019 年12 月),相同參數(shù)下兩者時(shí)效、精度和硬件消耗的對(duì)比結(jié)果如表1 所示。
表1 隨機(jī)森林回歸和XGBoost 模型對(duì)比Table 1 RF and XGBoost model comparison
經(jīng)上述對(duì)比發(fā)現(xiàn),相同參數(shù)下XGBoost 模型在時(shí)效、精度和硬件消耗上都優(yōu)于RF 模型,因此,選擇XGBoost 模型開展海洋三維溫鹽反演。
XGBoost 是由Chen 和Guestrin[48]提出的一種基于Boosting 思想的迭代決策樹集成學(xué)習(xí)算法,在梯度提升樹(Gradient Boosting Decision Tree,GBDT)基礎(chǔ)上實(shí)現(xiàn)了算法和工程優(yōu)化,主要改進(jìn)在:采用二階泰勒公式進(jìn)行梯度下降,優(yōu)化了目標(biāo)函數(shù);在目標(biāo)函數(shù)中加入正則項(xiàng),防止過擬合;支持自動(dòng)并行,大大提高了運(yùn)算效率。XGBoost 中心思想為不斷進(jìn)行特征分裂生長成樹,每次生成的樹是一個(gè)新函數(shù)用來擬合上次預(yù)測(cè)產(chǎn)生的殘差,即每加入一棵樹其損失函數(shù)不斷降低,這樣建立K 個(gè)回歸樹,最后將每個(gè)葉節(jié)點(diǎn)的計(jì)算值權(quán)重相加即為最終的預(yù)測(cè)值。
XGBoost 在傳統(tǒng)損失函數(shù)基礎(chǔ)上引入了模型復(fù)雜度來衡量算法的運(yùn)算效率,其目標(biāo)函數(shù) 計(jì)算式為:
式中:L(φ)為線性空間上的表達(dá);i為數(shù)據(jù)集中第i個(gè)樣本;k為第k棵樹;為第i個(gè)樣本預(yù)測(cè)值和目標(biāo)真實(shí)值 yi之間的訓(xùn)練誤差; Ω(fk)為第k棵樹的正則項(xiàng)。為傳統(tǒng)的損失函數(shù),用來衡量真實(shí)值yi與預(yù)測(cè)值之間的誤差;為正則化項(xiàng),代表模型的復(fù)雜度,其中每棵樹的復(fù)雜度 Ω(f)定義為:
式中: γ 為節(jié)點(diǎn)切分的難度;T 為葉子節(jié)點(diǎn)的個(gè)數(shù); λ 為L2 正則化系數(shù),防止過擬合; ‖ω‖為葉子節(jié)點(diǎn)向量的模。
XGboost 算法已廣泛應(yīng)用于遙感分類、目標(biāo)檢測(cè)等領(lǐng)域,海洋內(nèi)部環(huán)境呈現(xiàn)復(fù)雜動(dòng)態(tài)變化,XGBoost 算法屬于非線性機(jī)器學(xué)習(xí)模型,能夠很好地解釋海洋的非線性過程[49],并且其在算法和工程上的優(yōu)化提高了模型的精度和泛化能力。本文基于XGBoost 算法實(shí)現(xiàn)全球三維溫鹽場(chǎng)反演,模型構(gòu)建流程如圖1 所示。由于XGBoost 算法單邊輸出,并且不同深度的溫度和鹽度特征存在顯著差異,本文按58 層深度分別構(gòu)建不同深度的溫度(鹽度)反演模型。模型構(gòu)建過程如下:①將2004 年1 月至2018 年12 月共15 a 的SSTA、SSHA 數(shù)據(jù)和58 層(0~1 975 m)Argo-TA(Argo-SA)數(shù)據(jù)按8∶2 隨機(jī)劃分為相互獨(dú)立的訓(xùn)練數(shù)據(jù)集和驗(yàn)證數(shù)據(jù)集;②基于訓(xùn)練數(shù)據(jù)集開展XGBoost 溫度(鹽度)模型訓(xùn)練,利用驗(yàn)證數(shù)據(jù)集通過參數(shù)調(diào)優(yōu)不斷優(yōu)化模型;③基于2019 年SSTA、SSHA 數(shù)據(jù)利用構(gòu)建的XGBoost 溫度(鹽度)模型反演溫度異常和鹽度異常,將其分別添加上述移除的對(duì)應(yīng)平均氣候態(tài)場(chǎng),得到全球三維溫鹽信息并進(jìn)行精度評(píng)估。本文的XGBoost 溫度(鹽度)模型訓(xùn)練和反演是在高性能服務(wù)器上實(shí)現(xiàn),充分保障了模型訓(xùn)練與反演時(shí)效性和精確性。
圖1 XGBoost 模型構(gòu)建流程Fig. 1 Flowchart of XGBoost model construction
本文采用平均絕對(duì)誤差(Mean Absolute Error, MAE)和均方根誤差(Root Mean Squared Error, RMSE)評(píng)定XGBoost 溫度(鹽度)模型的三維溫鹽反演精度。MAE 越小,說明反演數(shù)據(jù)越準(zhǔn)確;RMSE 越小,說明反演數(shù)據(jù)越準(zhǔn)確。表達(dá)式分別如下所示:
式中:N 為數(shù)據(jù)數(shù)量; Ymodel,i為 模型反演的數(shù)據(jù); Yobs,i為對(duì)應(yīng)Argo 數(shù)據(jù)。
海水聲速是重要的海洋環(huán)境參數(shù)之一,也是水下通信和監(jiān)測(cè)的良好載體,但是其受溫度、鹽度和靜壓力的影響。本文將XGBoost 溫度(鹽度)反演模型得到的三維溫鹽信息應(yīng)用于海水聲速仿真,利用較為精確的Wilson 和Wayne[50]聲速公式實(shí)現(xiàn)。Wilson 聲速公式具體如下:
式中:c 為聲速(m/s);t 為溫度(℃),—4 ℃≤t≤30 ℃;S 為鹽度,0≤S≤37;p 為靜壓力(kg/cm2),1 kg/cm2≤p≤1 000 kg/cm2。該模型可獲得精度優(yōu)于0.3 m/s 的聲速,適用于我國海區(qū)。
本文建立了58 層獨(dú)立的XGBoost 溫度(鹽度)反演模型,實(shí)現(xiàn)了2019 年全球三維溫鹽反演。XGBoost 溫度反演模型單層深度平均反演時(shí)間為0.431 s,58 層總反演時(shí)間為25.016 s,平均MAE 和RMSE 分別為0.319 ℃和0.497 ℃;XGBoost 鹽度反演模型單層平均反演時(shí)間為0.378 s,58 層總反演時(shí)間為21.944 s,平均MAE 和RMSE 分別為0.050 和0.077。其中,溫度最大MAE 為0.618 ℃,深度位于100 m,這是由于海洋內(nèi)部層化結(jié)構(gòu)分布,特別是溫躍層附近溫度變化顯著所致。
冬季和夏季的溫度特征和變化更顯著。選擇1 月和7 月分別表征冬夏兩季,對(duì)XGBoost 溫度(鹽度)反演模型、Argo 數(shù)據(jù)的溫度(鹽度)及差值(XGBoost 反演值減去Argo 值)進(jìn)行對(duì)比,從而更直觀地顯示反演模型效果。圖2 和圖3 分別展示了1 月和7 月0、100、500 和1 000 m 深度基于XGBoost 溫度反演模型、Argo 數(shù)據(jù)的全球溫度及差值空間分布,圖4 展示了4 月和10 月0、100 m深度對(duì)應(yīng)全球溫度空間分布,可以發(fā)現(xiàn):①同一深度上該反演模型的全球表層和水下溫度分布與Argo 溫度分布存在較高的吻合度,尤其局部高溫或低溫區(qū)域?qū)?yīng)良好,能夠反映全球不同海域的溫度分布特點(diǎn);②反演模型和Argo 數(shù)據(jù)在不同深度上特征一致,均表現(xiàn)為0 m 和100 m 深度的溫度變化范圍較大且空間分布存在較大的差異,而500 m 以深溫度變化范圍和空間分布差異均減小,這是由中深層海洋內(nèi)部熱力環(huán)境隨深度增加逐步趨于穩(wěn)定所致;③由溫度差值可以清晰顯示兩者差別位置,100 m 深度太平洋和印度洋中北部差別較大,其余深度集中在太平洋北部和印度洋南部有較小差別。圖5 和圖6 分別為1 月和7 月0、100、500 和1 000 m 深度基于XGBoost 鹽度反演模型、Argo 數(shù)據(jù)的全球鹽度及差值空間分布,圖7 展示了4 月和10 月0、100 m 深度對(duì)應(yīng)全球鹽度空間分布,可以發(fā)現(xiàn)鹽度不同季節(jié)的空間分布和層化結(jié)構(gòu)差異不顯著,反演模型和Argo 數(shù)據(jù)特征吻合。由差值發(fā)現(xiàn)鹽度反演精度更高,隨深度增加誤差降低,表層誤差最大值主要出現(xiàn)在太平洋中北部,其余深度誤差均較低。
圖2 2019 年1 月不同深度XGBoost 溫度反演模型、Argo 數(shù)據(jù)的全球溫度及差值空間分布Fig. 2 Global temperature and their differential spatial distribution of XGBoost temperature inversion models and Argo data at different depths in January 2019
圖3 2019 年7 月不同深度XGBoost 溫度反演模型、Argo 數(shù)據(jù)的全球溫度及差值空間分布Fig. 3 Global temperature and their differential spatial distribution of XGBoost temperature inversion models and Argo data at different depths in July 2019
圖4 2019 年4 月和10 月不同深度XGBoost 溫度反演模型、Argo 數(shù)據(jù)的全球溫度及差值空間分布Fig. 4 Global temperature and their differential spatial distribution of XGBoost temperature inversion models and Argo data at different depths in April and October 2019
圖5 2019 年1 月不同深度XGBoost 鹽度反演模型、Argo 數(shù)據(jù)的全球鹽度及差值空間分布Fig. 5 Global salinity and their differential spatial distribution of XGBoost salinity inversion models and Argo data at different depths in January 2019
圖6 2019 年7 月不同深度XGBoost 鹽度反演模型、Argo 數(shù)據(jù)的全球鹽度及差值空間分布Fig. 6 Global salinity and their differential spatial distribution of XGBoost salinity inversion models and Argo data at different depths in July 2019
圖7 2019 年4 月和10 月不同深度XGBoost 鹽度反演模型、Argo 數(shù)據(jù)的全球鹽度及差值空間分布Fig. 7 Global salinity and their differential spatial distribution of XGBoost salinity inversion models and Argo data at different depths in April and October 2019
可見,本文的XGBoost 溫度(鹽度)反演模型能夠適用于全球不同季節(jié)的溫度和鹽度空間分布及層化結(jié)構(gòu)。
為了進(jìn)一步驗(yàn)證XGBoost 溫度(鹽度)反演模型的精度,繪制2019 和2020 年1 月至5 月在100 m和500 m 深度的溫度和鹽度反演誤差如表2 所示, 這兩年4 月在100 m 和500 m 深度反演的溫度和鹽度空間分布如圖8 所示,發(fā)現(xiàn)不同年度同期對(duì)應(yīng)深度本反演模型的溫度和鹽度空間分布特征存在明顯一致性,可見本反演模型的穩(wěn)定性。
圖8 2019 年和2020 年4 月100 m 和500 m 深度XGBoost 溫度(鹽度)反演模型的溫度和鹽度空間分布Fig. 8 Global temperature and salinity spatial distributions from XGBoost temperature (salinity)inversion models at 100 m and 500 m depth in April 2019 and 2020
表2 2019 年和2020 年的1 月至5 月XGBoost 溫度(鹽度)反演模型誤差Table 2 XGBoost temperature (salinity) inversion model errors from January to May in 2019 and 2020
南海和西太平洋海域是海洋研究重點(diǎn)關(guān)注海域,本文通過對(duì)南海和西太海域局部的溫度和鹽度剖面特征分析進(jìn)一步驗(yàn)證了模型有效性。圖9 為2019 年1 月和7 月19°37′30″N 經(jīng)向剖面的溫度和鹽度分布。由圖9a~9d 可見,反演模型和Argo 數(shù)據(jù)溫度剖面分布趨勢(shì)一致,均呈層狀分布;反演數(shù)據(jù)能夠反映溫躍層強(qiáng)度和深度的季節(jié)性差異,7 月受海表面高溫的影響溫躍層深度主要位于50~100 m,1 月深度下降至100~200 m。由圖9e~9h 可見,反演模型和Argo 數(shù)據(jù)鹽度分布趨勢(shì)較吻合,反演模型結(jié)果可反映該海域80~300 m 和400~600 m 深度分別呈現(xiàn)的顯著高鹽和低鹽特征,高鹽區(qū)東部略高于西部,低鹽區(qū)呈層狀均勻分布,且與Argo 數(shù)據(jù)強(qiáng)度和深度基本一致。
圖9 2019 年1 月和7 月19°37′30″N 經(jīng)向剖面XGBoost 溫度(鹽度)反演模型、Argo 數(shù)據(jù)的溫度和鹽度斷面分布Fig. 9 Temperature and salinity section distributions from XGBoost temperature (salinity) inversion models,Argo data at the 19°37′30″N meridional section for January and July 2019
此外,對(duì)南海和西太平洋海域特定點(diǎn)不同月份反演模型的溫度和鹽度剖面分布及精度進(jìn)行了分析。圖10 為南海(116°37′30″E, 17°37′30″N)處的XGBoost 溫度(鹽度)反演模型和Argo 數(shù)據(jù)的溫度和鹽度剖面分布。由圖10 可見,該點(diǎn)XGBoost 溫度(鹽度)反演模型與Argo 數(shù)據(jù)溫度(鹽度)特征一致,呈現(xiàn)明顯的季節(jié)趨勢(shì),特別是兩者溫度在夏秋季基本完全吻合。統(tǒng)計(jì)該點(diǎn)XGBoost 溫度(鹽度)反演模型的溫度和鹽度誤差,結(jié)果如表3 所示,溫度RMSE 和MAE 在冬春季明顯高于夏秋季,與圖10a~圖10d 曲線分布特征一致,即溫度在夏秋季反演精度更高;鹽度RMSE 和MAE 數(shù)值均較小,即鹽度反演精度未呈現(xiàn)明顯季節(jié)差異。圖11 為西太平洋(140°37′30″E, 12°37′30″N)處XGBoost 溫度(鹽度)反演模型和Argo 數(shù)據(jù)的溫度和鹽度剖面分布。由圖11 可見,溫度分布季節(jié)差異相對(duì)較小,同樣兩者溫度夏秋季吻合度高于冬春季節(jié);鹽度隨深度增加呈顯著高鹽、顯著低鹽、而后逐漸升高趨勢(shì),與經(jīng)向剖面特征(圖9)一致。該點(diǎn)的溫度和鹽度反演誤差如表3 所示,溫度RMSE 和MAE 同樣呈冬春季高于夏秋季特征,鹽度無明顯季節(jié)差異,溫度和鹽度反演精度較南海(116°37′30″E,17°37′30″N)相對(duì)低。由此可見,本文XGBoost 溫度(鹽度)反演模型能夠適用于局部海域的時(shí)空溫鹽研究。
圖10 2019 年1、4、7 和10 月南海(116°37′30″E, 17°37′30″N)處XGBoost 溫度(鹽度)反演模型、Argo 數(shù)據(jù)的溫度(鹽度)剖面分布Fig. 10 Temperature (salinity) profile distribution of XGBoost temperature (salinity) inversion model,Argo data at South China Sea (116°37′30″E, 17°37′30″N) in January, April, July and October 2019
圖11 2019 年1、4、7 和10 月西太平洋(140°37′30″E, 12°37′30″N)處XGBoost 溫度(鹽度)反演模型、Argo 數(shù)據(jù)的溫度(鹽度)剖面分布Fig. 11 Temperature (salinity) profile distribution of XGBoost temperature (salinity) inversion model,Argo data at western Pacific Ocean (140°37′30″E, 12°37′30″N) in January, April, July and October 2019
表3 2019 年1、4、7 和10 月南海(116°37′30″E, 17°37′30″N)和西太平洋(140°37′30″E, 12°37′30″N)XGBoost 溫度(鹽度)反演模型誤差Table 3 XGBoost temperature (salinity) inversion model errors at South China Sea (116°37′30″E, 17°37′30″N ) and western Pacific Ocean (140°37′30″E, 12°37′30″N) in January, April, July and October 2019
綜上所述,本文建立的XGBoost 溫度(鹽度)反演模型在保證模型精度的前提下,有效地提升了模型反演效率。
基于2019 年XGBoost 溫度(鹽度)反演模型得到的三維溫鹽信息,結(jié)合聲速公式(5)得到了不同深度的全球聲速。2019 年1、4、7 和10 月的0、100、500 和1 000 m 的聲速分布如圖12 所示,可以發(fā)現(xiàn)聲速與溫度分布呈現(xiàn)較好的一致性,這是由于溫度對(duì)聲速的影響最為顯著;不同季節(jié)聲速空間分布差異不顯著,但存在較明顯的深度分布特征,伴隨時(shí)間和空間的變化淺水層聲速發(fā)生較大范圍變化,隨深度增加聲速變化范圍減小。
圖12 2019 年1、4、7 和10 月基于XGBoost 溫度(鹽度)反演模型溫度和鹽度數(shù)據(jù)的全球聲速空間分布Fig. 12 Global spatial distribution of sound velocities based on XGBoost temperature (salinity) inversion model temperature and salinity data in January, April, July and October 2019
聲速剖面能夠更好地反映海水聲速分布特征,本文針對(duì)上述局部海域的溫度和鹽度剖面對(duì)應(yīng)分析聲速剖面特征。圖13 為2019 年1、4、7 和10 月基于XGBoost 溫度(鹽度)反演模型溫度和鹽度數(shù)據(jù)的經(jīng)向和緯向聲速剖面分布,由圖13 可見,經(jīng)向剖面聲速季節(jié)差異不明顯,呈典型的均勻?qū)訝罘植?,與鹽度經(jīng)向剖面不同(圖9e 和9f),聲速隨深度增加逐漸減弱,同樣表征了溫度對(duì)聲速的影響最為顯著;緯向聲速剖面季節(jié)差異靠近海面較明顯而深層較弱,即100 m 以淺在22°N 以北聲速冬春季低于夏秋季,較深層聲速差異不明顯;200~800 m 深度聲速呈由南向北傾斜層狀分布,這與緯向溫度分布特征一致。
圖13 2019 年1、4、7 和10 月基于XGBoost 溫度(鹽度)反演模型溫度和鹽度數(shù)據(jù)的19°37′30″N 經(jīng)向和130°37′30″E 緯向聲速斷面分布Fig. 13 Sound velocity section distributions of temperature (salinity) data from XGBoost temperature (salinity)inversion models at the 19°37′30″N meridional and 130°37′30″E zonal in January, April, July and October 2019
進(jìn)一步分析南海和西太平洋特定點(diǎn)的2019 年1、4、7 和10 月聲速剖面(圖14),兩點(diǎn)的聲速季節(jié)差異不明顯,在同一季節(jié)、同一深度300 m 以淺西太平洋(140°37′30″E, 12°37′30″N)的聲速略高于南海(116°37′30″E, 17°37′30″N),300~800 m 兩者相反,而800 m 以深兩者聲速基本一致。
圖14 2019 年南海(116°37′30″E, 17°37′30″N)和西太平洋(140°37′30″E, 12°37′30″N)基于XGBoost 溫度(鹽度)反演模型溫度和鹽度數(shù)據(jù)的聲速剖面分布Fig. 14 Distribution of sound velocity profiles based on XGBoost temperature (salinity) inversion model temperature and salinity data at South China Sea (116°37′30″E, 17°37′30″N)and western Pacific Ocean (140°37′30″E, 12°37′30″N) in 2019
本文基于衛(wèi)星遙感資料(SST 和SSH)構(gòu)建了XGBoost 溫度(鹽度)反演模型,反演全球海洋三維溫鹽信息,定性、定量地分析了該模型對(duì)全球及局部溫度和鹽度的反演效果、精度,并將反演數(shù)據(jù)應(yīng)用于聲速模擬仿真研究,能夠充分刻畫海水聲速特征。得到以下主要結(jié)論。
1)本文構(gòu)建的XGBoost 溫度(鹽度)反演模型實(shí)現(xiàn)了2019 年全球58 層反演溫度MAE 和RMSE為0.319 ℃和0.497 ℃,反演鹽度MAE 和RMSE 為0.050 和0.077,可見模型具有較高的反演精度。
2)實(shí)現(xiàn)了在30 s 內(nèi)反演2019 年全球三維溫度(鹽度)信息,即在保證模型精度的前提下,顯著提升了反演效率。
3)XGBoost 溫度(鹽度)反演模型的溫度(鹽度)數(shù)據(jù)空間和深度分布特征能夠反映海水的層化結(jié)構(gòu)和內(nèi)部動(dòng)力環(huán)境分布。
4)XGBoost 溫度(鹽度)反演模型的溫度和鹽度數(shù)據(jù)能夠表征海水聲速特征。
綜上,XGBoost 溫度(鹽度)反演模型能夠適用于全球海洋三維溫鹽信息反演和聲速仿真研究,具有較高的反演精度和極高的反演效率,為海上平臺(tái)作業(yè)急需的海洋環(huán)境信息保障提供了有力的技術(shù)支撐。