李倩倩,李宏琳,曹守蓮,嚴(yán)嫻,馬志川
(1.山東科技大學(xué) 測繪與空間信息學(xué)院,山東 青島 266590;2.哈爾濱工程大學(xué) 水聲工程學(xué)院,黑龍江 哈爾濱 150001)
海水聲速是海洋環(huán)境觀測的基本要素之一,對于水下聲波定位與目標(biāo)探測、海洋環(huán)境監(jiān)測和資源勘探等一系列活動至關(guān)重要[1–2]。獲取聲速剖面最直接的方法是現(xiàn)場觀測,但此類方法費(fèi)時(shí)費(fèi)力,且由于聲速的時(shí)空變化特性,這些現(xiàn)場觀測資料都不能獲得大范圍實(shí)時(shí)聲速剖面。隨著時(shí)間推移,海洋垂向觀測資料(船只走航、站點(diǎn)觀測、潛標(biāo)、水下滑翔機(jī)和浮標(biāo)等)日益增多,特別是中國Argo 實(shí)時(shí)資料中心[3]提供的大量觀測剖面以及網(wǎng)格產(chǎn)品,在海洋科學(xué)研究和應(yīng)用中發(fā)揮了重要作用。然而,現(xiàn)有垂向觀測資料的空間分辨率仍然較低,且不能實(shí)時(shí)地描述海洋內(nèi)部的結(jié)構(gòu)變化特征。而另一方面,隨著遙感衛(wèi)星傳感器的不斷發(fā)展,海面溫度和海面高度等資料逐漸完善,它們能實(shí)時(shí)地提供海面信息且具有較高的空間分辨率。但通過遙感衛(wèi)星資料得到的信息僅僅停留在海洋表層或者近表層,無法獲得海表面以下的信息。因此,利用遙感衛(wèi)星觀測數(shù)據(jù)和Argo 剖面數(shù)據(jù)相結(jié)合的方式來反演海洋聲速剖面成為重要的研究課題。
理論上,聲速剖面可以表示為深度和時(shí)間的矩陣形式,然而,該表示形式需要大量參數(shù),不利于聲速剖面的反演估計(jì),為此Tolstoy 等[4]提出了經(jīng)驗(yàn)正交函數(shù)(EOF)的表示方法。從而聲速剖面可以利用有限幾階EOF 系數(shù)進(jìn)行表示,聲速剖面的反演問題最終變?yōu)镋OF 系數(shù)的反演[5–6]。自20 世紀(jì)80 年代以來,世界各國海洋學(xué)家提出將海面信息映射到海洋內(nèi)部,從而反演溫度、鹽度剖面。早期,Hurlburt 等[7]通過考慮水動力和能量交換特征,構(gòu)建數(shù)值海洋預(yù)測模型,將模擬的高度計(jì)數(shù)據(jù)動態(tài)傳遞到海洋內(nèi)部得到模擬數(shù)據(jù)對溫躍層的敏感性。Carnes 等[8–9]在墨西哥灣流區(qū)域發(fā)現(xiàn)了關(guān)于海面高度、海面溫度與海洋標(biāo)準(zhǔn)層之間的統(tǒng)計(jì)關(guān)系,隨后,他們對西北太平洋和西北大西洋的溫度剖面進(jìn)行EOF 分解,建立海面數(shù)據(jù)與溫度剖面的回歸關(guān)系,即單經(jīng)驗(yàn)正交函數(shù)回歸(single Empirical Orthogonal Function regression,sEOF-r)方法。該方法已被美國海軍海洋預(yù)報(bào)系統(tǒng)[10]采用。Chen 等[11]利用海面數(shù)據(jù)結(jié)合sEOF-r 方法重構(gòu)了全球范圍的聲速剖面,并證明聲速誤差與動態(tài)漩渦活動相關(guān)。
近年來,人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Networks,ANN)在海洋環(huán)境參數(shù)反演估計(jì)中的應(yīng)用越來越多。Liu 等[12–13]首次提出將自組織映射(Self-Organizing Map,SOM)神經(jīng)網(wǎng)絡(luò)應(yīng)用在氣象與海洋方面,發(fā)現(xiàn)自組織映射神經(jīng)網(wǎng)絡(luò)可以從聯(lián)合高頻雷達(dá)和聲學(xué)多普勒流速剖面儀(ADCP)數(shù)據(jù)集中提取非均勻的、各向異性的三維沿海海洋流場變化。Charantonis 等[14],Chapman 和Charantonis[15]使用自組織映射方法逐步重建高度相關(guān)的海洋滑翔機(jī)稀疏數(shù)據(jù)集中的缺失數(shù)據(jù)(溫度、鹽度剖面)。隨后進(jìn)一步提出基于數(shù)據(jù)空間局部相關(guān)性改進(jìn)的SOM 神經(jīng)網(wǎng)絡(luò)新方法,根據(jù)衛(wèi)星提供的海洋表面信息以及Argo 浮標(biāo)測量的深海海流速度提高深海洋流的重構(gòu)速度精度。Chen 等[16–17]利用SOM 神經(jīng)網(wǎng)絡(luò)建立了溫度剖面對應(yīng)的經(jīng)驗(yàn)正交系數(shù)與西北太平洋海表面等多維信息的自組織特征映射圖,從而獲取待反演的系數(shù)并有效地重構(gòu)了1 000 m 以內(nèi)的溫度剖面。Jain 和Ali[18]采用人工神經(jīng)網(wǎng)絡(luò)的方法根據(jù)海表面參數(shù)以及溫、鹽剖面直接反演250 m 深度的聲速剖面。與傳統(tǒng)線性反演方法相比,神經(jīng)網(wǎng)絡(luò)等非線性方法可以捕捉海表面數(shù)據(jù)與聲速剖面異常之間的非線性關(guān)系,從而提高反演精度。
為此本文在前人研究的基礎(chǔ)上,利用人工神經(jīng)網(wǎng)絡(luò)的方法根據(jù)遙感衛(wèi)星觀測數(shù)據(jù)和Argo 歷史數(shù)據(jù)建立局域時(shí)空海洋聲速場。即利用中國Argo 實(shí)時(shí)資料中心提供的歷史聲速剖面生成EOF 基函數(shù)與系數(shù),聯(lián)合實(shí)時(shí)測量的海面遙感數(shù)據(jù)和表層聲速儀測量的固定深度處數(shù)據(jù),利用SOM 神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)對全海深聲速剖面的實(shí)時(shí)反演。
本文所使用的溫度、鹽度剖面數(shù)據(jù)來自中國Argo實(shí)時(shí)資料中心提供的全球海洋Argo 網(wǎng)格數(shù)據(jù)集[3]。其時(shí)間覆蓋范圍為2004 年1 月至2020 年12 月,空間分辨率為水平1°×1°,垂向標(biāo)準(zhǔn)層共有58 層(0~1 975 m)的逐年逐月網(wǎng)格化資料。
衛(wèi)星遙感數(shù)據(jù)主要包括海表面溫度(Sea Surface Temperature,SST)數(shù)據(jù)和海平面高度異常(Sea Level Anomaly,SLA)數(shù)據(jù)產(chǎn)品。SST 產(chǎn)品來源于美國國家海洋和大氣管理局(Nation Oceanic and Atmospheric Administration,NOAA)的每日最優(yōu)插值SST(Optimum Interpolation Sea Surface Temperature,OISST)[19]。該數(shù)據(jù)集將來自不同觀測平臺(衛(wèi)星、船舶和浮標(biāo))的數(shù)據(jù)構(gòu)建在一個(gè)常規(guī)全球網(wǎng)格上,其空間分辨率為0.25°×0.25°。SLA 數(shù)據(jù)為海面高度減去長時(shí)間序列的平均海面高度,其來自于衛(wèi)星海洋數(shù)據(jù)存儲、驗(yàn)證、插值處理中心(Archivings Validation and Interpretation of Satellite Oceanographic,AVISO)提供的0.25°×0.25°的月平均網(wǎng)格數(shù)據(jù),該數(shù)據(jù)融合了TOPEX/POSEIDON、JASON-1/2 和ERS 等多顆衛(wèi)星的測高資料[20]。
本文選取東南印度洋(14.5°~17.5°S,85.5°~90.5°E)范圍為研究區(qū)域,海表面遙感數(shù)據(jù)對應(yīng)截取14.375°~17.625°S,85.375°~90.625°E 之間的數(shù)據(jù)。如圖1 所示,藍(lán)色圓點(diǎn)表示海表面遙感數(shù)據(jù)所在位置,紅色圓點(diǎn)表示Argo 數(shù)據(jù)所在位置。圖1 表明,遙感數(shù)據(jù)與Argo 數(shù)據(jù)在經(jīng)度、緯度方向都相差0.125°,即Argo數(shù)據(jù)格點(diǎn)和海表面數(shù)據(jù)格點(diǎn)之間存在空間不匹配的問題。本文通過對Argo 數(shù)據(jù)點(diǎn)周圍的4 個(gè)海表面數(shù)據(jù)取算數(shù)平均,將遙感數(shù)據(jù)降采樣為1°×1°。從而保證SST 和SLA 數(shù)據(jù)與Argo 數(shù)據(jù)在水平方向上的采樣位置一致。同時(shí),海表面數(shù)據(jù)中的SST 是日平均數(shù)據(jù),與SLA 和Argo 的月平均數(shù)據(jù)在時(shí)間上不匹配,因此本文將SST 數(shù)據(jù)按月進(jìn)行算數(shù)平均,從而實(shí)現(xiàn)3 組數(shù)據(jù)在時(shí)間采樣上的一致性。
利用EOF 方法表示聲速剖面可以大大降低聲速剖面反演所需要的參數(shù)個(gè)數(shù),基函數(shù)確定后,利用有限的幾階系數(shù)即可表示聲速剖面。假如某測區(qū)內(nèi)有N條實(shí)測聲速剖面,將其插值到M個(gè)深度標(biāo)準(zhǔn)層,從而聲速剖面可以表示為矩陣CM×N
式中,每一列代表一個(gè)聲速剖面,每一行代表N條剖面在同一深度處的聲速。
對式(1)中每行取平均,獲得平均聲速CM×1,聲速剖面矩陣與平均聲速矩陣之間的差值稱為聲速擾動?CM×N,求聲速擾動的協(xié)方差矩陣COVM×M
并對其進(jìn)行特征分解得:
式中,λM×M為特征值矩陣;VM×M是特征向量矩陣,即為EOF 基函數(shù)。
將EOF 投影到聲速擾動 ?CM×N,可得到:
式中,PCM×N中的每一列為對應(yīng)聲速擾動剖面的EOF系數(shù)。
每一個(gè)特征向量對應(yīng)的特征值表示此特征向量的權(quán)重,計(jì)算前k階的貢獻(xiàn)率為
當(dāng)Q≥0.95時(shí),認(rèn)為前k階經(jīng)驗(yàn)正交函數(shù)可以表示當(dāng)前海域內(nèi)聲速剖面的主要特征。因此,前k階經(jīng)驗(yàn)正交函數(shù)即可重構(gòu)樣本中的任一聲速剖面,其中N個(gè)重構(gòu)聲速剖面表示為
SOM 是在1981 年由芬蘭學(xué)者Kohonen[21]提出的一種無監(jiān)督競爭式學(xué)習(xí)前饋型神經(jīng)網(wǎng)絡(luò)模型。SOM算法步驟如下:
(1)初始化神經(jīng)網(wǎng)絡(luò)。對輸入層的輸入變量與競爭層輸出神經(jīng)元的初始連接權(quán)值賦予一個(gè)較小的常數(shù),一般在[0,1]之間。設(shè)置學(xué)習(xí)率初始值為(0,1)之間某一數(shù)值,初始化鄰域函數(shù),確定鄰域半徑及鄰近神經(jīng)元集合,該集合隨著訓(xùn)練進(jìn)行而減小。
(2)構(gòu)建輸入向量。輸入層輸入變量,對于輸入層的X={x1,x2,···,xn},X中各元素分別對應(yīng)研究海域內(nèi)聲速剖面的EOF 系數(shù)、地理位置以及對應(yīng)的SST、SLA 數(shù)據(jù)。首先對輸入變量進(jìn)行歸一化處理,然后輸入到網(wǎng)絡(luò)。
(3)計(jì)算輸入向量與神經(jīng)元之間距離。對于每一個(gè)輸入變量,計(jì)算出輸入數(shù)據(jù)與所有的輸出神經(jīng)元j之間的歐式距離dj。計(jì)算公式如下:
式中,wi j為 輸入層第i個(gè)神經(jīng)元和輸出層第j個(gè)神經(jīng)元之間的權(quán)值。
(4)找出獲勝神經(jīng)元c。通過計(jì)算得到最小距離dj的神經(jīng)元j,距離最小的神經(jīng)元j,作為獲勝神經(jīng)元c或最佳匹配單元(Best Matching Unit,BMU)。
(5)確定獲勝鄰域Sn(t)。確定獲勝神經(jīng)元的鄰域范圍,鄰域范圍一般由鄰域函數(shù)確定,本文的鄰域函數(shù)H采用Gaussian 函數(shù),函數(shù)形式如下:
根據(jù)式(9)對獲勝神經(jīng)元c及鄰域內(nèi)的權(quán)值向量進(jìn)行更新,使其向輸入向量不斷靠攏,
式中,wi j(t+1)為第t+1 次迭代過程中第j個(gè)節(jié)點(diǎn)的權(quán)重向量;H(t)為鄰域函數(shù);η(t)為學(xué)習(xí)速率。
(6)更新學(xué)習(xí)率以及鄰域函數(shù),學(xué)習(xí)率隨著學(xué)習(xí)次數(shù)的增加而減小。
(7)重復(fù)步驟(3)和(4),直到完成所有輸入數(shù)據(jù)的學(xué)習(xí)。
本實(shí)驗(yàn)中,根據(jù)Liu 等[12]提出的一種基于海面以下和現(xiàn)有數(shù)據(jù)之間相關(guān)性的距離度量函數(shù),即式(11),計(jì)算已知信息與SOM 輸出層單元之間的歐氏距離,通過尋找SOM 輸出層中最佳匹配單元得到參考向量,將輸入數(shù)據(jù)匹配到最佳單元來實(shí)現(xiàn)。
為了驗(yàn)證反演方法的精度,利用均方根誤差(Root Mean Squar Error,RMSE)來表示聲速剖面估計(jì)值與測量值之間的誤差,定義均方根誤差為
式中,M為深度點(diǎn)數(shù);分別為測量和反演剖面在深度Zi處的聲速值。
圖2 給出了反演聲速剖面的流程,具體步驟如下:
圖2 聲速剖面反演流程Fig.2 Flow of sound speed profile inversion
(1)將實(shí)驗(yàn)海域的聲速剖面、海表面溫度(SST)與海表面高度異常(SLA)數(shù)據(jù)分成訓(xùn)練集和測試集;
(2)對訓(xùn)練集的聲速剖面進(jìn)行EOF 分解,得到該區(qū)域的歷史平均聲速剖面、基函數(shù)以及系數(shù)PC(基函數(shù)在擾動矩陣上的投影)來表示訓(xùn)練集聲速剖面;
(3)將步驟(2)中的系數(shù)與SST、SLA、緯度(LAT)、經(jīng)度(LON)以及表層聲速之間利用SOM 神經(jīng)網(wǎng)絡(luò)建立映射關(guān)系,通過驗(yàn)證集不斷調(diào)整參數(shù),得到最優(yōu)訓(xùn)練模型;
(4)反演測試集EOF 的系數(shù),將測試集的SST、SLA、LAT、LON 以及表層聲速輸入訓(xùn)練模型,計(jì)算與模型結(jié)果的最佳匹配單元(BMU),得到EOF 系數(shù);
(5)將步驟(4)反演的EOF 系數(shù)結(jié)合步驟(2)的歷史平均聲速剖面和基函數(shù)得到聲速剖面反演值。
從Argo 網(wǎng)格數(shù)據(jù)集中提取東南印度洋(14.5°~17.5°S,85.5°~90.5°E)范圍內(nèi)的月平均數(shù)據(jù),利用該數(shù)據(jù)集中的深度、溫度和鹽度數(shù)據(jù),通過Dell Grosso聲速經(jīng)驗(yàn)公式[22]計(jì)算聲速剖面。利用上文提到的時(shí)空匹配方法,將海表遙感數(shù)據(jù)集和Argo網(wǎng)格數(shù)據(jù)集進(jìn)行時(shí)空對準(zhǔn)。將數(shù)據(jù)分為兩部分,其中2015–2018 年逐年1 月的聲速剖面和對應(yīng)的SST、SLA 數(shù)據(jù)為訓(xùn)練集,主要用來生成聲速剖面的平均值以及EOF 基函數(shù),并且訓(xùn)練sEOF-r 和SOM 的模型參數(shù)。本文76 條聲速剖面用于訓(xùn)練SOM,為了調(diào)整神經(jīng)網(wǎng)絡(luò)模型的超參數(shù),20 條聲速剖面作為驗(yàn)證集對模型的能力進(jìn)行初步評估,測試集的24 條剖面用來評估模型的泛化能力。
該訓(xùn)練集中聲速剖面的個(gè)數(shù)為N=76,深度上的分層數(shù)為M=1 976。圖3a 的灰色細(xì)線為訓(xùn)練集中的聲速剖面,黑色粗線為平均聲速剖面。聲速擾動如圖3b 所示,最大值約為9 m/s,可以看出擾動主要位于水深400 m 以淺。圖3c 為前6 階EOF 的累計(jì)方差貢獻(xiàn)率,可以看出,前5 階EOF 的累積貢獻(xiàn)率可達(dá)95.51%,已大于95%,所以此海域的海水聲速剖面可用前5 階EOF 近似表示。
圖3 訓(xùn)練集中的聲速剖面(灰色線為實(shí)測剖面,黑色線為平均剖面)(a)、聲速擾動(b)和前6 階經(jīng)驗(yàn)正交函數(shù)(EOF)的累積方差貢獻(xiàn)率(c)Fig.3 The sound speed profile in the training set (gray lines are the measured profile,black line is the average profile) (a),residual sound speed (b) and the cumulative variance contribution rates of the first 6-order empirical orthogonal function (EOF) (c)
聲速剖面反演精度主要取決于3 個(gè)方面:第一,訓(xùn)練集提取出的EOF 基函數(shù)是否具有代表性;第二,歷史平均聲速剖面是否具有代表性;第三,反演方法估計(jì)得到的EOF 系數(shù)是否準(zhǔn)確。首先分析EOF 基函數(shù)的代表性,圖4 為訓(xùn)練集和測試集前5 階基函數(shù)之間的相關(guān)系數(shù)矩陣。該圖表明,同組基函數(shù)相互正交,而測試集中的基函數(shù)與訓(xùn)練集中的基函數(shù)有明顯差異,其中第1、3 階表現(xiàn)為極強(qiáng)相關(guān),第2 階為中等程度相關(guān),而第4、5 階表現(xiàn)為極弱相關(guān)。
圖4 訓(xùn)練集和測試集的經(jīng)驗(yàn)正交函數(shù)基函數(shù)之間的相關(guān)系數(shù)Fig.4 Correlation coefficient between empirical orthogonal function (EOF) basis functions of training set and test set
圖5 分別給出了訓(xùn)練集和測試集的前兩階基函數(shù),測試集中前6 階EOF 的累積貢獻(xiàn)率以及訓(xùn)練集和測試集平均聲速剖面的差值。圖5a 表明,兩組集合的第1 階基函數(shù)非常相似,而第2 階基函數(shù)的差異顯著,尤其是在250 m 深度處,二者差異明顯。圖5b表明前2 階基函數(shù)的累計(jì)方差貢獻(xiàn)率就達(dá)到95.6%,其中第2 階的累計(jì)方差貢獻(xiàn)率為9%。以上分析表明,由測試集獲取的基函數(shù)具有一定的代表性誤差,其誤差主要由第2 階基函數(shù)造成,因此基函數(shù)的選取對聲速剖面的反演很重要。圖5c 是訓(xùn)練集與測試集平均聲速剖面的差值,可以發(fā)現(xiàn)誤差主要分布在上層,誤差在2.66 m/s 之內(nèi)。
圖5 訓(xùn)練集和測試集的前兩階基函數(shù)(a)、測試集前6 階經(jīng)驗(yàn)正交函數(shù)(EOF)的累積方差貢獻(xiàn)率(b)和訓(xùn)練集和測試集的平均聲速誤差(c)Fig.5 The first two order basis functions of the training set and the test set (a),the cumulative variance contribution rate of the first six orders of empirical orthogonal function (EOF) in the test set (b) and the average sound speed error of the training set and test set (c)
為了驗(yàn)證EOF 基函數(shù)和平均聲速剖面的代表性誤差對重構(gòu)聲速精度的影響,圖6 利用訓(xùn)練集中提取出的基函數(shù)和平均聲速剖面,通過最小二乘法對測試集中的聲速剖面進(jìn)行重構(gòu)。圖6 給出了利用前5 階EOF 重構(gòu)測試集的聲速剖面與實(shí)際測試集聲速剖面之間的絕對誤差,誤差范圍為0~2.48 m/s??梢钥闯稣`差主要分布在400 m 以淺,即聲速劇烈擾動的深度。圖6 中的白色虛線為利用式(12)計(jì)算得到的聲速剖面均方根誤差,最大均方根誤差約0.56 m/s。
圖6 聲速剖面重構(gòu)誤差Fig.6 The reconstruction error of the sound speed profile
經(jīng)驗(yàn)正交函數(shù)(EOF)是目前使用最廣泛的聲速剖面表示方法,EOF 方法對于一定數(shù)量的聲速剖面在提取其主要特征時(shí),獲取的基函數(shù)比較準(zhǔn)確,因此在這里暫不考慮EOF 基函數(shù)的代表性誤差,歷史平均聲速剖面可以替換為現(xiàn)場觀測的少數(shù)CTD 平均數(shù)據(jù),這部分在文章后面會有討論,研究表明利用現(xiàn)場CTD 數(shù)據(jù)可以提高聲速剖面的反演精度。若是不考慮EOF 基函數(shù)和歷史平均聲速剖面的代表性誤差,圖6 的結(jié)果可以認(rèn)為是EOF 系數(shù)準(zhǔn)確時(shí),聲速剖面反演精度的最高值,因此本文將之作為衡量反演方法優(yōu)劣的標(biāo)準(zhǔn)。Casagrande 等[23]曾在研究中給出了EOF系數(shù)的物理解釋,第1 階EOF 系數(shù) α1表示了溫躍層的垂直位移,即 α1越大則代表溫躍層越淺,躍層深度的變化周期也反映在 α1的演化趨勢中,第2 階EOF 系數(shù)α2則表示了溫度梯度的改變,在溫躍層變化劇烈的時(shí)刻,α2取值也比較大。從物理意義來看,第3 階及以上的EOF 對聲速剖面的調(diào)制效果不顯著。
如圖7a 為平均聲速剖面的聲速梯度,可以發(fā)現(xiàn)60~130 m 的躍層部分梯度較大,130~400 m 的躍層部分梯度較小,梯度極大值約在106 m。圖7b 為SST、SLA 和聲速剖面(Sound Speed Profile,SSP)在0~1 975 m 深度的相關(guān)圖,從圖中可以發(fā)現(xiàn),SST 與SSP 的相關(guān)性在上層隨著深度增加不斷減小,說明SST 可以約束剖面的表層精度;SLA 在60~130 m 深度內(nèi),具有中度相關(guān)性,SLA 與SSP 的相關(guān)性最大值約在103 m,與平均聲速剖面聲速梯度的極大值深度106 m 相近。在130~400 m 躍層深度內(nèi),聲速梯度在0.1 s?1附近,該梯度相比于60~130 m 深度梯度較小,但比其他深度的梯度要大,而該范圍的聲速與SST、SLA 的相關(guān)性很弱,這也是誤差集中在130~>400 m深度的主要原因。由以上分析可知,由于海面遙感數(shù)據(jù)可以反映表層聲速剖面的結(jié)構(gòu)變化,又由于深層海水的聲速比較穩(wěn)定,因此這兩部分反演結(jié)果的誤差較小。但是對于梯度較小的躍層部分(130~400 m),其聲速相對深海來講擾動較強(qiáng)烈,然而該深度處的聲速與SST、SLA 的相關(guān)性極弱,從而導(dǎo)致該深度范圍的聲速反演誤差較大。
圖7 平均聲速剖面的聲速梯度(a),海表面溫度(SST)、海表面高度異常(SLA)和聲速剖面(SSP)的相關(guān)性(b)Fig.7 Sound speed gradient of mean sound speed profile (a),correlation between sea surface temperature (SST),sea level anomally(SLA) and sound speed profile (SSP) (b)
SOM 神經(jīng)網(wǎng)絡(luò)是將訓(xùn)練集的SST、SLA、經(jīng)度(LON)、緯度(LAT)、表層聲速儀測量數(shù)據(jù)和前5 階EOF 系數(shù)利用自組織網(wǎng)絡(luò)算法映射到輸出層不同單元上,每個(gè)單元代表一類聚類分析的參考向量。由于缺少表層聲速儀實(shí)測數(shù)據(jù),本文將Argo 剖面在10 m深度處的聲速c10假設(shè)為表層聲速儀的測量值,若具備表層聲速儀的實(shí)測數(shù)據(jù),那么該固定深度替換為表層聲速儀的實(shí)際測量深度。反演聲速剖面的過程是在輸出層單元上尋找與待反演剖面已知信息的最小歐氏距離對應(yīng)的單元,已知信息包括位置信息(LON,LAT),對應(yīng)位置的海面遙感數(shù)據(jù)(SST,SLA)以及10 m深度處聲速c10,最佳匹配單元中的參考向量即為反演的EOF 系數(shù)PCk,結(jié)合利用訓(xùn)練集得到的EOF 基函數(shù)和平均聲速剖面得到聲速剖面的估計(jì)值。
競爭層節(jié)點(diǎn)數(shù)由經(jīng)驗(yàn)公式(13)確定,經(jīng)過調(diào)試發(fā)現(xiàn)使用48 個(gè)類,初始鄰域半徑和最終鄰域半徑分別為4 和0.1 時(shí),均方根誤差最小,聲速剖面估計(jì)效果最好。
確定競爭層最少節(jié)點(diǎn)數(shù)的經(jīng)驗(yàn)公式如下:
式中,N代表訓(xùn)練樣本的個(gè)數(shù)。
經(jīng)典sEOF-r 方法的計(jì)算過程大致為:由聲速剖面的重構(gòu)方程(6)計(jì)算出訓(xùn)練集中每條剖面對應(yīng)的EOF 系數(shù)。將EOF 系數(shù)PC與海面數(shù)據(jù)建立一階線性回歸關(guān)系,利用訓(xùn)練集中的SLA、SST 數(shù)據(jù),得到擬合系數(shù)的最小二乘估計(jì)。進(jìn)而利用測試集中的SST 和SLA 數(shù)據(jù)可以計(jì)算得到聲速剖面的估計(jì)值。
EOF 系數(shù)與海面遙感數(shù)據(jù)建立線性回歸關(guān)系的表達(dá)式為
式中,k為選取的EOF 階數(shù);ak為擬合系數(shù)。利用訓(xùn)練集中的SLA、SST 數(shù)據(jù),得到擬合系數(shù)的最小二乘估計(jì)。進(jìn)而利用測試集中的SST 和SLA 數(shù)據(jù)可以計(jì)算得到聲速剖面的估計(jì)值。
為了表述方便,這里將本文提出的方法表示為SOM-c10方法。圖8 給出不同方法反演得到的聲速剖面絕對誤差,其中圖8a 為 SOM-c10方法的反演結(jié)果,與實(shí)際測試集聲速剖面在0~1 975 m 海深所有剖面的絕對誤差約不超過5.02 m/s。圖8b 為未考慮表層聲速儀數(shù)據(jù)的經(jīng)典SOM 神經(jīng)網(wǎng)絡(luò),利用SST、SLA、經(jīng)度(LON)、緯度(LAT)以及前5 階EOF 系數(shù)訓(xùn)練模型的反演結(jié)果,可以發(fā)現(xiàn)17 號剖面在350 m 附近的反演誤差最大,約為6.20 m/s。圖8c 為sEOF-r 方法的反演結(jié)果,可以發(fā)現(xiàn)第20 號剖面在220 m 附近的反演誤差最大,約為7.22 m/s。與經(jīng)典SOM 神經(jīng)網(wǎng)絡(luò)相比,SOM-c10方法的最大誤差降低約1 m/s,并且15~18 號剖面反演結(jié)果明顯變好;與經(jīng)典sEOF-r 方法相比 S OM-c10方法的最大誤差降低約2 m/s。
圖8 測試集中聲速剖面反演誤差Fig.8 The inversion error of the sound speed profiles in the test set
根據(jù)均方根誤差公式(12),圖9 給出不同方法的均方根誤差隨測試集聲速剖面的變化,其中最小二乘解與圖6 中的一致??梢钥闯觯琒OM-c10方法的最大均方根誤差約為1.36 m/s,最小均方根誤差約為0.57 m/s,標(biāo)準(zhǔn)差為0.16 m/s;經(jīng)典SOM 神經(jīng)網(wǎng)絡(luò)的最大均方根誤差約為1.69 m/s,最小均方根誤差約為0.59 m/s,標(biāo)準(zhǔn)差為0.24 m/s;sEOF-r 方法的最大均方根誤差約為1.86 m/s,最小均方根誤差約為0.67 m/s,標(biāo)準(zhǔn)差為0.35 m/s。圖9 表明,本文提出的 SOM-c10方法性能最穩(wěn)定,除第13~18 號剖面以外,其他情況下的反演精度最高。相反,sEOF-r 方法的性能最不穩(wěn)定,其對第13~18 號剖面的反演精度最高,然而對其他剖面的反演精度卻是很低。
圖9 不同方法的均方根誤差Fig.9 The root mean square error for different methods
圖10 繪制出了測試集中的第13~18 號聲速剖面,可見這6 條剖面大致可以分為兩類,第Ⅰ類為黑色實(shí)線表示的剖面(第13,14 號聲速剖面),有兩個(gè)較明顯的負(fù)躍層;第Ⅱ類為紅色實(shí)線表示的剖面(15~18 號聲速剖面),在100~300 m 水深處,其聲速梯度變化較小,而在320 m 附近出現(xiàn)正梯度。
圖10 測試集中的13~18 號聲速剖面Fig.10 The 13th?18th sound speed profiles in the test set
以第13 號和16 號剖面為例,圖11 給出了sEOF-r方法和 SOM-c10方法的反演結(jié)果,從圖中不難看出,sEOF-r 方法的反演結(jié)果與實(shí)測值更加吻合,而SOM-c10方法在躍層處的誤差顯著。相比于sEOF-r 方法,SOM神經(jīng)網(wǎng)絡(luò)不僅利用海面遙感數(shù)據(jù),還考慮了剖面的位置信息。然而更多的先驗(yàn)信息卻帶來較高的反演誤差,其原因有可能是訓(xùn)練集的水平位置分辨率不高。因?yàn)檠芯勘砻?,SOM 神經(jīng)網(wǎng)絡(luò)在反演該6 條剖面的EOF 系數(shù)時(shí),匹配到訓(xùn)練結(jié)果的同一個(gè)神經(jīng)元,即相同的EOF 系數(shù)。從圖9 不同方法的均方根誤差結(jié)果可以發(fā)現(xiàn),SOM-c10方法反演的13 號、14 號剖面比15~18 號剖面的均方根誤差要小,說明反演的EOF 系數(shù)得到的聲速剖面與測試集的13 號、14 號這類剖面更接近。
圖11 測試集中第13 號剖面(a)和第16 號剖面(b)的反演情況Fig.11 The inversion of 13th profile (a) and 16th profile (b) in the test set
對于減小平均聲速剖面的代表性誤差,是比較容易實(shí)現(xiàn)的,通常在海上作業(yè)時(shí)會利用CTD 通過定點(diǎn)測量方式獲取幾個(gè)站位的海水聲速剖面來消除聲速誤差的影響,該實(shí)時(shí)測量的聲速剖面一般會比歷史平均聲速剖面更具有代表性,在一定程度上可以提高反演精度。因此本文從測試集中選取具有代表性的第13 號和17 號剖面,取其平均值作為現(xiàn)場平均聲速剖面。圖12a 是sEOF-r 方法的反演結(jié)果,可見選取新的平均聲速剖面之后,大部分均方根誤差都略有降低;圖12b 是 SOM-c10方法的反演結(jié)果,選取新的平均聲速剖面之后,大部分均方根誤差都有明顯降低,且部分均方根誤差與最小二乘法結(jié)果相近。
圖12 不同平均聲速剖面下sEOF-r 和SOM-c10 方法的反演結(jié)果Fig.12 Prediction results of sEOF-r and SOM-c10 method with different mean sound speed profiles
本文提出一種聯(lián)合表層聲速的自組織映射的非線性反演方法,海表面遙感數(shù)據(jù)和表層聲速儀測量的固定深度處數(shù)據(jù)(本文選取10 m 深度聲速值作為表層聲速)作為輸入,尋找最佳匹配單元以獲得聲速剖面的EOF 系數(shù),再結(jié)合歷史平均聲速剖面和基函數(shù)來實(shí)時(shí)反演全海深聲速剖面。就印度洋中部海域的實(shí)驗(yàn)結(jié)果來看,綜合考慮表層聲速儀的數(shù)據(jù)后,本文提出的方法反演性能最穩(wěn)定且精度最高。選擇前5 階EOF 系數(shù)可以滿足反演方法的精度相關(guān)要求,重構(gòu)的均方根誤差在0.5 m/s 附近,該方法也初步解釋了海表面遙感數(shù)據(jù)與聲速剖面擾動之間存在關(guān)系,同時(shí),在表層和躍層梯度較大的深度范圍內(nèi),聲速剖面與海表面遙感數(shù)據(jù)具有較高的相關(guān)性。
在反演全海深聲速剖面時(shí)有兩點(diǎn)需要引起注意,一是,本文方法對測試集中6 個(gè)剖面的反演精度略差于經(jīng)典sEOF-r 方法,其原因有可能是訓(xùn)練集的水平位置分辨率不高所造成的,SOM 神經(jīng)網(wǎng)絡(luò)在處理該6 條剖面時(shí),獲得的為同一個(gè)最佳匹配單元,即EOF系數(shù)相同。二是,聲速剖面基函數(shù)的代表性問題。這也是作者下一步擬進(jìn)行研究的問題。