• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      一種機(jī)器學(xué)習(xí)海面風(fēng)場快速融合的方法

      2022-11-14 06:34:28張巍杜超凡郭安博宇宋曉姜沈世瑩
      海洋學(xué)報(bào) 2022年11期
      關(guān)鍵詞:浮標(biāo)風(fēng)場插值

      張巍,杜超凡,郭安博宇,宋曉姜,沈世瑩

      ( 1. 國家海洋環(huán)境預(yù)報(bào)中心,北京 100081;2. 中國海洋大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,山東 青島 266100)

      1 引言

      作為海洋學(xué)最重要的物理參數(shù)之一,海面風(fēng)場是海洋上層運(yùn)動的主要動力來源,幾乎所有的海水運(yùn)動都與之直接相關(guān)[1–7]。與此同時,海面風(fēng)場對于海洋漁業(yè)、海上交通及工程活動、風(fēng)能開發(fā)等都有著直接的影響[8–9]。對于海面風(fēng)場的測量,其中常規(guī)的測量手段包括船舶、浮標(biāo)以及沿岸站等。相對于全球海洋來說,常規(guī)測量手段獲取到的風(fēng)場數(shù)據(jù)資料非常缺乏,很難滿足人類的生產(chǎn)或研究的需求。此時,衛(wèi)星遙感技術(shù)的出現(xiàn)很好地解決了常規(guī)測量手段所存在的問題。衛(wèi)星遙感技術(shù)有著覆蓋范圍廣,空間分辨率高,能夠?qū)崟r或準(zhǔn)實(shí)時獲取數(shù)據(jù)的優(yōu)勢[10–11]。但是單一衛(wèi)星提供的海面風(fēng)場產(chǎn)品在覆蓋率等方面存在著不可避免的缺陷,因此研究如何將多源衛(wèi)星海面風(fēng)場等產(chǎn)品進(jìn)行融合,以此提高海面風(fēng)場數(shù)據(jù)的覆蓋范圍和精度,從而滿足當(dāng)前數(shù)值預(yù)報(bào)研究以及海洋中小尺度系統(tǒng)研究的需求變得尤為重要。

      當(dāng)前有許多數(shù)據(jù)融合算法被研究者提出并利用。海面風(fēng)場作為數(shù)據(jù)融合的應(yīng)用領(lǐng)域,目前主要的融合方法有插值類融合算法和同化變分類融合算法。其中插值算法有Cressman 插值、Kriging 插值和時空加權(quán)分析方法等,同化變分算法包括最優(yōu)插值法、三維變分法等[12]。凌征等[13]通過Cressman 插值融合了我國近海的衛(wèi)星風(fēng)場和沿岸氣象站風(fēng)場資料。Zhang 等[14–15]對包括SSM/I、TMI、QuikSCAT、AMSRE 等在內(nèi)的多顆衛(wèi)星海面風(fēng)速數(shù)據(jù)進(jìn)行了時空權(quán)重插值融合,產(chǎn)生了全球范圍1987–2006 年的時間分辨率為12 h、每天、每月的0.25°網(wǎng)格的風(fēng)速。齊亞琳和林明森[16]對海洋二號衛(wèi)星海面風(fēng)場和NCEP 數(shù)值風(fēng)場資料進(jìn)行融合,融合算法中同樣采用時空權(quán)重插值。Yan 等[17]對多源散射計(jì)和輻射計(jì)風(fēng)場與模式在分析風(fēng)場進(jìn)行了融合研究,利用最優(yōu)插值法建立了時間分辨率為6 h,空間分辨率為0.25°的2000–2015年的全球風(fēng)場產(chǎn)品。Chao 等[18]基于二維變分分析的方法融合了衛(wèi)星散射計(jì)海面風(fēng)場與區(qū)域中尺度大氣模式風(fēng)場。

      綜上所述,不論是插值類融合算法,還是同化變分類融合算法,它們都可以基本解決海面風(fēng)場融合的問題。但是在實(shí)際應(yīng)用中,受到當(dāng)前計(jì)算能力的制約[19]。這些算法由于計(jì)算過程復(fù)雜,往往需要使用計(jì)算機(jī)集群,且較難實(shí)現(xiàn)實(shí)時化融合。

      為了以較低的計(jì)算代價實(shí)現(xiàn)實(shí)時化海面風(fēng)場融合,本文提出在多源衛(wèi)星數(shù)據(jù)和ERA-5 再分析數(shù)據(jù)重疊區(qū)域,訓(xùn)練基于XGBoost 的機(jī)器學(xué)習(xí)ERA-5 數(shù)據(jù)修正模型。然后利用該模型在無衛(wèi)星數(shù)據(jù)區(qū)域快速修正(機(jī)器學(xué)習(xí)推理)ERA-5 數(shù)據(jù),使得修正后得到的融合風(fēng)場數(shù)據(jù)更加貼近衛(wèi)星觀測值,最終得到時間分辨率為12 h、每天的0.25°的網(wǎng)格融合風(fēng)場數(shù)據(jù),實(shí)現(xiàn)無縫網(wǎng)格風(fēng)場[20]。其中最核心的修正過程是利用已經(jīng)訓(xùn)練好的模型進(jìn)行快速推理,而由于機(jī)器學(xué)習(xí)推理的快速性,可以減小計(jì)算代價,構(gòu)建整個海面融合風(fēng)場。

      2 海面風(fēng)場相關(guān)數(shù)據(jù)集

      本文使用的衛(wèi)星有海洋二號B(HY-2B)衛(wèi)星、中法海洋衛(wèi)星(CFOSAT)以及歐洲氣象衛(wèi)星B(MetOp-B)衛(wèi)星。3 顆衛(wèi)星均可提供2020 年12 月以及2021 年1 月的海面風(fēng)場資料。

      HY-2B 衛(wèi)星散射計(jì)L2B 級數(shù)據(jù)存儲經(jīng)過風(fēng)場反演和模糊去除處理后得到軌道各個風(fēng)元的中心位置、風(fēng)速、風(fēng)向、觀測時間及其他相關(guān)數(shù)據(jù)。HY-2B衛(wèi)星散射計(jì)每天約有16 軌數(shù)據(jù),可覆蓋全球90%的海域[21]。陳克海等[21]使用ECMWF 再分析風(fēng)場數(shù)據(jù)、熱帶大氣海洋觀測計(jì)劃(TAO)浮標(biāo)和NDBC 浮標(biāo)實(shí)測數(shù)據(jù)對HY-2B 風(fēng)場進(jìn)行了總體質(zhì)量分析。分析發(fā)現(xiàn),在4~24 m/s 風(fēng)速區(qū)間內(nèi),HY-2B 衛(wèi)星風(fēng)速、風(fēng)向均方根誤差(RMSE)分別優(yōu)于2 m/s 和20°,能較好滿足HY-2B 衛(wèi)星散射計(jì)業(yè)務(wù)化應(yīng)用的精度要求。本文使用2020 年12 月以及2021 年1 月數(shù)據(jù)來進(jìn)行實(shí)驗(yàn),選取的HY-2B 衛(wèi)星散射計(jì)L2B 級數(shù)據(jù)的時間跨度為12 h,空間分辨率為25 km×25 km,且空間分布在0°~45°N,100°E~180°。

      中法海洋衛(wèi)星采用成熟的CAST2000 小衛(wèi)星平臺,設(shè)計(jì)壽命為3 年,運(yùn)行于軌道高度為521 km、降交點(diǎn)地方時07:00 的太陽同步軌道,探測數(shù)據(jù)分別傳輸至中法兩國地面站,由兩國地面應(yīng)用系統(tǒng)接收并進(jìn)行處理。該衛(wèi)星在海洋動力環(huán)境業(yè)務(wù)監(jiān)測、海洋災(zāi)害監(jiān)測和預(yù)報(bào)預(yù)警、海洋科學(xué)研究中發(fā)揮重要作用。本文同樣使用2020 年12 月以及2021 年1 月數(shù)據(jù)來進(jìn)行實(shí)驗(yàn),選取的CFOSAT 衛(wèi)星L2B 級數(shù)據(jù)時間跨度為12 h,空間分辨率為12.5 km×12.5 km,且空間分布在0°~45°N,100°E~180°,其風(fēng)速精度為1.5 m/s,風(fēng)向精度為20°[22]。

      2013 年4 月24 日,歐洲航天局和歐洲氣象衛(wèi)星開發(fā)組織聯(lián)合發(fā)射的MetOp-B 代替MetOp-A 作為主要的業(yè)務(wù)觀測衛(wèi)星,其提供的海面風(fēng)場數(shù)據(jù)產(chǎn)品風(fēng)速精度為2 m/s,風(fēng)速范圍為0~50 m/s。本文選取的MetOp-B 風(fēng)場數(shù)據(jù)空間分辨率為12.5 km×12.5 km,且空間分布在0°~45°N,100°E~180°。

      ERA-5 是歐洲中期天氣預(yù)報(bào)中心對過去40~70 年全球氣候和天氣的第5 代再分析數(shù)據(jù)。目前的數(shù)據(jù)是從1950 年開始的,分為1950–1978 年的氣候數(shù)據(jù)存儲條目和1979 年以后的。ERA-5 提供了大量大氣、海浪和陸地表面數(shù)量的每小時估計(jì)數(shù)。本文選用的ERA-5 再分析風(fēng)場時間區(qū)間為2020 年12 月以及2021 年1 月,其空間分辨率為0.25°×0.25°,其空間分布在0°~45°N,100°E~180°。

      浮標(biāo)數(shù)據(jù)選自離岸50 km 以上,具有連續(xù)風(fēng)矢量觀測能力的TAO 浮標(biāo)數(shù)據(jù)。該浮標(biāo)具有較高的觀測頻率,每10 min 觀測一次風(fēng)速、風(fēng)向。由于選定的TAO 浮標(biāo)上的測風(fēng)計(jì)距離海面4 m,而散射計(jì)測量的是高度10 m 處的風(fēng)速,因此需要將浮標(biāo)觀測風(fēng)速轉(zhuǎn)換到10 m 高度上的風(fēng)速,轉(zhuǎn)換公式為

      式中,z表示距離海面的高度;s10和sz分別表示10 m高度處的風(fēng)速和在z高度上的風(fēng)速。

      3 融合方法

      對于融合風(fēng)場的生成,研究共分為兩部分進(jìn)行,即修正融合風(fēng)場模型的訓(xùn)練及其機(jī)器推理。文中首先以衛(wèi)星數(shù)據(jù)作為實(shí)況數(shù)據(jù),通過XGBoost 模型方法對ERA-5 數(shù)據(jù)進(jìn)行修正訓(xùn)練,得到修正融合風(fēng)場模型,使得修正后的ERA-5 數(shù)據(jù)更加接近于衛(wèi)星數(shù)據(jù)分布,然后利用訓(xùn)練完畢的模型生成海面融合風(fēng)場。

      文中將混合的衛(wèi)星數(shù)據(jù)統(tǒng)一處理成為0.25°×0.25°的標(biāo)準(zhǔn)網(wǎng)格數(shù)據(jù)。在插值處理過程中,由于衛(wèi)星數(shù)據(jù)之間分辨率的不同,即12.5 km×12.5 km 和25 km×25 km不等,為了方便統(tǒng)一插值,本文在空間上采用反距離加權(quán)插值算法,時間上采用最近鄰方法對混合衛(wèi)星數(shù)據(jù)進(jìn)行插值,插值完成后的衛(wèi)星數(shù)據(jù)與ERA-5 數(shù)據(jù)共同完成修正融合風(fēng)場模型的訓(xùn)練,并最終得到全區(qū)域的時間分辨率為12 h 的0.25°×0.25°的標(biāo)準(zhǔn)網(wǎng)格數(shù)據(jù),具體融合流程如圖1 所示。

      圖1 海面融合風(fēng)場生成流程Fig. 1 The process of obtaining the sea surface fusion wind

      3.1 插值方法

      3.1.1 反距離加權(quán)插值算法

      當(dāng)前對氣象要素等進(jìn)行插值的算法有很多[23–28],本文選取的插值算法為反距離權(quán)重法(IDW)。IDW插值是一種經(jīng)常使用的空間插值方法,在1972 年被美國國家氣象局首次提出[29–31]。它的邏輯來源于地理學(xué)第一定律—相近相似原理。IDW是通過插值點(diǎn)與樣本點(diǎn)之間距離的倒數(shù)為權(quán)重進(jìn)行加權(quán)平均,與插值點(diǎn)越靠近的樣本點(diǎn)計(jì)算時所被賦予的權(quán)重值越大,權(quán)重值一般與距離成反比關(guān)系,所以稱之為“反距離”加權(quán)。其計(jì)算公式可以表示為

      3.2 生成修正融合風(fēng)場模型

      正如引言所說,本文使用衛(wèi)星數(shù)據(jù)對ERA-5 數(shù)據(jù)進(jìn)行修正融合,使得修正融合后的風(fēng)場數(shù)據(jù)更加貼近真實(shí)值。研究流程如圖1 所示,首先對混合后的衛(wèi)星數(shù)據(jù)進(jìn)行插值操作,空間上使用反距離加權(quán)插值算法(IDW),時間上采用最近鄰方法將其插值成為0.25°×0.25°的標(biāo)準(zhǔn)網(wǎng)格數(shù)據(jù)。然后利用衛(wèi)星插值數(shù)據(jù)和ERA-5 數(shù)據(jù)獲取訓(xùn)練樣本后進(jìn)行訓(xùn)練,最終得到所需的XGBoost 模型,即修正融合風(fēng)場模型。

      3.2.1 修正融合方法

      ERA-5 數(shù)據(jù)是全區(qū)域數(shù)據(jù),其風(fēng)場數(shù)據(jù)既涵蓋了海洋區(qū)域,也包括了陸地區(qū)域。由于陸地風(fēng)場和海洋風(fēng)場的差異較大,詳細(xì)分析請見4.1 節(jié)。因此為了研究的科學(xué)性及其可靠性,本文采用4 種方法來對ERA-5 數(shù)據(jù)進(jìn)行修正,具體方法如下:

      方法1:風(fēng)速、風(fēng)向修正(全區(qū)域)即D_S_A_XGBoost 模型。在XGBoost 訓(xùn)練的過程中,不區(qū)分海洋和陸地風(fēng)場數(shù)據(jù),全部用來進(jìn)行模型的訓(xùn)練。

      方法2:U、V修正(全區(qū)域)即U_V_A_XGBoost模型。與方法1 相同,訓(xùn)練過程中不區(qū)分海洋和陸地風(fēng)場數(shù)據(jù)。區(qū)別在于方法1 中使用的訓(xùn)練數(shù)據(jù)為風(fēng)速和風(fēng)向,而方法2 中使用的訓(xùn)練數(shù)據(jù)為U10 和V10,訓(xùn)練結(jié)束后再合成風(fēng)速和風(fēng)向。

      方法3:風(fēng)速、風(fēng)向修正(陸地掩碼)即D_S_O_XGBoost 模型。訓(xùn)練過程中區(qū)分海洋和陸地風(fēng)場數(shù)據(jù),即使用陸地掩碼將陸地風(fēng)場數(shù)據(jù)剔除,不參與模型的訓(xùn)練。

      方法4:U、V修正(陸地掩碼)即U_V_O_XGBoost模型。與方法3 相同,訓(xùn)練過程中區(qū)分海洋和陸地風(fēng)場數(shù)據(jù)。不同點(diǎn)在于方法3 中使用的訓(xùn)練數(shù)據(jù)為風(fēng)速和風(fēng)向,方法4 中使用的訓(xùn)練數(shù)據(jù)為U10 和V10,訓(xùn)練結(jié)束后再合成風(fēng)速和風(fēng)向進(jìn)行修正。

      3.2.2 樣本生成

      噪聲與偏差、方差共同構(gòu)成機(jī)器學(xué)習(xí)的泛化誤差[32]。噪聲普遍存在,具有隨機(jī)性和不可控性,例如數(shù)據(jù)采集儀器等帶來的隨機(jī)性偏差就是噪聲的一種,本文中海陸交界處的無效數(shù)據(jù)可視為衛(wèi)星觀測的噪聲。機(jī)器學(xué)習(xí)訓(xùn)練允許且需要數(shù)據(jù)中噪聲的存在,由含噪聲數(shù)據(jù)訓(xùn)練得到的模型通常更具有魯棒性,能夠更好地在未知分布數(shù)據(jù)上推理。

      本文采用局部訓(xùn)練,全局推理的方式進(jìn)行研究。即使用所能獲取到的區(qū)域內(nèi)樣本數(shù)據(jù)進(jìn)行訓(xùn)練,訓(xùn)練得到的模型可以應(yīng)用于整片區(qū)域。本文對于訓(xùn)練樣本的獲取過程如圖2 所示。經(jīng)過插值處理后的衛(wèi)星數(shù)據(jù)與ERA-5 數(shù)據(jù)均為0.25°×0.25°的網(wǎng)格數(shù)據(jù),本文使用衛(wèi)星插值風(fēng)場數(shù)據(jù)作為學(xué)習(xí)目標(biāo),選取衛(wèi)星插值格點(diǎn)及其周圍(5×5 窗口)的ERA-5 值作為訓(xùn)練特征,進(jìn)行訓(xùn)練。圖2a 綠色點(diǎn)表示的是衛(wèi)星插值數(shù)據(jù),周圍5×5 格點(diǎn)為ERA-5 數(shù)據(jù),當(dāng)ERA-5 數(shù)據(jù)在5×5 空間格點(diǎn)中全部存在時,那么就會得到如圖2b 的訓(xùn)練樣本,若ERA-5 數(shù)據(jù)存在缺失,那么在該點(diǎn)就無法獲取到訓(xùn)練樣本。本文使用的訓(xùn)練樣本為2020 年12 月21日至2021 年1 月21 日數(shù)據(jù),測試數(shù)據(jù)為2021 年1 月31日衛(wèi)星初始數(shù)據(jù)以及修正前后的ERA-5 數(shù)據(jù)。在研究過程中,本文針對0 時和12 時數(shù)據(jù)分別訓(xùn)練模型,即0 時刻修正模型以及12 時刻修正模型,其中訓(xùn)練過程中使用的訓(xùn)練集約400 000,驗(yàn)證集約40 000,測試集約60 000。

      圖2 訓(xùn)練樣本生成Fig. 2 Generation of training samples

      3.2.3 XGBoost 算法

      集成學(xué)習(xí)通過構(gòu)建并結(jié)合多個學(xué)習(xí)器來完成學(xué)習(xí)任務(wù),比單一學(xué)習(xí)器獲得顯著優(yōu)越的泛化性能。XGBoost 是在梯度下降樹(Gradient Boosting Decision Tree,GBDT)的基礎(chǔ)上對boosting 算法進(jìn)行的改進(jìn),由多棵決策樹迭代組成[33–36]。

      XGBoost 算法的核心思想是每次構(gòu)建一棵新樹來學(xué)習(xí)上次預(yù)測得到的殘差,即首先初始構(gòu)建一棵樹來預(yù)測一個值,得到預(yù)測值與實(shí)際值的殘差,然后構(gòu)建下一棵樹來學(xué)習(xí)殘差,直至構(gòu)建K棵樹,并在訓(xùn)練中對構(gòu)建樹不斷優(yōu)化,算法的整體思路如圖3 所示。XGBoost 算法將訓(xùn)練得到的各個決策樹預(yù)測值相加,得到模型最終的預(yù)測值。如公式所示:

      圖3 XGBoost 模型訓(xùn)練流程Fig. 3 Training flow of the XGBoost model

      式中,y^i為模型對于第i個樣本的預(yù)測值;xi為 第i個樣本的標(biāo)簽;K為分類回歸樹的數(shù)量;fk為第k棵樹模型函數(shù)。

      4 模型評價及其分析

      本文采用均方根誤差(Root Mean Square Error,RMSE)、絕對誤差(Mean Absolute Error,MAE)、相關(guān)系數(shù)(R)、標(biāo)準(zhǔn)差(σ)以及中心均方根誤差(E')5 種誤差統(tǒng)計(jì)方法來對風(fēng)速模型性能進(jìn)行評估[21,37]。

      對于風(fēng)向來說,使用常規(guī)的RMSE 以及MAE 并不能夠很好地衡量研究結(jié)果,因此本文采用RMSEd以及MAEd[21]進(jìn)行評價。

      4.1 研究區(qū)域風(fēng)場分析

      在數(shù)據(jù)獲取的過程中對ERA-5 風(fēng)場數(shù)據(jù)中陸地部分和海洋部分進(jìn)行分析,如圖4 所示,陸地風(fēng)場的風(fēng)速分布和海洋風(fēng)場的風(fēng)速分布存在著很大的不同。陸地風(fēng)場整體風(fēng)速較小,其分布峰值約為2.5 m/s,大部分風(fēng)力等級在5 級風(fēng)以下,而在海洋風(fēng)場中,風(fēng)速分布峰值在6~8 m/s 之間,整體分布在0 m/s 至20.0 m/s,并且6 級以上大風(fēng)發(fā)生頻率較大。本文分析海洋中由于海面寬闊,沒有遮擋物,對空氣移動的摩擦力小,從而風(fēng)速較大,陸地上由于地面粗糙,地形起伏,有植被及建筑物阻礙等對空氣移動的摩擦較大,導(dǎo)致風(fēng)速較小。介于陸地風(fēng)場和海洋風(fēng)場分布的不同,本研究采用4 種修正方法來對風(fēng)場進(jìn)行修正,即3.2 節(jié)中提出的修正方法。

      圖4 海陸風(fēng)場風(fēng)速統(tǒng)計(jì)直方圖Fig. 4 Histogram of wind speed statistics for sea and land wind fields

      4.2 ERA-5 修正融合結(jié)果分析

      融合風(fēng)場模型在(0°~45°N,100°E~180°)研究區(qū)域內(nèi)進(jìn)行機(jī)器推理,其中全區(qū)域內(nèi)共計(jì)58 101 個點(diǎn),在推理過程中由于5×5 窗口的存在,模型最終對56 109 個點(diǎn)進(jìn)行修正。推理過程中模型輸入為ERA-5數(shù)據(jù),且在CPU 上進(jìn)行,當(dāng)前實(shí)驗(yàn)使用的CPU 型號為Intel(R) Xeon(R) CPU E5-2 690 v4 @ 2.60GHz,單時刻推理平均用時約為2.1 s。

      4.2.1 原始衛(wèi)星數(shù)據(jù)評價

      在機(jī)器學(xué)習(xí)領(lǐng)域中,以未參與訓(xùn)練的真值數(shù)據(jù)檢驗(yàn)?zāi)P停P蜏y試與評價)必不可少。本文以ERA-5 風(fēng)場數(shù)據(jù)作為輸入,以衛(wèi)星插值數(shù)據(jù)作為學(xué)習(xí)目標(biāo)訓(xùn)練融合模型,該模型期望從ERA-5 風(fēng)場推理得出衛(wèi)星風(fēng)場(本文稱為融合風(fēng)場便于和衛(wèi)星真值相區(qū)分)。若推理得出的融合風(fēng)場相較于ERA-5 風(fēng)場更加接近衛(wèi)星原始數(shù)據(jù),即說明融合風(fēng)場模型有效。所以本文以未參與模型訓(xùn)練的衛(wèi)星原始數(shù)據(jù)進(jìn)行測試評價。

      一般機(jī)器學(xué)習(xí)的評價所用真值數(shù)據(jù)和模型推理數(shù)據(jù)處于同樣的網(wǎng)格點(diǎn)。融合模型推理得到數(shù)據(jù)處于ERA-5 的網(wǎng)格點(diǎn),與衛(wèi)星原始數(shù)據(jù)位置并不一樣,而作為評價的衛(wèi)星原始數(shù)據(jù)是不能做任何插值處理的。本文是將融合風(fēng)場數(shù)據(jù)再插值回到衛(wèi)星原始數(shù)據(jù)點(diǎn)進(jìn)行比較。由于模型本身的學(xué)習(xí)目標(biāo)是插值后衛(wèi)星數(shù)據(jù),而檢驗(yàn)和評價卻使用衛(wèi)星原始數(shù)據(jù),這其實(shí)是超出一般機(jī)器學(xué)習(xí)檢驗(yàn)的更高和更嚴(yán)的要求。如能在這一更高要求下,融合模型也能得到很好的結(jié)果,則說明該融合方法是有效的。

      實(shí)驗(yàn)中測試數(shù)據(jù)為2021 年1 月31 日00 時和12 時數(shù)據(jù),共計(jì)約130 000 個。實(shí)驗(yàn)使用訓(xùn)練完畢的XGBoost 模型對ERA-5 數(shù)據(jù)進(jìn)行修正,得到修正后的ERA-5 數(shù)據(jù)分別插值到對應(yīng)時間點(diǎn)的衛(wèi)星數(shù)據(jù)上,即將衛(wèi)星數(shù)據(jù)作為真值,計(jì)算RMSE 等,最終實(shí)驗(yàn)結(jié)果如下所示。

      (1)表1 和表2 展示了對于U_V_A_XGBoost 模型和D_S_A_XGBoost 模型的評價信息及結(jié)果。

      表1 衛(wèi)星評價數(shù)據(jù)信息(全區(qū)域)Table 1 Satellite data information used in the test (whole region)

      表2 全區(qū)域訓(xùn)練模型評價結(jié)果Table 2 Evaluation results of the whole regional training model

      (2)表3 和表4 展示了對于U_V_O_XGBoost 模型和D_S_O_XGBoost 模型的評價信息及結(jié)果。

      表3 衛(wèi)星評價數(shù)據(jù)信息(陸地掩碼)Table 3 Satellite data information used in the test (land mask)

      表4 陸地掩碼訓(xùn)練模型評價結(jié)果Table 4 Evaluation results of land mask training model

      對比表1 數(shù)據(jù)信息和表3 數(shù)據(jù)信息可以發(fā)現(xiàn),表3 中的MetOp-B 衛(wèi)星測試數(shù)據(jù)比表1 中MetOp-B 衛(wèi)星測試數(shù)據(jù)少,這是因?yàn)槟P蚒_V_O_XGBoost和U_V_O_XGBoost 是基于陸地掩碼的模型,所以在測試的時候貼近陸地的衛(wèi)星數(shù)據(jù)可能無法進(jìn)行評估,從而導(dǎo)致了測試數(shù)據(jù)減少。

      從表2 中分析,對于風(fēng)向來說,U_V_A_XGBoost 模型在MAEd方面表現(xiàn)最好,除了在MetOp-B 衛(wèi)星上有所上升,在HY-2B 和CFOSAT 衛(wèi)星上均下降,在RMSEd方面,D_S_A_XGBoost 模型的表現(xiàn)較好,但在2021 年1 月31 日12 時的測試樣例中,在MetOp-B 評價結(jié)果中出現(xiàn)了上升的情況,而U_V_A_XGBoost 模型表現(xiàn)穩(wěn)定,全部呈現(xiàn)下降趨勢。對于風(fēng)速來說,不論是D_S_A_XGBoost 模型還是U_V_A_XGBoost 模型,在RMSE以及MAE 方面結(jié)果均下降。整體來說,U_V_A_XGBoost 模型的表現(xiàn)較穩(wěn)定。

      從表4 進(jìn)行分析,對于風(fēng)向來說,U_V_O_XGBoost模型在MAEd方面表現(xiàn)最好,與表2 中U_V_A_XGBoost模型的表現(xiàn)類似,除了在MetOp-B 衛(wèi)星上有所上升,在HY-2B 和CFOSAT 衛(wèi)星結(jié)果中均下降,在RMSEd方面,D_S_O_XGBoost 模型表現(xiàn)整體要好于U_V_O_XGBoost 模型,但是同樣在2021 年1 月31 日12 時的測試樣例中,出現(xiàn)了上升的情況,而U_V_O_XGBoost 模型一直保持下降。對于風(fēng)速來說,U_V_O_XGBoost 模型和D_S_O_XGBoost 模型均表現(xiàn)良好,不論是在RMSE還是在MAE 方面,測試結(jié)果均下降。整體來說,U_V_O_XGBoost 模型的穩(wěn)定性較好。

      綜上所述,所有的模型在HY-2B 衛(wèi)星和CFOSAT衛(wèi)星上的測試結(jié)果表現(xiàn)良好,但是在MetOp-B 衛(wèi)星的風(fēng)向修正方面表現(xiàn)不理想,研究分析認(rèn)為,導(dǎo)致該現(xiàn)象的原因可能有兩點(diǎn),一是ERA-5 再分析數(shù)據(jù)的制作過程中使用了MetOp-B 衛(wèi)星數(shù)據(jù),所以修正后的ERA-5 數(shù)據(jù)可能會與MetOp-B 衛(wèi)星數(shù)據(jù)偏差增大;二是HY-2B 衛(wèi)星和CFOSAT 衛(wèi)星都是中國參與研制并運(yùn)行的衛(wèi)星,而MetOp-B 衛(wèi)星是歐洲衛(wèi)星,衛(wèi)星數(shù)據(jù)之間可能存在差異,模型的訓(xùn)練過程中可能更加偏向了HY-2B 衛(wèi)星和CFOSAT 衛(wèi)星,所以導(dǎo)致MetOp-B 衛(wèi)星的模型結(jié)果不佳。根據(jù)表2 和表4 的模型結(jié)果發(fā)現(xiàn),使用U、V分量修正風(fēng)速風(fēng)向的研究方法在穩(wěn)定性上要好于使用直接風(fēng)速風(fēng)向進(jìn)行修正的研究方法。

      圖5 表示的是U_V_O_XGBoost 模型(模型選擇的具體原因參見4.2.2 節(jié))修正結(jié)果在HY-2B 衛(wèi)星、CFOSAT 衛(wèi)星以及MetOp-B 衛(wèi)星上的關(guān)于風(fēng)向的展示,挑選的時間為2021 年1 月31 日12 時。其中圖中描述的是ERA-5數(shù)據(jù)的插值結(jié)果與該點(diǎn)上衛(wèi)星數(shù)據(jù)偏差的絕對值即MAEd,圖5a 和圖5b 表示HY-2B 衛(wèi)星效果圖,圖5c 和圖5d 表示CFOSAT 衛(wèi)星效果圖,圖5e 和圖5f 表示MetOp-B 衛(wèi)星效果圖。左側(cè)圖表示的是原始ERA-5數(shù)據(jù)與衛(wèi)星數(shù)據(jù)之間的偏差,右側(cè)圖表示的是修正后的ERA-5 數(shù)據(jù)與衛(wèi)星數(shù)據(jù)之間的偏差。圖6 為U_V_O_XGBoost 模型修正結(jié)果在HY-2B、CFOSAT 以及MetOp-B 衛(wèi)星上的關(guān)于風(fēng)速的展示,所選時間為2021 年1 月31 日12 時。其中圖中描述的是ERA-5 數(shù)據(jù)的插值結(jié)果與該點(diǎn)上衛(wèi)星數(shù)據(jù)偏差的絕對值即MAE。圖6a 和圖6b 表示HY-2B 衛(wèi)星效果圖,圖6c 和圖6d 表示CFOSAT 衛(wèi)星效果圖,圖6e和圖6f 表示MetOp-B 衛(wèi)星效果圖。

      圖5 ERA-5 修正的風(fēng)向效果圖Fig. 5 Wind direction effect diagram of ERA-5 correction experiment

      圖6 ERA-5 修正的風(fēng)速效果圖Fig. 6 Wind speed effect diagram of ERA-5 correction experiment

      4.2.2 浮標(biāo)評價

      本文使用浮標(biāo)數(shù)據(jù)對ERA-5 數(shù)據(jù)的修正方法進(jìn)行評價,選取的浮標(biāo)為經(jīng)緯度在8°N,165°E,距離海面4 m 高的TAO 浮標(biāo),選取的時間范圍為2020 年12 月至2021 年1 月共計(jì)兩個月的數(shù)據(jù)。本文剔除與浮標(biāo)風(fēng)速相差3 倍標(biāo)準(zhǔn)差的數(shù)據(jù),并剔除與浮標(biāo)風(fēng)向相差大于90°的數(shù)據(jù)[21,38],原因在于本文認(rèn)定該點(diǎn)數(shù)據(jù)可能存在較為明顯的誤差,該點(diǎn)數(shù)據(jù)可能會對整體的數(shù)據(jù)評價造成較大的影響。最終ERA-5 數(shù)據(jù)與浮標(biāo)數(shù)據(jù)匹配后得到123 個測試樣例,計(jì)算相關(guān)系數(shù)等評價指標(biāo),結(jié)果如圖7 所示。

      圖7 風(fēng)速泰勒圖Fig. 7 Tyler diagram of wind speed

      圖7 中展示的是4 個模型方法的結(jié)果和原始ERA-5 風(fēng)速數(shù)據(jù)與浮標(biāo)風(fēng)速數(shù)據(jù)之間的差異,從圖中可以看出,使用U_V_O_XGBoost 模型修正的ERA-5 數(shù)據(jù)與浮標(biāo)數(shù)據(jù)的相關(guān)系數(shù)最高,中心均方根誤差最小,整體結(jié)果要好于原始ERA-5 數(shù)據(jù)的結(jié)果,意味著生成的融合風(fēng)場數(shù)據(jù)更加接近浮標(biāo)數(shù)據(jù)。

      圖8 表示的是浮標(biāo)數(shù)據(jù)與ERA-5 原始數(shù)據(jù)以及U_V_O_XGBoost 模型修正后的融合風(fēng)場數(shù)據(jù)的匹配情況。從圖中可以看出風(fēng)速在不同時刻差異明顯,例如風(fēng)速可以從5 m/s 迅速增到9 m/s,同樣可以從約13 m/s 迅速減小到5 m/s,風(fēng)速前后相差較大。通過觀察發(fā)現(xiàn),在圖中黑框區(qū)域,修正融合風(fēng)場數(shù)據(jù)與浮標(biāo)數(shù)據(jù)的差距明顯減小,表明修正融合風(fēng)場數(shù)據(jù)更加接近浮標(biāo)數(shù)據(jù)。圖9 中分別表示的是ERA-5 數(shù)據(jù)與浮標(biāo)數(shù)據(jù)的風(fēng)速相關(guān)性以及融合風(fēng)場與浮標(biāo)數(shù)據(jù)的風(fēng)速相關(guān)性。從圖9 中可以看出融合風(fēng)場風(fēng)速相較于ERA-5 數(shù)據(jù)來說相關(guān)系數(shù)有所提高。

      圖8 浮標(biāo)數(shù)據(jù)與ERA-5 數(shù)據(jù)的風(fēng)速對比Fig. 8 Comparison of wind speed between buoy data and ERA-5 data

      圖9 風(fēng)速散點(diǎn)圖Fig. 9 Scatter plot about wind speed

      本文采用Adaboost 以及Random Forest 算法進(jìn)行風(fēng)場融合研究,與XGBoost 方法進(jìn)行比較,結(jié)果如表5 所示,其中相關(guān)系數(shù)、均方根誤差以及標(biāo)準(zhǔn)差的計(jì)算公式在第4 章進(jìn)行了說明。從表中可以看出,Adaboost、Random Forest 以及XGBoost 等算法生成的融合風(fēng)場數(shù)據(jù)相比ERA-5 數(shù)據(jù)來說與浮標(biāo)的相關(guān)系數(shù)均有所提高,即更加接近于浮標(biāo)數(shù)據(jù),且XGBoost 算法相對來說效果最好。

      表5 不同機(jī)器學(xué)習(xí)算法風(fēng)場融合結(jié)果Table 5 Wind field fusion results of different machine learning algorithms

      4.2.3 融合時間對比

      本文目的在于降低風(fēng)場融合的硬件要求,提高融合速度,且保證融合風(fēng)場的質(zhì)量。因此本文對融合時間進(jìn)行統(tǒng)計(jì)對比,數(shù)據(jù)結(jié)果如表6 所示。表中XGBoost 表示的是本文采用XGBoost 模型針對單一風(fēng)場要素進(jìn)行海面風(fēng)場融合的方法,插值方法表示的是采用傳統(tǒng)的IDW 方法針對單一風(fēng)場要素進(jìn)行海面風(fēng)場融合。本文在0°~45°N ,0°~180°區(qū)域共計(jì)58 101個網(wǎng)格點(diǎn)進(jìn)行海面風(fēng)場融合,針對1 個月數(shù)據(jù)共計(jì)60 次融合時間進(jìn)行統(tǒng)計(jì)分析,結(jié)果如表6 所示。XGBoost 模型方法融合時間明顯優(yōu)于傳統(tǒng)插值方法。

      表6 融合時間對比Table 6 Comparison of fusion time

      4.3 融合風(fēng)場展示

      本文以ERA-5 數(shù)據(jù)作為模型輸入,以衛(wèi)星插值數(shù)據(jù)作為學(xué)習(xí)目標(biāo)進(jìn)行模型訓(xùn)練,得到海面風(fēng)場修正融合模型,最終采用訓(xùn)練完畢的海面風(fēng)場修正融合模型進(jìn)行推理,得到融合風(fēng)場。圖10 中表示的是2021 年1 月30 日00 時的融合情況,從圖10 中可以看出衛(wèi)星數(shù)據(jù)與ERA-5 數(shù)據(jù)以及融合風(fēng)場數(shù)據(jù)均具有大致相同的數(shù)據(jù)分布。從上述3 處風(fēng)場分布來看,融合風(fēng)場數(shù)據(jù)更加貼近衛(wèi)星數(shù)據(jù),即風(fēng)速達(dá)到12.5 m/s 以上的區(qū)域中融合風(fēng)場更加接近衛(wèi)星數(shù)據(jù)分布情況。圖11展示的是融合風(fēng)場中風(fēng)速在2021 年1 月27 日12 時至2021 年1 月31 日12 時的連續(xù)時空分布情況,其時間分辨率為12 h,圖12 展示的是該時間段融合風(fēng)場整體分布情況,由圖可以看出該時段西北太平洋區(qū)域風(fēng)場多為東北風(fēng)或西北風(fēng)。

      圖10 風(fēng)速對比圖Fig. 10 Comparison chart of wind speed data

      圖11 融合風(fēng)速效果圖Fig. 11 The effect of wind speed after fusion

      圖12 融合風(fēng)場效果圖Fig. 12 Rendering of the fusion wind field

      5 總結(jié)

      本文使用CFOSAT 衛(wèi)星、HY-2B 衛(wèi)星、MetOp-B衛(wèi)星數(shù)據(jù)以及ERA-5 再分析數(shù)據(jù),利用傳統(tǒng)機(jī)器學(xué)習(xí)XGBoost 在研究區(qū)域(0°~45°N,100°E~180°)內(nèi)進(jìn)行生成融合風(fēng)場的研究。研究首先以衛(wèi)星數(shù)據(jù)作為學(xué)習(xí)目標(biāo),將ERA-5 數(shù)據(jù)作為模型輸入訓(xùn)練得到修正融合風(fēng)場生成模型,然后利用融合風(fēng)場生成模型進(jìn)行機(jī)器推理最終得到全區(qū)域空間分辨率為0.25°×0.25°,時間分辨率為12 h 的融合風(fēng)場。其中,在機(jī)器推理過程中,生成單時刻全區(qū)域融合風(fēng)場的時間僅需要約2 s,相比較傳統(tǒng)融合方法來說,該模型方法更加快速高效。文中共提出4 種模型進(jìn)行融合風(fēng)場的研究,結(jié)論如下:

      (1)使用U、V分量修正風(fēng)速風(fēng)向的研究方法比直接修正風(fēng)速風(fēng)向的研究方法在結(jié)果上更加穩(wěn)定。

      (2) U_V_O_XGBoost 模型得到的融合風(fēng)場數(shù)據(jù)在風(fēng)速方面最為接近浮標(biāo)數(shù)據(jù),同時風(fēng)場修正結(jié)果穩(wěn)定。

      (3)研究中出現(xiàn)了修正融合結(jié)果在MetOp-B 衛(wèi)星風(fēng)向方面上升,在HY-2B 衛(wèi)星和CFOSAT 衛(wèi)星表現(xiàn)良好的情況,分析得到HY-2B 衛(wèi)星和CFOSAT 衛(wèi)星均為中國參與研制并運(yùn)行,而MetOp-B 衛(wèi)星為歐洲氣象衛(wèi)星,兩者存在差異,該差異導(dǎo)致了模型在學(xué)習(xí)過程中出現(xiàn)偏向。

      總而言之,傳統(tǒng)機(jī)器學(xué)習(xí)方法在對ERA-5 再分析數(shù)據(jù)修正融合的過程中,能夠有效地學(xué)習(xí)到衛(wèi)星數(shù)據(jù)的分布特征,使得修正融合后的風(fēng)場數(shù)據(jù)更加貼近研究區(qū)域內(nèi)衛(wèi)星數(shù)據(jù)分布,從而提高生成的融合風(fēng)場的質(zhì)量。對于目前,深度學(xué)習(xí)取得了重大進(jìn)展,深度學(xué)習(xí)擅長抽取高維數(shù)據(jù)的復(fù)雜結(jié)構(gòu),通過足夠多的數(shù)據(jù)和組合,學(xué)習(xí)到非常復(fù)雜的函數(shù)關(guān)系[39]。因此本文下一步準(zhǔn)備將深度學(xué)習(xí)方法應(yīng)用到融合風(fēng)場的研究中,提高融合風(fēng)場精度。

      猜你喜歡
      浮標(biāo)風(fēng)場插值
      受了委屈的浮標(biāo)君
      受了委屈的浮標(biāo)君
      受了委屈的浮標(biāo)君
      家教世界(2023年7期)2023-03-22 12:11:24
      受了委屈的浮標(biāo)君
      家教世界(2023年4期)2023-03-04 07:31:28
      基于FLUENT的下?lián)舯┝魅S風(fēng)場建模
      基于Sinc插值與相關(guān)譜的縱橫波速度比掃描方法
      “最美風(fēng)場”的贏利法則
      能源(2017年8期)2017-10-18 00:47:39
      側(cè)向風(fēng)場中無人機(jī)的飛行研究
      一種改進(jìn)FFT多譜線插值諧波分析方法
      基于四項(xiàng)最低旁瓣Nuttall窗的插值FFT諧波分析
      英山县| 准格尔旗| 台江县| 商南县| 沭阳县| 浪卡子县| 东乡县| 杭锦后旗| 华蓥市| 新乡县| 兰西县| 凌云县| 略阳县| 珲春市| 沅陵县| 怀柔区| 金堂县| 铁岭县| 衡阳市| 德安县| 怀远县| 塘沽区| 广汉市| 乌拉特前旗| 宁化县| 宁波市| 太湖县| 密山市| 繁昌县| 赣州市| 根河市| 广南县| 漳平市| 岱山县| 临沂市| 宁乡县| 开原市| 商河县| 武冈市| 张北县| 资源县|