董昌明,LIM KAM SIAN Kenny Thiam Choy,蔣星亮,曹玉晗,嵇宇翔,王 森,余 洋,陸曉婕,周書逸,韋銷蔚0,BETHEL Brandon Justin,徐廣珺,董濟(jì)海,孫文金,王海麗,單海霞,王 錦,王東霞,滕芳園,曹 茜,謝文鴻,游志偉,王子韻,林連杰
(1.南京信息工程大學(xué) 海洋科學(xué)學(xué)院,江蘇 南京 210044;2.南方海洋科學(xué)與工程廣東省實(shí)驗(yàn)室(珠海),廣東 珠海 519000;3.無錫學(xué)院,江蘇 無錫 214105;4.復(fù)旦大學(xué) 大氣與海洋科學(xué)系,上海 200438;5.江蘇海洋大學(xué) 海洋技術(shù)與測繪學(xué)院,江蘇 連云港 222005;6.江蘇省連云港市氣象局,江蘇 連云港 222006;7.江蘇海洋大學(xué) 海洋資源開發(fā)研究院,江蘇 連云港 222005;8.福建省氣象臺,福建 福州 350007;9.清華大學(xué) 地球系統(tǒng)科學(xué)系,北京 100084;10.廣西壯族自治區(qū)氣象局,廣西 南寧 530022;11.廣東海洋大學(xué) 電子與信息工程學(xué)院,廣東 湛江 524088;12.中國科學(xué)院 南海海洋研究所,廣東 廣州 510301;13.中國船舶集團(tuán) 海裝風(fēng)電股份有限公司,重慶 401123)
作為建立在物理框架下面向應(yīng)用的基礎(chǔ)學(xué)科,物理海洋學(xué)涵蓋海浪、海洋環(huán)流等過程,還受到海氣相互作用和氣候變化等過程影響[1-2],其采用的研究手段包括衛(wèi)星和現(xiàn)場觀測、數(shù)值模擬和理論分析。由于海洋環(huán)境研究中難于觀測,實(shí)測數(shù)據(jù)相對匱乏,數(shù)值模擬成為科學(xué)研究和業(yè)務(wù)應(yīng)用的主要手段。數(shù)值模擬技術(shù)問世以來,各國研究者爭相研發(fā),已在海洋災(zāi)害預(yù)警預(yù)報、海洋環(huán)境安全保障、海洋權(quán)益維護(hù)、海洋資源開發(fā)、海上工程、氣候預(yù)測等方面實(shí)現(xiàn)了業(yè)務(wù)化應(yīng)用。中國的海洋氣象數(shù)值模擬也在過去的40 a 期間取得了長足的進(jìn)步,在多源數(shù)據(jù)同化、海氣耦合模擬、模式創(chuàng)新改進(jìn)、區(qū)域業(yè)務(wù)化精準(zhǔn)預(yù)報等方面取得了豐碩的成果[3-7]。20 世紀(jì)80 年代Dickinson 等[8]和Giorgi[9]提出區(qū)域模擬想法,隨著全球海洋技術(shù)發(fā)展,中國海氣數(shù)值模擬已成為海洋氣象業(yè)務(wù)的堅(jiān)強(qiáng)技術(shù)后盾,也成為學(xué)科發(fā)展不可或缺的推動力[10-13]。
20 世紀(jì)90 年代末全球海洋資料同化實(shí)驗(yàn)GODAE(Global Ocean Data Assimilation Experiment)的發(fā)起,極大地促進(jìn)了全球海洋實(shí)時多源觀測數(shù)據(jù)集成融合技術(shù)、海洋數(shù)據(jù)同化技術(shù)和海洋預(yù)報系統(tǒng)的發(fā)展[14]。海洋數(shù)據(jù)同化技術(shù)的理論基礎(chǔ)是以數(shù)值模式作為動力學(xué)驅(qū)動,提煉觀測信息。即從包含誤差的空間分布不均勻的實(shí)測資料中,依據(jù)動力系統(tǒng)自身的演化規(guī)律來確定海洋系統(tǒng)狀態(tài)的最優(yōu)估計(jì)?,F(xiàn)代海洋資料同化方法,包括最優(yōu)插值(Optimal Interpolation,簡稱OI)、變分方法(3 Dimensional Variational 和 4 Dimensional Variational,分別簡稱 3D Var 和 4D Var)和濾波方法(Filtering)。資料同化能夠改進(jìn)海洋大氣模式的模擬和預(yù)報水平。隨著研究深入,國內(nèi)外學(xué)者開始廣泛采用多模式耦合系統(tǒng)進(jìn)行全球預(yù)報技術(shù)的研究,例如國際耦合模式比較計(jì)劃CMIP5(Coupled Model Intercomparison Project Phase 5)和美國業(yè)務(wù)化全球海洋系統(tǒng)基于HYCOM(HYbrid Coordinate Ocean Model)海洋模式。Chelton 等[15]和Xie 等[16-17]通過對比衛(wèi)星數(shù)據(jù),提出粗分辨率的全球耦合模式無法分辨海氣相互作用過程和中尺度現(xiàn)象。因此高分辨率、區(qū)域化的海氣耦合模式成為研究、業(yè)務(wù)工作的一個必然選擇。區(qū)域海氣耦合模式近年來得到快速發(fā)展。例如,美國針對沿海、五大湖海氣信息,成立了綜合海洋觀測系統(tǒng)IOOS(The Integrated Ocean Observing System,https://ioos.noaa.gov/)協(xié)調(diào)美國現(xiàn)有的觀測、模型、系統(tǒng)等,以分區(qū)域模擬和綜合整合的方式進(jìn)行集成。其中南加州海岸海洋觀測系統(tǒng)SCCOOS(Southern California Coastal Ocean Observing System,https://sccoos.org/)便是IOOS 包含的十一個區(qū)域之一[18]。作為南加州的區(qū)域觀測系統(tǒng),SCCOOS 通過海洋生物、化學(xué)和物理觀測和數(shù)值模擬,發(fā)展了支持短期決策和長期評估的近實(shí)時可用的業(yè)務(wù)化系統(tǒng)。例如SCCOOS 針對在2018—2019 年Imperial 海灘的Cardiff和Coronado 的現(xiàn)場觀測[19],得出區(qū)域化經(jīng)驗(yàn)關(guān)系,且對參數(shù)化方案進(jìn)行了改進(jìn),獲得了更精確的美國西海岸潮位觀測模型。
目前我國海洋科學(xué)研究者將海洋數(shù)值模式與大氣、陸面、海冰、生物地球化學(xué)等過程耦合,組成耦合的地球模擬系統(tǒng)[20-21]。21 世紀(jì)初,中國科學(xué)院大氣物理研究所推出了海洋環(huán)流模式LICOM 1.0(LASG/IAP Climate system Ocean Model)[22],隨后逐漸完善形成面向全球的海陸氣地球系統(tǒng)模式GOALS(Global Ocean-Atmosphere-Land System)[23]。同時,基于LICOM 3.0,我國研究者們陸續(xù)研發(fā)了全球渦分辨海洋預(yù)報系統(tǒng)LFS(LICOM Forecast System)和全球渦分辨率海浪-潮流-環(huán)流耦合數(shù)值模式FIO-COM(coupled ocean model developed by the First Institute of Oceanography),并實(shí)現(xiàn)業(yè)務(wù)化應(yīng)用[24-29]。在近10 a,耦合模式的發(fā)展更加迅猛,先后有國家氣候中心推出的BCC-CSM(Climate system model developed by Beijing Climate Center)系列[30]、自然資源部第一海洋研究所自主研發(fā)的FIO-ESM(Earth system model developed by the First Institute of Oceanography)[20]和北京師范大學(xué)的BNU-ESM(Earth system model developed by Beijing Normal University)[31]等模式。
近些年隨著計(jì)算機(jī)軟硬件的發(fā)展,以深度學(xué)習(xí)為核心的人工智能技術(shù)迅速崛起。人工神經(jīng)網(wǎng)絡(luò)以其良好的自適應(yīng)性和非線性映射能力,為解決物理機(jī)制復(fù)雜的非線性問題提供了較好的基礎(chǔ),并應(yīng)用于各行各業(yè)。在風(fēng)速預(yù)報方面,曾使用BP(back propagation)神經(jīng)網(wǎng)絡(luò)[32-33]、RBF(Radial Basis Function)網(wǎng)絡(luò)[34]和支持向量機(jī)(Support Vector Machine,簡稱SVM)[35]等神經(jīng)網(wǎng)絡(luò)算法對風(fēng)電功率預(yù)測展開過的研究表明神經(jīng)網(wǎng)絡(luò)不僅可以準(zhǔn)確地預(yù)測風(fēng)電功率,還可以有效提升預(yù)測效率。一直以來循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,簡稱RNN)作為時序預(yù)測問題的核心算法,對時序數(shù)據(jù)具有更好的適應(yīng)能力,但是依舊存在梯度消失和對數(shù)據(jù)的長期依賴等問題。在RNN 算法的基礎(chǔ)上,LSTM(Long Short-Term Memory)算法、TCN 算法(Temporal Convolutional Network)等模型被相繼提出并應(yīng)用于風(fēng)速預(yù)報[36],進(jìn)一步提高了預(yù)報的準(zhǔn)確性和精度。LightGBM(Light Gradient Boosting Machine)是一種基于梯度提升樹(Gradient Boosting Machine,簡稱GBDT)的數(shù)據(jù)模型,可以在占用較少內(nèi)存并提高預(yù)報精度的同時,大幅度提高預(yù)測速度。目前LightGBM算法已經(jīng)廣泛應(yīng)用于降水的預(yù)報訂正、風(fēng)電功率預(yù)報[37]以及大氣海洋數(shù)據(jù)重構(gòu)等領(lǐng)域。
綜上所述,區(qū)域海氣耦合模擬系統(tǒng)的研發(fā)和建立,不僅能夠豐富我們對區(qū)域大氣過程、區(qū)域海洋過程及局地海氣相互作用過程的理解,而且在業(yè)務(wù)運(yùn)行、預(yù)警預(yù)報領(lǐng)域具有良好的應(yīng)用前景。我們基于海氣模式40 a 的研究積淀,立足我國邊緣海域海氣多要素預(yù)報的實(shí)際需求,采用多模式高分辨率離線耦合的方式(離線耦合的頻率減少,提高預(yù)報效率),同時結(jié)合了人工智能技術(shù)以及南京信息工程大學(xué)海洋數(shù)值模擬與觀測實(shí)驗(yàn)室研發(fā)的從海面到海底的一系列參數(shù)化方案,構(gòu)建了一種針對中國邊緣海的風(fēng)-浪-流多參數(shù)耦合預(yù)報系統(tǒng),旨在為我國邊緣海關(guān)鍵海區(qū)開展精準(zhǔn)、及時、全面的海氣要素預(yù)報和極端天氣預(yù)警提供科學(xué)參考。
本預(yù)報系統(tǒng)主要由數(shù)據(jù)下載、中國沿海全區(qū)域模式、預(yù)報集成系統(tǒng)處理、小區(qū)域模式以及可視化數(shù)據(jù)顯示五個模塊組成。其中數(shù)據(jù)下載模塊主要為耦合模式模塊提供已同化觀測資料的初始場,以及邊界場等輸入數(shù)據(jù);全區(qū)域模式模塊主要為風(fēng)-浪-流三種模式基于同化模塊提供的數(shù)據(jù)進(jìn)行耦合計(jì)算,得到初步的物理要素結(jié)果;預(yù)報集成系統(tǒng)處理模塊負(fù)責(zé)對模式結(jié)果進(jìn)行后處理,以及利用大區(qū)域結(jié)果獲取小區(qū)域模式模塊的輸入數(shù)據(jù);最后通過可視化數(shù)據(jù)顯示模塊將最終的預(yù)報結(jié)果展示出來。預(yù)報系統(tǒng)的總體設(shè)計(jì)方案如圖1 所示。
圖1 預(yù)報系統(tǒng)總體設(shè)計(jì)結(jié)構(gòu)Fig.1 Overall forecast system design structure
WRF 模式是一個非靜力、準(zhǔn)壓縮、跟隨地形的三維大氣模式,為模擬中尺度和微尺度大氣運(yùn)動提供了多種先進(jìn)的物理參數(shù)化方案。在本預(yù)報系統(tǒng)中,大氣模式采用Advance Research WRF(ARW)3.8 版本。模式在垂直方向上設(shè)置了38 層,水平方向上結(jié)合動力降尺度(ndown)模塊進(jìn)行了3 層離線嵌套??臻g分辨率為9 km×9 km,模擬范圍為103°16′12″~136°40′48″E,13°36′36″~43°34′12″N(圖2)。該模式每天在0:00UTC 進(jìn)行初始化,運(yùn)算大氣變量7 d 的預(yù)測結(jié)果,模式的側(cè)向和表面邊界使用全球天氣預(yù)報系統(tǒng)(Global Forecast System,簡稱GFS)數(shù)據(jù)進(jìn)行強(qiáng)迫,并通過ndown 模塊為3 km×3 km 的第一層嵌套區(qū)域生成輸入場文件,同樣的步驟用于生成最內(nèi)層的1 km×1 km 第二層嵌套區(qū)域的模式輸入場文件。
圖2 WRF 模式區(qū)域(為第一層嵌套區(qū)域,為第二層嵌套區(qū)域)Fig.2 WRF model domain(the first level nesting is shown in blue,the second level nesting is in red)
大氣模塊使用Kain-Fritsch 積云對流方案[38]計(jì)算云和亞網(wǎng)格尺度的對流,使用WRF single-moment sixclass 水汽微物理方案[39]模擬網(wǎng)格尺度的降水過程,使用快速輻射傳輸模型[40]模擬長波輻射,使用Dudhia方案[41]進(jìn)行短波輻射模擬。在行星邊界層中,采用MYNN2.5 湍流方案[42]。
海流數(shù)值模塊采用的是CROCO 模式,該模式的前身是區(qū)域海洋模式(Regional Ocean Modeling System,簡稱ROMS)的Agrif 版本。這是一個分裂顯式、自由表面的海洋模式。模式采用Arakawa C 網(wǎng)格,水平流速的2 個分量及標(biāo)量(溫度、鹽度、密度、水位等)分別處于岔開的網(wǎng)格點(diǎn)上。該模式垂直坐標(biāo)為地形自適應(yīng)坐標(biāo),具有在需重點(diǎn)關(guān)注的深度進(jìn)行垂向加密的能力。模式使用較短的時間步長來驅(qū)動海表面變化以及正壓動量,使用較長的時間步長來驅(qū)動溫度、鹽度及斜壓動量,具有更優(yōu)的穩(wěn)定性和計(jì)算效率。同時該模式具備了豐富的參數(shù)化方案,內(nèi)嵌多個模塊,功能完善且架構(gòu)靈活,目前已廣泛應(yīng)用于多種尺度的海洋學(xué)研究中。
CROCO 采用靜力平衡及包辛尼斯克假設(shè)下的納維斯托克斯方程作為控制方程。全區(qū)域模式范圍選取為105°00′00″~135°00′00″E,15°00′00″~42°00′00″N。地形提取自全球水深地形數(shù)據(jù)(Earth′s surface that integrates land topography and the ocean bathymetry dataset,簡稱ETOPO)。全區(qū)域的水平分辨率設(shè)置為(1/24)°,垂向劃分為40 層,且在表面進(jìn)行了加密。模式的西邊界全為陸地,因此設(shè)置為閉邊界,剩余3 個側(cè)邊界設(shè)置為開邊界。自由水位與正壓流速分別采用Flather 和Chapman 邊界條件,三維流速及溫鹽則采用輻射邊界條件,表面強(qiáng)迫采用WRF 模式的輸出結(jié)果。側(cè)邊界場數(shù)據(jù)采用HYCOM 的預(yù)報場,包含未來7 d 內(nèi)逐3 h的溫度、鹽度、海表面高度及流場數(shù)據(jù)[43],其水平分辨率為(1/12)°,垂向分為40 層。此外,模式包含了潮汐和徑流驅(qū)動,其中潮汐數(shù)據(jù)來自TPXO8[44],該數(shù)據(jù)水平分辨率為(1/30)°。模式還包含了M2、S2、K1、O1、N2、P1、K2及Q1八個主要分潮。徑流的數(shù)據(jù)來自Dai 和Trenberth 全球河流及陸架徑流數(shù)據(jù)集[45],模式主要選取了長江及黃河。模式垂直混合采用KPP(K-Profile Parameterization)一階模型參數(shù)化方案,內(nèi)模時間步長設(shè)置為120 s,內(nèi)外模時間步長比設(shè)置為60。
海浪數(shù)值模塊采用荷蘭代爾夫特大學(xué)土木工程系開發(fā)的第三代海浪模式——SWAN。SWAN 模式采用基于歐拉近似的作用量譜平衡方程、線性隨機(jī)表面重力波理論對波浪進(jìn)行模擬。該模式專門用于淺水、近岸的海浪模型,對海岸、湖泊和河口的波浪具有良好的模擬效果。SWAN 模式可以通過給定風(fēng)場、地形和流場來計(jì)算海岸、湖泊和河口的統(tǒng)計(jì)波浪參數(shù),適用于任意時空尺度的表面風(fēng)成重力波,可模擬以下波浪過程:空間域的波浪傳播、地形或流引起波浪的折射、繞射,地形及流引起的淺水效應(yīng),反向流引起的波浪反射,波浪在障礙物前的繞射、阻滯及反射。另外,在笛卡爾坐標(biāo)系下SWAN 模式還可以有效模擬波浪引起的增水過程[46-48]。
在本系統(tǒng)中,海浪數(shù)值模擬預(yù)報區(qū)域?yàn)?05°00′00″~135°00′00″E,15°00′00″~42°00′00″N,空間分辨率為4 km×4 km,時間分辨率為3 h。模式地形水深數(shù)據(jù)與海流模式一致,均采用ETOPO 高程數(shù)據(jù)[49],驅(qū)動模型的風(fēng)場數(shù)據(jù)來自WRF 模式的輸出結(jié)果。模式中還考慮了底摩擦、白帽、反射、三波和四波的波-波相互作用,以及水深變化誘發(fā)波浪破碎等物理過程,并采用二維非定常計(jì)算模式[50-51]。
本預(yù)報系統(tǒng)的同化模塊采用2 種方法:最優(yōu)插值法和WRF 數(shù)據(jù)同化方法(WRF Data Assimilation,簡稱WRFDA)。WRFDA 是由美國國家大氣研究中心(National Center for Atmospheric Research,簡稱NCAR)開發(fā)的WRF 模式系統(tǒng)的組成部分之一。
1.4.1 最優(yōu)插值法
最優(yōu)插值法(Optimal Interpolation,簡稱OI)是一種相對簡單但功能強(qiáng)大的數(shù)據(jù)同化方法。在20 世紀(jì)70和80 年代,世界上大多數(shù)氣象中心都使用最優(yōu)插值法進(jìn)行數(shù)值天氣業(yè)務(wù)預(yù)報。直到最近10 a,才逐漸有從最優(yōu)插值法轉(zhuǎn)向變分方法的過渡。在最優(yōu)插值法中只有空間維度。其命名是因?yàn)樵诶碚撋纤且粋€最小方差估計(jì)方式,而在實(shí)踐中,它永遠(yuǎn)不會是最優(yōu)的,因此又被稱為“統(tǒng)計(jì)插值”技術(shù)。只有當(dāng)我們真正知道錯誤統(tǒng)計(jì)信息時,最優(yōu)插值法才是最優(yōu)的。
數(shù)值天氣預(yù)報的最優(yōu)插值法作為間歇性(0:00、6:00、12:00、18:00UTC)數(shù)據(jù)同化方案應(yīng)用,而不是連續(xù)插入數(shù)據(jù)。觀測結(jié)果以分析時間為中心分為6 h 間隔。估計(jì)值由加權(quán)最小二乘法擬合觀測值和數(shù)值天氣預(yù)報模式預(yù)報提供的背景場所提供。權(quán)重是觀測值和背景場的誤差協(xié)方差矩陣的倒數(shù)。不管分析時間步長如何,取值都使用相同的背景誤差協(xié)方差,所以假設(shè)背景場在所有時間都具有相同的統(tǒng)計(jì)量。這意味著假設(shè)背景誤差是平穩(wěn)的。但在實(shí)際中,背景誤差存在逐月變化。在任意給定時間的同化產(chǎn)品是對格點(diǎn)上每個模式預(yù)報變量的完整分析,然后將其用作預(yù)報模式集成的初始狀態(tài)。
1.4.2 WRFDA
WRFDA 是一個先進(jìn)的數(shù)據(jù)同化系統(tǒng),直接包含在WRF 模式中,可提供三維/四維變分(3D/4D Var)以及變分/集成混合技術(shù)。WRFDA 已經(jīng)被廣泛用于實(shí)際應(yīng)用和科學(xué)研究,被多個國際業(yè)務(wù)數(shù)據(jù)同化系統(tǒng)、業(yè)務(wù)中心、高校和研究機(jī)構(gòu)用于數(shù)據(jù)同化的研究。其具體表達(dá)式:
式中:x表示基于背景預(yù)測xb和觀測值y0的大氣真實(shí)狀態(tài)的最大似然估計(jì);B、O、E分別是背景、觀測值和背景誤差協(xié)方差矩陣,我們在使用時采用的背景誤差協(xié)方差是WRFDA 中的CV5。背景誤差是對觀測算子P中引入的誤差的估計(jì),用于將格點(diǎn)分析值x轉(zhuǎn)換至觀測空間y=P(x)。本預(yù)報系統(tǒng)的數(shù)據(jù)同化部分選用了三維變分方法。模型將來自中國氣象局固定站點(diǎn)和自動氣象站(Automatic Weather Stations,簡稱AWS)的表風(fēng)速、氣溫、相對濕度和壓力的觀測數(shù)據(jù),同化到9 km×9 km 分辨率的WRF 輸入場中。
除了使用以上基于數(shù)值模式的預(yù)報方法,本系統(tǒng)中還加入了智能預(yù)報模塊。相較于數(shù)值模式方法,以深度學(xué)習(xí)為核心的智能預(yù)報方法在預(yù)報效率上更具優(yōu)勢,使用方式也更為靈活。該方法除了可以直接對預(yù)報參數(shù)實(shí)現(xiàn)快速準(zhǔn)確的預(yù)報,還可以將其應(yīng)用于數(shù)值模式輸出結(jié)果實(shí)現(xiàn)預(yù)報訂正,進(jìn)一步優(yōu)化預(yù)報效果。本系統(tǒng)基于ConvLSTM(Convolutional LSTM Network)和TCN-LightGBM 兩種方法分別開展了波浪有效波高預(yù)報[52]和風(fēng)速預(yù)報訂正。
1.5.1 ConvLSTM
ConvLSTM 是從傳統(tǒng)LSTM(Long Short-term Memory)演變而來。LSTM 在時序數(shù)據(jù)問題上已經(jīng)被廣泛應(yīng)用,但是在面對二維數(shù)據(jù)時,若將輸入展開成全連接層處理不僅會耗費(fèi)巨大的計(jì)算資源,并且難以捕獲到二維空間場的空間相關(guān)性以及空間特征?;诖耍琒hi 將LSTM 中的全連接用卷積結(jié)構(gòu)代替,開發(fā)出ConvLSTM 方法[53]。ConvLSTM 與LSTM 的主要區(qū)別是將矩陣乘法換成了卷積操作,具體的表達(dá)式:
卷積操作可以很好地提取數(shù)據(jù)的空間特征,而LSTM 可以很好地提取數(shù)據(jù)的時間相關(guān)性。因此ConvLSTM 同時具備時序建模和刻畫空間特征的能力,適用于像海洋波浪的有效波高等時空相關(guān)性較強(qiáng)的物理量的預(yù)報。
1.5.2 TCN-LightGBM
TCN 算法(Temporal Convolutional Network)可以實(shí)現(xiàn)時間序列的卷積,性能優(yōu)于循環(huán)神經(jīng)網(wǎng)絡(luò)。該算法采用一維卷積網(wǎng)絡(luò),其中包括因果卷積、擴(kuò)張卷積和殘差模塊,曾被應(yīng)用于風(fēng)速預(yù)報。相較于傳統(tǒng)的LSTM 算法,TCN 引入的因果卷積考慮了上下層之間的因果關(guān)系,其使用的殘差連接和擴(kuò)張卷積有效避免了梯度消失和梯度爆炸的問題,具有梯度穩(wěn)定、并行性良好、占用內(nèi)存低和感受靈活等優(yōu)點(diǎn),從而有效提高了預(yù)報的準(zhǔn)確性和預(yù)報精度。
LightGBM 是一種基于梯度提升樹(GBDT)的數(shù)據(jù)模型,可以在占用較少內(nèi)存并提高預(yù)報精度的同時,大幅度提高預(yù)測速度。其采用帶有深度限制的Life-wise 增長策略,而非其他決策樹算法常采用的按層生長策略。Life-wise 策略在所有遍歷葉子中,找到分裂收益最大的葉子節(jié)點(diǎn)進(jìn)行分裂,如此往復(fù)。與其他決策樹按層分裂的策略相比,該策略在相同的分裂次數(shù)下可以獲得更好的精度,能有效減少對收益較低節(jié)點(diǎn)的分裂計(jì)算,從而節(jié)省計(jì)算資源。為防止生成較深的樹,該方法限制了決策樹的最大深度,在保證算法精度的同時,有效防止了過擬合現(xiàn)象的出現(xiàn)。目前LightGBM 算法已經(jīng)被廣泛應(yīng)用于降水的預(yù)報訂正、風(fēng)電功率預(yù)報[37]以及大氣、海洋數(shù)據(jù)重構(gòu)等領(lǐng)域。
為了進(jìn)一步提升算法性能,本系統(tǒng)將TCN 和LightGBM 算法相互結(jié)合,提出基于TCN-LightGBM 算法的風(fēng)速預(yù)報訂正模型,首先使用TCN 算法進(jìn)行風(fēng)速預(yù)報,然后使用LightGBM 算法進(jìn)行訂正,將24 h 內(nèi)的風(fēng)速預(yù)報均方根誤差(RMSE)提升了約20%。
WRF 模式的初始條件和邊界條件由GFS 數(shù)據(jù)[54]提供。GFS 是由美國國家環(huán)境預(yù)報中心(National Centers for Environmental Prediction,簡稱NCEP)提供的天氣預(yù)報模型產(chǎn)品[54]。該數(shù)據(jù)集包含溫度、風(fēng)應(yīng)力、降水、土壤濕度、大氣臭氧濃度等數(shù)十種變量。GFS 的產(chǎn)品數(shù)據(jù)[54]覆蓋全球,平均水平網(wǎng)格的精度為28 km。該數(shù)據(jù)集包含未來16 d 的天氣預(yù)報。
海流預(yù)報模塊每日預(yù)報的初始場來自最近一次更新的HYCOM 當(dāng)日預(yù)報場。初始場中包括該時刻三維溫度場、鹽度場、流場及二維海表面高度場。邊界場同樣來自HYCOM,選取最近一次更新的HYCOM 未來7 d 預(yù)報的溫度場、鹽度場、流場及海表面高度場。為提高下載速度,僅下載以模式邊界為中心,寬度為2°的帶狀區(qū)域,插值制作成時長為7 d 的邊界驅(qū)動場。
CROCO 模式的大氣強(qiáng)迫數(shù)據(jù)來自WRF 模式輸出的結(jié)果,WRF 模式需要輸出的變量:離地面10 m 高度的風(fēng)場,離地面2 m 高度的絕對濕度及溫度、海表面氣壓、向下長短波輻射、反射率、表面溫度、表面輻射率以及降水率。利用以上變量計(jì)算出離地面2 m 高度的氣溫、絕對濕度、降水率、風(fēng)場、凈短波通量及凈長波通量,作為計(jì)算塊體通量所需的變量輸入CROCO 模式中進(jìn)行強(qiáng)迫。
海浪預(yù)報模塊的初始頻譜根據(jù)聯(lián)合北海波浪計(jì)劃(Joint North Sea Wave Project,簡稱JONSWAP)譜和當(dāng)?shù)仫L(fēng)速計(jì)算得到,初始場采用熱啟動。計(jì)算區(qū)域的邊界有陸地或水邊界,陸地邊界不會產(chǎn)生波,將入射波的能量吸收;水邊界條件可以根據(jù)現(xiàn)場觀測,也可以通過其他波浪模型模擬得到。通常水邊界只有1 個或2 個迎浪邊界,迎浪邊界條件可以較準(zhǔn)確地確定,但是橫向邊界條件比較難確定。模式假定沒有波浪從該邊傳入計(jì)算區(qū)域,但波浪能通過橫向邊界自由離開計(jì)算區(qū)域,此假定模型計(jì)算水域存在一定誤差,因此橫向邊界的選擇應(yīng)該距離研究水域足夠遠(yuǎn),才能保證模擬結(jié)果的準(zhǔn)確度。模式的水邊界采用太平洋島嶼海洋觀測系統(tǒng)(Pacific Islands Ocean Observing System,簡稱PacIOOS)提供的WAVEWATCH III(WW III)模式計(jì)算的波浪參數(shù)[55],包括混合浪的有效波高、平均波向和平均波周期,該模式的時間分辨率為1 h,空間分辨率為0.5°×0.5°。
該預(yù)報系統(tǒng)的潮汐模塊設(shè)置3 個潮汐開邊界條件,分別為東邊界、南邊界和北邊界,采用模擬區(qū)域內(nèi)潮汐數(shù)據(jù)8 大分潮的潮位和潮流調(diào)和常數(shù)值作為開邊界驅(qū)動系統(tǒng)模擬。該系統(tǒng)采用的潮汐數(shù)據(jù)為TPXO8 數(shù)據(jù)集,該數(shù)據(jù)集包含8 個主要分潮(M2、S2、N2、K2、K1、O1、P1、Q1)、2 個較長周期分潮(Mf和Mm)以及3 個淺水分潮(M4、MS4和MN4)的潮位、潮流等數(shù)據(jù)信息[44]。
本預(yù)報系統(tǒng)中將最新發(fā)表的一些湍流參數(shù)化方案應(yīng)用至預(yù)報系統(tǒng),從而提高預(yù)報的準(zhǔn)確率,這是本預(yù)報系統(tǒng)的一個關(guān)鍵技術(shù)。目前添加到這個預(yù)報系統(tǒng)中的這些參數(shù)化方案是由南京信息工程大學(xué)海洋數(shù)值模擬與觀測實(shí)驗(yàn)室研發(fā)的。這些參數(shù)化方案的驗(yàn)證結(jié)果表明它們對模式結(jié)果的影響是顯著的。浪致混合作用可加深上邊界層混合,通過對比有、無浪致混合參數(shù)化方案的模擬結(jié)果,我們發(fā)現(xiàn)夏季浪致混合作用可改善溫度模擬的偏高現(xiàn)象,冬季浪致混合作用可改善混合層模擬的偏淺現(xiàn)象,加入波浪影響參數(shù)化方案的模擬效果好于未考慮的[56-57]。對稱不穩(wěn)定的參數(shù)化改善了模型對海洋混合層模擬偏深的問題,提高了模型對海洋混合層模擬的準(zhǔn)確性[58]。
1.7.1 浪致混合
海洋波浪對海洋物理過程的主要影響之一是浪致垂向混合。浪致混合過程可以通過參數(shù)化方案來實(shí)現(xiàn)??紤]波浪誘導(dǎo)的朗繆爾環(huán)流對上邊界層混合的影響,被稱為海浪間接作用參數(shù)化方案。
利用大渦模擬方法[56-57]模擬朗繆爾環(huán)流,對浪致擴(kuò)散進(jìn)行無量綱分析,考慮波浪破碎的影響,對模式數(shù)據(jù)結(jié)果進(jìn)行擬合計(jì)算,提出由浪致混合引起的浪致擴(kuò)散函數(shù)[57]:
式中Kd表 示與深度z、邊界層深度hb、海表面摩擦速度u*以 及表層平均朗繆爾湍流數(shù)LaSL有關(guān)的由波浪作用引起的擴(kuò)散函數(shù)。其中變量A和B控制Kd擴(kuò)散曲線的彎曲度。平均朗繆爾數(shù)與邊界層深度、海表面摩擦速度以及斯托克斯漂流有關(guān),在研究中變量A和B可定義為與平均朗繆爾數(shù)有關(guān)的函數(shù),Wang 等[57]通過一系列實(shí)驗(yàn)對變量A和B擬合得到:
將波浪的影響直接疊加到原來的KPP 參數(shù)化方案的基礎(chǔ)上,有效地增大了渦擴(kuò)散系數(shù)。
1.7.2 亞中尺度
對稱不穩(wěn)定不但對全球海洋能量級串的平衡起著重要的作用,還影響大氣對海洋的動量輸入、海洋上混合層的動力學(xué)和熱力學(xué)結(jié)構(gòu)。因此,對稱不穩(wěn)定的參數(shù)化是海洋模式發(fā)展和優(yōu)化必須考慮的問題。
基于準(zhǔn)地轉(zhuǎn)理論,對稱不穩(wěn)定的發(fā)生要求海洋中的位勢渦度(Potential Vorticity,q)與背景場的行星渦度(f)符號相反[59],即fq<0,對于滿足熱成風(fēng)關(guān)系的流場,如鋒面處,總是傾向于使得fq<0,以便有利于對稱不穩(wěn)定的發(fā)生。當(dāng)上混合層內(nèi)存在鋒面時,對流過程和對稱不穩(wěn)定的相互作用最終會將上混合層(其厚度記為Hm)分為2 個部分:接近表層由對流過程主導(dǎo)的部分,其厚度記為h?;诖?,對稱不穩(wěn)定的能量轉(zhuǎn)化率(Geostrophic shear production,簡稱GSP)參數(shù)化表達(dá)[60]:
式中:FSI=EBF+B0,而EBF=為表層Ekman 輸運(yùn)引起的浮性通量;為表層增降溫或者蒸發(fā)降水導(dǎo)致的浮性通量,g表示重力加速度常量,α表示海水的熱膨脹系數(shù),Qnh為表層凈熱通量,Cp為海水定壓比熱容,β 表示海水的鹽收縮系數(shù),EP表示淡水凈通量(Qnh或EP為正值時海水失去浮性),S表示海水的鹽度?;谏鲜鲛D(zhuǎn)化率便可得到對稱不穩(wěn)定誘導(dǎo)的黏性系數(shù)和擴(kuò)散系數(shù),代入相關(guān)的動量控制方程,便可實(shí)現(xiàn)對稱不穩(wěn)定過程的參數(shù)化。區(qū)域海洋模型和全球海洋模式的模擬結(jié)果表明,該參數(shù)化方案可以很好地將對稱不穩(wěn)定的影響引入到模型結(jié)果中,并提升模式的模擬效果[58,61-62]。
1.7.3 渦旋誘導(dǎo)的沿等密度面和跨等密度面混合
中尺度渦旋占海洋全球海洋表面的25%~ 30%[63],并且包含了大約90%的海洋總動能[64],因此其在海洋能量串級中發(fā)揮著至關(guān)重要的作用。數(shù)值模式發(fā)展的早期,受制于計(jì)算機(jī)能力的限制,中尺度渦旋曾經(jīng)是氣候模式參數(shù)化的核心內(nèi)容之一。但是隨著模式分辨率的逐步提高,渦旋分辨已經(jīng)在眾多的氣候模式中實(shí)現(xiàn)。中尺度渦旋誘導(dǎo)的雙重混合(即沿等密度面與跨等密度面的混合)成為了當(dāng)前模式參數(shù)化必須解決的前沿科學(xué)問題之一。
“通量梯度關(guān)系”中的渦旋輸運(yùn)張量是連接次網(wǎng)格湍流通量與模式已分辨尺度物理量梯度之間的橋梁。采用由Bachman[65]提出的示蹤物偽逆方法,對理想中尺度渦旋誘導(dǎo)的雙重混合現(xiàn)象進(jìn)行高分辨率的模擬分析(水平分辨率500 m),Sun 和Dong[66]提出了中尺度渦旋誘導(dǎo)的雙重混合參數(shù)化。該參數(shù)化方案將渦旋輸運(yùn)張量T表達(dá)為層化強(qiáng)度、渦旋垂向深度(He)、水平鋒面強(qiáng)度科氏參數(shù)(f)以及瑞查德森數(shù)(Ri)的函數(shù)。其中,g、ρ、b分別表示重力加速度常量、海水的密度和浮性。渦旋輸運(yùn)張量T在笛卡爾直角坐標(biāo)系中具體的表達(dá)式:
其相應(yīng)的在等密度層坐標(biāo)中的表達(dá)形式可以借助坐標(biāo)轉(zhuǎn)換矩陣予以實(shí)現(xiàn)。將上述雙重混合參數(shù)化方案代入相關(guān)的動量和示蹤物粒子的控制方程,便可實(shí)現(xiàn)在渦分辨的模式中對渦旋誘導(dǎo)的雙重混合過程的參數(shù)化。
1.7.4 海山誘導(dǎo)混合
海山等復(fù)雜海底地形在海洋混合中往往具有重要的作用和意義。由于全球模式受計(jì)算資源的限制,網(wǎng)格分辨率偏低,不足以分辨出海山地形,導(dǎo)致海山誘導(dǎo)的部分垂向混合被忽略。海底地形誘導(dǎo)混合參數(shù)化方案的應(yīng)用有利于引入這部分被忽略的物理過程,從而改進(jìn)模式對全球混合的模擬能力。
通過海底地形粗糙度tr代替海底地形起伏變化,海底地形粗糙度的計(jì)算公式:
式中:hi是 對應(yīng)格點(diǎn)的地形高度;是 1°×1°網(wǎng)格區(qū)域內(nèi)地形高度的均值;N是1°×1°網(wǎng)格區(qū)域內(nèi)對應(yīng)格點(diǎn)數(shù)。地形粗糙度與海洋混合之間存在很好的相關(guān)關(guān)系[67]。利用Argo 浮標(biāo)資料,結(jié)合全球海底地形粗糙度,擬合得出經(jīng)驗(yàn)性的基于地形粗糙度的全球背景混合系數(shù)k的關(guān)系式:
混合強(qiáng)度受海水與海底地形之間距離的影響,因此全球背景混合系數(shù)滿足垂直結(jié)構(gòu)函數(shù)F(x,y,z)[68-69]:
式中:H(x,y)為 水面到海底的距離;z為 水深;ζ 為垂直衰減尺度,文中取水深800 m;C0根據(jù)海洋上層2 000 m 范圍內(nèi)的混合系數(shù)數(shù)值取為2×105。
復(fù)雜海底地形誘導(dǎo)的混合可表達(dá)[70]:
2.1.1 風(fēng)速觀測數(shù)據(jù)
風(fēng)速觀測數(shù)據(jù)由位于江蘇省如東市八仙角海上風(fēng)電場的風(fēng)機(jī)電組測得,該數(shù)據(jù)為100 m 高度的風(fēng)速,時間分辨率為15 min。風(fēng)機(jī)(121°15′00″E,32°45′00″N)測得的數(shù)據(jù)覆蓋的時間段較長,因此選取該點(diǎn)數(shù)據(jù)驗(yàn)證預(yù)報風(fēng)場的準(zhǔn)確性。
2.1.2 全球預(yù)報系統(tǒng)預(yù)報數(shù)據(jù)(Global Forecast System forecast,簡稱GFS 預(yù)報數(shù)據(jù))
GFS 是由美國國家環(huán)境預(yù)報中心(NCEP)提供的全球數(shù)值天氣預(yù)報系統(tǒng)。該系統(tǒng)使用有限體積立方球動力核心和全球數(shù)據(jù)同化系統(tǒng)(Global Data Assimilation System,簡稱GDAS),通過耦合4 個單獨(dú)的模式(大氣模式、海洋模式、陸地/土壤模式以及海冰模式)提供大氣、土壤等變量的數(shù)據(jù)。該系統(tǒng)每天提供4 個時次的預(yù)報,分別為0:00、6:00、12:00、18:00UTC,其預(yù)報時效為16 d(第1 天~第5 天每小時提供一次數(shù)據(jù),第6 天~第16 天每3 h 提供一次數(shù)據(jù))。該系統(tǒng)的空間分辨率為0.25°×0.25°,垂向?yàn)?27 層。該數(shù)據(jù)被用作大氣模式的初始條件和邊界條件[54]。
2.1.3 全球預(yù)報系統(tǒng)再分析數(shù)據(jù)(Global Forecast System reanalysis,簡稱GFS 再分析數(shù)據(jù))
我們使用GFS 再分析數(shù)據(jù)中離地面100 m 高度的風(fēng)場[71]驗(yàn)證大氣模式的輸出結(jié)果。與GFS 預(yù)報數(shù)據(jù)相比,GFS 再分析數(shù)據(jù)將更多的觀測數(shù)據(jù)同化進(jìn)結(jié)果,同時基于觀測數(shù)據(jù)對預(yù)報結(jié)果進(jìn)行訂正。GFS 再分析數(shù)據(jù)的水平分辨率為0.25°×0.25°和時間分辨率為6 h。為方便比較,使用雙線性插值方法將GFS 再分析數(shù)據(jù)插值到與WRF 輸出相同的分辨率。
預(yù)報系統(tǒng)從下載3 個模型的初始和邊界條件所需的數(shù)據(jù)開始,直到結(jié)果的后處理和在WebGIS 中展示的完全實(shí)現(xiàn)自動化運(yùn)行。在每天的預(yù)報流程中,首先通過Linux 的crontab 模塊啟動GFS 和HYCOM 數(shù)據(jù)的下載;當(dāng)數(shù)據(jù)下載完成后,通過WRF、CROCO 和SWAN 模式得出連續(xù)7 d 的大氣、海洋和波浪的預(yù)報數(shù)據(jù);最后在WebGIS 系統(tǒng)上展示預(yù)報結(jié)果。
在WRF 模式中,首先通過預(yù)處理系統(tǒng)WPS 和real 模塊對數(shù)據(jù)進(jìn)行預(yù)處理,然后運(yùn)行較粗分辨率(9 km×9 km)的WRF 模式。在本預(yù)報系統(tǒng)中,通過使用ndown 模塊來生成較高分辨率(1 km×1 km)模式區(qū)域的初始和邊界條件,并進(jìn)行離線嵌套。WRF 的輸出數(shù)據(jù)會被用作CROCO 和SWAN 模式所需的強(qiáng)迫場,這些數(shù)據(jù)也會從WRF 模式的輸出中自動抓取。此外在CROCO 模式中,還會自動提取HYCOM 預(yù)報數(shù)據(jù)制作模式的初始和邊界場。3 個模式運(yùn)行后,所需的輸出變量都會經(jīng)過自動化的后處理被保存為netCDF 格式,供WebGIS 調(diào)用展示。最后在WebGIS 系統(tǒng)上會展示所需的各模式輸出變量,用戶可以選擇預(yù)報日期和時間,也可以查看任一變量在任一坐標(biāo)點(diǎn)上的時間序列。
3.1.1 模式與同化結(jié)果
不同預(yù)報時間長度的相關(guān)系數(shù)表明,數(shù)據(jù)同化提高了短期預(yù)報的準(zhǔn)確性。實(shí)例證明,預(yù)報時長1 d 與觀測數(shù)據(jù)之間的相關(guān)性從-0.070 增加至0.586。比較RMSE 也可以發(fā)現(xiàn)誤差從6.439 降低至3.498。3、5、7 d的預(yù)報準(zhǔn)確度也有所提高(表1)。但較長預(yù)報時長(5 d 和7 d)的相關(guān)系數(shù)和RMSE 表明,數(shù)據(jù)同化對結(jié)果的改進(jìn)并沒有顯著影響。數(shù)據(jù)同化的局限性之一是所使用的觀測數(shù)據(jù)缺乏,同化更多類型的觀測數(shù)據(jù)(如高層大氣數(shù)據(jù)、衛(wèi)星數(shù)據(jù)、雷達(dá)數(shù)據(jù)等)可以進(jìn)一步提高較長時間的預(yù)報準(zhǔn)確性。
表1 WRF 模擬江蘇省如東市八仙角海上風(fēng)電場(121°15′00″E,32°45′00″N)100 m 高度風(fēng)速的相關(guān)系數(shù)與RMSE(m·s-1)的原始和數(shù)據(jù)同化對比Table 1 Comparison of WRF-simulated 100-m wind speed correlation and RMSE(m·s-1)between the original and data assimilated data for the Baxianjiao Offshore Windfarm(121°15′00″E,32°45′00″N),Rudong City,Jiangsu Province
預(yù)報風(fēng)場的空間分布與GFS 再分析數(shù)據(jù)提供的空間分布非常一致(圖3)。第1 天的預(yù)報結(jié)果顯示,臺風(fēng)在2 個產(chǎn)品中的位置幾乎相似。輸出的空間分辨率更高,預(yù)測結(jié)果呈現(xiàn)更多細(xì)節(jié)(尤其是在陸地上)。在第3 天預(yù)報結(jié)果中,陸地上風(fēng)速略大于再分析數(shù)據(jù)。第5 天和第7 天時長的預(yù)報表明,隨著預(yù)報時長的增加,預(yù)報和再分析結(jié)果的空間分布之間的差異也隨之增加。例如,再分析數(shù)據(jù)中沒有觀察到預(yù)報數(shù)據(jù)中菲律賓東部第5 天和第7 天的臺風(fēng)。
圖3 100 m 高度風(fēng)場WRF 和GFS 再分析數(shù)據(jù)的比較(預(yù)報輸出時間:2021-10-12)Fig.3 Comparison of WRF-simulated and GFS reanalysis data 100-m wind field(forecast output time: 2021-10-12)
模式預(yù)報的準(zhǔn)確性與預(yù)報時長有關(guān)。2020-11-16—2021-10-24 的預(yù)測準(zhǔn)確度,隨著預(yù)報時長的增加,結(jié)果的準(zhǔn)確度隨之下降(圖4)。
圖4 2020-11-16—2021-10-24 江蘇省如東市八仙角海上風(fēng)電場(121°15′00″E,32°45′00″N)100 m 高度風(fēng)速的觀測與預(yù)報的相關(guān)系數(shù)與RMSEFig.4 100-m wind speed correlation and RMSE between observations and forecasts for the Baxianjiao Offshore Wind Farm(121°15′00″E,32°45′00″N),Rudong City,Jiangsu Province from 2020-11-16 to 2021-10-24
1 d 的預(yù)報中,大部分結(jié)果的相關(guān)系數(shù)在0.6~0.9。隨著預(yù)報時長的增加,峰值天數(shù)開始轉(zhuǎn)向較低的相關(guān)系數(shù),3 d 預(yù)報的相關(guān)系數(shù)為0.6~0.8,5 d 預(yù)報的相關(guān)系數(shù)為0.5~0.6,7 d 預(yù)報的相關(guān)系數(shù)為0.4~0.6。RMSE 也展現(xiàn)了相似的結(jié)果。1 d 的預(yù)報結(jié)果,最大值集中在2.0~2.5 m/s。隨著預(yù)報時長的增加,RMSE 也會增加,7 d 的預(yù)報結(jié)果中的最大值可以達(dá)到3.5 m/s。
3.1.2 智能預(yù)報結(jié)果
基于TCN-LightGBM 的風(fēng)速智能預(yù)報訂正模型在八仙角的預(yù)報效果(圖5),最大的預(yù)報步長為96,時間分辨率為15 min。圖5a 中兩種預(yù)報模型RMSE 隨預(yù)報時間步長的變化表明隨著預(yù)報步長的增加,RMSE相應(yīng)增加,預(yù)報時長為12 h 后誤差變化不明顯。同時通過對比可知,LightGBM 算法的引入可以有效地降低RMSE(圖5a)。圖5b 更為直觀、準(zhǔn)確地展示了LightGBM 算法的引入后RMSE 的降低率,加入LightGBM訂正模塊后RMSE 最大降低率約為27%(圖5b)。
圖5 江蘇省如東市八仙角海上風(fēng)電場測試集預(yù)報結(jié)果Fig.5 Forecast results of the Baxianjiao Offshore Wind Farm test set in Rudong City,Jiangsu Province
3.2.1 模式驗(yàn)證
用于CROCO 模式驗(yàn)證的數(shù)據(jù)采用REMSS(Remote Sensing System)的SST(海表面溫度)數(shù)據(jù)[72]、SMAP衛(wèi)星提供的SSS(海表面鹽度數(shù)據(jù))[73]、AVISO 提供的絕對動力高度(Absolute dynamic topography,ADT)場數(shù)據(jù)[74]、GDP(Global Drifter Program)的海表流場數(shù)據(jù)[75]以及UHSLC(University of Hawaii Sea Level Center)提供的13 個驗(yàn)潮站水位數(shù)據(jù)[76]。其中,REMSS 使用最優(yōu)插值法融合了微波以及紅外測量的SST,格點(diǎn)SST 數(shù)據(jù)的水平分辨率為9 km。SMAP 3 級月平均數(shù)據(jù)集的空間水平分辨率為0.25°,數(shù)據(jù)時間跨度為2015 年4 月至2020 年12 月。AVISO 的網(wǎng)格分辨率為0.25°×0.25°,時間分辨率為1 d,時間跨度為1993 年至2020 年。ADT不能直接與海表面高度相比較,需要將其減去其時間平均,模式的SSH 同樣減去其時間平均,得到的海表面高度的異常場(SSHA)具有可比性。GDP 的海表面流場由1979 年至2015 年布放在世界大洋中的大量浮標(biāo)軌跡得來,其氣候態(tài)月平均的流場水平分辨率為0.25°。
模式結(jié)果的東海區(qū)域季節(jié)平均SST 分布與REMSS 的季節(jié)平均SST 分布基本相同,僅存在一些局部的差異且主要集中在沿岸(圖6)。春季模式結(jié)果中黑潮的高溫結(jié)構(gòu)相比REMSS 更加明顯,蘇北沿岸SST 略高于REMSS 的結(jié)果。夏季模式結(jié)果中半封閉海盆的沿岸SST 高于REMSS 結(jié)果。秋季二者的SST 分布幾乎一致。冬季渤海沿岸模式結(jié)果的SST 低于REMSS 結(jié)果,黃海的暖舌結(jié)構(gòu)以及黑潮高溫結(jié)構(gòu)也更加明顯。
圖6 模式模擬與REMSS 觀測的季節(jié)平均SSTFig.6 Seasonal averages of modeled and REMSS SST
模式結(jié)果中東海區(qū)域的季節(jié)平均SSS 的分布與觀測值大體相似(圖7),觀測數(shù)據(jù)在近岸有缺失情況,如渤海近岸。黃渤海SSS 的模式結(jié)果比SMAP 衛(wèi)星的略高0.5~1.0;在東海長江沖淡水區(qū)域存在較明顯的差異。夏季長江沖淡水發(fā)展最為旺盛,沿蘇北沿岸北上,導(dǎo)致SSS 明顯低于其他季節(jié);冬季長江沖淡水的發(fā)展最弱;而春季和秋季分布形態(tài)類似。
圖7 模式模擬與SMAP 觀測的季節(jié)平均SSSFig.7 Seasonal averages of modeled and SMAP SSS
模式得到東海區(qū)域的SSHA 分布形態(tài)與AVISO 結(jié)果基本一致(圖8)。模式結(jié)果中的SSHA 在4 個季節(jié)均能體現(xiàn)出黑潮的流態(tài)。此外,SSHA 的渤海區(qū)域模式結(jié)果在夏季和冬季分別呈現(xiàn)出較大的正值和負(fù)值,高于AVISO 的結(jié)果。
圖8 模式模擬與AVISO 觀測的季節(jié)平均SSHAFig.8 Seasonal averages of modeled and AVISO SSHA
模式結(jié)果中東海區(qū)域季節(jié)平均的表面環(huán)流形態(tài)大體上與GDP 結(jié)果一致(圖9)。模式結(jié)果中黑潮的路徑與流幅和GDP 數(shù)據(jù)中一致;流速稍大,模式模擬的黑潮主軸流速在夏季可達(dá)到1.5 m/s,冬季約為1.1 m/s。同樣在夏秋季節(jié),模式結(jié)果中對馬暖流流速較強(qiáng),春冬季節(jié)稍弱。由于觀測資料限制,如GDP 未給出中國近岸的流場,但模式結(jié)果中能反映出長江沖淡水以及浙閩沿岸流。
圖9 模式模擬與GDP 觀測的季節(jié)平均海表流場Fig.9 Seasonal averages of modeled and GDP surface current fields
選取時長為1 a 的逐小時潮位數(shù)據(jù)進(jìn)行調(diào)和分析,用來計(jì)算潮位調(diào)和常數(shù)的觀測值。模式模擬結(jié)果同樣取時長為1 a 的逐小時SSH 數(shù)據(jù)進(jìn)行調(diào)和分析,用來計(jì)算潮位調(diào)和常數(shù)。對比的分潮為4 大分潮(M2、K1、O1和S2)。圖10 顯示了2002 年6 月至8 月4 個驗(yàn)潮站(濱田站、石垣站、那霸站和奄美站)的地理位置、逐小時水位時間序列觀測結(jié)果和模式結(jié)果。結(jié)果表明,模式模擬的水位時間序列與觀測結(jié)果的相關(guān)性均高于0.9,且均方根誤差均未超過0.12 m,即模擬的效果較好。圖11 為4 大主要分潮的振幅-相位散點(diǎn)模式結(jié)果和觀測結(jié)果圖。結(jié)果表明,多數(shù)驗(yàn)潮站的分潮振幅均與觀測振幅相近,部分驗(yàn)潮站的M2分潮振幅差異稍大,但均未超過10%(振幅差異/振幅)。與觀測相位對比,大部分驗(yàn)潮站的分潮相位差異都小于15°。其中模式結(jié)果與觀測結(jié)果相比,僅有2 個驗(yàn)潮站相位差異較大(未超過50°)。
圖10 2002 年6 月至8 月濱田站、石垣站、那霸站和奄美站UHSLC 觀測與模式模擬的SSHA 對比Fig.10 SSHA comparison of UHSLC and model results at Hamada,Ishigaki,Naha and Naze tide stations from June to August 2002
圖11 13 個驗(yàn)潮站的模式與UHSLC 的潮汐調(diào)和分析結(jié)果散點(diǎn)圖Fig.11 Scatter plot of the 13 tide stations tidal harmonic analysis from UHSLC and model results
3.2.2 結(jié)果分析
2021-10-12 的CROCO 日平均預(yù)報海表流場和SST 見圖12。日平均流場結(jié)果顯示,黃渤海半封閉海盆內(nèi)的流速度較小,基本不超過0.25 m/s;而其他開闊海域的流速較大,基本都超過了0.25 m/s。在黃海有一支較明顯的自北向南流,流速約為0.2 m/s,在33°N 附近與從濟(jì)州島分離出來的支流相遇。在東海存在臺灣暖流、對馬暖流以及黑潮這三支主要海流。秋季臺灣暖流很弱,流速約為0.2 m/s。對馬暖流流速可達(dá)0.4 m/s,在島嶼后方由于地形作用產(chǎn)生急流,流速甚至能超過0.5 m/s。黑潮基本沿陸架邊緣流動,主軸流速約1 m/s。此外,黑潮南部存在許多從太平洋傳入的直徑上百千米的中尺度渦旋,部分渦旋邊緣的流速能超過0.5 m/s。
圖12 2021-10-12 的CROCO 預(yù)報場日平均海表流場與SST 分布Fig.12 CROCO averaged modeled current field and SST on October 12,2021
日平均SST 基本呈現(xiàn)南高北低的分布,溫度跨度可達(dá)8 ℃。最低溫度出現(xiàn)在渤海沿岸地區(qū),可達(dá)16 ℃。黃海溫度約為22 ℃,應(yīng)是自北向南的海流將渤海的冷水帶入黃海。東海的SST 基本高于24 ℃,應(yīng)是黑潮的支流將高溫水帶入東海以及對馬海峽。此外,黑潮南部的SST 場也存在和中尺度渦相匹配的SST 結(jié)構(gòu)。
3.3.1 海浪模式
海浪模式結(jié)果的評估結(jié)合了江蘇近海海域的浮標(biāo)、日本氣象廳(Japan Meteorological Agency,簡稱JMA)海洋數(shù)據(jù)浮標(biāo)和歐洲中期天氣預(yù)報中心(European Centre for Medium-Range Weather Forecasts,簡稱 ECMWF)提供的波浪再分析產(chǎn)品。在95%置信水平下進(jìn)行測試,模擬與ERA5(ECMWF reanalysis V5)中期數(shù)據(jù)[77]具有高度的正相關(guān)。JMA 的浮標(biāo)22001 位于黑潮流軸(126°19′48″E,28°10′12″N)附近,該位置的水深為175 m。將觀測到的有效波高數(shù)據(jù)與模擬結(jié)果進(jìn)行比較,發(fā)現(xiàn)模式數(shù)據(jù)與浮標(biāo)數(shù)據(jù)的時間序列變化趨勢一致,1 月模式輸出的有效波高與浮標(biāo)實(shí)測的有效波高的相關(guān)系數(shù)為0.90,7 月為0.93。均方根誤差在1 月為0.48 m,7 月為0.27 m,表明模擬結(jié)果很好地再現(xiàn)了觀測到的波浪,具體的比較結(jié)果詳見Wang 等2020 年的研究[51]。此外,徐瑾等[50]利用該模式模擬江蘇近海的波浪與浮標(biāo)觀測的波浪結(jié)果相近,證明了模式模擬的高分辨率江蘇近海海浪場結(jié)果是可靠的。
2022-07-01 預(yù)報的2022-07-02T0:00 的結(jié)果見圖13,在南海海域受臺風(fēng)影響海浪場的有效波高(圖13a)最大值超過8 m,分布在臺風(fēng)眼的右側(cè)海域。同時臺風(fēng)對該海域的涌浪場影響也非常顯著(圖13b),最大值達(dá)到8 m,涌浪的大值區(qū)集中于風(fēng)眼的右側(cè)海域。該預(yù)報時刻的海浪周期空間分布顯示,在南海海域受臺風(fēng)影響海浪周期值相對其他海域較大,最大值達(dá)到11.5 s,此外海浪周期在外海海域要大于近岸海域的。我們用同時刻ECMWF 提供的ERA5 再分析的海浪場結(jié)果[77]對預(yù)報模式進(jìn)行驗(yàn)證,對比分析表明,預(yù)報的結(jié)果與再分析海浪場空間分布特征相似,在臺風(fēng)過境海域有效波高、涌浪浪高和波浪周期比再分析數(shù)據(jù)大,這主要受到模式的驅(qū)動風(fēng)場和模式分辨率的影響。
圖13 預(yù)報的2022-07-02T0:00 的海浪場(預(yù)報輸出時間:2022-07-01)與ERA5 再分析海浪場的對比Fig.13 Comparison of modeled wave field and ERA5 reanalysis wave field at 2022-07-02T0:00(the forecast output time: 2022-07-01)
3.3.2 海浪智能預(yù)報
除使用傳統(tǒng)的動力驅(qū)動海洋數(shù)值模式的方法外,我們積累并開發(fā)了基于深度學(xué)習(xí)的海浪智能預(yù)報系統(tǒng)。在實(shí)際預(yù)報應(yīng)用中,這些深度學(xué)習(xí)方法由于不需要進(jìn)行差分迭代求解,僅通過調(diào)用訓(xùn)練好的模型即可實(shí)現(xiàn)端到端的智能預(yù)報,大大增加預(yù)報頻率和預(yù)報的及時響應(yīng)性,以及應(yīng)對突發(fā)事件時對快速預(yù)報的需求?;谏疃葘W(xué)習(xí)的海浪智能預(yù)報系統(tǒng)相較于傳統(tǒng)的數(shù)值模式具有更好的可擴(kuò)展性,可以通過遷移學(xué)習(xí)不斷更新預(yù)報模型,更好地應(yīng)對目前全球變暖背景下天氣突變事件增加。
我們正擬將具備時空特征提取能力的深度學(xué)習(xí)算法,如ConvLSTM 算法[53]和基于注意力機(jī)制的卷積LSTM 網(wǎng)絡(luò)[78],運(yùn)用到海浪的有效波高預(yù)報中;將EMD(Empirical Mode Decomposition)模型[79]引入單點(diǎn)海浪預(yù)報模型,有效提高單點(diǎn)海浪有效波高預(yù)報的準(zhǔn)確性。這些模型在針對海浪有效波高的臨近或短時預(yù)報中可以媲美數(shù)值模式,并且耗費(fèi)的計(jì)算資源更少。雖然在本預(yù)報系統(tǒng)中尚未將這些方法納入并驗(yàn)證,但可以預(yù)見這些將是本系統(tǒng)未來進(jìn)一步優(yōu)化和擴(kuò)展的方向之一。
在業(yè)務(wù)化預(yù)報過程中,每天預(yù)報系統(tǒng)都會產(chǎn)出大量的預(yù)報結(jié)果。為了能更方便直觀地查看這些預(yù)報結(jié)果,我們還配套開發(fā)了自動展示系統(tǒng)。該系統(tǒng)每天自動接收預(yù)報產(chǎn)出的數(shù)據(jù),并通過網(wǎng)頁端展示。用戶可以在網(wǎng)頁端選擇每天新生成的或歷史預(yù)報文件,查詢預(yù)報目標(biāo)時刻的各種預(yù)報要素。后臺服務(wù)器會根據(jù)用戶的實(shí)際選取,實(shí)時繪圖并展示在頁面上。
自主研發(fā)的自動展示系統(tǒng)基于Python 語言,由多個第三方開源工具庫進(jìn)行搭建,主要包括分別用于數(shù)據(jù)讀取和網(wǎng)頁構(gòu)建的netCDF 和Dash。netCDF 讀取模式輸出的數(shù)據(jù),通過設(shè)置輸入的日期變量實(shí)現(xiàn)實(shí)時讀取不同日期的數(shù)據(jù),包括每日新增的和歷史生成的數(shù)據(jù)。這一日期并不是直接在程序中輸入,而是默認(rèn)賦予了當(dāng)天的日期作為變量值,通過改變網(wǎng)頁端的日期選擇框?qū)ash 部件的功能傳入到程序中。Dash 作為構(gòu)建網(wǎng)頁應(yīng)用程序的高效Python 框架,使用純Python 實(shí)現(xiàn)高度自定義用戶界面,并構(gòu)建數(shù)據(jù)可視化應(yīng)用程序。
基于這一框架,我們將應(yīng)用程序部署到服務(wù)器,通過URL 實(shí)現(xiàn)共享。當(dāng)用戶通過URL 訪問到該網(wǎng)頁界面,用戶的操作傳遞請求到服務(wù)器端,服務(wù)器根據(jù)這些請求迅速做出相應(yīng)的數(shù)據(jù)選擇和繪圖。在服務(wù)器端使用Supervisord 進(jìn)行監(jiān)管,實(shí)現(xiàn)無人值守式地保護(hù)頁面進(jìn)程并每日自動更新程序。Supervisord 將自動展示系統(tǒng)進(jìn)程作為其子進(jìn)程啟動,實(shí)時檢測進(jìn)程情況并可以在其意外崩潰時自動重新啟動。另外通過配置,Supervisord 可以每日自動更新進(jìn)程,使得最新的數(shù)據(jù)和日期時刻顯示在頁面上。
自動展示系統(tǒng)的實(shí)時全景展示效果見圖14~圖16(分別為風(fēng)速、流速和浪高)。各圖左側(cè)是該系統(tǒng)的導(dǎo)航欄,按照預(yù)報系統(tǒng)中的各個模式進(jìn)行分類導(dǎo)航,用戶可以在導(dǎo)航欄中選取想要查看的模式及模式中的預(yù)報變量。各圖右側(cè)從上往下分別是預(yù)報文件、預(yù)報目標(biāo)日期、預(yù)報目標(biāo)時刻(小區(qū)域的預(yù)報目標(biāo)時刻可選擇分鐘)以及預(yù)報變量的選擇。在打開頁面時,頁面會默認(rèn)選擇最新預(yù)報文件的當(dāng)天8:00 的數(shù)據(jù)進(jìn)行展示,中間區(qū)域的大圖為大區(qū)域的預(yù)報結(jié)果,4 個小圖窗分別展示的是4 個小區(qū)域的結(jié)果??赏ㄟ^顏色條比對查看數(shù)據(jù)分布情況,還可將鼠標(biāo)光標(biāo)懸停在彩圖上,光標(biāo)位置會給出該點(diǎn)對應(yīng)的經(jīng)緯度和對應(yīng)數(shù)據(jù)的數(shù)值。與此同時,該點(diǎn)未來的預(yù)報數(shù)值會被抽取形成時間序列并在界面右下側(cè)繪制。
圖14 風(fēng)速的自動展示系統(tǒng)效果圖(單位:m·s-1)Fig.14 Snapshot of the wind of the automated display system(unit: m·s-1)
圖15 流速的自動展示系統(tǒng)效果圖(單位:m·s-1)Fig.15 Snapshot of the current speed of the automated display system(unit: m·s-1)
圖16 浪高的自動展示系統(tǒng)效果圖(單位:m)Fig.16 Snapshot of the wave height of the automated display system(unit: m)
為了滿足人們對中國邊緣海海洋動力環(huán)境信息日益增長的需求,基于南京信息工程大學(xué)海洋數(shù)值模擬實(shí)驗(yàn)室的參數(shù)化研究成果,結(jié)合中尺度大氣數(shù)值預(yù)報模式WRF、海浪數(shù)值預(yù)報模式SWAN、海流數(shù)值預(yù)報模式CROCO、潮汐模式NAOTIDE 進(jìn)行數(shù)據(jù)交換耦合,引入同化模塊和人工智能技術(shù),建立了高分辨率的風(fēng)-浪-流耦合同化精細(xì)化數(shù)值預(yù)報模式,并搭建了中國邊緣海海洋動力環(huán)境可視化預(yù)報系統(tǒng)。海洋預(yù)報的發(fā)展離不開物理海洋理論基礎(chǔ)、海洋3D 觀測技術(shù)、海洋資料同化技術(shù)、海洋數(shù)值模擬參數(shù)化方案和計(jì)算機(jī)技術(shù)等的發(fā)展。因此海洋預(yù)報技術(shù)中許多關(guān)鍵性問題的進(jìn)一步突破會拓展更大的發(fā)展空間。
中國近海長期且充足觀測資料的缺失,使得預(yù)報系統(tǒng)通過同化技術(shù)和人工智能預(yù)報技術(shù)對模式預(yù)報結(jié)果的訂正存在一定的偏差。本預(yù)報系統(tǒng)中較長預(yù)報時長(第5 天~第7 天)的相關(guān)系數(shù)和均方根誤差體現(xiàn)了數(shù)據(jù)同化的局限性之一——觀測數(shù)據(jù)的缺乏。在同化過程中加入更多類型的觀測數(shù)據(jù),可進(jìn)一步提高變量初始場以及預(yù)報的準(zhǔn)確性。
在線和離線耦合的主要區(qū)別在于,離線耦合中模式之間的數(shù)據(jù)交換不是即時的。在線耦合模式可以設(shè)置不同模式之間每隔固定時間進(jìn)行數(shù)據(jù)交換,即來自不同模式的反饋/響應(yīng)在整個耦合模式運(yùn)行過程中都能夠即時響應(yīng)。而離線耦合則是利用一個模式的輸出數(shù)據(jù)去驅(qū)動另一個模式。這里使用的是離線耦合模式。首先利用GFS 數(shù)據(jù)作為WRF 的初始和邊界條件驅(qū)動WRF,然后利用WRF 輸出的數(shù)據(jù)強(qiáng)迫CROCO 和SWAN。在這種情況下,模式運(yùn)行期間如果沒有即時將海洋和表面波浪的影響傳遞給大氣模式(WRF),就可能會導(dǎo)致預(yù)報結(jié)果誤差變大。
已有研究表明,區(qū)域海氣耦合模式對未來氣候變化的研究意義重大,主要體現(xiàn)為2 點(diǎn):①區(qū)域海氣耦合模式與全球海氣耦合模式、地球系統(tǒng)模式共存互補(bǔ);②將大區(qū)域大尺度低分辨率環(huán)流模擬結(jié)果經(jīng)過動力降尺度等方法處理后得到小區(qū)域模式的輸入數(shù)據(jù),利用這些輸入數(shù)據(jù)驅(qū)動小區(qū)域高分辨率的海氣耦合模擬不僅能夠較好地提高模擬準(zhǔn)確度[3,12],而且能夠節(jié)省計(jì)算資源。Yu 等[80]利用全球CCSM3 IPCCAR4 動力降尺度后的模式結(jié)果,驅(qū)動CROCO 模式對中國東部沿海進(jìn)行了高分辨率的未來預(yù)報。然而,利用動力降尺度方法結(jié)合WRF、CROCO 和SWAN 模式對中國邊緣海區(qū)的海氣耦合模擬預(yù)報研究尚少,我們的風(fēng)-浪-流預(yù)報系統(tǒng)則彌補(bǔ)了這一欠缺,利用動力降尺度的方法,對中國邊緣海區(qū)域的大氣和海洋環(huán)流進(jìn)行了精細(xì)化預(yù)報模擬。整體上,關(guān)鍵海區(qū)高精度的預(yù)報結(jié)果例如風(fēng)速與實(shí)際觀測數(shù)據(jù)的相關(guān)度高,誤差精度符合實(shí)際工程需求。
基于TCN-LightGBM 算法的風(fēng)速預(yù)報訂正模型雖然相對于單一模型,模型訓(xùn)練和計(jì)算的時間有所增加,但與傳統(tǒng)的數(shù)值預(yù)報模式比較,預(yù)報速度仍有大幅提升的空間。同時基于機(jī)器學(xué)習(xí)的風(fēng)速智能預(yù)報訂正算法在使用中擺脫了計(jì)算資源的限制,可以遷移到普通的計(jì)算機(jī)上運(yùn)行,為風(fēng)速預(yù)報個性化需求計(jì)算提供了可能。