周冠博,錢奇峰,呂心艷,聶高臻
(1.國家氣象中心,北京 100081;2.中國氣象科學(xué)研究院災(zāi)害天氣國家重點(diǎn)實(shí)驗(yàn)室,北京 100081)
臺風(fēng)災(zāi)害是全球發(fā)生頻率最高、影響最嚴(yán)重的自然災(zāi)害之一。我國位于太平洋西岸,受臺風(fēng)活動影響的廣大沿海省份人口稠密、經(jīng)濟(jì)發(fā)達(dá),對臺風(fēng)災(zāi)害的承受力也最為脆弱,臺風(fēng)災(zāi)害對我國的社會經(jīng)濟(jì)發(fā)展構(gòu)成了嚴(yán)重的威脅[1-2]。特別是隨著全球氣候變暖,西北太平洋地區(qū)臺風(fēng)增強(qiáng)概率和比例均在上升,臺風(fēng)強(qiáng)度增大,強(qiáng)臺風(fēng)偏多,而其移速變慢,造成登陸臺風(fēng)強(qiáng)度以及影響時間都在增加,臺風(fēng)帶來的危害正在逐漸加大,導(dǎo)致更多人員傷亡和財產(chǎn)損失,臺風(fēng)的防御難度也進(jìn)一步加大。
過去的20a,臺風(fēng)的路徑預(yù)報有了顯著的提高,24h 路徑誤差減少約60%,但臺風(fēng)強(qiáng)度預(yù)報誤差卻逐年波動[3-4],強(qiáng)度預(yù)報技巧改進(jìn)非常有限[5-6],特別是近海臺風(fēng)強(qiáng)度預(yù)報不準(zhǔn)確,往往會導(dǎo)致預(yù)報預(yù)警不及時,出現(xiàn)臺風(fēng)防御不足、預(yù)報服務(wù)工作非常被動的局面。經(jīng)評估,24h 強(qiáng)度預(yù)報誤差每減小1m·s-1,可減少3.8 億元直接經(jīng)濟(jì)損失[7]??梢?,臺風(fēng)強(qiáng)度預(yù)報的準(zhǔn)確性是防臺減災(zāi)的重要一環(huán)。數(shù)值預(yù)報模式是現(xiàn)代天氣預(yù)報的重要技術(shù)支撐,但數(shù)值預(yù)報對臺風(fēng)強(qiáng)度預(yù)報能力卻十分有限[8],特別是快速增強(qiáng)臺風(fēng)基本沒有預(yù)報能力。另外,影響臺風(fēng)強(qiáng)度變化的因素錯綜復(fù)雜,主要因素有海洋熱狀況條件、大尺度環(huán)境因子以及臺風(fēng)內(nèi)核結(jié)構(gòu),并且目前海上臺風(fēng)觀測資料的缺乏,一定程度上阻礙了臺風(fēng)強(qiáng)度變化機(jī)理的研究。臺風(fēng)強(qiáng)度變化的物理過程的科學(xué)認(rèn)識不足,嚴(yán)重制約了臺風(fēng)強(qiáng)度預(yù)報水平的提高。
近年來隨著人工智能技術(shù)的興起,利用地面自動氣象站、雷達(dá)、衛(wèi)星等獲取的觀測數(shù)據(jù)越來越多,在氣象大數(shù)據(jù)背景下,結(jié)合具有強(qiáng)大的數(shù)據(jù)學(xué)習(xí)能力和復(fù)雜結(jié)構(gòu)特征刻畫能力的深度學(xué)習(xí)進(jìn)行研究有著十分廣闊的應(yīng)用場景。目前已有很多人工智能應(yīng)用于氣象領(lǐng)域的案例,例如短時臨近預(yù)報、氣候預(yù)測、空氣質(zhì)量指數(shù)(AQI)預(yù)測、數(shù)據(jù)同化、臺風(fēng)和極端天氣預(yù)測、數(shù)值預(yù)報優(yōu)化等。因此,本文針對當(dāng)前人工智能技術(shù)在臺風(fēng)監(jiān)測和預(yù)報中的應(yīng)用與發(fā)展進(jìn)行回顧,最后給出目前人工智能方法在臺風(fēng)監(jiān)測和預(yù)報應(yīng)用中存在的問題以及未來的工作展望。
臺風(fēng)往往在開闊的洋面上生成,由于海洋上觀測資料稀少,臺風(fēng)的監(jiān)測主要依靠氣象衛(wèi)星探測來完成。在臺風(fēng)業(yè)務(wù)預(yù)報中,也主要是依靠衛(wèi)星云圖來確定臺風(fēng)的強(qiáng)度。雖然衛(wèi)星遙感不能直接測量地表附近的風(fēng),但是云、水汽和降水的衛(wèi)星圖像可以作為估計熱帶氣旋強(qiáng)度的替代物[9-12]。
四十多年來,Dvorak[13-14]技術(shù)一直是全球熱帶氣旋(TC)強(qiáng)度估計的主要來源,尤其是在飛機(jī)偵察數(shù)據(jù)不可用的情況下[10]。Dvorak 技術(shù)包括主觀識別彩色增強(qiáng)紅外圖像中的中心和帶狀云特征,基于云圖的臺風(fēng)云型特征與臺風(fēng)強(qiáng)度的統(tǒng)計關(guān)系發(fā)展的一套基于衛(wèi)星圖像臺風(fēng)云型特征的臺風(fēng)強(qiáng)度估計技術(shù)。在過去的二十年中,已經(jīng)開發(fā)了幾種修正的Dvorak 技術(shù)[15]。例如,Olander 和Velden[16]先進(jìn)的Dvorak 技術(shù)(ADT,Advanced Dvorak Technique)目前用于業(yè)務(wù)熱帶氣旋強(qiáng)度估計。自動氣象站通過使用客觀的風(fēng)暴中心確定方案和基于計算機(jī)識別云特征的算法來減少主觀性,對這些算法應(yīng)用線性回歸來估計熱帶氣旋強(qiáng)度。經(jīng)過多年業(yè)務(wù)實(shí)踐,Dvorak方法也已成為各國官方機(jī)構(gòu)最常使用的臺風(fēng)主觀定強(qiáng)方法[17]。Dvorak 方法的缺點(diǎn)是在云特征指數(shù)的確定方面存在較大主觀性,不同的預(yù)報員往往定出的指數(shù)有較大的差別,因此,需要提高臺風(fēng)定強(qiáng)的客觀化和自動化程度。
近年來,隨著人工智能學(xué)科的廣泛應(yīng)用,由于其在圖像識別方面的優(yōu)勢,如何將深度學(xué)習(xí)技術(shù)應(yīng)用于氣象領(lǐng)域的臺風(fēng)監(jiān)測,受到越來越多的關(guān)注。自從2012 年AlexNet[18-19]的提出,深度學(xué)習(xí)算法蓬勃發(fā)展。這些算法包括卷積神經(jīng)網(wǎng)絡(luò)(CNN)、遞歸神經(jīng)網(wǎng)絡(luò)(RNN)和生成對抗網(wǎng)絡(luò)(GAN)。CNN 由從輸入圖像中提取空間特征的卷積層和具有簡單計算單元的完全連接層組成,簡單計算單元學(xué)習(xí)辨別特征以改善對目標(biāo)現(xiàn)象的預(yù)測,而不依賴人類智能來識別哪個特征是重要的[20]。因此,正如氣象學(xué)家確定云的形態(tài)在一定強(qiáng)度范圍內(nèi)與熱帶氣旋有關(guān),CNN 將使用這些特征作為預(yù)測因子來估計TC 強(qiáng)度。崔林麗等[21]基于FY-4 衛(wèi)星的東南沿海臺風(fēng)強(qiáng)度深度學(xué)習(xí)算法,利用FY-4 衛(wèi)星多通道數(shù)據(jù),采用CNN 深度學(xué)習(xí)模型,根據(jù)提取的特征,分別對白天和夜間構(gòu)建分類模型,給出臺風(fēng)強(qiáng)度;Zhang 等[22]利用TCIC(TC intensity grade classification)模塊結(jié)合紅外衛(wèi)星圖像將TC 強(qiáng)度分為三類,給出了三個基于CNN 回歸網(wǎng)絡(luò)的TCIE(TC intensity estimation)模型,它們將不同強(qiáng)度類型的紅外衛(wèi)星圖像與TC 最佳跟蹤數(shù)據(jù)相結(jié)合。三種TCIE 模型都考慮了分類誤差,以提高TCIE 精度。Zhuo 和Tan[23]基于物理增強(qiáng)的深度學(xué)習(xí)估計熱帶氣旋強(qiáng)度和尺度,通過引入反映TC 強(qiáng)度與尺度關(guān)聯(lián)的新概念——TC 豐滿度,能夠顯著改進(jìn)TC 強(qiáng)度估計。另外,引入的其他物理信息(下墊面信息、TC 移動速度和風(fēng)暴年齡等)可以進(jìn)一步提升TC強(qiáng)度估計性能。
2019 年國家氣象中心聯(lián)合北京郵電大學(xué),提出了一種端到端的可視化智能臺風(fēng)定強(qiáng)模型(核心模型見圖1),該模型就是通過計算機(jī)視覺領(lǐng)域成熟的預(yù)訓(xùn)練CNN 深度學(xué)習(xí)模型為基礎(chǔ),比如:RESNET(Residual Network)、VGG(Visual Geometry Group)等,對衛(wèi)星云圖數(shù)據(jù)進(jìn)行臺風(fēng)強(qiáng)度相關(guān)的特征提??;然后,根據(jù)提取的特征分別構(gòu)建分類模型和基于相似度的檢索模型獲取決策結(jié)果;最后,融合兩個模型的識別結(jié)果,給出最終臺風(fēng)的強(qiáng)度、置信度和參考云圖。深度學(xué)習(xí)通過機(jī)器對大量樣本的分析和學(xué)習(xí),能夠隱式提取圖像中深層抽象的復(fù)雜特征,越來越多地被應(yīng)用到臺風(fēng)強(qiáng)度估測中。
該模型已于2019 年在中央氣象臺進(jìn)行了業(yè)務(wù)測試,2020 年正式投入到實(shí)際的臺風(fēng)強(qiáng)度估測業(yè)務(wù),基本上實(shí)現(xiàn)了基于氣象衛(wèi)星圖像對臺風(fēng)強(qiáng)度的智能識別。以2021 年登陸我國的超強(qiáng)臺風(fēng)“煙花”為例,介紹人工智能在臺風(fēng)強(qiáng)度估測中的表現(xiàn)??傮w而言,模型對臺風(fēng)各個階段強(qiáng)度的估計與實(shí)際變化均比較一致。在臺風(fēng)增強(qiáng)階段,對臺風(fēng)在8 月6 日12時之前的強(qiáng)度估計略偏弱。在臺風(fēng)整個生命史中,能較好識別出臺風(fēng)在7 月21 日增強(qiáng)過程,以及7 月25 日登陸之后的減弱過程(圖2),對臺風(fēng)“煙花”的強(qiáng)度估計較為準(zhǔn)確,雖然某些時刻表現(xiàn)出不同程度的波動,但整體而言模型對臺風(fēng)強(qiáng)度的估計與實(shí)況基本吻合,檢驗(yàn)結(jié)果MAE 為3.35m·s-1,RMSE 為4.6m·s-1,基本上可以滿足業(yè)務(wù)需求。
圖3 是ResNet 模型對臺風(fēng)“煙花”三個不同時刻云圖的強(qiáng)度估計結(jié)果,其中圖3(a)為“煙花”達(dá)到巔峰強(qiáng)度42m·s-1時的云圖,模型認(rèn)為該時刻臺風(fēng)強(qiáng)度為42m·s-1的概率為60%、38m·s-1的概率為34%以及48m·s-1的概率為4%,最終模型加權(quán)平均后給出40.9m·s-1的強(qiáng)度估計,與業(yè)務(wù)定強(qiáng)較為接近。圖3(b)為“煙花”強(qiáng)度的維持階段,此時模型給出的強(qiáng)度估計41.7m·s-1與業(yè)務(wù)定強(qiáng)42m·s-1更為接近。圖3(c)是“煙花”深入內(nèi)陸后的云圖,此時臺風(fēng)云型松散,中心空心明顯,但模型估計結(jié)果為25.1m·s-1,與業(yè)務(wù)定強(qiáng)25m·s-1基本一致。
臺風(fēng)的移動路徑主要受到大尺度環(huán)境背景場、海氣相互作用以及臺風(fēng)自身結(jié)構(gòu)等多種因素的影響,因此傳統(tǒng)的預(yù)報方法并不能很好的同時反映這些復(fù)雜的熱力和動力系統(tǒng),很難用于提高臺風(fēng)路徑的預(yù)報水平。近年來,隨著人工智能新技術(shù)的發(fā)展,人工神經(jīng)網(wǎng)絡(luò)方法在很多學(xué)科領(lǐng)域取得了一些很好的研究成果[24-28],而遺傳算法是近年來人工智能技術(shù)領(lǐng)域十分廣泛采用的一種基于自然選擇和自然遺傳的全局優(yōu)化算法[29-33];Jin 等[34]以進(jìn)化的遺傳算法,生成期望輸出相同的多個神經(jīng)網(wǎng)絡(luò)個體,建立了新的非線性人工智能集合預(yù)報模型;黃小燕和金龍[35]綜合考慮了臺風(fēng)移動路徑的氣候持續(xù)因子和數(shù)值預(yù)報動力因子,采用主成分分析特征提取與逐步回歸相結(jié)合的預(yù)報因子數(shù)據(jù)挖掘技術(shù),以BP(Back Propagation)神經(jīng)網(wǎng)絡(luò)作為基本模型,結(jié)合遺傳算法構(gòu)建了一種非線性智能臺風(fēng)路徑集合預(yù)報方法;王瀚[36]總結(jié)了基于深度學(xué)習(xí)的臺風(fēng)路徑預(yù)測多模型算法研究;BP 神經(jīng)網(wǎng)絡(luò)方法主要是通過選取經(jīng)緯度、中心氣壓、最大風(fēng)速、移速等預(yù)報因子(參考CLIPER 法的預(yù)報因子)來進(jìn)行臺風(fēng)的路徑預(yù)報[37];呂慶平等[38]利用氣候持續(xù)性因子,采用支持向量機(jī)法、神經(jīng)網(wǎng)絡(luò)法及最小二乘回歸法建立了3 種不同的熱帶氣旋路徑預(yù)報模型;朱雷[39]提出了基于貝葉斯神經(jīng)網(wǎng)絡(luò)結(jié)合Bagging 委員會機(jī)器集成的臺風(fēng)路徑預(yù)報模型;周笑天等[40]則基于神經(jīng)網(wǎng)絡(luò)結(jié)合集合預(yù)報對臺風(fēng)路徑預(yù)報進(jìn)行了優(yōu)化;Mario Ruttgers等[41]研究了在生成對抗網(wǎng)絡(luò)中利用衛(wèi)星圖像來進(jìn)行臺風(fēng)路徑預(yù)測。由此可見,人工智能在臺風(fēng)的路徑預(yù)報中的應(yīng)用還是比較多樣的,主要的技術(shù)包括多神經(jīng)網(wǎng)絡(luò)集成(以氣候持續(xù)因子、數(shù)值模式物理量、EC 臺風(fēng)預(yù)報產(chǎn)品等資料為基礎(chǔ),采用深度學(xué)習(xí)特征提取技術(shù),結(jié)合多種神經(jīng)網(wǎng)絡(luò)的集成預(yù)報模型)、基于路徑圖形的預(yù)報、基于集合預(yù)報(BP 神經(jīng)網(wǎng)絡(luò)篩選集合預(yù)報成因)的方法、基于云圖的外推預(yù)報(基于對抗神經(jīng)網(wǎng)絡(luò)GAN,結(jié)合一段時間云圖,做6h 外推云圖預(yù)報,識別臺風(fēng)位置)等。
近年來,國家氣象中心也在不斷嘗試傳統(tǒng)的路徑預(yù)報方法與人工智能新技術(shù)相結(jié)合,目前業(yè)務(wù)上主要應(yīng)用的方法有兩種:(1)優(yōu)化臺風(fēng)路徑集合預(yù)報訂正(TYTEC)方法,對TYTEC 前期預(yù)報進(jìn)行實(shí)時誤差評估,通過AI 算法自動調(diào)整各集合預(yù)報模式的參數(shù)及權(quán)重系數(shù),從而取得最佳臺風(fēng)路徑預(yù)報效果。(2)基于多種智能計算模型的臺風(fēng)路徑集成預(yù)報方案。具體的技術(shù)路線如圖4 所示,首先對EC 臺風(fēng)集合預(yù)報成員,采用最優(yōu)定位排序法,將T 個最好成員組成一個因子矩陣X;然后利用廣義回歸神經(jīng)網(wǎng)絡(luò)、回歸隨機(jī)森林算法以及偏最小二乘算法,分別對因子矩陣X,以相同年份作為獨(dú)立樣本交叉建模,獲得三個具有與因子矩陣X 相同樣本的序列Y={y1,y2,y3};最后采用多元回歸模型對由Y、X 和日本預(yù)報組成的模型輸入矩陣二次建模,實(shí)現(xiàn)路徑客觀預(yù)報。
目前氣象業(yè)務(wù)上的臺風(fēng)強(qiáng)度預(yù)報,除了綜合預(yù)報方法外,其它的客觀預(yù)報方法主要是以統(tǒng)計預(yù)報和統(tǒng)計-動力模式為主,并且大多采用回歸等統(tǒng)計方法,對臺風(fēng)強(qiáng)度的快速變化刻畫能力較弱。近年來,隨著人工智能技術(shù)的發(fā)展,具有較強(qiáng)非線性能力的神經(jīng)網(wǎng)絡(luò)等方法在氣象預(yù)報應(yīng)用中獲得了一定的進(jìn)展,Pradhan 等[42]使用基于多層深度CNN(Convolutional Neural Network)網(wǎng)絡(luò)對臺風(fēng)等級進(jìn)行估計,Zahera等[43]使用LSTM(Long Short-Term Memory)和DNN(Deep Neural Network)網(wǎng)絡(luò)對臺風(fēng)強(qiáng)度進(jìn)行估計,Chen 等[44]發(fā)布了一個開放數(shù)據(jù)集,提出了基于CNN強(qiáng)度回歸的多模型融合方法,Wei 等[45]使用神經(jīng)網(wǎng)絡(luò)方法對臺風(fēng)強(qiáng)度進(jìn)行更加精細(xì)的劃分,張淼等[46]利用FY-3C 微波溫度計通道特征與臺風(fēng)強(qiáng)度建立統(tǒng)計關(guān)系估計熱帶氣旋強(qiáng)度。很多的研究表明了人工智能技術(shù)在臺風(fēng)強(qiáng)度預(yù)報方面有很好的發(fā)展前景[47-48]。因此,通過人工智能技術(shù)對臺風(fēng)預(yù)報中的非線性問題進(jìn)行研究,是未來的發(fā)展趨勢之一。
基于深度學(xué)習(xí)預(yù)測臺風(fēng)強(qiáng)度快速增強(qiáng)的基礎(chǔ)特征提取,傳統(tǒng)的計算強(qiáng)度的特征提取方法是Dvorak技術(shù)。它設(shè)計人類構(gòu)造的特征模式,來進(jìn)行具有主觀性推測的強(qiáng)度估計和預(yù)測。近年來,基于深度學(xué)習(xí)的臺風(fēng)強(qiáng)度估計和預(yù)測的方法也得到了越來越多的關(guān)注?;谏疃葘W(xué)習(xí)的分類模型的強(qiáng)度預(yù)測方法將每個強(qiáng)度作為一個獨(dú)立的固定類來預(yù)測臺風(fēng)強(qiáng)度,并利用交叉熵?fù)p失來優(yōu)化模型。基于深度回歸的方法使用均方誤差作為損失函數(shù)估計和預(yù)測臺風(fēng)的準(zhǔn)確強(qiáng)度值。然而,這些方法忽略了強(qiáng)度預(yù)測的一個關(guān)鍵點(diǎn),即臺風(fēng)特征提取的準(zhǔn)確性對于臺風(fēng)強(qiáng)度預(yù)測的重要性。具有相似特征模式的臺風(fēng)往往具有更接近的強(qiáng)度,因此,從歷史信息和多視角信息結(jié)合起來進(jìn)行強(qiáng)度預(yù)測是可行的研究方向。Chen 等[49]使用了五點(diǎn)加權(quán)平均法來組合歷史信息,雖然在結(jié)果上顯示了改進(jìn),但沒有考慮到時空臺風(fēng)圖像之間的復(fù)雜關(guān)系。Chen 等[44]提出的另一個方法是將圖像旋轉(zhuǎn)不同角度后的估計值與實(shí)際圖像進(jìn)行融合以降低估計的偏差,但它忽略了圖像本身的多視角特征。臺風(fēng)強(qiáng)度預(yù)測離不開強(qiáng)度估計的準(zhǔn)確性,已有研究使用CNN 來估計臺風(fēng)強(qiáng)度。Pradhan 等[42]在研究中首先介紹了CNN 在臺風(fēng)強(qiáng)度估計中的應(yīng)用,并將臺風(fēng)圖像分為八類。然而,他們只得到強(qiáng)度范圍而不是準(zhǔn)確的強(qiáng)度,他們的訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù)是相關(guān)的。Chen 等[50]在研究中使用多通道衛(wèi)星圖像和外部信息,如緯度、經(jīng)度和日期,通過回歸網(wǎng)絡(luò)來估計準(zhǔn)確的強(qiáng)度。Xu 等[51]在研究中提出一個上下文感知的cycleGAN 來解決臺風(fēng)數(shù)據(jù)的高度不平衡的問題。Chen 等[52]還提出使用GAN 從IR1 和WV 通道生成PMW 和VIS 通道圖像,用于實(shí)時強(qiáng)度估計。然而,現(xiàn)有的方法缺乏可解釋性,不能充分利用TC 強(qiáng)度(label),而TC 強(qiáng)度是連續(xù)的,對優(yōu)化嵌入空間非常重要。不同的是,我們提出的DR-transformer 框架將臺風(fēng)強(qiáng)度估計看作是一個最近鄰分類問題,并利用標(biāo)簽的連續(xù)性構(gòu)造了一個距離一致性嵌入空間,在這個空間中我們可以很容易地通過K-最近鄰分類器找到查詢圖像的領(lǐng)域。
因此,國家氣象中心采用人工智能領(lǐng)域的基于時空關(guān)聯(lián)深度學(xué)習(xí)模型為技術(shù)基礎(chǔ),通過標(biāo)注、學(xué)習(xí)、預(yù)測已有數(shù)據(jù)中的關(guān)鍵信息來解決臺風(fēng)強(qiáng)度快速增強(qiáng)趨勢預(yù)測和判別問題?;跁r空關(guān)聯(lián)深度學(xué)習(xí)模型的技術(shù)路線如圖5 所示,實(shí)現(xiàn)步驟分別是:①臺風(fēng)強(qiáng)度變化特征提??;②臺風(fēng)強(qiáng)度趨勢預(yù)測;③臺風(fēng)強(qiáng)度突變檢測;最后,根據(jù)②和③的結(jié)果進(jìn)行策略融合,輸出臺風(fēng)強(qiáng)度趨勢判別結(jié)果?;跁r空關(guān)聯(lián)深度學(xué)習(xí)模型的關(guān)鍵步驟說明如下:
(1)臺風(fēng)強(qiáng)度變化特征提取
特征提取是強(qiáng)度趨勢預(yù)測和突變檢測的基礎(chǔ)。該技術(shù)基于歷史臺風(fēng)時間序列數(shù)據(jù)進(jìn)行學(xué)習(xí),包括時序云圖序列數(shù)據(jù)、位置序列、其他相關(guān)數(shù)值數(shù)據(jù)比如氣壓、降水等序列的學(xué)習(xí),屬于有監(jiān)督的多模態(tài)序列學(xué)習(xí)問題,這也是對傳統(tǒng)序列學(xué)習(xí)的一個挑戰(zhàn)。本部分研究擬采用PIPELINE 架構(gòu)的3D 卷積神經(jīng)網(wǎng)絡(luò)(CNN)結(jié)合長短期記憶(LSTM)網(wǎng)絡(luò)構(gòu)成的3D_LSTM 模型,同時對初始時刻到任意t 時刻的時序云圖序列的時間和空間特征進(jìn)行序列學(xué)習(xí),并結(jié)合其他時序位置數(shù)據(jù)、數(shù)值數(shù)據(jù)進(jìn)行關(guān)聯(lián)和特征融合,預(yù)測臺風(fēng)強(qiáng)度在下一時刻即t+1 時刻的變化特征向量。
(2)臺風(fēng)強(qiáng)度趨勢預(yù)測
臺風(fēng)強(qiáng)度趨勢預(yù)測是基于臺風(fēng)強(qiáng)度變化的通用特征,即大樣本特征進(jìn)行預(yù)測的技術(shù)。因此,在3D_LSTM 模型得到的時序多模態(tài)下一時刻時空特征的基礎(chǔ)上,進(jìn)一步構(gòu)造回歸損失函數(shù)為基礎(chǔ)的預(yù)測模型,訓(xùn)練并計算臺風(fēng)強(qiáng)度變化的通用特征權(quán)重,從而預(yù)測臺風(fēng)在下一時刻的強(qiáng)度。
(3)臺風(fēng)強(qiáng)度突變檢測
臺風(fēng)強(qiáng)度突變檢測是基于臺風(fēng)強(qiáng)度變化特征中突變特征,即需要在所有強(qiáng)度變化特征中,學(xué)習(xí)與強(qiáng)度突變影響相關(guān)的特征。因此,在3D_LSTM 模型得到的時序多模態(tài)下時刻時空特征的基礎(chǔ)上,進(jìn)一步構(gòu)造基于注意力機(jī)制的分類模型,計算不同時刻、不同特征的權(quán)重,從而預(yù)測臺風(fēng)在t+1 時刻的強(qiáng)度突變的級別和概率。最后,將(2)和(3)的結(jié)果分別作為進(jìn)行交叉融合學(xué)習(xí),得到最終的臺風(fēng)強(qiáng)度趨勢判別結(jié)果。
人工智能是基于多層神經(jīng)網(wǎng)絡(luò)建立模擬人類分析、學(xué)習(xí)的模型,模仿人腦機(jī)制識別目標(biāo),感知信息,模型通過訓(xùn)練能夠自動提取原始數(shù)據(jù)中隱含的信息形成抽象的高層特征表示,將特征表示通過擬合函數(shù)進(jìn)行計算得到?jīng)Q策結(jié)果。近年來隨著人工智能技術(shù)的興起,利用地面自動氣象站、雷達(dá)、衛(wèi)星等獲取的觀測數(shù)據(jù)越來越多,在氣象大數(shù)據(jù)背景下,結(jié)合具有強(qiáng)大的數(shù)據(jù)學(xué)習(xí)能力和復(fù)雜結(jié)構(gòu)特征刻畫能力的深度學(xué)習(xí)進(jìn)行研究有著十分廣闊的應(yīng)用場景。人工智能技術(shù)在數(shù)值天氣預(yù)報中也表現(xiàn)出明顯的優(yōu)勢,不僅可以對資料預(yù)處理、資料同化、模式積分以及預(yù)報信息的處理和交流起到優(yōu)化作用,而且還可以改善集合預(yù)報、數(shù)值模式的后處理、數(shù)值預(yù)報模型研發(fā),甚至可以代替?zhèn)鹘y(tǒng)數(shù)值模式,有望在天氣預(yù)報中起到積極的推動作用。
然而,由于人工智能技術(shù)多以統(tǒng)計為基礎(chǔ),因此在應(yīng)用時也存在明顯的不足:(1)弱解釋性問題。人工智能對規(guī)律的表示比較難理解,解釋性不足,在一定程度上限制了其在行業(yè)內(nèi)的廣泛應(yīng)用和認(rèn)可。(2)如何進(jìn)行模型設(shè)計。數(shù)值天氣預(yù)報背后有大量的數(shù)學(xué)和物理理論的支撐,而如何使用這些有明確物理意義的理論來指導(dǎo)人工智能技術(shù)還值得進(jìn)一步研究。(3)不確定性問題。我們目前的天氣預(yù)報比較重視預(yù)報的不確定性問題,那么如何利用人工智能技術(shù)將天氣預(yù)報的不確定性有效地表達(dá)出來也是一個值得思考的問題。(4)如何與數(shù)值天氣預(yù)報相耦合的問題。目前人工智能技術(shù)的應(yīng)用主要表現(xiàn)為局部優(yōu)化和替代,如何實(shí)現(xiàn)與數(shù)值天氣預(yù)報和集合預(yù)報長期穩(wěn)定耦合,也是需要妥善解決的問題。(5)在高時空分辨率天氣預(yù)報問題中的可行性。人工智能預(yù)報模型主要是依靠純數(shù)據(jù)驅(qū)動的,這種定量化的預(yù)報模型如何在高時空分辨率和強(qiáng)非線性的天氣預(yù)報問題中使用,還有待進(jìn)一步研究。綜上所述,人工智能技術(shù)在天氣預(yù)報應(yīng)用中還存著許多挑戰(zhàn)。
從現(xiàn)有研究看,人工智能已開始在臺風(fēng)監(jiān)測和預(yù)報中發(fā)揮越來越重要的作用,體現(xiàn)在臺風(fēng)的渦旋識別、定位定強(qiáng)、路徑預(yù)報、強(qiáng)度預(yù)報等多個方面。純數(shù)據(jù)驅(qū)動的人工智能預(yù)報模型已經(jīng)在臺風(fēng)監(jiān)測和預(yù)報的應(yīng)用中表現(xiàn)出巨大的潛力。然而人工智能技術(shù)在臺風(fēng)監(jiān)測和預(yù)報的應(yīng)用中還存在許多的困難和挑戰(zhàn),未來的發(fā)展方向可能主要分為以下幾個方面:
(1)在全球熱帶氣旋的監(jiān)測中的應(yīng)用。包括全球熱帶氣旋的自動識別和定位定強(qiáng)。隨著我國多系列氣象衛(wèi)星的發(fā)射成功,我們每天可以得到海量的衛(wèi)星云圖數(shù)據(jù),如何從大量的衛(wèi)星數(shù)據(jù)圖像中更加精準(zhǔn)地識別出全球范圍內(nèi)同時存在的多個熱帶氣旋,并且自動進(jìn)行定位和定強(qiáng)是未來臺風(fēng)監(jiān)測的重點(diǎn)發(fā)展方向。同時,人工智能預(yù)報模型在計算量和數(shù)據(jù)訪問量方面的需求也大幅提升,也對高性能計算平臺提出了更高的要求。
(2)臺風(fēng)路徑預(yù)報的優(yōu)化。近年來隨著集合預(yù)報和數(shù)值模式的發(fā)展,臺風(fēng)路徑預(yù)報水平有了大幅提高,但是對于復(fù)雜路徑和奇異路徑的臺風(fēng),模式往往顯得無能為力,因此臺風(fēng)路徑預(yù)報也遇到了發(fā)展的瓶頸。未來借助于人工智能技術(shù)深度挖掘影響和制約臺風(fēng)移動路徑的多種大尺度影響因子、臺風(fēng)本身內(nèi)力,并結(jié)合數(shù)值模式和集合預(yù)報,可能會找到提高臺風(fēng)路徑預(yù)報水平的新突破口。
(3)臺風(fēng)強(qiáng)度突變的預(yù)報。當(dāng)熱帶氣旋在短時間內(nèi)急劇增強(qiáng)時,就會發(fā)生快速增強(qiáng)。臺風(fēng)快速增強(qiáng)仍然是熱帶天氣預(yù)報的主要挑戰(zhàn)之一。如何利用海量的氣象衛(wèi)星圖像,通過人工智能技術(shù)對衛(wèi)星圖像特征信息進(jìn)行深度學(xué)習(xí)和挖掘,結(jié)合數(shù)值模式對臺風(fēng)強(qiáng)度預(yù)報的一些模式算法,進(jìn)而識別其強(qiáng)度迅速變化的征兆,從而提高對臺風(fēng)強(qiáng)度及其突變的預(yù)報能力也就成為了尤為重要的課題。
隨著人工智能技術(shù)的不斷發(fā)展,研究探索適合氣象領(lǐng)域的深度學(xué)習(xí)模型,更好地利用來自地面自動氣象站、雷達(dá)、衛(wèi)星等獲取的大規(guī)模觀測數(shù)據(jù),自動、智能、快速地得到更加精準(zhǔn)、可解釋、可控可調(diào)、可視化的預(yù)測結(jié)果,必將對氣象領(lǐng)域帶來深遠(yuǎn)的影響。
通過對衛(wèi)星云圖所拍攝的臺風(fēng)進(jìn)行渦旋識別、定強(qiáng)、路徑跟蹤可以有效地對實(shí)時臺風(fēng)的位置定位、風(fēng)險評估及預(yù)警發(fā)布,圍繞如何有效利用氣象衛(wèi)星圖像進(jìn)行自動渦旋定位和定強(qiáng),進(jìn)行全天候自動追蹤展開研究,利用人工智能技術(shù)對衛(wèi)星云圖進(jìn)行特征分析、抽取、識別和定位,具有重要的研究意義。未來結(jié)合人工智能等方法,也必將對臺風(fēng)實(shí)時監(jiān)測乃至預(yù)報預(yù)測等技術(shù)起到巨大的推動作用。