許磊,李琪,陶雲(yún),余紅楚,杜文英,陳澤強(qiáng),陳能成
1. 中國(guó)地質(zhì)大學(xué)(武漢) 國(guó)家地理信息系統(tǒng)工程技術(shù)研究中心,武漢 430074;
2. 武漢理工大學(xué) 航運(yùn)學(xué)院,武漢 430063
降水是一個(gè)與日常生活息息相關(guān)的現(xiàn)象,同時(shí)也是地理空間中重要的氣象水文要素。降水作為地理空間信息的重要組成部分,在智慧城市建設(shè)中同樣不可忽視,降水預(yù)報(bào)有助于更好地管理城市水利設(shè)施,保障公共安全(龔健雅等,2019)。由于我國(guó)處于東亞季風(fēng)區(qū),每到夏天暴雨洪澇災(zāi)害多發(fā)重發(fā),1990~2021 年造成直接經(jīng)濟(jì)損失約50813.03 億元(高守亭等,2018;《中國(guó)水旱災(zāi)害防御公報(bào)》編寫(xiě)組,2022)。準(zhǔn)確實(shí)時(shí)地預(yù)測(cè)未來(lái)0~6 h 的降水量對(duì)于區(qū)域防災(zāi)減災(zāi)具有重要的現(xiàn)實(shí)意義。
深度學(xué)習(xí)是一種數(shù)據(jù)驅(qū)動(dòng)的人工智能技術(shù),對(duì)研究對(duì)象進(jìn)行深度網(wǎng)絡(luò)建模并逐漸應(yīng)用于多個(gè)領(lǐng)域,包括短期降水預(yù)報(bào)、圖像識(shí)別和目標(biāo)檢測(cè)等領(lǐng)域(陳軍等,2023;王詩(shī)洋等,2021)。通過(guò)在雷達(dá)和衛(wèi)星觀測(cè)的大數(shù)據(jù)集上訓(xùn)練,來(lái)模擬降水現(xiàn)象,繼而實(shí)現(xiàn)精準(zhǔn)降水預(yù)測(cè)。然而,由于觀測(cè)手段、技術(shù)方法和認(rèn)知水平的局限性,數(shù)據(jù)驅(qū)動(dòng)的人工智能預(yù)測(cè)技術(shù)存在低穩(wěn)健性和不確定性,使得短臨降水預(yù)報(bào)存在不可靠性(Kasiviswanathan 和Sudheer,2017)。
短臨降水預(yù)報(bào)的可靠性是預(yù)報(bào)系統(tǒng)在給定時(shí)間內(nèi)完成準(zhǔn)確預(yù)測(cè)的能力(Shi,2009),其中數(shù)據(jù)可靠性和模型可靠性是提升系統(tǒng)整體可靠性的關(guān)鍵。數(shù)據(jù)可靠性是數(shù)據(jù)表達(dá)的內(nèi)容與現(xiàn)實(shí)世界的吻合度,但是復(fù)雜的客觀世界、對(duì)世界的模糊認(rèn)知,以及存在誤差的數(shù)據(jù)獲取、處理和表達(dá)過(guò)程,使得數(shù)據(jù)具有不確定性(史文中等,2017;O’sullivan和Unwin,2003)。數(shù)據(jù)可靠性分析在輔助判斷預(yù)測(cè)結(jié)果的同時(shí),還對(duì)數(shù)據(jù)處理過(guò)程進(jìn)行反饋,是實(shí)現(xiàn)短臨降水準(zhǔn)確預(yù)報(bào)的支撐(徐振強(qiáng),2021)。模型可靠性是對(duì)數(shù)據(jù)進(jìn)行持續(xù)準(zhǔn)確預(yù)測(cè)的能力。一個(gè)可靠的模型應(yīng)該具有高準(zhǔn)確率和低誤報(bào)率,同時(shí)能夠推廣到新的數(shù)據(jù)集中。準(zhǔn)確理解和表示物理過(guò)程的能力是提高可靠性的關(guān)鍵(Weisheimer 和Palmer,2014)。
在降水預(yù)報(bào)中,人工智能可用于處理多預(yù)報(bào)因子問(wèn)題,能夠快速吸納多種分散資料源,物理模型和人工智能模型的耦合是未來(lái)降水預(yù)報(bào)的范式(顧建峰等,2020;李雙林等,2022)。Bonavita 和Laloyaux(2020)討論了人工神經(jīng)網(wǎng)絡(luò)對(duì)平流層系統(tǒng)模式誤差的改善,提高了預(yù)測(cè)準(zhǔn)確性,同時(shí)人工智能和物理模型的結(jié)合,能夠提高模型的模擬能力。Rasp 等(2018)將神經(jīng)網(wǎng)絡(luò)參數(shù)化與動(dòng)力學(xué)交互,產(chǎn)生接近其訓(xùn)練氣候態(tài)的穩(wěn)定平均氣候。劉忠民(2018)將小波分析、人工神經(jīng)網(wǎng)絡(luò)分析及水文頻率分析相結(jié)合,充分考慮了不確定因素對(duì)中長(zhǎng)期降水預(yù)報(bào)模型的影響。以上研究表明了物理模型和人工智能模型耦合的可行性,也給未來(lái)降水預(yù)報(bào)研究提供了方向。
現(xiàn)代觀測(cè)儀器精度的提高、氣象自動(dòng)站密度的增大,以及衛(wèi)星、雷達(dá)技術(shù)的進(jìn)步,為短臨降水預(yù)報(bào)可靠性分析提供了良好的數(shù)據(jù)基礎(chǔ)。短臨降水預(yù)報(bào)的精度和可靠性受到眾多因素的影響,如數(shù)據(jù)不確定性、模型方法、計(jì)算平臺(tái)等,需要對(duì)這些因素進(jìn)行有效的分析和建模,從而提升整個(gè)預(yù)報(bào)系統(tǒng)的可靠性(王慧媛,2020;史文中等,2012a)。本文首先分析短臨降水預(yù)報(bào)可靠性研究現(xiàn)狀;其次提出數(shù)據(jù)驅(qū)動(dòng)的短臨降水預(yù)報(bào)可靠性分析的總體思路;最后設(shè)計(jì)數(shù)據(jù)驅(qū)動(dòng)的短臨降水預(yù)報(bào)可靠性分析技術(shù)體系,并對(duì)短臨降水預(yù)報(bào)可靠性進(jìn)行綜合評(píng)估和定量關(guān)聯(lián)推理。本研究能夠?yàn)楦呖煽慷膛R降水預(yù)報(bào)提供理論與技術(shù)支撐。
短臨降水預(yù)報(bào)方法主要分為數(shù)值天氣預(yù)報(bào)、基于雷達(dá)回波外推和基于人工智能的降水預(yù)報(bào)。數(shù)值天氣預(yù)報(bào)是長(zhǎng)期以來(lái)降水預(yù)報(bào)的主要方法,但其缺乏利用最新可用信息進(jìn)行短期預(yù)報(bào)的能力,在短臨預(yù)報(bào)方面具有一定局限性(Trebing 等,2021)?;诶走_(dá)回波外推的降水預(yù)報(bào)具有精度高、實(shí)時(shí)性強(qiáng)和計(jì)算量小的特點(diǎn),可與數(shù)值天氣預(yù)報(bào)互作補(bǔ)充(孫杏杏,2020)?;谌斯ぶ悄艿慕邓A(yù)報(bào)主要是通過(guò)機(jī)器學(xué)習(xí)和深度學(xué)習(xí)方法對(duì)雷達(dá)回波或者降水圖像在時(shí)空上的關(guān)聯(lián)和變化機(jī)制進(jìn)行外推,預(yù)測(cè)未來(lái)雷達(dá)回波或者降水分布(張飛鴻,2020)。
近年來(lái),觀測(cè)數(shù)據(jù)的海量增長(zhǎng)使得短臨降水預(yù)報(bào)面臨著兩大挑戰(zhàn):①?gòu)暮A繑?shù)據(jù)中提取信息;②推導(dǎo)出能主動(dòng)從數(shù)據(jù)中學(xué)習(xí)的模型,同時(shí)仍遵循自然規(guī)律(Reichstein 等,2019)。人工智能的飛速發(fā)展為應(yīng)對(duì)上述挑戰(zhàn)提供了機(jī)遇。深度神經(jīng)網(wǎng)絡(luò)在降水預(yù)報(bào)方面有許多優(yōu)勢(shì),如數(shù)據(jù)不需要人工注釋、滿足大量計(jì)算需求和利用數(shù)據(jù)豐富的時(shí)空結(jié)構(gòu)(Espeholt 等,2022)。循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)、卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)、長(zhǎng)短時(shí)記憶(long short term memory,LSTM)等數(shù)據(jù)驅(qū)動(dòng)的深度學(xué)習(xí)模型的提出,提升了預(yù)測(cè)的準(zhǔn)確性和精度,但其仍舊為黑箱模型,存在可解釋性差的問(wèn)題,缺乏物理意義(秦昆等,2023)。
人工智能和物理模型在一定程度上可以進(jìn)行互補(bǔ),物理模型提供了可解釋性,而數(shù)據(jù)驅(qū)動(dòng)的方法在從大數(shù)據(jù)中提取可解釋的信息和知識(shí)方面具有高度的靈活性(Reichstein 等,2019)。人工智能和物理模型可以從三個(gè)方面進(jìn)行耦合:①物理模型預(yù)測(cè)作為先驗(yàn)輸入;②深度學(xué)習(xí)替換物理模型;③深度學(xué)習(xí)用于物理模型后處理。物理模型的先驗(yàn)知識(shí)能夠幫助人工智能更好地模擬現(xiàn)實(shí)世界,當(dāng)前耦合研究大都是在人工智能算法中添加物理約束,研究不同的耦合方式可以推動(dòng)短臨降水預(yù)報(bào)技術(shù)的發(fā)展(胡羽聰?shù)龋?023)。
數(shù)據(jù)驅(qū)動(dòng)的短臨降水預(yù)報(bào)可靠性分析的主要內(nèi)容:①分析預(yù)測(cè)過(guò)程中的關(guān)鍵影響因素及其邏輯關(guān)系,包括空間數(shù)據(jù)、模型參數(shù)、計(jì)算框架、評(píng)價(jià)方法等方面的眾多影響因素(史文中和張敏,2021);②建立從預(yù)測(cè)輸入可靠性至預(yù)測(cè)結(jié)果可靠性之間的可靠性關(guān)聯(lián)推理模型;③構(gòu)建可靠性綜合評(píng)估指標(biāo)體系,全面評(píng)估短臨降水預(yù)報(bào)過(guò)程和結(jié)果的可靠性,闡明可靠性傳播的規(guī)律,包括隨機(jī)性和關(guān)聯(lián)性、時(shí)間和空間分異、影響因素重要度和不確定性等(張效康,2017)??煽啃栽u(píng)估的內(nèi)容是針對(duì)具體研究對(duì)象,構(gòu)建相應(yīng)的可靠性評(píng)估指標(biāo),計(jì)算整體可靠性?,F(xiàn)有可靠性評(píng)估研究在空間數(shù)據(jù)質(zhì)量、遙感圖像識(shí)別和地理國(guó)情監(jiān)測(cè)等方面開(kāi)展了相關(guān)探索,提出了空間數(shù)據(jù)與人工智能算法可靠性評(píng)估的內(nèi)容和指標(biāo)(史文中等,2012b;張璨和張明英,2018)。在可靠性分析模型方面,已有故障樹(shù)、馬爾可夫鏈、貝葉斯網(wǎng)絡(luò)等方法,在可靠性分析中具有廣泛應(yīng)用(林佳宇,2016)。
然而,由于空間數(shù)據(jù)的不確定性、模型參數(shù)的多樣性和人工智能技術(shù)的不透明性等諸多因素的存在,當(dāng)前短臨降水預(yù)報(bào)存在不可靠性。盡管對(duì)降水預(yù)報(bào)的研究逐漸成熟,但是仍有不足之處。
(1)降水在空間中的運(yùn)動(dòng)蘊(yùn)含著內(nèi)在的物理規(guī)律,基于人工智能的短臨降水預(yù)報(bào)模型需正確捕獲數(shù)據(jù)的時(shí)空結(jié)構(gòu),深入結(jié)合降水形成特征和物理過(guò)程才可得到準(zhǔn)確預(yù)測(cè)(郭曉萌等,2021)?,F(xiàn)有研究多為缺乏物理過(guò)程指導(dǎo)的深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),可解釋性較低(Reichstein 等,2019)。
(2)短臨降水預(yù)報(bào)需要數(shù)據(jù)和模型作為輸入,然而數(shù)據(jù)與模型的不確定性和誤差,會(huì)傳至預(yù)測(cè)結(jié)果,帶來(lái)預(yù)測(cè)結(jié)果的不確定性?,F(xiàn)有人工智能降水預(yù)測(cè)方法往往僅給出一個(gè)確定性的預(yù)測(cè)結(jié)果,忽略了預(yù)測(cè)過(guò)程中數(shù)據(jù)和模型不確定性對(duì)預(yù)測(cè)結(jié)果的影響,缺乏預(yù)測(cè)過(guò)程的可靠性建模(Yuan 等,2020;Ravuri 等,2021)。
(3)短臨降水預(yù)報(bào)精度受到眾多因素的影響,如數(shù)據(jù)質(zhì)量、模型結(jié)構(gòu)、參數(shù)優(yōu)化、計(jì)算平臺(tái)等?,F(xiàn)有研究主要集中于分析單一影響因素對(duì)預(yù)測(cè)結(jié)果的影響,缺乏對(duì)預(yù)測(cè)影響因素的關(guān)聯(lián)分析、過(guò)程推理和綜合評(píng)估,難以對(duì)預(yù)測(cè)過(guò)程進(jìn)行可靠性控制(王勁峰和徐成東,2017;高松,2020)。
綜上所述,國(guó)內(nèi)外研究針對(duì)短臨降水預(yù)報(bào)精度和預(yù)測(cè)影響因素進(jìn)行了評(píng)估與分析。在空間精度評(píng)價(jià)和人工智能方法優(yōu)化方面取得了較大的進(jìn)展(劉瑞霞,2016;Sharma 等,2018)。然而,當(dāng)前研究存在可靠性過(guò)程建模不足、可靠性評(píng)估方法片面和可靠性傳播機(jī)制不明等問(wèn)題,具有片面性、不連續(xù)、離散性等特征,忽略了可靠性傳播分析的整體性、連續(xù)性和關(guān)聯(lián)性。因此,如何構(gòu)建科學(xué)合理的可靠性綜合評(píng)估指標(biāo)體系,建立有效的可靠性定量關(guān)聯(lián)推理模型,是短臨降水預(yù)報(bào)可靠性分析的前沿問(wèn)題。
可靠性分析是通過(guò)識(shí)別具體研究問(wèn)題的影響因素,對(duì)具有隨機(jī)性和關(guān)聯(lián)性的事件進(jìn)行描述與分析,確定不同事件之間的邏輯關(guān)系,建立可靠性推理模型,分析可靠性傳播過(guò)程中的規(guī)律,進(jìn)而提出相應(yīng)的改進(jìn)措施,提高預(yù)報(bào)的可靠性(史文中和張敏,2021)。本研究提出的短臨降水預(yù)報(bào)可靠性分析總體思路,如圖1 所示。短臨降水預(yù)報(bào)的目標(biāo)是預(yù)報(bào)未來(lái)0~6 h 的降水強(qiáng)度信息、降水時(shí)間信息和降水位置信息等。預(yù)報(bào)過(guò)程中,可靠性的影響因素來(lái)源于諸多因素的不確定性,如多源數(shù)據(jù)的誤差、預(yù)測(cè)方法的不完善性和建模方法的不準(zhǔn)確性等,而不同因素的可靠性會(huì)隨著模型的前向運(yùn)行而傳播。短臨降水預(yù)報(bào)可靠性分析的方法是過(guò)程建模、綜合評(píng)估和關(guān)聯(lián)推理,通過(guò)神經(jīng)網(wǎng)絡(luò)、殘差建模和注意力機(jī)制等人工智能技術(shù)進(jìn)行預(yù)測(cè)建模,從而提升短臨降水預(yù)報(bào)可靠性定量過(guò)程建模的整體性、可解釋性和精度等。
圖1 短臨降水預(yù)報(bào)可靠性分析總體思路Fig.1 Overall approach for reliability analysis of precipitation nowcasting
針對(duì)短臨降水預(yù)報(bào)過(guò)程中的不確定性因素,可以從數(shù)據(jù)與模型不確定性表征、模型結(jié)構(gòu)設(shè)計(jì)和不確定性傳播三個(gè)方面進(jìn)行可靠性過(guò)程建模。首先,研究概率–非概率聯(lián)合時(shí)變不確定性分析方法,對(duì)空間數(shù)據(jù)和模型參數(shù)中存在的隨機(jī)和認(rèn)知不確定性進(jìn)行聯(lián)合建模,從時(shí)空維度上表征空間數(shù)據(jù)和模型參數(shù)的不確定性;其次,提出基于物理過(guò)程指導(dǎo)的短臨降水概率預(yù)測(cè)方法,通過(guò)考慮天氣動(dòng)力學(xué)基本理論和短臨降水形成特征,利用卷積神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)、殘差建模和注意力機(jī)制等人工智能技術(shù),構(gòu)建基于深度學(xué)習(xí)的短臨降水預(yù)報(bào)模型;最后,基于預(yù)測(cè)模型和不確定性傳播理論,提出空間數(shù)據(jù)和模型參數(shù)不確定性的前向傳播方法,生成短臨降水時(shí)變概率預(yù)測(cè)結(jié)果,以概率視角量化預(yù)測(cè)結(jié)果不確定性。
針對(duì)現(xiàn)有短臨降水預(yù)報(bào)可靠性評(píng)估存在的片面性問(wèn)題,研究空間數(shù)據(jù)、模型參數(shù)和預(yù)測(cè)結(jié)果的可靠性評(píng)估方法,建立短臨降水預(yù)報(bào)可靠性綜合評(píng)估體系。首先,提出短臨降水預(yù)報(bào)可靠性指標(biāo)及計(jì)算方法,對(duì)影響短臨降水預(yù)報(bào)可靠性的不同因素進(jìn)行可靠性計(jì)算;其次,針對(duì)預(yù)測(cè)算法,計(jì)算目標(biāo)函數(shù)、訓(xùn)練數(shù)據(jù)和對(duì)抗樣本等因素對(duì)算法可靠性的影響;針對(duì)空間數(shù)據(jù)和預(yù)測(cè)結(jié)果,計(jì)算現(xiàn)勢(shì)性、準(zhǔn)確性、一致性、完整性和穩(wěn)健性指標(biāo);最后,基于專(zhuān)家經(jīng)驗(yàn)和指標(biāo)信息,設(shè)計(jì)主客觀賦權(quán)方法,對(duì)短臨降水預(yù)報(bào)可靠性指標(biāo)進(jìn)行主客觀賦權(quán)融合。構(gòu)建短臨降水預(yù)報(bào)可靠性綜合評(píng)估模型,實(shí)現(xiàn)短臨降水預(yù)報(bào)過(guò)程和結(jié)果可靠性的綜合評(píng)估。
長(zhǎng)期以來(lái),可靠性研究范式是根據(jù)輸入及相關(guān)約束條件,利用已經(jīng)建立的物理模型或者函數(shù)關(guān)系,得到期望的輸出結(jié)果(肖立志,2022)。這忽略了可靠性影響因素關(guān)聯(lián)關(guān)系不清的問(wèn)題。因此,本研究分析短臨降水預(yù)報(bào)可靠性影響因素,包括空間數(shù)據(jù)、模型參數(shù)、訓(xùn)練樣本、計(jì)算平臺(tái)、任務(wù)需求等因素,基于相關(guān)分析和專(zhuān)家經(jīng)驗(yàn),對(duì)可靠性傳播過(guò)程中的關(guān)鍵影響因子進(jìn)行識(shí)別;基于故障樹(shù)分析理論,分析影響因素可靠性與預(yù)測(cè)結(jié)果可靠性之間的邏輯關(guān)系,建立短臨降水預(yù)報(bào)可靠性推理模型,通過(guò)邏輯運(yùn)算方法、因素可靠性計(jì)算方法和采樣技術(shù),定量計(jì)算可靠性傳播過(guò)程;分析可靠性傳播過(guò)程中的分異性、關(guān)聯(lián)性與不確定性,探究可靠性影響因素之間的相互作用關(guān)系,計(jì)算可靠性影響因素的重要度,揭示短臨降水預(yù)報(bào)過(guò)程中的可靠性傳播規(guī)律。
本文提出的短臨降水預(yù)報(bào)可靠性分析總體技術(shù)路線,如圖2 所示。首先,基于多源氣象空間數(shù)據(jù)和人工智能預(yù)測(cè)方法,分析可靠性傳播中的影響因素和不確定性。其次,研究短臨降水預(yù)報(bào)可靠性過(guò)程建模方法,對(duì)空間數(shù)據(jù)和模型參數(shù)中的隨機(jī)和認(rèn)知不確定性進(jìn)行表征建模,提出概率–非概率時(shí)變不確定性表征方法。根據(jù)短臨降水形成特征,提出深度智能網(wǎng)絡(luò),對(duì)短臨降水時(shí)空特征進(jìn)行建模,根據(jù)短臨降水預(yù)測(cè)模型,對(duì)空間數(shù)據(jù)和模型參數(shù)的不確定性進(jìn)行前向傳播,開(kāi)展短臨降水集合概率預(yù)測(cè)。再次,研究短臨降水預(yù)報(bào)可靠性綜合評(píng)估方法,提出空間數(shù)據(jù)可靠性、模型參數(shù)可靠性和預(yù)測(cè)結(jié)果可靠性評(píng)估指標(biāo)。對(duì)不同因素的可靠性指標(biāo)進(jìn)行組合賦權(quán)融合,計(jì)算短臨降水預(yù)報(bào)整體可靠性,構(gòu)建短臨降水預(yù)報(bào)可靠性綜合評(píng)估模型。最后,研究短臨降水預(yù)報(bào)可靠性關(guān)聯(lián)推理模型,對(duì)短臨降水預(yù)報(bào)可靠性影響因素進(jìn)行識(shí)別和分析。構(gòu)建不同影響因素之間的邏輯關(guān)聯(lián)關(guān)系,提出預(yù)測(cè)可靠性關(guān)聯(lián)推理模型。分析可靠性傳播的分異性、關(guān)聯(lián)性、不確定性及影響因素重要度,揭示可靠性傳播規(guī)律。
圖2 短臨降水預(yù)報(bào)可靠性分析總體技術(shù)路線Fig.2 Overall technical route for reliability analysis of precipitation nowcasting
短臨降水預(yù)報(bào)可靠性過(guò)程建模方法技術(shù)路線,如圖3 所示。首先對(duì)空間數(shù)據(jù)和模型參數(shù)的隨機(jī)和認(rèn)知不確定性進(jìn)行聯(lián)合表征,獲得時(shí)變概率邊界。進(jìn)一步針對(duì)短臨降水影響因素和形成特征,建立物理過(guò)程指導(dǎo)的深度神經(jīng)網(wǎng)絡(luò)方法,對(duì)未來(lái)6 h 降水的發(fā)生發(fā)展和運(yùn)動(dòng)過(guò)程進(jìn)行建模。在模型訓(xùn)練的過(guò)程中,將數(shù)據(jù)和參數(shù)的不確定性融入訓(xùn)練過(guò)程,得到短臨降水時(shí)變概率預(yù)測(cè)結(jié)果。
圖3 短臨降水預(yù)報(bào)可靠性過(guò)程建模方法技術(shù)路線Fig.3 Technical route for process modeling methods in the reliability analysis of precipitation nowcasting
1)隨機(jī)和認(rèn)知不確定性時(shí)變表征方法
研究概率–非概率聯(lián)合時(shí)變不確定性建模方法,對(duì)空間數(shù)據(jù)與模型參數(shù)的隨機(jī)和認(rèn)知不確定性進(jìn)行聯(lián)合表征。隨機(jī)不確定性因素,如多源空間數(shù)據(jù)的隨機(jī)測(cè)量誤差或模型參數(shù)的隨機(jī)擾動(dòng),通過(guò)擬合合適的概率密度分布來(lái)表示不確定性分布。對(duì)于認(rèn)知不確定性,如數(shù)據(jù)不完整、信息模糊、知識(shí)缺乏、模型結(jié)構(gòu)不完善和參數(shù)經(jīng)驗(yàn)不足等,通過(guò)定義認(rèn)知不確定性的區(qū)間或上下概率邊界,即概率盒的形式來(lái)表征認(rèn)知不確定性。概率方法可以作為概率邊界方法的特例,即上下概率邊界相同,進(jìn)而對(duì)隨機(jī)和認(rèn)知不確定性開(kāi)展概率–非概率聯(lián)合不確定性表征??紤]不確定性在時(shí)間上的分異性,開(kāi)展空間數(shù)據(jù)和模型參數(shù)不確定性時(shí)變建模研究,即在每個(gè)時(shí)刻對(duì)數(shù)據(jù)或參數(shù)構(gòu)建概率盒,獲得時(shí)變概率邊界。在對(duì)每個(gè)時(shí)刻進(jìn)行不確定性表征時(shí),通過(guò)元數(shù)據(jù)、專(zhuān)家經(jīng)驗(yàn)、地面站點(diǎn)和多源數(shù)據(jù)四重組合等先驗(yàn)信息對(duì)空間數(shù)據(jù)不確定性進(jìn)行時(shí)變表征,通過(guò)增量學(xué)習(xí)、模型微調(diào)、隨機(jī)正則化等方法對(duì)模型參數(shù)進(jìn)行時(shí)變表征。
2)基于深度學(xué)習(xí)的短臨降水概率預(yù)測(cè)
首先,根據(jù)影響短臨降水發(fā)生發(fā)展的中尺度天氣系統(tǒng),如槽、氣旋、鋒面、切變線、低渦和急流等模式,以及大氣運(yùn)動(dòng)方程,包括運(yùn)動(dòng)方程、連續(xù)方程、水汽方程、狀態(tài)方程和熱力學(xué)方程,研究短臨降水影響因素和形成特征,深入分析不同天氣系統(tǒng)的形成機(jī)制和動(dòng)力學(xué)過(guò)程;然后,結(jié)合現(xiàn)有深度學(xué)習(xí)框架和技術(shù),包括卷積神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)、轉(zhuǎn)換器(transformer)、殘差網(wǎng)絡(luò)和生成對(duì)抗網(wǎng)絡(luò),將短臨降水物理過(guò)程及其特征映射到深度網(wǎng)絡(luò)結(jié)構(gòu)中,使得網(wǎng)絡(luò)結(jié)構(gòu)更符合短臨降水形成的時(shí)空傳播和響應(yīng)機(jī)制;最后,對(duì)短臨降水形成及發(fā)展的時(shí)空特征進(jìn)行建模,包括多因素三維空間耦合、短臨降水過(guò)程時(shí)間記憶、多因素時(shí)空全局關(guān)聯(lián)、預(yù)測(cè)過(guò)程殘差以及混沌過(guò)程,建立物理過(guò)程指導(dǎo)的深度神經(jīng)網(wǎng)絡(luò)方法,設(shè)計(jì)用于捕捉短臨降水信號(hào)的結(jié)構(gòu)單元。對(duì)短臨降水未來(lái)6 h 的發(fā)生發(fā)展和運(yùn)動(dòng)過(guò)程進(jìn)行建模,提升短臨降水智能預(yù)測(cè)模型結(jié)構(gòu)的合理性。
3)短臨降水預(yù)報(bào)不確定性傳播方法
基于空間數(shù)據(jù)和模型參數(shù)時(shí)變表征方法,在模型訓(xùn)練的過(guò)程中,將數(shù)據(jù)和參數(shù)的不確定性融入訓(xùn)練過(guò)程,隨著網(wǎng)絡(luò)結(jié)構(gòu)逐層前向傳播。在傳播過(guò)程中,通過(guò)雙層蒙特卡羅方法對(duì)數(shù)據(jù)和參數(shù)的時(shí)變不確定性進(jìn)行采樣,在外層采樣中,對(duì)時(shí)變概率盒的分布參數(shù)進(jìn)行采樣,得到一系列采樣點(diǎn)的集合,在內(nèi)層抽樣中,對(duì)模型和參數(shù)的概率密度分布進(jìn)行采樣,獲得函數(shù)響應(yīng)值。在預(yù)測(cè)的每個(gè)時(shí)刻,均通過(guò)雙層采樣對(duì)數(shù)據(jù)和模型參數(shù)不確定性進(jìn)行傳播。通過(guò)模型的逐層傳播,將輸入數(shù)據(jù)和參數(shù)的時(shí)變不確定性傳播到輸出層。根據(jù)短臨降水智能預(yù)報(bào)模型,輸出層為0~6 h 的降水量空間預(yù)測(cè)值集合,代表降水量預(yù)測(cè)的概率分布,即短臨降水概率預(yù)測(cè)結(jié)果,通過(guò)蒙特卡羅采樣可以獲得降水量預(yù)測(cè)的均值和方差。
短臨降水預(yù)報(bào)可靠性綜合評(píng)估方法技術(shù)路線,如圖4 所示。首先研究空間數(shù)據(jù)、模型參數(shù)和預(yù)測(cè)結(jié)果可靠性指標(biāo)設(shè)計(jì)和計(jì)算方法,進(jìn)而根據(jù)專(zhuān)家經(jīng)驗(yàn)、指標(biāo)關(guān)聯(lián)性和可靠性融合方法對(duì)短臨降水預(yù)報(bào)可靠性進(jìn)行綜合評(píng)估,建立短臨降水預(yù)報(bào)可靠性綜合評(píng)估指標(biāo)體系。
圖4 短臨降水預(yù)報(bào)可靠性綜合評(píng)估方法技術(shù)路線Fig.4 Technical route for comprehensive evaluation methods in the reliability analysis of precipitation nowcasting
可靠性評(píng)估的內(nèi)容是針對(duì)具體研究對(duì)象,構(gòu)建相應(yīng)的可靠性評(píng)估指標(biāo),計(jì)算整體可靠性。在可靠性評(píng)估過(guò)程中,需要考慮空間數(shù)據(jù)和模型參數(shù)的不可靠性及可靠性評(píng)估的整體性(Lin 等,2018)。設(shè)計(jì)綜合評(píng)估體系的關(guān)鍵在于評(píng)估指標(biāo)的選取和權(quán)重設(shè)計(jì)。評(píng)價(jià)指標(biāo)的權(quán)重體現(xiàn)了各個(gè)評(píng)價(jià)指標(biāo)的相對(duì)重要程度,會(huì)直接影響整個(gè)評(píng)估的可信度(任紀(jì)安等,2019)。
1)空間數(shù)據(jù)可靠性評(píng)估指標(biāo)及計(jì)算方法
降水?dāng)?shù)據(jù)的可靠性研究應(yīng)從以下五個(gè)方面考慮。
(1)完整性,空間數(shù)據(jù)的位置和屬性信息與實(shí)際情況相比較,是否存在和缺失。
(2)準(zhǔn)確性,空間數(shù)據(jù)的位置和屬性信息與實(shí)際情況相比較的準(zhǔn)確程度。
(3)一致性,空間數(shù)據(jù)在空間上的分布、時(shí)間趨勢(shì)和季節(jié)變化上的一致程度。
(4)現(xiàn)勢(shì)性,空間數(shù)據(jù)生成時(shí)間與實(shí)際情況觀測(cè)時(shí)刻的差別程度。
(5)穩(wěn)健性,空間數(shù)據(jù)由不同傳感器進(jìn)行觀測(cè)時(shí)的抗干擾能力。
2)模型參數(shù)可靠性評(píng)估指標(biāo)及計(jì)算方法
對(duì)于降水預(yù)報(bào)模型,計(jì)算目標(biāo)函數(shù)、訓(xùn)練數(shù)據(jù)、對(duì)抗樣本、平臺(tái)依賴和算法性能對(duì)模型參數(shù)可靠性的影響。
(1)在目標(biāo)函數(shù)中,分析收斂能力和擬合程度對(duì)模型可靠性的影響。若模型在這些數(shù)據(jù)集上的擬合程度都達(dá)到較高的水平,則擬合能力較強(qiáng)。
(2)在訓(xùn)練數(shù)據(jù)中,分析數(shù)據(jù)均衡和數(shù)據(jù)規(guī)模對(duì)模型參數(shù)可靠性的影響。
(3)在對(duì)抗樣本中,分析以黑盒和白盒方式生成的樣本對(duì)模型可靠性的影響。在黑盒方式中,目標(biāo)模型未知,通過(guò)代理模型按照白盒方式生成樣本。在白盒方式中,目標(biāo)模型已知,按照梯度下降方法生成樣本。
(4)在平臺(tái)依賴中,分析不同學(xué)習(xí)框架和操作系統(tǒng)對(duì)模型可靠性的影響。在學(xué)習(xí)框架中,分析不同框架在利用模型開(kāi)展預(yù)測(cè)時(shí)的差異程度。對(duì)于操作系統(tǒng),分析預(yù)測(cè)模型在不同操作系統(tǒng)上的差異程度。
(5)在算法性能方面,分析模型在響應(yīng)時(shí)間和完成任務(wù)指標(biāo)方面的能力。
3)預(yù)測(cè)結(jié)果可靠性評(píng)估指標(biāo)及計(jì)算方法
計(jì)算預(yù)測(cè)結(jié)果的完整性、準(zhǔn)確性、一致性、 現(xiàn)勢(shì)性和穩(wěn)健性指標(biāo)。
(1)完整性,預(yù)測(cè)結(jié)果與現(xiàn)實(shí)世界待預(yù)測(cè)時(shí)段在空間和時(shí)間的符合及缺失程度。
(2)準(zhǔn)確性,預(yù)測(cè)結(jié)果和現(xiàn)實(shí)世界真實(shí)觀測(cè)的差別程度。除了絕對(duì)預(yù)測(cè)誤差之外,進(jìn)一步計(jì)算短臨降水事件預(yù)測(cè)的成功率、漏報(bào)率、誤報(bào)率及綜合預(yù)報(bào)得分。
(3)一致性,預(yù)測(cè)結(jié)果和現(xiàn)實(shí)世界真實(shí)觀測(cè)在空間分布與時(shí)間趨勢(shì)上的一致性程度。
(4)現(xiàn)勢(shì)性,預(yù)測(cè)結(jié)果是否能滿足空間上每個(gè)時(shí)刻實(shí)時(shí)預(yù)測(cè)的需求。
(5)穩(wěn)健性,預(yù)測(cè)結(jié)果對(duì)于樣本分布和樣本規(guī)模等因素的依賴程度。
利用以上指標(biāo),根據(jù)氣象專(zhuān)家經(jīng)驗(yàn)和指標(biāo)本身關(guān)聯(lián)信息,分別計(jì)算主觀和客觀權(quán)重,進(jìn)而權(quán)衡主客觀權(quán)重進(jìn)行組合賦權(quán),對(duì)可靠性指標(biāo)進(jìn)行加權(quán)融合,最終計(jì)算短臨降水預(yù)報(bào)整體可靠性指數(shù)。在主觀權(quán)重確定方面,通過(guò)多個(gè)氣象專(zhuān)家在短臨降水預(yù)測(cè)方面的經(jīng)驗(yàn)與領(lǐng)域規(guī)范要求,綜合確定不同可靠性指標(biāo)的重要性;對(duì)于客觀權(quán)重,通過(guò)信息熵方法構(gòu)建權(quán)重。通過(guò)主客觀評(píng)價(jià)方法的融合,可以分別對(duì)數(shù)據(jù)、模型和預(yù)測(cè)結(jié)果進(jìn)行可靠性評(píng)估,同時(shí)基于數(shù)據(jù)與模型可靠性計(jì)算過(guò)程可靠性。
短臨降水預(yù)報(bào)可靠性關(guān)聯(lián)推理模型技術(shù)路線,如圖5 所示?;诳煽啃栽u(píng)估結(jié)果,分析短臨降水預(yù)報(bào)的可靠性影響因素,建立短臨降水預(yù)報(bào)可靠性推理模型,對(duì)預(yù)測(cè)過(guò)程的可靠性影響因素進(jìn)行關(guān)聯(lián)推理,分析可靠性傳播規(guī)律。
圖5 短臨降水預(yù)報(bào)可靠性關(guān)聯(lián)推理模型技術(shù)路線Fig.5 Technical route for relational inference model in the reliability analysis of precipitation nowcasting
1)短臨降水預(yù)報(bào)可靠性影響因素識(shí)別
分析影響短臨降水預(yù)報(bào)可靠性的關(guān)鍵因素,包括空間數(shù)據(jù)、模型參數(shù)、訓(xùn)練過(guò)程、計(jì)算平臺(tái)和評(píng)價(jià)方法中的因素與指標(biāo)。
(1)針對(duì)空間數(shù)據(jù),選擇完整性、準(zhǔn)確性、一致性、現(xiàn)勢(shì)性和穩(wěn)健性指標(biāo)因素。
(2)針對(duì)模型參數(shù),選擇模型結(jié)構(gòu)合理性、參數(shù)賦值準(zhǔn)確性、對(duì)抗樣本生成方式和目標(biāo)函數(shù)指標(biāo)因素。
(3)針對(duì)訓(xùn)練過(guò)程,選擇參數(shù)優(yōu)化算法、迭代終止準(zhǔn)則、訓(xùn)練數(shù)據(jù)規(guī)模和訓(xùn)練數(shù)據(jù)均衡性因素。
(4)對(duì)于計(jì)算平臺(tái),包括系統(tǒng)穩(wěn)健性和計(jì)算框架因素。
(5)對(duì)于評(píng)價(jià)方法,包括加權(quán)方式和指標(biāo)設(shè)置因素。
研究可靠性影響因素計(jì)算方法,對(duì)眾多影響因素進(jìn)行可靠性計(jì)算。例如,模型結(jié)構(gòu)合理性是在其他參數(shù)不變的情況下,模型結(jié)構(gòu)的變化在訓(xùn)練和驗(yàn)證數(shù)據(jù)集上能達(dá)到的最優(yōu)精度。參數(shù)賦值準(zhǔn)確性是參數(shù)不可靠性情況下的預(yù)測(cè)精度和最優(yōu)參數(shù)情況下的預(yù)測(cè)精度差別。類(lèi)似地,對(duì)所有可靠性影響因素進(jìn)行可靠性計(jì)算。
2)短臨降水預(yù)報(bào)可靠性過(guò)程推理模型
基于故障樹(shù)方法對(duì)影響可靠性的因子進(jìn)行可靠性關(guān)聯(lián)建模,建立可靠性推理模型。將可靠性研究目標(biāo)和不同因素劃分為頂事件、中間事件與底事件,構(gòu)建底事件之間、底事件與中間事件、中間事件之間,以及中間事件和頂事件的邏輯關(guān)系,包括與、或、非、順序、加權(quán)等關(guān)系。在可靠性計(jì)算中,考慮影響因素可靠性的不確定性,對(duì)可靠性進(jìn)行時(shí)變概率表征,即在不同時(shí)刻構(gòu)建影響因素可靠性的區(qū)間分布,而不是固定的數(shù)值。通過(guò)蒙特卡羅采樣對(duì)可靠性傳播過(guò)程進(jìn)行計(jì)算,根據(jù)可靠性推理模型最終推理出預(yù)測(cè)結(jié)果可靠性。考慮可靠性傳播在空間和時(shí)間上的分異性,計(jì)算可靠性傳播過(guò)程。考慮可靠性傳播在時(shí)間上的記憶性,利用馬爾可夫鏈構(gòu)建可靠性影響因素在不同預(yù)測(cè)時(shí)長(zhǎng)(0~6 h)的狀態(tài)轉(zhuǎn)移概率。
3)短臨降水預(yù)報(bào)可靠性傳播規(guī)律分析
根據(jù)可靠性推理模型,挖掘短臨降水預(yù)報(bào)可靠性傳播規(guī)律,包括可靠性影響因素關(guān)聯(lián)性、可靠性傳播空間分異、可靠性傳播時(shí)間分異、可靠性傳播不確定性、影響因素重要度和可靠性傳播時(shí)間記憶。其中,影響因素關(guān)聯(lián)性是不同影響因素在可靠性傳播過(guò)程中的關(guān)聯(lián)性,包括邏輯關(guān)系和可靠性轉(zhuǎn)移程度;可靠性傳播空間分異是可靠性傳播過(guò)程在空間上的分異程度,如可靠性傳播空間異質(zhì)性、空間相關(guān)性、空間一致性等;可靠性傳播時(shí)間分異是可靠性傳播在不同時(shí)間上的分布規(guī)律,包括趨勢(shì)性、季節(jié)性、平穩(wěn)性、隨機(jī)性等特征;可靠性傳播不確定性包括隨機(jī)因素的影響、采樣方法合理性、影響因素完整性和準(zhǔn)確性等因素;影響因素重要度是影響因素在不可靠的情況下對(duì)預(yù)測(cè)結(jié)果的概率分布的影響,影響程度越大則重要度越大;可靠性傳播時(shí)間記憶是影響因素的可靠性隨著預(yù)測(cè)時(shí)長(zhǎng)(0~6 h)的變化如何轉(zhuǎn)移。
本文提出了短臨降水預(yù)報(bào)可靠性分析的技術(shù)體系,而技術(shù)體系的有效性則需要后續(xù)進(jìn)一步的實(shí)驗(yàn)驗(yàn)證。例如,可以通過(guò)建立對(duì)照實(shí)驗(yàn)來(lái)驗(yàn)證提出的可靠性過(guò)程建模體系的有效性。實(shí)驗(yàn)組基于概率–非概率聯(lián)合時(shí)變不確定性進(jìn)行建模,對(duì)空間數(shù)據(jù)和模型參數(shù)的隨機(jī)和認(rèn)知不確定性進(jìn)行聯(lián)合表征,而后開(kāi)展預(yù)測(cè)實(shí)驗(yàn)得到預(yù)測(cè)結(jié)果。對(duì)照組與實(shí)驗(yàn)組使用同一數(shù)據(jù)集、同一預(yù)測(cè)方法,不考慮預(yù)測(cè)過(guò)程的不確定性或者只對(duì)其中一種不確定性進(jìn)行建模,通過(guò)比較實(shí)驗(yàn)組和對(duì)照組的預(yù)測(cè)結(jié)果與實(shí)際觀測(cè)數(shù)據(jù)的擬合效果,評(píng)估可靠性過(guò)程建模的有效性。同樣地,可以對(duì)可靠性綜合評(píng)估思路和可靠性關(guān)聯(lián)推理進(jìn)行驗(yàn)證。在可靠性評(píng)估驗(yàn)證中,運(yùn)用本文提出的可靠性評(píng)估指標(biāo)和加權(quán)方法,和傳統(tǒng)可靠性評(píng)估方法進(jìn)行對(duì)比,分析本文提出的評(píng)估體系的有效性。在可靠性關(guān)聯(lián)推理方面,運(yùn)用本文提出的可靠性影響因素和推理模型,和傳統(tǒng)可靠性推理方法進(jìn)行對(duì)比,定性和定量比較二者在因素推理方面的能力。
目前,人工智能技術(shù)在短臨降水預(yù)報(bào)方面得到了廣泛的應(yīng)用,如LSTM、RNN、CNN、Transformer方法等。主流的短臨降水預(yù)報(bào)方法,從傳統(tǒng)的數(shù)值天氣預(yù)報(bào)、光流法到人工智能和物理模型耦合的天氣預(yù)報(bào),預(yù)報(bào)方法復(fù)雜多樣,然而預(yù)報(bào)的可靠性尚未進(jìn)行全面有效的分析、評(píng)估和控制,亟需進(jìn)一步的研究。
現(xiàn)有的短臨降水預(yù)報(bào)可靠性分析研究存在單一性、片面性和不完整性等問(wèn)題,僅集中于分析某個(gè)影響因素(如模型結(jié)構(gòu)和參數(shù)優(yōu)化方法)對(duì)預(yù)測(cè)結(jié)果的影響,忽略了可靠性分析的整體性。本文提出短臨降水預(yù)報(bào)可靠性過(guò)程建模方法、短臨降水預(yù)報(bào)可靠性多方位多指標(biāo)綜合評(píng)估方法與短臨降水預(yù)報(bào)可靠性全生命周期過(guò)程推理模型,充分考慮了數(shù)據(jù)和模型的不確定性,提出了預(yù)測(cè)過(guò)程可靠性綜合評(píng)估和定量推理的基本思路。
觀測(cè)大數(shù)據(jù)、高性能計(jì)算技術(shù)的發(fā)展為可靠性分析提供了良好的數(shù)據(jù)基礎(chǔ)和堅(jiān)實(shí)的計(jì)算支撐,氣象理論的不斷完善和人工智能的飛速發(fā)展使得人工智能與物理模型的耦合能創(chuàng)造更多可能,可靠性分析有望為數(shù)據(jù)驅(qū)動(dòng)的短臨降水預(yù)報(bào)提供更可靠的信息和知識(shí),為預(yù)報(bào)精度和模型健壯性的提升提供理論指導(dǎo)。針對(duì)本文提出的短臨降水預(yù)報(bào)可靠性分析總體思路,在后續(xù)研究中進(jìn)行實(shí)驗(yàn)驗(yàn)證并加以完善,推動(dòng)短臨降水預(yù)報(bào)的研究進(jìn)展。