吳香華 華亞婕 官元紅 王巍巍 劉端陽(yáng)
吉林省位于中國(guó)東北地區(qū)中部,大部分地區(qū)屬于溫帶季風(fēng)氣候,降水、氣溫和氣象災(zāi)害的時(shí)空分布差異較大.吉林省是我國(guó)重要的糧食和農(nóng)產(chǎn)品生產(chǎn)地,穩(wěn)定的農(nóng)業(yè)生產(chǎn)環(huán)境是保證糧食產(chǎn)量的根本因素[1].研究降水預(yù)測(cè),對(duì)預(yù)防氣象災(zāi)害、穩(wěn)定農(nóng)業(yè)生產(chǎn)和經(jīng)濟(jì)發(fā)展具有重要的戰(zhàn)略意義[2].
近年來(lái),基于現(xiàn)代統(tǒng)計(jì)方法的人工智能理論和應(yīng)用迅速發(fā)展,相關(guān)技術(shù)被廣泛應(yīng)用于降水預(yù)測(cè)中.運(yùn)用現(xiàn)代統(tǒng)計(jì)模型和人工智能方法改進(jìn)傳統(tǒng)的降水發(fā)生模型,提高預(yù)測(cè)精度是科研和業(yè)務(wù)中提升管理水資源決策可靠性的迫切需求[3-4].在運(yùn)用Logistic模型對(duì)全國(guó)范圍內(nèi)強(qiáng)降水的研究中,引進(jìn)主成分分析和Bootstrap抽樣技術(shù)能進(jìn)一步改善模型過(guò)擬合的問(wèn)題[5].將隨機(jī)森林應(yīng)用到降水發(fā)生的預(yù)測(cè),并與C4.5決策樹(shù)和SQIL決策樹(shù)進(jìn)行比較,發(fā)現(xiàn)隨機(jī)森林的準(zhǔn)確度高于其他類型的決策樹(shù),但建模所需時(shí)間遠(yuǎn)大于其他方法[6].Ortiz-Garcia等[7]使用支持向量機(jī)(Support Vector Machine,SVM)預(yù)測(cè)降水量,與決策樹(shù)、極限學(xué)習(xí)機(jī)等方法比較,并評(píng)估不同資料的可靠性,發(fā)現(xiàn)隨著樣本量的增加,SVM的核函數(shù)映射維度提高、計(jì)算量增加從而影響模型的時(shí)效性.
BP神經(jīng)網(wǎng)絡(luò)具有較好的非線性映射能力,比傳統(tǒng)統(tǒng)計(jì)方法更加適合非線性的降水研究.在對(duì)不同環(huán)流型下的降水觀測(cè)資料進(jìn)行降尺度預(yù)報(bào)的研究中,發(fā)現(xiàn)BP神經(jīng)網(wǎng)絡(luò)對(duì)暴雨預(yù)測(cè)的相對(duì)偏差指數(shù)最小,預(yù)測(cè)效果最優(yōu)[8].在預(yù)報(bào)中心地區(qū)和周圍地區(qū)運(yùn)用多層感知機(jī)(Multilayer Perceptron,MLP)建立不同地區(qū)與降水之間的關(guān)系以預(yù)測(cè)3 h降水,比日本氣象廳數(shù)值模式的均方根誤差降低了1.5 mm[9].針對(duì)較長(zhǎng)時(shí)間尺度的歷史數(shù)據(jù),神經(jīng)網(wǎng)絡(luò)方法能夠快速學(xué)習(xí)到數(shù)據(jù)的主要特征.李增[10]基于長(zhǎng)達(dá)56年的東北地區(qū)氣象觀測(cè)數(shù)據(jù)進(jìn)行干旱預(yù)測(cè),結(jié)果發(fā)現(xiàn),深度學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)模型比MLP的預(yù)測(cè)性能提高24.19%,且明顯優(yōu)于傳統(tǒng)的統(tǒng)計(jì)預(yù)測(cè)模型.
卷積神經(jīng)網(wǎng)絡(luò)能快速捕捉降水?dāng)?shù)據(jù)的非線性關(guān)系并緩解過(guò)擬合問(wèn)題,能夠顯著改善降水預(yù)報(bào)模型的效果[11].當(dāng)輸入數(shù)據(jù)的向量維度過(guò)大,易出現(xiàn)維數(shù)災(zāi)難問(wèn)題而降低模型的學(xué)習(xí)效率.Attention機(jī)制是一種有效獲得良好結(jié)果的機(jī)制,其關(guān)鍵是對(duì)重要信息提高注意力,利用注意力機(jī)制確定氣象因素對(duì)降水預(yù)測(cè)的影響權(quán)重.在卷積神經(jīng)網(wǎng)絡(luò)中加入Attention機(jī)制,通過(guò)對(duì)中間層神經(jīng)元分配不同的概率權(quán)重,使得神經(jīng)網(wǎng)絡(luò)模型更加關(guān)注對(duì)降水發(fā)生影響較大的信息,減少甚至忽略對(duì)降水預(yù)測(cè)影響較小信息的關(guān)注[12].
本文提出將Attention應(yīng)用于卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)中,加入BP神經(jīng)網(wǎng)絡(luò)(Back Propagation,BP)對(duì)整個(gè)組合模型進(jìn)行調(diào)參.將預(yù)處理后的降水影響因素作為輸入向量,進(jìn)行神經(jīng)網(wǎng)絡(luò)降維.在 CNN隱藏層中,引入Attention機(jī)制來(lái)捕捉氣壓、風(fēng)速、氣溫和相對(duì)濕度的特征對(duì)降水發(fā)生影響的重要程度.將經(jīng)過(guò)CNN層和Attention層降維后的特征向量輸入BP神經(jīng)網(wǎng)絡(luò)進(jìn)行降水發(fā)生預(yù)測(cè),并對(duì)模型性能進(jìn)行評(píng)估分析.
本文的數(shù)據(jù)來(lái)源于國(guó)家氣象科學(xué)數(shù)據(jù)中心(http:∥data.cma.cn)的中國(guó)地面氣候資料日值數(shù)據(jù)集(V3.0).根據(jù)不同的氣候類型,選取吉林省的長(zhǎng)春站、白城站、延吉站為研究站點(diǎn),各站點(diǎn)信息見(jiàn)表1.選用1961—2020年夏季6—8月的20—次日20時(shí)本站平均氣壓(hPa)、平均風(fēng)速(m/s)、平均氣溫(℃)和平均相對(duì)濕度(%)為物理協(xié)變量,降水發(fā)生與否為研究的目標(biāo)變量.
對(duì)研究數(shù)據(jù)進(jìn)行質(zhì)量控制.為了加快模型的收斂速度,減少離群點(diǎn)的影響,對(duì)數(shù)據(jù)記錄中的物理協(xié)變量進(jìn)行歸一化處理[13],公式如下:
(1)
卷積神經(jīng)網(wǎng)絡(luò)是一種前饋式神經(jīng)網(wǎng)絡(luò),由輸入層、卷積層、池化層、全連接層及輸出層構(gòu)成,結(jié)構(gòu)如圖1所示.卷積層和池化層專門(mén)用來(lái)數(shù)據(jù)預(yù)處理,任務(wù)是過(guò)濾輸入數(shù)據(jù)、提取有用的信息用作輸入.卷積層在原始輸入數(shù)據(jù)和生成新特征值的卷積核之間進(jìn)行卷積運(yùn)算.這種技術(shù)最初用于從圖像數(shù)據(jù)集中提取特征[14],輸入數(shù)據(jù)必須是結(jié)構(gòu)化的矩陣形式.
相對(duì)于輸入矩陣,卷積核(濾波器)被認(rèn)為是一個(gè)小窗口,包含矩陣形式的系數(shù)值.這個(gè)窗口滑動(dòng)整個(gè)輸入矩陣,對(duì)輸入矩陣中的指定窗口遇到每個(gè)子區(qū)域進(jìn)行卷積運(yùn)算.所有數(shù)據(jù)經(jīng)過(guò)操作后的結(jié)果稱為卷積矩陣,表示由系數(shù)值和應(yīng)用濾波器的尺寸大小所指定的特征值[15].通過(guò)對(duì)輸入數(shù)據(jù)應(yīng)用不同的卷積核,可以生成多個(gè)卷積特征,這些特征通常比輸入數(shù)據(jù)的原始特征更重要,從而可以提高模型的性能.池化層從卷積特征中二次采樣,提取特征值并產(chǎn)生低維矩陣,以減少網(wǎng)絡(luò)的參數(shù),提高模型的魯棒性.通過(guò)上述類似的過(guò)程,與卷積層上執(zhí)行的操作一樣,池化層利用最小滑動(dòng)窗口,將卷積特征的每個(gè)子區(qū)域的值作為輸入并輸出一個(gè)新的值.
表1 研究站點(diǎn)的地理特征和降水頻率
圖1 卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)Fig.1 Architecture of convolutional neural network
將Attention機(jī)制(圖2)加入神經(jīng)網(wǎng)絡(luò)中,考慮過(guò)去狀態(tài)不同的影響因子,捕捉與日降水量相關(guān)的最重要部分.為了充分利用過(guò)去的狀態(tài)信息,本文提出的CNN-Attention-BP組合模型在CNN層上增加一個(gè)注意力層,目的是降低甚至忽略與降水發(fā)生無(wú)關(guān)的信息,改變對(duì)重要信息的注意力.關(guān)鍵是對(duì)神經(jīng)元分配不同的概率權(quán)重,使得模型更加注意到影響分類預(yù)測(cè)較大的數(shù)據(jù)信息以提高預(yù)測(cè)準(zhǔn)確率[16].
圖2 注意力機(jī)制的結(jié)構(gòu)Fig.2 Architecture of attention mechanism
反向傳播神經(jīng)算法(Back Propagation Neural Network)簡(jiǎn)稱BP神經(jīng)網(wǎng)絡(luò),是一種基于誤差反向傳播的多層前饋網(wǎng)絡(luò).BP網(wǎng)絡(luò)包括輸入層、隱藏層、輸出層,訓(xùn)練過(guò)程由網(wǎng)絡(luò)信號(hào)的正向傳遞和誤差的反向傳遞組成[17],結(jié)構(gòu)如圖3所示.前者為信號(hào)的前向傳遞,傳遞正方向計(jì)算輸出值;后者采用梯度下降法調(diào)整權(quán)值和閾值來(lái)計(jì)算目標(biāo)函數(shù)的最優(yōu)值[18].
本文提出的組合模型結(jié)構(gòu)主要分為Input層、CNN層、Attention層、BP層和Output層,流程如圖4所示.
圖3 BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)Fig.3 Architecture of BP neural network
圖4 CNN-Attention-BP組合模型流程Fig.4 Flow chart of the CNN-Attention-BP model
將降水相關(guān)的歷史數(shù)據(jù)
作為組合模型的輸入,xi1表示降水發(fā)生的標(biāo)簽值,i=1,…,n;xi2,…,xnp表示第p個(gè)影響因子歸一化后的序列.首先經(jīng)過(guò)卷積層連接一個(gè)非線性激活函數(shù)ReLU,然后選取常用的最大值池化進(jìn)行運(yùn)算,即提取池化層中元素的最大值.經(jīng)過(guò)卷積層和池化層后原始數(shù)據(jù)被映射到隱層特征空間,再搭建選用Sigmoid激活函數(shù)的全連接層將其轉(zhuǎn)換輸出以解決降水分類問(wèn)題,最后得到輸出的特征向量[19].
首先,將CNN層的輸出特征向量Yc表示為
Z1=f(X?W1+b1)=ReLU(X?W1+b1),
(2)
F1=max(C1)+b2,
(3)
Z2=f(F1?W2+b3)=ReLU(F1?W2+b3),
(4)
F2=max(Z2)+b4,
(5)
Yc=f(F2×W3+b5)=Sigmoid(Z2×W3+b5),
(6)
式中:Z1,Z2分別為第1層和第2層卷積的輸出;F1,F2分別為池化1層和2層的輸出;W1,W2,W3為權(quán)重矩陣;b1,b2,b3,b4,b5為偏差;?和max()分別為卷積運(yùn)算和最大值函數(shù);CNN層輸出的長(zhǎng)度為t;Yc=[Yc1,Yc2,…,Yct]T.
然后,將經(jīng)過(guò)CNN隱藏層激活處理后的向量Y作為Attention層的輸入,經(jīng)非線性轉(zhuǎn)化成et表示第t個(gè)樣本經(jīng)過(guò)CNN層輸出向量ht的特征狀態(tài)矩陣,如式(7):
et=utanh(wlht+b),
(7)
u和wl為權(quán)重矩陣,b為偏置矩陣.其次,對(duì)每一個(gè)變量賦予初始權(quán)值,再通過(guò)softmax層進(jìn)行歸一化得到注意力權(quán)重,計(jì)算方式如下:
(8)
(9)
其中,?t為注意力向量,st為Attention層在第t時(shí)刻的輸出.
將經(jīng)過(guò)CNN、Attention層后的輸出向量記為Xc=[xc1,xc2,…,xcl]T,表示l維的BP神經(jīng)網(wǎng)絡(luò)輸入向量,Y=[y1,y2,…,ym]T表示預(yù)測(cè)值,初始化權(quán)重值Wpq,Wqk以及隱含層閾值aq和輸出層閾值bk后,進(jìn)行前向傳播與后向傳播.本文在BP各隱含層節(jié)點(diǎn)使用Sigmoid激活函數(shù),則神經(jīng)節(jié)點(diǎn)l輸入表示為
(10)
式中l(wèi)為隱藏層節(jié)點(diǎn)數(shù),f為隱藏層激勵(lì)函數(shù).經(jīng)過(guò)隱藏層得到預(yù)測(cè)模型的輸出:
(11)
當(dāng)Yk為實(shí)際值,有誤差函數(shù):
ek=Yk-Ok.
(12)
最后,計(jì)算輸出目標(biāo)向量和實(shí)際值的誤差.若全局誤差比設(shè)定的誤差值小,固定當(dāng)前的權(quán)重和閾值各參數(shù)值,學(xué)習(xí)結(jié)束,輸出預(yù)測(cè)向量Y=[y1,y2,…,yf]T;若不在誤差范圍內(nèi),誤差值進(jìn)行反向傳遞以更新權(quán)值和閾值.
基于CNN-Attention-BP組合模型進(jìn)行降水發(fā)生預(yù)測(cè)的過(guò)程可劃分為兩個(gè)階段.第一階段為 1960—2000年6—8月的訓(xùn)練階段,第二階段為2001—2020年6—8月的預(yù)測(cè)階段.以長(zhǎng)春站為例,改進(jìn)后的卷積神經(jīng)網(wǎng)絡(luò)模型步驟如下:
Step1.將歸一化后的長(zhǎng)春站降水?dāng)?shù)據(jù)劃分為訓(xùn)練集和測(cè)試集.
Step2.將已清洗的與降水相關(guān)的氣象數(shù)據(jù)作為輸入變量,實(shí)際降水標(biāo)簽值為輸出變量,使用卷積神經(jīng)網(wǎng)絡(luò)方法進(jìn)行訓(xùn)練.將訓(xùn)練周期(Epoch)設(shè)定為1,初始化的學(xué)習(xí)率為0.1,Batch_Size表示訓(xùn)練一次選取的樣本數(shù),初始設(shè)定為32,捕捉降水相關(guān)序列的特征.
Step3.在CNN隱藏層引入Attention進(jìn)行訓(xùn)練,提取與降水發(fā)生相關(guān)性較強(qiáng)的氣象數(shù)據(jù).
Step4.再將Attention層的輸出結(jié)果輸入到BP神經(jīng)網(wǎng)絡(luò)中,實(shí)現(xiàn)對(duì)整個(gè)神經(jīng)網(wǎng)絡(luò)進(jìn)行調(diào)參,輸出預(yù)測(cè)向量和實(shí)際值的誤差;若不在誤差范圍內(nèi),返回Step2再次計(jì)算誤差梯度,更新權(quán)值,直至在誤差范圍內(nèi),訓(xùn)練結(jié)束,固定各參數(shù)值.隨著Epoch的增大,準(zhǔn)確率開(kāi)始下降,所以選取準(zhǔn)確率最高時(shí)的Epoch為9.由于批次過(guò)大會(huì)產(chǎn)生過(guò)擬合現(xiàn)象,故本文設(shè)定Batch為32、64、128和256.經(jīng)過(guò)前期訓(xùn)練,當(dāng)Batch為128時(shí)訓(xùn)練誤差最小.更新學(xué)習(xí)率為0.000 1.具體見(jiàn)圖5、圖6.此時(shí),BP的訓(xùn)練次數(shù)為10,學(xué)習(xí)率為0.002,批次大小為50.
圖5 模型在不同訓(xùn)練周期下的預(yù)測(cè)精度Fig.5 Forecast accuracy of the model with different epochs
圖6 模型在不同批次下的訓(xùn)練誤差Fig.6 Training loss of the model with different Batch_Size
Step5.利用參數(shù)優(yōu)化后的模型對(duì)測(cè)試集數(shù)據(jù)進(jìn)行建模,完成對(duì)降水發(fā)生模型的預(yù)測(cè).改進(jìn)后的神經(jīng)網(wǎng)絡(luò)方法的參數(shù)設(shè)置如表2所示.
表2 改進(jìn)的神經(jīng)網(wǎng)絡(luò)方法的參數(shù)
本文在組合的預(yù)測(cè)模型訓(xùn)練過(guò)程中,選取 Adam (Adaptive moment estimation)[20]算法最小化目標(biāo)函數(shù),對(duì)神經(jīng)網(wǎng)絡(luò)參數(shù)進(jìn)行優(yōu)化.Adam算法能夠基于訓(xùn)練數(shù)據(jù)迭代更新神經(jīng)網(wǎng)絡(luò)的權(quán)重,使損失函數(shù)輸出值達(dá)到最優(yōu).同時(shí),使用交叉熵?fù)p失函數(shù)(Cross-Entropy Loss Function)作為評(píng)判指標(biāo),即:
(1-yi)·log(1-pi),i=1,…,f,
(10)
式中,floss表示交叉熵?fù)p失函數(shù),yi為樣本的期望輸出,pi為樣本的實(shí)際輸出.交叉熵其實(shí)是實(shí)際輸出概率與期望輸出概率的距離,即交叉熵的值越小,兩個(gè)概率分布就越接近,損失就更小.
僅使用交叉熵?fù)p失函數(shù)不能充分評(píng)估模型的性能,故選取可表明模型穩(wěn)定性的準(zhǔn)確率(A)以及評(píng)估模型泛化能力的F1-score(F1):
(11)
其中,TP表示正確預(yù)測(cè)為有降水的樣本數(shù),TN表示正確預(yù)測(cè)為無(wú)降水的樣本數(shù),FP表示錯(cuò)誤預(yù)測(cè)為有降水的樣本數(shù),FN表示錯(cuò)誤預(yù)測(cè)為無(wú)降水的樣本數(shù).
(12)
其中:
本文選用吉林省1961—2020年夏季6—8月的20—次日20時(shí)降水量、平均本站氣壓、平均風(fēng)速、平均氣溫和平均相對(duì)濕度數(shù)據(jù)來(lái)進(jìn)行組合模型的訓(xùn)練和測(cè)試.根據(jù)不同的氣候類型選擇具有代表性的長(zhǎng)春站、白城站、延吉站為研究站點(diǎn),使用SVM、MLP、單一的CNN和組合的CNN-Attention-BP方法分別對(duì)降水發(fā)生模型進(jìn)行預(yù)測(cè).其中,1961—2000年6—8月的氣象數(shù)據(jù)作為訓(xùn)練樣本,2001—2020年6—8月觀測(cè)資料用于預(yù)報(bào)效果的檢驗(yàn).
圖7 代表性站點(diǎn)不同模型的性能Fig.7 Performance comparison of different models for the studied stations
將上文提到的SVM、MLP、單一的CNN和CNN-Attention-BP方法的評(píng)估結(jié)果進(jìn)行對(duì)比.從圖7可見(jiàn):改進(jìn)后的CNN組合模型相較于其他單一的模型具有更高的預(yù)測(cè)精度,準(zhǔn)確率均大于80%;在損失函數(shù)直方圖中,CNN-Attention-BP具有更小的損失,尤其在可表明模型綜合性能的F1-score指標(biāo)中,本文提出的方法具有更高的神經(jīng)網(wǎng)絡(luò)模型的質(zhì)量.在不同站點(diǎn),新的組合模型準(zhǔn)確率更高,損失更小,效果明顯優(yōu)于單一模型.
根據(jù)定義可知,準(zhǔn)確率越高表明模型具有更好的預(yù)測(cè)精度.從表3的預(yù)測(cè)結(jié)果中,延吉站的CNN-Attention-BP組合模型的準(zhǔn)確率最高達(dá)到88.4%,相對(duì)于其他單一模型至少提高4.9個(gè)百分點(diǎn).交叉熵?fù)p失函數(shù)的值越小,損失就更小,表明實(shí)際輸出概率與期望輸出概率的距離越近.延吉站組合模型的交叉熵?fù)p失函數(shù)最小為52%,相較于其他方法最多降低10.5個(gè)百分點(diǎn);F1-score綜合考慮模型的精準(zhǔn)率與查全率的計(jì)算結(jié)果,在SVM中F1-score最低達(dá)到27.4%,MLP、CNN以及CNN-Attention-BP對(duì)應(yīng)的F1-score分別為35.9%、40.1%、42.4%.CNN-Attention-BP組合模型的F1-score最高,表明優(yōu)化后的CNN質(zhì)量更高.
表3 代表性站點(diǎn)不同模型的預(yù)測(cè)性能
對(duì)于長(zhǎng)春站的夏季降水發(fā)生模型,CNN-Attention-BP組合模型的準(zhǔn)確率最高可達(dá)85.9%,相較于SVM方法提高9.8個(gè)百分點(diǎn),相較MLP方法提高8.3個(gè)百分點(diǎn),相較CNN方法提高5.4個(gè)百分點(diǎn);交叉熵?fù)p失函數(shù)最高可降低8.8個(gè)百分點(diǎn);在F1-score方面,組合的CNN-Attention-BP模型最穩(wěn)定為41.1%,SVM最低為30.7%.
在白城站,CNN-Attention-BP的準(zhǔn)確率最高達(dá)到80.1%,相對(duì)于單一的CNN模型提高6.4個(gè)百分點(diǎn).此站點(diǎn)的準(zhǔn)確率比其他站點(diǎn)低,是因?yàn)榘壮菍贉貛Т箨懶詺夂?降水整體偏少,降水頻率只有0.36,表明無(wú)降水與有降水的總天數(shù)存在不平衡,即正負(fù)樣本數(shù)量的不均衡,導(dǎo)致傳統(tǒng)的統(tǒng)計(jì)模型不能較好地學(xué)習(xí)其降水特征,而優(yōu)化后的卷積神經(jīng)網(wǎng)絡(luò)可以快速地學(xué)習(xí)降水?dāng)?shù)據(jù)特征并找到重要信息進(jìn)行訓(xùn)練.交叉熵?fù)p失函數(shù)相對(duì)于其他方法至少降低5.6個(gè)百分點(diǎn);F1-score在SVM中最低為31.9%,MLP、CNN以及CNN-Attention-BP對(duì)應(yīng)的F1-score分別為36.3%、37.8%、40.5%.綜合分析,改進(jìn)的卷積神經(jīng)網(wǎng)絡(luò)方法的預(yù)測(cè)準(zhǔn)確率較為穩(wěn)定,在交叉熵?fù)p失函數(shù)和F1-score指標(biāo)上都有明顯的改進(jìn),表明組合的降水發(fā)生預(yù)測(cè)模型具有更好的性能.
由于降水發(fā)生事件的不確定性,本文提出一種基于CNN-Attention-BP的組合模型,將復(fù)雜的降水發(fā)生預(yù)測(cè)任務(wù)進(jìn)行分解.先采用卷積神經(jīng)網(wǎng)絡(luò)有效地學(xué)習(xí)與降水有關(guān)的氣象信息進(jìn)行特征提取,進(jìn)而利用Attention機(jī)制對(duì)重要的信息進(jìn)行權(quán)重分配,最后,使用BP對(duì)整個(gè)網(wǎng)絡(luò)進(jìn)行參數(shù)調(diào)整以達(dá)到最優(yōu)的預(yù)測(cè)結(jié)果.對(duì)吉林省代表性站點(diǎn)的夏季降水發(fā)生進(jìn)行預(yù)測(cè),結(jié)果表明:基于不同氣候類型的夏季降水發(fā)生相關(guān)序列,在溫帶大陸性氣候、降水頻率為0.36的白城站,本文提出的CNN-Attention-BP組合模型在準(zhǔn)確性方面,準(zhǔn)確率最高可提高17個(gè)百分點(diǎn);在衡量降水發(fā)生和不發(fā)生概率分布距離的損失函數(shù)指標(biāo)中,最高降低8.4個(gè)百分點(diǎn);代表模型泛化能力的綜合性指標(biāo),F1-score至少降低2.7個(gè)百分點(diǎn).在降水頻率近0.5的長(zhǎng)春站、延吉站,準(zhǔn)確率最高可達(dá)88.4%,損失函數(shù)最低為52%,F1-score最高為42.4%.比較代表性站點(diǎn)的性能評(píng)價(jià)指標(biāo),新的組合模型在降水發(fā)生預(yù)測(cè)方面穩(wěn)定性和準(zhǔn)確性更好,具有較好的適用性.