賈丙宏 楊 帥 冉 姝
(1. 山東科技大學(xué) 測(cè)繪與空間信息學(xué)院, 山東 青島 266590; 2. 濟(jì)南市勘察測(cè)繪研究院, 山東 濟(jì)南 250000; 3. 山東省巨野縣委宣傳部, 山東 菏澤 274900)
風(fēng)暴潮是由熱帶氣旋或溫帶氣旋等氣象條件在海洋表面的切向風(fēng)應(yīng)力推動(dòng)海水淹沒(méi)陸地的過(guò)程[1]。我國(guó)東南沿海是世界上風(fēng)暴潮災(zāi)害最嚴(yán)重的地區(qū)之一,全球約三分之一的臺(tái)風(fēng)來(lái)源于西北太平洋,我國(guó)東南沿海位于西北太平洋臺(tái)風(fēng)的主要移動(dòng)路徑上[2]。因此,一定的地理因素導(dǎo)致我國(guó)東南沿海長(zhǎng)期遭受臺(tái)風(fēng)風(fēng)暴潮。其中,浙江省是我國(guó)損失最嚴(yán)重的省份之一。據(jù)《中國(guó)海洋公報(bào)》統(tǒng)計(jì),2019年各類海洋災(zāi)害中,最嚴(yán)重的為風(fēng)暴潮災(zāi)害,占總直接經(jīng)濟(jì)損失的99%。其中,最嚴(yán)重的省是浙江省,達(dá)到了87.35億元。中央財(cái)經(jīng)委第三次會(huì)議上,習(xí)近平總書(shū)記對(duì)海洋防災(zāi)減災(zāi)工作作出重要指示,明確提出要“提升抵御臺(tái)風(fēng)、風(fēng)暴潮等海洋災(zāi)害能力”[3]。積極響應(yīng)國(guó)家戰(zhàn)略,及時(shí)、準(zhǔn)確地評(píng)估風(fēng)暴潮災(zāi)害造成的直接經(jīng)濟(jì)損失,對(duì)減災(zāi)政策的制定具有指導(dǎo)意義,根據(jù)損失的程度和大小確定災(zāi)后補(bǔ)償和重建的力度,能為災(zāi)后的救助工作提供強(qiáng)有力的理論依據(jù)和數(shù)據(jù)支持。
近年來(lái),風(fēng)暴潮災(zāi)害損失評(píng)估越來(lái)越受到重視,相關(guān)的科學(xué)研究也越來(lái)越多,投入產(chǎn)出模型、灰色模型(Gray Model,GM)[4]以及神經(jīng)網(wǎng)絡(luò)等方法被廣泛利用。但這些評(píng)估方法精度較差,有待優(yōu)化,并且結(jié)構(gòu)單一,一個(gè)模型只能反映整個(gè)風(fēng)暴潮系統(tǒng)特征的部分信息,組合模型的研究較少[1]。鑒于此,本文提出了基于麻雀搜索算法優(yōu)化的SVR和GRNN組合模型,對(duì)風(fēng)暴潮災(zāi)害造成的直接經(jīng)濟(jì)損失進(jìn)行評(píng)估。
本文選取1990—2020年浙江省記錄完整的29個(gè)風(fēng)暴潮歷史災(zāi)情數(shù)據(jù)作為數(shù)據(jù)集。風(fēng)暴潮災(zāi)害資料主要統(tǒng)計(jì)于《中國(guó)海洋災(zāi)害公報(bào)》[5]、《中國(guó)風(fēng)暴潮災(zāi)害史料集》[6]、國(guó)家減災(zāi)中心統(tǒng)計(jì)數(shù)據(jù)和浙江省統(tǒng)計(jì)年鑒[7]。
本文充分考慮風(fēng)暴潮災(zāi)害的形成機(jī)理、災(zāi)害系統(tǒng)理論和風(fēng)險(xiǎn)管理理論,從致災(zāi)因素、孕災(zāi)背景、承災(zāi)體脆弱性和防潮減災(zāi)能力4個(gè)方面選取指標(biāo)建立風(fēng)暴潮災(zāi)害損失評(píng)估指標(biāo)體系,如圖1所示。
圖1 風(fēng)暴潮災(zāi)害損失評(píng)估指標(biāo)體系
1.2.1致災(zāi)因素
風(fēng)暴潮災(zāi)害是由嚴(yán)重大氣擾動(dòng)引起的海水異常升降淹沒(méi)陸地的現(xiàn)象[1],最大增水量和潮位變化是最直接的標(biāo)志。于是,選取相關(guān)性較強(qiáng)的中心最大風(fēng)速Z1、登陸中心氣壓Z2、最大風(fēng)暴增水Z3、最大超警戒潮位Z4作為致災(zāi)因子。
1.2.2孕災(zāi)背景
受災(zāi)地區(qū)的地形地貌等因素與風(fēng)暴潮造成的損失有較強(qiáng)的相關(guān)性,并且人口密度等指標(biāo)也與損失程度息息相關(guān)。根據(jù)指標(biāo)的可量化性,選擇了農(nóng)業(yè)產(chǎn)值Z5、漁業(yè)產(chǎn)值Z6以及人口密度Z7指標(biāo)。
1.2.3承災(zāi)體脆弱性
該類指標(biāo)反映了受災(zāi)體的抗損失能力。在風(fēng)暴潮災(zāi)害的承災(zāi)體中,受影響的農(nóng)田、人口以及海洋工程的破壞是比較直觀的。因此,本文以農(nóng)田受災(zāi)面積Z8、受災(zāi)人口Z9、房屋倒塌Z10、水產(chǎn)養(yǎng)殖受災(zāi)面積Z11、防護(hù)工程損毀Z12以及船只損毀Z13作為評(píng)估指標(biāo)。
1.2.4防潮減災(zāi)能力
以往的研究中經(jīng)常忽視防災(zāi)減災(zāi)這一維度的指標(biāo),實(shí)際上,近年來(lái)國(guó)家很重視風(fēng)暴潮的防御以及防護(hù)工程的建設(shè)。防災(zāi)能力可以減少經(jīng)濟(jì)損失,幫助災(zāi)后的生產(chǎn)恢復(fù)。鑒于這一維度的覆蓋面極廣,選取每千人配比床位數(shù)Z14、醫(yī)藥衛(wèi)生單位數(shù)Z15、人均國(guó)內(nèi)生產(chǎn)總值(Gross Domestic Product,GDP)Z16、人均儲(chǔ)蓄存款Z17、城鎮(zhèn)人均可支配收入Z18、農(nóng)村人均可支配收入Z19以及財(cái)政總收入Z20作為指標(biāo)因子。
從4個(gè)維度選取的20個(gè)指標(biāo)因子間存在相關(guān)性,易出現(xiàn)信息冗余,需要進(jìn)行科學(xué)篩選。本文利用熵權(quán)法[8]對(duì)指標(biāo)因子進(jìn)行處理,熵權(quán)法是根據(jù)各因子的變異程度,計(jì)算出熵值,確定各個(gè)指標(biāo)間的離散程度。具體步驟如下:
(1)通過(guò)歸一化處理,消除掉單位不統(tǒng)計(jì)問(wèn)題,并使得不同量級(jí)的指標(biāo)亦能進(jìn)行衡量。
(1)
式中,xij為第i個(gè)樣本的第j個(gè)指標(biāo)的原始數(shù)值;yij為第i個(gè)樣本的第j個(gè)指標(biāo)標(biāo)準(zhǔn)化后的數(shù)值(i=1,2,…,n,j=1,2,…,m)。
(2)計(jì)算第i樣本在第j項(xiàng)指標(biāo)中的占比
(2)
(3)計(jì)算熵值
(3)
(4)計(jì)算信息熵冗余度
(4)
(5)計(jì)算權(quán)重值并排序
(5)
根據(jù)以上步驟,將計(jì)算得到的各指標(biāo)權(quán)重值由大到小進(jìn)行排序,如表1所示。從中篩選出權(quán)重值累計(jì)貢獻(xiàn)率85%的指標(biāo),最終將{Z4,Z5,Z6,Z8,Z9,Z11,…,Z20}作為評(píng)估模型的指標(biāo)輸入量,在表1中用方框標(biāo)出。
表1 指標(biāo)權(quán)重值排序結(jié)果
支持向量機(jī)(Support Vector Machine,SVM)是基于統(tǒng)計(jì)學(xué)習(xí)理論構(gòu)建的一種新型機(jī)器學(xué)習(xí)方法,根據(jù)應(yīng)用方面不同分為:支持向量分類(Support Vector Classification,SVC)和支持向量回歸(Support Vector Regression,SVR)。基于交叉驗(yàn)證(Vapnik-Chervonenkis,VC)維數(shù)理論和統(tǒng)計(jì)學(xué)習(xí)理論中的結(jié)構(gòu)風(fēng)險(xiǎn)最小化原理,支持向量機(jī)最終轉(zhuǎn)化為二次優(yōu)化問(wèn)題[9]。SVR的優(yōu)點(diǎn)是用于小樣本預(yù)測(cè)問(wèn)題具有較好的效果,本文利用支持向量機(jī)解決回歸問(wèn)題,其基本思想是尋找某個(gè)最優(yōu)分類面使得樣本距離該分類面的誤差最小[10],如圖2所示。原理是將原始空間樣本數(shù)據(jù)投影到高維特征空間中,核函數(shù)進(jìn)行非線性轉(zhuǎn)換和映射。核函數(shù)選擇徑向基(Radial Basis Function,RBF)核函數(shù):
圖2 SVR基本思想示意圖
(6)
式中,x表示輸入空間的樣本;xi表示第i個(gè)樣本;σ為均方差,RBF核函數(shù)能夠通過(guò)調(diào)節(jié)σ值調(diào)整核函數(shù),具有較高的靈活性。
圖2中,ε表示能夠容忍的模型輸出值與真實(shí)值的最大偏差;δ為偏差絕對(duì)值大于ε時(shí)產(chǎn)生的損失。
2.1.2GRNN
神經(jīng)網(wǎng)絡(luò)具有強(qiáng)大的非線性擬合能力,廣義回歸神經(jīng)網(wǎng)絡(luò)(Generalized Regression Neural Network,GRNN)[11]是由Specht教授于1991年提出基于非線性回歸理論的人工神經(jīng)網(wǎng)絡(luò)模型,具有良好的非線性逼近性能,一般由4層網(wǎng)絡(luò)結(jié)構(gòu)組成,分別為輸入層、模式層、求和層和輸出層,如圖3所示。圖3中,GRNN結(jié)構(gòu)的模式層和輸出層用不同的樣式符號(hào)進(jìn)行區(qū)分。GRNN的優(yōu)勢(shì)在于其方便的網(wǎng)絡(luò)參數(shù)設(shè)置功能,只需調(diào)節(jié)一個(gè)平滑參數(shù)Spread即可建立預(yù)測(cè)模型,增加人為可控性。Spread的大小直接影響了整個(gè)網(wǎng)絡(luò)模型的評(píng)估性能,Spread越大,函數(shù)逼近越平滑;Spread越小,函數(shù)擬合性能越好?;跀M合能力以及樣本數(shù)量的考慮,本文采用四折交叉驗(yàn)證的方法來(lái)確定最佳Spread值。
圖3 GRNN結(jié)構(gòu)示意圖
神經(jīng)網(wǎng)絡(luò)算法通過(guò)構(gòu)建更廣泛、更復(fù)雜的學(xué)習(xí)網(wǎng)絡(luò)來(lái)擬合多維變量之間的復(fù)雜非線性關(guān)系,可以提高損失評(píng)估的精度。然而,樣本數(shù)據(jù)少,收斂速度慢等問(wèn)題也造成了風(fēng)暴潮災(zāi)害研究效率和精度上的障礙。研究表明,采用優(yōu)化算法對(duì)初始參數(shù)進(jìn)行優(yōu)化后再對(duì)網(wǎng)絡(luò)進(jìn)行訓(xùn)練能在很大程度上提升網(wǎng)絡(luò)性能,避免網(wǎng)絡(luò)擬合缺陷[12]。
SSA[13]是基于麻雀的群體智慧、覓食行為以及反獵食行為建立的群搜索算法。其生物原理為:麻雀群為尋找食物分為發(fā)現(xiàn)者與加入者兩類,發(fā)現(xiàn)者負(fù)責(zé)標(biāo)記食物方向,加入者追隨發(fā)現(xiàn)者的食物信號(hào),一旦麻雀中的警惕者覺(jué)察到危險(xiǎn),會(huì)立即變化位置。依據(jù)這一原理,麻雀能夠獲取食物并躲避攻擊。
SVR進(jìn)行建模時(shí),懲罰參數(shù)(C)與核參數(shù)(g)對(duì)模型的性能有著重要的影響。利用麻雀搜索算法對(duì)該參數(shù)進(jìn)行尋優(yōu)計(jì)算,可以提高SVR的網(wǎng)絡(luò)性能,減少評(píng)估誤差。具體優(yōu)化流程如圖4所示。
圖4 SSA-SVR評(píng)估模型流程圖
2.3.2SSA-GRNN
根據(jù)GRNN網(wǎng)絡(luò)模型的原理,只需要調(diào)節(jié)一個(gè)平滑參數(shù)Spread就可以影響整個(gè)網(wǎng)絡(luò)的性能。本文利用麻雀搜索算法主要對(duì)GRNN的Spread參數(shù)進(jìn)行優(yōu)化,設(shè)計(jì)適應(yīng)度函數(shù)。優(yōu)化評(píng)估模型結(jié)構(gòu)如圖5所示。
圖5 SSA-GRNN評(píng)估模型流程圖
(7)
式中,n為風(fēng)暴潮樣本的個(gè)數(shù);m為評(píng)估模型的個(gè)數(shù);eij為第i個(gè)評(píng)估模型中第j個(gè)樣本的誤差值;∑wi=1,wi≥0。
本文收集整理了浙江省記錄完整的29個(gè)風(fēng)暴潮災(zāi)害樣本,依次利用其中的28個(gè)樣本訓(xùn)練預(yù)測(cè)剩余的一個(gè)樣本的直接經(jīng)濟(jì)損失值,以此來(lái)提高小樣本評(píng)估測(cè)試的說(shuō)服力。15個(gè)篩選指標(biāo)作為輸入因子,直接經(jīng)濟(jì)損失為輸出因子。以MATLAB 2018b為平臺(tái)進(jìn)行實(shí)驗(yàn),決定系數(shù)R2、均方根誤差(Root Mean Square Error,RMSE)以及希爾不等系數(shù)Theil IC檢驗(yàn)評(píng)估模型的性能,公式如下:
鑒于文本樣本數(shù)量29個(gè),輸入因子維度為15,模型搜索過(guò)程不太復(fù)雜,麻雀搜索算法的初始規(guī)模設(shè)置為30、最大迭代次數(shù)30,其他設(shè)置如下:發(fā)現(xiàn)者的數(shù)量占比0.7、感應(yīng)危險(xiǎn)的麻雀數(shù)量占比0.2、安全值為0.6。實(shí)驗(yàn)結(jié)果如下:SSA-SVR模型R2值為0.847 3,擬合結(jié)果如圖6所示;SSA-GRNN模型R2值為0.882 8,擬合結(jié)果如圖7所示。
圖6 SSA-SVR模型擬合圖
圖7 SSA-GRNN模型擬合圖
對(duì)比圖6和圖7可以看出,SSA-SVR中第11和28號(hào)樣本的直接經(jīng)濟(jì)損失評(píng)估出現(xiàn)較大的偏差,SSA-GRNN模型的評(píng)估穩(wěn)定性要優(yōu)于SSA-SVR,但SSA-SVR在其他點(diǎn)的精度上要優(yōu)于SSA-GRNN。于是可以根據(jù)優(yōu)勢(shì)互補(bǔ)將兩個(gè)模型建立組合評(píng)估。
利用最小二乘法將SSA-SVR與SSA-GRNN模型進(jìn)行最優(yōu)加權(quán)組合,計(jì)算所得權(quán)重系數(shù)w1、w2分別為0.39、0.61,則組合評(píng)估模型的表達(dá)式可以寫(xiě)作:
(11)
然后將組合模型進(jìn)行實(shí)驗(yàn)擬合,R2值為0.919 0,擬合結(jié)果如圖8所示。并利用ERMS、CI指標(biāo)進(jìn)行精度對(duì)比如表2所示。
圖8 組合評(píng)估模型擬合圖
表2 不同模型精度對(duì)比
對(duì)比單一模型與組合模型的擬合圖以及精度評(píng)價(jià)指標(biāo),可以看出,經(jīng)過(guò)最優(yōu)組合后的評(píng)估模型在精度上有所提高,同時(shí)也證明組合評(píng)估模型在風(fēng)暴潮災(zāi)害損失評(píng)估中的適用性。
為了更好地評(píng)估風(fēng)暴潮災(zāi)害,本文從致災(zāi)因素、孕災(zāi)背景、承災(zāi)體脆弱性以及防潮減災(zāi)能力4個(gè)維度建立全面系統(tǒng)的風(fēng)暴潮災(zāi)害損失評(píng)估指標(biāo)體系,使用熵權(quán)法來(lái)進(jìn)行指標(biāo)篩選預(yù)處理,篩選出涵蓋信息多、權(quán)重高、相關(guān)性大的10個(gè)指標(biāo)。利用麻雀搜索算法對(duì)SVR和GRNN兩種評(píng)估模型進(jìn)行優(yōu)化改進(jìn),并將優(yōu)化后的模型基于最小二乘法建立最優(yōu)加權(quán)組合,將組合評(píng)估模型與單一模型進(jìn)行了實(shí)驗(yàn)對(duì)比,結(jié)果顯示:SSA-SVR、SSA-GRNN、組合評(píng)估模型的R2值分別為0.847 3、0.882 8、0.919 0;ERMS分別為6.461 3、5.660 4、4.990 2;CI分別為0.139 8、0.127 4、0.111 2。表明組合模型可以有效地從多個(gè)模型中收集有用的信息。因此,其評(píng)估精度、評(píng)估穩(wěn)定性和對(duì)動(dòng)態(tài)系統(tǒng)變化的適應(yīng)能力遠(yuǎn)高于單一模型。
風(fēng)暴潮是非常嚴(yán)重的海洋災(zāi)害,危機(jī)人民的生命和財(cái)產(chǎn)安全。因此,全面研究風(fēng)暴潮對(duì)盡可能減少災(zāi)害損失具有重要意義,然而,有限的歷史災(zāi)情數(shù)據(jù)可能對(duì)風(fēng)暴潮災(zāi)害評(píng)估提出了挑戰(zhàn)。未來(lái),采用新的評(píng)估指標(biāo)(例如登陸城市的地形要素等),利用新的分析工具(例如地理信息系統(tǒng)、遙感等)可能會(huì)在這項(xiàng)研究中發(fā)揮重要作用。