肖 雯,劉 春,趙文燦
(1.江西省氣象服務(wù)中心,330096,南昌;2.江西省氣象臺(tái),330096,南昌;3.浙江廣晟信息技術(shù)有限公司,310016,杭州)
電線積冰指的是雨凇、霧凇凝附在導(dǎo)線上或濕雪凍結(jié)在導(dǎo)線上的現(xiàn)象[1],是冬季常見的氣象災(zāi)害之一,也是影響電網(wǎng)建設(shè)及其安全運(yùn)行最大的隱患之一。電線積冰導(dǎo)致的電線舞動(dòng)、桿塔倒塌、通訊不暢等現(xiàn)象,給國民生活和社會(huì)經(jīng)濟(jì)帶來巨大的損失。國內(nèi)外許多專家學(xué)者已經(jīng)對(duì)電線積冰的時(shí)空分布特征和氣象影響因子進(jìn)行了分析,林小紅等發(fā)現(xiàn)福建山區(qū)最易出現(xiàn)的電線積冰類型為雨凇型積冰,其次為霧凇型積冰[2]??蝶惱虻鹊难芯勘砻鳎憬「呱秸?0%以上的電線積冰是雨凇和霧凇型的混合積冰,純雨凇形成的電線積冰比較少見[3]。陳百煉等對(duì)貴州冬季電線積冰進(jìn)行研究,發(fā)現(xiàn)地面氣溫降至0℃以下時(shí),低層水汽充沛會(huì)使得電線積冰的維持和增長[4]。陳柏堃等發(fā)現(xiàn)雨凇型積冰逆溫層高度較高,近地面層為負(fù)溫度區(qū);而霧凇型積冰逆溫層高度較低,近地面層為正溫區(qū)[5]。武輝芹等發(fā)現(xiàn)河北省電線積冰與霧凇、雨凇以及站點(diǎn)海拔高度密切相關(guān)[6];出現(xiàn)導(dǎo)線舞動(dòng)時(shí),氣溫低于3 ℃,相對(duì)濕度在60%以上,風(fēng)速大于5 m/s。在電線積冰厚度的定量預(yù)報(bào)方面,杜骦等利用WRF模式預(yù)報(bào)出來的溫度、風(fēng)速等氣象要素,代入Jones模型對(duì)河南省一次電線積冰過程進(jìn)行模擬,得到的范圍和積冰厚度演變與觀測值大體吻合[7]。宋丹等通過多元線性逐步回歸和判別分析分類方法,建立了電線積冰厚度預(yù)報(bào)模型,TS準(zhǔn)確率超過80%[8]。溫華洋等則通過人工神經(jīng)網(wǎng)絡(luò)和多元線性逐步回歸方法,建立了安徽省標(biāo)準(zhǔn)冰厚的估算模型[9]。王懷清等研究表明,江西省雨凇天氣山區(qū)多于平原和丘陵[10]。鄭婧等研究發(fā)現(xiàn),低層冷墊較強(qiáng),暖濕氣流在低層冷墊上爬升,為江西省大范圍凍雨天氣的產(chǎn)生提供了非常有利的條件[11]。趙文燦等通過分區(qū)合成分析得到江西省電線積冰的溫度層結(jié)特征,發(fā)現(xiàn)贛北贛中雨凇型積冰溫度層結(jié)符合“3層模型”,而贛南則類似于“1層模型”[12]。
本文利用1970—2016年江西省電線積冰觀測資料,統(tǒng)計(jì)分析不同類型電線積冰情況下氣象要素分配情況,隨后采用多隱層BP神經(jīng)網(wǎng)絡(luò),通過機(jī)器學(xué)習(xí)嘗試定量預(yù)報(bào)電線積冰厚度,為提高通信、電力傳輸?shù)臍庀蠓罏?zāi)減災(zāi)能力提供物理、統(tǒng)計(jì)原理和技術(shù)支持。
本文采用江西省17個(gè)氣象臺(tái)站1970—2016年的電線積冰觀測資料和常規(guī)氣象觀測資料,資料主要內(nèi)容包括積冰類型、積冰厚度、積冰質(zhì)量、日平均溫度、日最低氣溫、日降水量、平均風(fēng)向風(fēng)速。
我國地面氣象觀測規(guī)范規(guī)定,氣象站的電線積冰觀測在距地面2 m高的電線積冰架上進(jìn)行,當(dāng)出現(xiàn)覆冰時(shí)定時(shí)測量導(dǎo)線上的最大積冰直徑和厚度,當(dāng)直徑達(dá)到規(guī)定標(biāo)準(zhǔn)時(shí)測量積冰重量。積冰直徑是指垂直于導(dǎo)線的切面上冰層積結(jié)的最大值(包括導(dǎo)線本身直徑在內(nèi)),相當(dāng)于電力部門導(dǎo)線覆冰觀測的長徑;積冰厚度為導(dǎo)線切面上垂直于積冰直徑方向上冰層積結(jié)的最大值,相當(dāng)于電力部門觀測的短徑。
中國氣象局綜合觀測司于2010年6月為所有電線積冰觀測臺(tái)站配備了220 kV電力傳輸用的26.8 mm直徑的電纜,在對(duì)比觀測結(jié)束后將觀測導(dǎo)線由直徑為4 mm的導(dǎo)線更換為直徑26.8 mm的電纜,所有電線積冰觀測臺(tái)站從2011年1月1日起采用26.8 mm電纜正式觀測、發(fā)報(bào)、存檔。因此本文所選電線積冰厚度數(shù)據(jù),在2011年之前和2011年之后,采用了不同的因子進(jìn)行訂正。
1.2.1 聚類分析法 聚類分析也稱為群分類或點(diǎn)群分類,其基本原理是,根據(jù)樣本自身的屬性,用數(shù)學(xué)方法按照某種相似性或者差異性指標(biāo)(多用距離或者相關(guān)性量化表示),定量地確定樣本之間的親疏關(guān)系,并按這種親疏關(guān)系程度對(duì)樣本進(jìn)行聚類。經(jīng)典的聚類方法大致可被分為兩類:層次聚類法和非層次聚類法,近年來又發(fā)展出一種稱為智能聚類的方法。
層次聚類方法首先確定距離的基本定義,以及類間距離的計(jì)算方式,隨后按照距離的遠(yuǎn)近,通過把距離接近的數(shù)據(jù)一步一步歸為一類,直到數(shù)據(jù)完全歸為一個(gè)類別為止,最終將得到一系列可能的聚類結(jié)果,最后再利用相應(yīng)的指標(biāo)來確定聚為幾類的結(jié)果最為合適,所以這種聚類結(jié)果存在著嵌套。
非層次聚類則是在分析前就確定了具體的類別個(gè)數(shù),整個(gè)分類過程使用迭代的方法進(jìn)行,首先起步于一個(gè)初始的分類,然后通過不斷的迭代把數(shù)據(jù)在不同類別之間移動(dòng),直到最后達(dá)到一定的標(biāo)準(zhǔn)為止,整個(gè)計(jì)算過程中不需要存儲(chǔ)基本數(shù)據(jù)或者距離矩陣,因此不會(huì)出現(xiàn)多個(gè)互相嵌套的聚類結(jié)果,而且計(jì)算速度也要快得多。
1.2.2 多隱層BP神經(jīng)網(wǎng)絡(luò) BP神經(jīng)網(wǎng)絡(luò)的核心L-M(Levenberg-Marquardt)算法,是一種非線性規(guī)劃方法,主要用于無約束的多維非線性規(guī)劃問題,也是一階牛頓法的一種改進(jìn),目的是為了更快的收斂。輸入一個(gè)初始值Xk,利用一階泰勒展開式不斷逼近Xk附近點(diǎn)f(Xk+△K)的估計(jì)值,當(dāng)|f(Xk+△K)-f(Xk)|≤ε時(shí),就認(rèn)為算法收斂,循環(huán)迭代結(jié)束。改進(jìn)后的L-M算法采用增量正規(guī)化方程,加快這種迭代逼近方式,如圖1所示,λ是增量方程中的增量,如果方程的解△K導(dǎo)致ek減小,就接受這個(gè)λ,并在下次迭代中使用λ/10進(jìn)行替代,形成逐步逼近;如果△K導(dǎo)致ek增大,就放棄這個(gè)λ,并將其代換為10λ重新求解增量方程。通過不斷迭代,最終得到預(yù)期的XK+1為止。
圖1 L-M算法流程圖
標(biāo)準(zhǔn)的BP神經(jīng)網(wǎng)絡(luò)是由3個(gè)神經(jīng)元層次組成,即輸入層、隱含層和輸出層,L-M算法對(duì)輸入的初始值無約束,但為了方便迭代時(shí)的數(shù)據(jù)收斂,前期進(jìn)行歸一化帶入,但計(jì)算效果很差,最終決定用未處理的原始數(shù)據(jù)帶入。
設(shè)置最大迭代次數(shù)為100次,閾值ε為0.1,滿足任意一個(gè)條件,迭代停止。增加隱層數(shù)可以降低神經(jīng)網(wǎng)絡(luò)誤差,提高精度,但也會(huì)使網(wǎng)絡(luò)復(fù)雜化,從而增加網(wǎng)絡(luò)的訓(xùn)練時(shí)間和出現(xiàn)過擬合的傾向。在雙隱層基礎(chǔ)上,逐步增加隱層數(shù),效果也隨之提高,但時(shí)間成本也隨之增加。綜合考慮,本文使用3隱層,都采用S型對(duì)數(shù)激活函數(shù),S型對(duì)數(shù)激活函數(shù)表達(dá)式為:
理論上,一個(gè)3層的BP神經(jīng)網(wǎng)絡(luò)已經(jīng)能夠逼近任何有理函數(shù),所以本文使用3隱層,對(duì)隱層節(jié)點(diǎn)的選擇,取盡可能少的節(jié)點(diǎn)數(shù),以滿足緊湊結(jié)構(gòu)下的精度要求,所以每層對(duì)應(yīng)節(jié)點(diǎn)數(shù)分別為10個(gè)、10個(gè)、8個(gè)。輸入節(jié)點(diǎn)包括電線積冰當(dāng)天觀測的電線積冰厚度、當(dāng)日降水量、當(dāng)日最大風(fēng)速和平均風(fēng)速、當(dāng)日平均氣溫,通過幾個(gè)物理量的相關(guān)學(xué)習(xí),嘗試定量預(yù)報(bào)各物理因子對(duì)電線積冰的影響。前3/4的時(shí)間用于訓(xùn)練,后1/4的時(shí)間用于模擬,進(jìn)行監(jiān)督學(xué)習(xí)。
通過對(duì)1970—2016年的江西省電線積冰觀測資料的統(tǒng)計(jì),結(jié)果表明,江西省電線積冰主要發(fā)生在11月、12月、1月、2月、3月,集中在12—2月,占84.4%;雨凇型積冰為1 177次,占67.5%,霧凇型積冰為388次,占22.3%,混合型積冰178次,占10.2%;廬山站由于其海拔高度較高,為1 165.3 m,3月份也容易發(fā)生電線積冰,達(dá)到200次,井岡山站海拔838.1 m,3月份出現(xiàn)了5次電線積冰。積冰厚度大值均出現(xiàn)在廬山站,其中最大值出現(xiàn)在1975年12月10日的262 mm,對(duì)應(yīng)積冰重量為5 432 g/m。圖2給出了江西省不同月份、不同類型電線積冰的空間分布情況,從中可知,江西省電線積冰多發(fā)生在贛北、贛中,大值區(qū)位于贛西北。霧凇型積冰多發(fā)生在贛北地區(qū),贛中、贛南基本不發(fā)生;雨凇型積冰有3個(gè)大值區(qū),分別為環(huán)鄱陽湖地區(qū)、井岡山一帶和贛中東部。廬山站由于緯度和海拔高度的原因,在電線積冰出現(xiàn)頻率和積冰強(qiáng)度方面和其他站點(diǎn)有較大差異,因此在后續(xù)分析中剔除該站點(diǎn)。
(a)12月;(b)1月;(c)2月;(d)霧凇型;(e)雨凇型;(f)總分布
不同觀測站因?yàn)榈乩砦恢?、海拔高度、水域分布、環(huán)流背景等,產(chǎn)生電線積冰情況均不相同。江西省氣象臺(tái)根據(jù)緯度不同,將江西省分為贛北、贛中、贛南3個(gè)部分,贛北包括修水、波陽、景德鎮(zhèn)、南昌、樟樹、貴溪、玉山7個(gè)站;贛中包括宜春、吉安、寧岡、井岡山、遂川、南城、廣昌7個(gè)站;贛南包括贛州、尋烏2個(gè)站。這種簡單的分類方法,能夠?qū)栴}簡化,但電線積冰問題不單單是緯度差異造成的,也有其他方面,并且通過緯度劃分,得出的氣象要素并未呈現(xiàn)一定的規(guī)律,還有許多信息有待提取,所以本文嘗試使用聚類法進(jìn)行分類,并通過相關(guān)性分析,來尋找電線積冰的出現(xiàn)與氣象要素之間的關(guān)系。表1為雨凇型電線積冰直徑和相關(guān)物理量相關(guān)性分析結(jié)果,可以看出,積冰直徑和積冰厚度具有很好相關(guān)性,與降水量有較好相關(guān)性,對(duì)溫度的敏感性不高。出現(xiàn)電線積冰時(shí),日平均氣溫范圍從-1.78~1.81 ℃,并不隨著緯度有規(guī)律地變化,與風(fēng)速顯著的負(fù)相關(guān)。所以進(jìn)行聚類分析時(shí),采用平均風(fēng)速、最大風(fēng)速、平均溫度和降水量作為物理指標(biāo),考慮到緯度差異對(duì)電線積冰的影響,因此將緯度也作為一個(gè)指標(biāo)。計(jì)算前對(duì)各物理量進(jìn)行歸一化操作,采用歐幾里得距離計(jì)算方法進(jìn)行聚類分析。
表1 雨凇型電線積冰直徑和氣象要素的相關(guān)性
通過層次聚類法得到的結(jié)果如圖3所示,去除廬山站后,將江西省16個(gè)積冰觀測站分為3類。第1類包括修水、宜春、吉安、寧岡、井岡山、廣昌;第2類包括波陽、景德鎮(zhèn)、南昌、樟樹、貴溪、玉山、南城;第3類包括遂川、贛州、尋烏。分組后對(duì)所有變量進(jìn)行單因素方差分析,得到各變量的重要程度排序?yàn)椋浩骄L(fēng)速、最大風(fēng)速、緯度、降水量和平均氣溫,可以看出風(fēng)速對(duì)江西省電線積冰類別劃分影響很大。
圖3 層次聚類分析樹狀圖
表2為分組后出現(xiàn)積冰事件時(shí)氣象要素的統(tǒng)計(jì)結(jié)果,從中可知,風(fēng)速方面,Ⅰ類站點(diǎn)出現(xiàn)積冰時(shí)風(fēng)速、日平均風(fēng)速和日最大風(fēng)速都是最小,其次是Ⅲ類站點(diǎn),Ⅱ類站點(diǎn)最大;雨量方面,3類站點(diǎn)出現(xiàn)積冰時(shí)降水量級(jí)均為小雨;氣溫方面,Ⅰ類站點(diǎn)出現(xiàn)積冰時(shí)氣溫、日平均氣溫和日最低氣溫最低,其次是Ⅱ類站點(diǎn),Ⅲ類站點(diǎn)最高,且各氣溫要素均<0 ℃,Ⅲ類站點(diǎn)的日平均氣溫0.38 ℃除外。從風(fēng)向上來看,Ⅰ類站點(diǎn)出現(xiàn)積冰時(shí)靜風(fēng)占比最大,為35%,其次為北風(fēng),15%;Ⅱ類站點(diǎn)出現(xiàn)積冰時(shí)北風(fēng)占比最大,為32%,其次為北北西風(fēng),20%;Ⅲ類站點(diǎn)出現(xiàn)積冰時(shí)東北風(fēng)占比最大,為25%,其次為北風(fēng),21%??梢钥闯觯e冰出現(xiàn)時(shí)常伴隨明顯的偏北風(fēng)。
表2 3類站點(diǎn)積冰當(dāng)天的氣象要素情況
統(tǒng)計(jì)發(fā)現(xiàn)Ⅰ類、Ⅱ類、Ⅲ類積冰事件個(gè)例數(shù)分別為205個(gè)、117個(gè)、58個(gè),本文選取第Ⅰ類積冰事件進(jìn)行分析,同時(shí)選取日降水量、日最大風(fēng)速、日平均風(fēng)速、日平均氣溫等要素進(jìn)行學(xué)習(xí)。為減小某次實(shí)驗(yàn)的波動(dòng),本文進(jìn)行600次獨(dú)立實(shí)驗(yàn),前3/4個(gè)例用于訓(xùn)練,后1/4用于預(yù)測。
圖4為600次實(shí)驗(yàn)的預(yù)測與實(shí)況的絕對(duì)誤差散點(diǎn)圖,從中可知,兩者呈現(xiàn)不顯著的負(fù)相關(guān),預(yù)測絕對(duì)誤差明顯大于訓(xùn)練絕對(duì)誤差,預(yù)測誤差集中在2~4 mm,占比達(dá)到97%,2~3 mm的占比也達(dá)到81%;訓(xùn)練絕對(duì)誤差集中在0.5~2 mm,占比達(dá)到87%,1.5~2 mm占比也達(dá)到63%;且訓(xùn)練誤差處于1.5~2 mm時(shí),對(duì)應(yīng)的預(yù)測絕對(duì)誤差大多集中于2~3 mm,波動(dòng)不大。因此,篩選訓(xùn)練誤差為1.5~2 mm的數(shù)據(jù)進(jìn)行實(shí)驗(yàn),可以發(fā)現(xiàn),過濾后的預(yù)報(bào)效果較好,過濾前后的平均絕對(duì)誤差分別為2.41 mm和2.24 mm,均方根誤差分別為3.17 mm和2.81 mm。10 mm以下的預(yù)報(bào)效果較好,當(dāng)觀測積冰超過10 mm就會(huì)出現(xiàn)較大的差異。
圖4 預(yù)測與實(shí)況的絕對(duì)誤差散點(diǎn)圖
本文通過對(duì)1970—2016年江西省電線積冰數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,得到其時(shí)空分布特征,并利用BP神經(jīng)網(wǎng)絡(luò)方法對(duì)電線積冰直徑進(jìn)行定量預(yù)報(bào),得到結(jié)論如下。
1)江西省電線積冰發(fā)生集中月份為12—2月,占84.4%;雨凇型積冰為1 177次,占67.5%,霧凇型積冰為388次,占22.3%,混合型積冰178次,占10.2%;江西省電線積冰多發(fā)生在贛北、贛中,大值區(qū)位于贛西北。
2)利用聚類分析法,將江西省電線積冰觀測站分為3類:第1類包括修水、宜春、吉安、寧岡、井岡山、廣昌;第2類包括波陽、景德鎮(zhèn)、南昌、樟樹、貴溪、玉山、南城;第3類包括遂川、贛州、尋烏。且各個(gè)變量對(duì)聚類結(jié)果的重要程度排列依次為:平均風(fēng)速、最大風(fēng)速、緯度、降水量和平均氣溫。
3)通過多隱層BP神經(jīng)網(wǎng)絡(luò)方法,進(jìn)行600次實(shí)驗(yàn)發(fā)現(xiàn),過濾后的預(yù)報(bào)效果較好,過濾前后的平均絕對(duì)誤差分別為2.41 mm和2.24 mm,均方根誤差分別為3.17 mm和2.81 mm。
本文利用BP神經(jīng)網(wǎng)絡(luò)方法對(duì)江西省電線積冰直徑進(jìn)行預(yù)測,發(fā)現(xiàn)該方法在10 mm以下電線積冰厚度預(yù)測較好,但往往10 mm以上電線積冰產(chǎn)生的危害更大,實(shí)際預(yù)測效果卻并不理想,原因是樣本數(shù)較少,選取的物理量因子也不夠多,挖掘的信息也較少,進(jìn)行機(jī)器學(xué)習(xí)時(shí)容易產(chǎn)生較大的預(yù)測偏差,因此未來研究中仍需要繼續(xù)改進(jìn)。