李曉帆
(昆明能訊科技有限責(zé)任公司,昆明 650217)
臺(tái)風(fēng)是一種可以給沿海地區(qū)電網(wǎng)造成巨大破壞的自然災(zāi)害,中國(guó)東南沿海地區(qū)正是臺(tái)風(fēng)災(zāi)害頻發(fā)的地區(qū)。對(duì)于強(qiáng)臺(tái)風(fēng)環(huán)境下的地區(qū)電網(wǎng),臺(tái)風(fēng)的強(qiáng)風(fēng)可導(dǎo)致輸配電網(wǎng)中的電氣設(shè)備產(chǎn)生結(jié)構(gòu)性損傷,影響供電穩(wěn)定性。在電網(wǎng)設(shè)備中,桿塔是最易被臺(tái)風(fēng)影響的大型設(shè)備,從中國(guó)東南沿海電網(wǎng)歷史臺(tái)風(fēng)災(zāi)損統(tǒng)計(jì)結(jié)果來看,絕大多數(shù)的倒塔與斷桿主要發(fā)生在強(qiáng)風(fēng)圈內(nèi),顯然風(fēng)速對(duì)桿塔的影響是巨大的?,F(xiàn)在的絕大部分臺(tái)風(fēng)預(yù)警型都是以臺(tái)風(fēng)的預(yù)測(cè)風(fēng)速為基礎(chǔ)進(jìn)行預(yù)警,但是顯然輸電桿塔的故障并不只取決于風(fēng)速這一個(gè)特征,可是由于其他的特征數(shù)據(jù)太少且數(shù)據(jù)質(zhì)量不高,難以和臺(tái)風(fēng)故障相關(guān)聯(lián),所以很難進(jìn)行分析和建模,那么如何從這些復(fù)雜數(shù)據(jù)中提取出有用的信息,用來進(jìn)一步完善臺(tái)風(fēng)預(yù)警模型就很值得研究。
電網(wǎng)設(shè)備臺(tái)風(fēng)預(yù)警相關(guān)的數(shù)據(jù)特征主要分布于三個(gè)維度:氣象、地形、設(shè)備。
由于臺(tái)風(fēng)路徑的隨機(jī)性,風(fēng)圈半徑的變化以及對(duì)電網(wǎng)組件損害的不確定性等,需要充分考慮到臺(tái)風(fēng)破壞風(fēng)險(xiǎn)的事故前預(yù)備程度。
通過對(duì)臺(tái)風(fēng)相關(guān)資料的查詢以及獲取到的數(shù)據(jù)分析,臺(tái)風(fēng)對(duì)電網(wǎng)的影響主要體現(xiàn)在幾個(gè)方面,輸電線路斷線,倒塔以及水淹,伴隨著各種故障引起的線路跳閘事故則是最多的,而這些情況自然和臺(tái)風(fēng)自身的風(fēng)速以及降雨量有極強(qiáng)的相關(guān)性。從氣象臺(tái)可以得到實(shí)時(shí)以及預(yù)測(cè)的臺(tái)風(fēng)風(fēng)速,臺(tái)風(fēng)風(fēng)圈以及臺(tái)風(fēng)移動(dòng)路徑,降雨等數(shù)據(jù),也可以在GIS 系統(tǒng)中獲得相應(yīng)位置的地理環(huán)境數(shù)據(jù),結(jié)合電網(wǎng)內(nèi)部的設(shè)備狀態(tài)數(shù)據(jù),可以使用機(jī)器學(xué)習(xí)模型給出臺(tái)風(fēng)到達(dá)之前的電網(wǎng)災(zāi)害預(yù)警,以及臺(tái)風(fēng)經(jīng)過時(shí)的電網(wǎng)實(shí)時(shí)狀態(tài)評(píng)估。
通過對(duì)海南電網(wǎng)2014 年至今設(shè)備缺陷和故障的統(tǒng)計(jì)分析,電網(wǎng)設(shè)備在臺(tái)風(fēng)期間受臺(tái)風(fēng)的影響主要包括設(shè)備的地形環(huán)境、設(shè)備參數(shù)、氣象環(huán)境的影響。然而由于電網(wǎng)對(duì)臺(tái)風(fēng)的損失統(tǒng)計(jì)都是在臺(tái)風(fēng)過后進(jìn)行,因此數(shù)據(jù)僅有一個(gè)大概的統(tǒng)計(jì)結(jié)果,時(shí)效性很差,并且不夠細(xì)致,并不能作為建立模型的可用數(shù)據(jù)。因此我們另辟蹊徑,從95598 的故障單來尋找信息。
95598 的故障單是根據(jù)用戶的實(shí)時(shí)電話進(jìn)行記錄,因此在時(shí)效性上很強(qiáng),且自帶地點(diǎn)信息,雖然地點(diǎn)不夠準(zhǔn)確,但是也可以確定所在的縣市等。但是工單報(bào)的故障是否和臺(tái)風(fēng)有強(qiáng)相關(guān)性就需要進(jìn)一步分析了。
以下是從2016 年到現(xiàn)在海南省各地區(qū)95598 在正常日收到的日平均故障報(bào)告與臺(tái)風(fēng)日收到的日平均故障報(bào)告的對(duì)比圖如表1 所示:
表1 正常天與臺(tái)風(fēng)天故障報(bào)告次數(shù)對(duì)比
從上表中我們可以看到,在臺(tái)風(fēng)經(jīng)過的日期中,日平均故障報(bào)告要明顯多于沒有臺(tái)風(fēng)時(shí)的日平均故障報(bào)告,因此可以確定,95598 的故障報(bào)告單數(shù)據(jù)與臺(tái)風(fēng)故障有著很強(qiáng)的關(guān)聯(lián)性,以此數(shù)據(jù)為標(biāo)準(zhǔn)建立模型是可以反應(yīng)真實(shí)情況的。
由于各地區(qū)的桿塔數(shù)量不同,所以不能簡(jiǎn)單的以報(bào)故障次數(shù)的多少來評(píng)判危險(xiǎn)程度,那么我們可以分開來看每一個(gè)地區(qū),用每一個(gè)地區(qū)平時(shí)的報(bào)故障次數(shù)和臺(tái)風(fēng)期間的報(bào)故障次數(shù)來做歸一化處理,這樣就可以得到比較合理的故障危險(xiǎn)程度了。
數(shù)據(jù)歸一化就是按一定方式將所有數(shù)據(jù)縮放到0-1 之間,歸一化方法:
通常情況氣象特征有很多,例如溫度、濕度、風(fēng)速、風(fēng)向、降雨等,跟臺(tái)風(fēng)相關(guān)的大概有風(fēng)速、風(fēng)向、降雨,但是風(fēng)向和降雨只有在特定情況下才會(huì)對(duì)輸電桿塔造成影響,比如風(fēng)向和輸電線路形成一定角度的時(shí)候,降雨在某些特定的地形條件下可以對(duì)輸電設(shè)備造成淹沒或侵泡的時(shí)候,這些數(shù)據(jù)很難做進(jìn)一步處理,與其他相關(guān)數(shù)據(jù)進(jìn)行關(guān)聯(lián),成為可以進(jìn)行桿塔風(fēng)險(xiǎn)模型建設(shè)的結(jié)構(gòu)化數(shù)據(jù)。
風(fēng)速是對(duì)電網(wǎng)設(shè)備造成破壞的第一因素,風(fēng)速越高破壞力越強(qiáng),強(qiáng)風(fēng)會(huì)導(dǎo)致主網(wǎng)和配網(wǎng)的桿塔倒塌,傾斜。風(fēng)速數(shù)據(jù)根據(jù)氣象局的預(yù)測(cè)風(fēng)圈決定。那么如何確定不同風(fēng)力下輸電桿塔的危險(xiǎn)程度呢,我們使用一個(gè)通用的指數(shù)型曲線函數(shù)擬合算法公式:
其中:V 是目前風(fēng)速,Vmin為桿塔設(shè)計(jì)風(fēng)速,Vex為桿塔的極限風(fēng)速,K 為一個(gè)待定系數(shù),在此次建模中,通過各種嘗試,我們?nèi)?.15。這樣就可以計(jì)算出風(fēng)速對(duì)桿塔的影響系數(shù),也就是風(fēng)速危險(xiǎn)系數(shù),系數(shù)越大則代表?xiàng)U塔越危險(xiǎn)。
由于配電網(wǎng)桿塔與架空線經(jīng)常需要貫穿一些復(fù)雜地形,從平原地區(qū)到高山地區(qū),經(jīng)常伴隨著幾千米的海拔變化,而隨著海拔的變化,臺(tái)風(fēng)經(jīng)過該地區(qū)時(shí)的風(fēng)速也會(huì)受到相應(yīng)的影響,因此對(duì)配電網(wǎng)所在地區(qū)微地形對(duì)臺(tái)風(fēng)的影響進(jìn)行分析和評(píng)估就對(duì)輸電線路在臺(tái)風(fēng)經(jīng)過時(shí)的危險(xiǎn)程度的評(píng)定有重大價(jià)值。
電網(wǎng)設(shè)備所處的地形也至關(guān)重要,在高坡或者山地等高海拔地區(qū)的設(shè)備受到風(fēng)力的影響會(huì)更大,遠(yuǎn)大于平原和洼地,然而由于高山地形也會(huì)對(duì)臺(tái)風(fēng)的強(qiáng)度造成影響,導(dǎo)致臺(tái)風(fēng)減弱,但是我們無法從具體地形去分析。從設(shè)備臺(tái)賬數(shù)據(jù)中,我們觀察到有桿塔所在的微地形數(shù)據(jù),并且可以和所在區(qū)域關(guān)聯(lián)起來,那么通過剛才得到的每一區(qū)域的危險(xiǎn)系數(shù),可以把地形的特征加入建立一個(gè)線性回歸模型,來看每一種地形對(duì)不同危險(xiǎn)的貢獻(xiàn)程度。
多元線性回歸就是用多個(gè)數(shù)據(jù)特征來線性擬合另一個(gè)特征,其公式如下:
建立了特征之間的對(duì)應(yīng)關(guān)系之后,通過最小二乘法來尋找每個(gè)特征的最佳系數(shù)。普通最小二乘法通過最小化誤差的平方和尋找最佳參數(shù),優(yōu)化公式如下:
我們從桿塔臺(tái)賬數(shù)據(jù)表中,找出四種最常見的地形:平原、丘陵、山地、高山,并建立線性回歸模型,地形線性回歸模型特征對(duì)照表如表2 所示:
表2 地形危險(xiǎn)系數(shù)線性回歸對(duì)應(yīng)表
最后,我們得到這四種地形對(duì)于臺(tái)風(fēng)的危險(xiǎn)系數(shù)如表3 所示:
表3 地形危險(xiǎn)系數(shù)
輸電桿塔的類型也對(duì)臺(tái)風(fēng)經(jīng)過時(shí)桿塔的危險(xiǎn)程度有很大影響,通常來說,輸電網(wǎng)中最多的輸電桿塔為耐張桿塔和直線桿塔,耐張塔需要承受架空線的拉力,所以在結(jié)構(gòu)設(shè)計(jì)上更為堅(jiān)固;直線桿塔只需要承受架空線的自重,所以相比耐張塔來說,直線桿塔在自身的結(jié)構(gòu)強(qiáng)度上要弱一些。
我們同樣使用多元線性回歸擬合的方法,去得到桿塔類型的臺(tái)風(fēng)危險(xiǎn)系數(shù)。我們同樣選取最常見的四種類型桿塔:普通直線塔、普通耐張塔、普通直線桿、普通耐張桿,如表4 所示:
表4 桿塔類型危險(xiǎn)系數(shù)線性回歸對(duì)應(yīng)表
最后,我們得到這四種地形對(duì)于臺(tái)風(fēng)的危險(xiǎn)系數(shù):
表5 桿塔類型危險(xiǎn)系數(shù)
根據(jù)之前所做的地形危險(xiǎn)系數(shù)、桿塔類型危險(xiǎn)系數(shù)和臺(tái)風(fēng)風(fēng)速危險(xiǎn)系數(shù)等特征的臺(tái)風(fēng)危險(xiǎn)系數(shù)結(jié)果進(jìn)行線性疊加得到臺(tái)風(fēng)對(duì)電網(wǎng)的不同的影響,建立預(yù)警模型,其中地形危險(xiǎn)系數(shù)和桿塔類型危險(xiǎn)系數(shù)是固定值,而臺(tái)風(fēng)風(fēng)速危險(xiǎn)系數(shù)可以通過氣象臺(tái)所預(yù)報(bào)的臺(tái)風(fēng)位置以及風(fēng)速,對(duì)相關(guān)區(qū)域的桿塔設(shè)備進(jìn)行風(fēng)速危險(xiǎn)系數(shù)計(jì)算,最后在做一次歸一化,后得到預(yù)警模型結(jié)果。
通過這樣的建模方法得到的危險(xiǎn)系數(shù)有一個(gè)問題,就是通過歸一化后,無法看出每種特征對(duì)最后的危險(xiǎn)系數(shù)的貢獻(xiàn)程度,而使用統(tǒng)一的系數(shù)。而這并不符合客觀情況,現(xiàn)實(shí)情況中或許在一些區(qū)域只有風(fēng)速對(duì)結(jié)果產(chǎn)生影響,地形和桿塔類型的貢獻(xiàn)可以忽略不計(jì),而由于地形和桿塔類型危險(xiǎn)系數(shù)是固定值,會(huì)穩(wěn)定的對(duì)模型產(chǎn)生影響貢獻(xiàn),我們嘗試引入attention 機(jī)制,對(duì)臺(tái)風(fēng)預(yù)警模型不同特征的貢獻(xiàn)程度根據(jù)實(shí)際數(shù)據(jù)做一下調(diào)整。
A ttention 機(jī)制實(shí)際上是一個(gè)編碼再解碼的過程,編碼算法和解碼算法可以根據(jù)情況自行選擇,最后,通過中間碼的大小來確定每一個(gè)特征的貢獻(xiàn)程度。這里我們選擇編碼和解碼都使用多層BP 神經(jīng)網(wǎng)絡(luò)。
深層人工神經(jīng)網(wǎng)絡(luò)(DNN,M LP),除了輸入輸出層,它中間可以有多個(gè)隱層。最簡(jiǎn)單的MLP 需要有一層隱層,即輸入層、隱層和輸出層才能稱為一個(gè)簡(jiǎn)單的神經(jīng)網(wǎng)絡(luò)。神經(jīng)網(wǎng)絡(luò)是仿生物神經(jīng)網(wǎng)絡(luò)而來的一種技術(shù),通過連接多個(gè)特征值,經(jīng)過線性和非線性的組合,最終達(dá)到一個(gè)目標(biāo)。如圖1 所示:
圖1 深層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)示意圖
前向傳播指的是信息從第一層逐漸地向高層進(jìn)行傳遞的過程。假設(shè)第一層為輸入層,輸入的信息為[x1,x2,x3]。對(duì)于層l,用Ll表示該層的所有神經(jīng)元,其輸出為yl, 其中第j個(gè)節(jié)點(diǎn)的輸出為yl(j),該節(jié)點(diǎn)的輸入為ul(j),連接第l層與第(l-1)層的權(quán)重矩陣為Wl,上一層的第i個(gè)節(jié)點(diǎn)到第l層第j個(gè)節(jié)點(diǎn)的權(quán)重為wl ji。結(jié)合之前定義的字母標(biāo)記,對(duì)于第二層的三個(gè)神經(jīng)元的輸出則有:
將上述的式子轉(zhuǎn)換為矩陣表達(dá)式:
將第二層的前向傳播計(jì)算過程推廣到網(wǎng)絡(luò)中的任意一層,則:
其中f(.)為激活函數(shù),bl(j)為第l層第j個(gè)節(jié)點(diǎn)的偏置。
由于深層網(wǎng)絡(luò)的特殊性,普通的激活函數(shù),例如sigmoid 容易在層與層間傳播時(shí)有梯度彌散,導(dǎo)致信息丟失,因此這里選擇leaky relu 作為激活函數(shù),如圖2 所示:
圖2 relu激活函數(shù)圖
基本的模型搭建完成后,訓(xùn)練的時(shí)候所做的就是完成模型參數(shù)的更新。由于存在多層的網(wǎng)絡(luò)結(jié)構(gòu),因此無法直接對(duì)中間的隱層利用損失來進(jìn)行參數(shù)更新,但可以利用損失從頂層到底層的反向傳播來進(jìn)行參數(shù)的估計(jì)。對(duì)于網(wǎng)絡(luò)的最后一層第k層——輸出層,現(xiàn)在定義損失函數(shù):
為了極小化損失函數(shù),通過梯度下降來進(jìn)行推導(dǎo):
那么則有:
另有,下一層所有結(jié)點(diǎn)的輸入都與前一層的每個(gè)結(jié)點(diǎn)輸出有關(guān),因此損失函數(shù)可以認(rèn)為是下一層的每個(gè)神經(jīng)元結(jié)點(diǎn)輸入的函數(shù)。那么: 此處定義節(jié)點(diǎn)的靈敏度為誤差對(duì)輸入的變化率,即:
注意到上式中表達(dá)的是前后兩層的靈敏度關(guān)系,而對(duì)于最后一層,也就是輸出層來說,并不存在后續(xù)的一層,因此并不滿足上式。但輸出層的輸出是直接和誤差聯(lián)系的,因此可以用損失函數(shù)的定義來直接求取偏導(dǎo)數(shù)。那么:
至此,損失函數(shù)對(duì)各參數(shù)的梯度為:
建模使用多層BP 神經(jīng)網(wǎng)絡(luò)分類算法,通過隨機(jī)數(shù)來隨機(jī)生成風(fēng)速數(shù)據(jù),暫定風(fēng)速區(qū)間為0-50m/s,得到不同的風(fēng)速危險(xiǎn)系數(shù),最后將風(fēng)速、桿塔類型、地形等數(shù)據(jù)作為分類模型特征,將得到的臺(tái)風(fēng)危險(xiǎn)系數(shù)作為目標(biāo)值,建立多層神經(jīng)網(wǎng)絡(luò),多層神經(jīng)網(wǎng)絡(luò)的中間層輸出就是我們得到的特征貢獻(xiàn)權(quán)重向量,最后我們根據(jù)這個(gè)特征權(quán)重,對(duì)響應(yīng)的地形危險(xiǎn)系數(shù),或者桿塔類型危險(xiǎn)系數(shù),或者臺(tái)風(fēng)風(fēng)速危險(xiǎn)系數(shù)做相應(yīng)的加減,并再次做歸一化,最后得到最終的臺(tái)風(fēng)危險(xiǎn)系數(shù)。當(dāng)然在實(shí)際預(yù)測(cè)中,風(fēng)速數(shù)據(jù)來源于氣象臺(tái)的預(yù)報(bào),最終得到的臺(tái)風(fēng)風(fēng)險(xiǎn)系數(shù)經(jīng)過歸一化后是一個(gè)0-1 之間的值,我們可以根據(jù)需求來定制預(yù)警的閾值。