胡亞山,倉(cāng)敏,諸德律,王靜怡
(國(guó)網(wǎng)江蘇省電力有限公司經(jīng)濟(jì)技術(shù)研究院,江蘇南京 210008)
配電網(wǎng)是電力系統(tǒng)發(fā)、輸、變、配的關(guān)鍵環(huán)節(jié)之一。隨著智能電網(wǎng)的發(fā)展建設(shè),電網(wǎng)公司對(duì)配電網(wǎng)領(lǐng)域的投資也越來(lái)越多。配電網(wǎng)具有眾多的電力設(shè)備,電網(wǎng)公司對(duì)配電設(shè)備進(jìn)行運(yùn)行維護(hù)、資產(chǎn)管理過(guò)程中產(chǎn)生了海量的數(shù)據(jù),如何管理并利用好這些數(shù)據(jù)是值得研究的重要問(wèn)題[1-3]。
近年來(lái),大數(shù)據(jù)技術(shù)結(jié)合深度學(xué)習(xí)等人工智能算法深入挖掘海量數(shù)據(jù)的潛在價(jià)值,其在電力系統(tǒng)的負(fù)荷預(yù)測(cè)、故障診斷、狀態(tài)評(píng)價(jià)、用電行為分析等領(lǐng)域應(yīng)用廣泛[4-6]。該文結(jié)合深度學(xué)習(xí)算法開(kāi)展多體系信息融合數(shù)據(jù)在配電網(wǎng)設(shè)備剩余壽命預(yù)測(cè)的應(yīng)用研究,為配電網(wǎng)設(shè)備的退役更換提供信息支撐及輔助決策。
在配電網(wǎng)設(shè)備資產(chǎn)的全壽命周期管理中,涉及海量配電網(wǎng)設(shè)備的相關(guān)數(shù)據(jù)信息,這些數(shù)據(jù)與配電網(wǎng)設(shè)備的健康狀態(tài)存在密切關(guān)聯(lián)。
基于多體系信息融合的配電網(wǎng)設(shè)備數(shù)據(jù),分析配電網(wǎng)設(shè)備全壽命周期質(zhì)量與關(guān)鍵要素的關(guān)聯(lián)性,可以為配電網(wǎng)設(shè)備全壽命周期的管控優(yōu)化提供指導(dǎo)。
以配電網(wǎng)中常見(jiàn)的電力變壓器為例,構(gòu)建多體系信息融合數(shù)據(jù)架構(gòu)如圖1 所示。該數(shù)據(jù)架構(gòu)主要包括油色譜指標(biāo)、油化指標(biāo)和電氣指標(biāo)共3個(gè)方面。
圖1 電力變壓器多體系信息融合數(shù)據(jù)架構(gòu)
油色譜指標(biāo)是指通過(guò)分析變壓器絕緣油中特定氣體成分的存在情況,以判斷電力變壓器的使用時(shí)間或是否存在局部放電和過(guò)熱等故障;油化指標(biāo)是指通過(guò)分析變壓器絕緣油的絕緣性能,實(shí)現(xiàn)電力變壓器質(zhì)量情況的評(píng)估;電氣指標(biāo)包括變壓器繞組的主要電氣特征,其能夠直接反映變壓器的健康情況。
主成分分析(Principal Component Analysis,PCA)是一種重要的多維空間數(shù)據(jù)統(tǒng)計(jì)分析技術(shù)。其核心思想是將存在相關(guān)性的高維數(shù)據(jù)映射到線性不相關(guān)的低維空間,實(shí)現(xiàn)數(shù)據(jù)壓縮和特征提取,從而簡(jiǎn)化數(shù)據(jù)復(fù)雜度,消除數(shù)據(jù)之間的相關(guān)性[7-8]。
假設(shè)Rn為特征空間,對(duì)于包含j維特征變量的k個(gè)數(shù)據(jù)樣本,PCA 的主要計(jì)算步驟如下[9-10]:
1)數(shù)據(jù)標(biāo)準(zhǔn)化
為了消除不同維度特征變量量綱對(duì)主特征提取結(jié)果的影響,有必要對(duì)原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化,計(jì)算方法如式(1)-(2)所示:
2)計(jì)算協(xié)方差矩陣
為消除不同特征變量之間的相關(guān)性,達(dá)到線性化與降維度的目的,首先計(jì)算表征特征變量之間相關(guān)性的協(xié)方差矩陣R:
式中,rij為第i維特征變量與第j維特征變量之間的相關(guān)系數(shù),計(jì)算方法如下:
3)計(jì)算特征值與特征向量
通過(guò)求解特征方程|λI-R|=0 得到協(xié)方差矩陣R的特征值,將這些特征值從大到小依次進(jìn)行排序:
式中,λp為協(xié)方差矩陣R的第p個(gè)特征值,共有P個(gè)特征值。
進(jìn)一步計(jì)算P個(gè)特征值對(duì)應(yīng)的單位特征向量:
式中,ep為特征值λp對(duì)應(yīng)的單位特征向量,epj為ep第j維取值。
4)計(jì)算主成分貢獻(xiàn)率
按照如式(7)和式(8)所示的定義,計(jì)算各個(gè)主成分的貢獻(xiàn)率φp,按從大到小進(jìn)行排序并計(jì)算累計(jì)貢獻(xiàn)率ψp,然后篩選出累計(jì)貢獻(xiàn)率大于閾值pmin的前h個(gè)主成分:
5)數(shù)據(jù)樣本映射
將主成分對(duì)應(yīng)的h個(gè)特征向量作為列向量組成特征向量矩陣:
通過(guò)以下矩陣運(yùn)算將原數(shù)據(jù)樣本映射到主成分構(gòu)成的特征空間中,實(shí)現(xiàn)數(shù)據(jù)的降維和線性化:
式中,X′為映射后的數(shù)據(jù)樣本。
長(zhǎng)短期記憶(Long Short-Term Memory,LSTM)網(wǎng)絡(luò)是一種具有時(shí)間記憶功能的深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò),其核心思想是模擬人類記憶和處理信息的機(jī)制[11-12]。LSTM 的結(jié)構(gòu)與神經(jīng)網(wǎng)絡(luò)相似,只是每層的輸入層和輸出層之間由循環(huán)的記憶單元連接門[13-15]、輸出門及忘記門構(gòu)成,其結(jié)構(gòu)如圖2 所示[16]。
圖2 LSTM記憶單元結(jié)構(gòu)
1)忘記門
式中,Wxf為輸入層與忘記門之間的權(quán)重;Whf為隱藏層與忘記門之間的權(quán)重,αf為忘記門的偏置值;σ(·)為激活函數(shù)。
2)輸入門
輸入門負(fù)責(zé)控制更新的神經(jīng)元信息,其輸出信息如下:
式中,Wxt為輸入層與輸入門之間的權(quán)重;Wsl為記憶單元和輸入門之間的權(quán)重;αl為輸入門的偏執(zhí)值。
3)輸出門
輸出門負(fù)責(zé)控制記憶單元最終的輸出信息,公式如下:
式中,Wxo為輸入層與輸出門之間的權(quán)重;Wso為記憶單元與輸出門的權(quán)重;αo為輸出門的偏置值。
該文提出基于PCA-LSTM 的配電網(wǎng)設(shè)備數(shù)據(jù)分析與優(yōu)化管控方法,實(shí)現(xiàn)配電網(wǎng)設(shè)備剩余壽命的預(yù)測(cè),從而輔助配電網(wǎng)設(shè)備資產(chǎn)的管理運(yùn)維,管控流程如圖3 所示。首先將多體系信息融合數(shù)據(jù)作為輸入,通過(guò)PCA 算法對(duì)數(shù)據(jù)進(jìn)行降維簡(jiǎn)化處理;然后將提取的主成分?jǐn)?shù)據(jù)作為L(zhǎng)STM 模型的輸入,從而自動(dòng)學(xué)習(xí)數(shù)據(jù)特征,獲得配電網(wǎng)設(shè)備剩余壽命預(yù)測(cè)結(jié)果。
圖3 配電網(wǎng)設(shè)備數(shù)據(jù)分析與優(yōu)化管控流程
為驗(yàn)證該文提出的基于PCA-LSTM 的配電設(shè)備數(shù)據(jù)分析與優(yōu)化管控方法的正確性和有效性,選取1 000 組配電設(shè)備多體系數(shù)據(jù)作為樣本,并按4∶1 的比例劃分為訓(xùn)練樣本和測(cè)試樣本。
1 000組數(shù)據(jù)樣本中,每個(gè)數(shù)據(jù)樣本都包含如圖1所示的13 個(gè)指標(biāo)值,數(shù)據(jù)樣本取值如表1 所示。
表1 數(shù)據(jù)樣本的取值
通過(guò)PCA 算法,前7 個(gè)主特征的貢獻(xiàn)率及累計(jì)貢獻(xiàn)率如表2 所示。由表2 可知,主成分1-4 的貢獻(xiàn)率分別為40.15%、25.67%、17.91%和13.11%,而主成分5 的貢獻(xiàn)率僅為2.25%。前4 項(xiàng)主成分累計(jì)的貢獻(xiàn)率已達(dá)96.84%,大于閾值95%,故選取主成分1-4構(gòu)建特征向量矩陣,并對(duì)原始數(shù)據(jù)樣本進(jìn)行映射。
表2 前7個(gè)主特征的貢獻(xiàn)率
1)算法性能對(duì)結(jié)果的影響分析
以所有數(shù)據(jù)樣本作為輸入,分別采用PCA-LSTM算法、LSTM 算法和PCA-BP 算法,得到配電網(wǎng)設(shè)備剩余壽命的預(yù)測(cè)模型。然后以5 組數(shù)據(jù)測(cè)試模型的準(zhǔn)確性,結(jié)果如表3 所示。
表3 不同算法的剩余壽命預(yù)測(cè)結(jié)果分析
由表3 可知,PCA-LSTM 算法配電網(wǎng)設(shè)備剩余壽命預(yù)測(cè)誤差均小于3%,LSTM 算法最大誤差達(dá)4.5%,PCA-BP 算法最大誤差達(dá)3.8%。對(duì)于同一數(shù)據(jù)樣本,PCA-LSTM 算法的預(yù)測(cè)誤差是3 種算法中最小的一種,而LSTM 算法與PCA-BP 算法則各有優(yōu)劣。相比于LSTM 算法,PCA-LSTM 算法通過(guò)PCA 將配電網(wǎng)設(shè)備的特征數(shù)據(jù)進(jìn)行降維簡(jiǎn)化,消除不相關(guān)特征對(duì)剩余壽命預(yù)測(cè)結(jié)果的干擾;相比于PCA-BP 算法,經(jīng)過(guò)主成分特征數(shù)據(jù)的學(xué)習(xí),LSTM 算法比BP 算法具有更優(yōu)的自動(dòng)學(xué)習(xí)性能,剩余壽命預(yù)測(cè)結(jié)果也更加準(zhǔn)確。
2)多體系信息融合對(duì)結(jié)果的影響分析
選取不同的信息方案作為PCA-LSTM 模型的輸入,得到的配電網(wǎng)設(shè)備剩余壽命預(yù)測(cè)結(jié)果如表4 所示。由表4 可知,選取單種體系信息作為輸入時(shí),剩余壽命預(yù)測(cè)誤差大于12%;選取兩種信息作為輸入時(shí),剩余壽命預(yù)測(cè)誤差大于5%;而該文所提方法將多種體系信息作為輸入,剩余壽命預(yù)測(cè)誤差小于3%。
表4 不同體系信息的剩余壽命預(yù)測(cè)結(jié)果分析
該文開(kāi)展了基于PCA-LSTM 算法的配電網(wǎng)設(shè)備剩余壽命預(yù)測(cè)研究,通過(guò)算例分析結(jié)果表明,PCA 算法能夠?qū)崿F(xiàn)配電網(wǎng)多體系信息的主要成分提取,從而達(dá)到降低數(shù)據(jù)復(fù)雜度的目的;PCA-LSTM 算法相比于LSTM 算法與PCA-BP 算法,剩余壽命預(yù)測(cè)結(jié)果更加準(zhǔn)確;而相比于采用單種體系或兩種體系信息,文中所提算法能夠全面利用反映配電網(wǎng)設(shè)備剩余價(jià)值的關(guān)鍵數(shù)據(jù),提高預(yù)測(cè)結(jié)果的準(zhǔn)確性。但該文所提算法僅實(shí)現(xiàn)了配電網(wǎng)設(shè)備剩余壽命的預(yù)測(cè),如何同步實(shí)現(xiàn)配電網(wǎng)設(shè)備的故障研判將在后續(xù)研究中開(kāi)展。