作者簡(jiǎn)介:暢楠(1986— ),男,中級(jí)工程師,本科;研究方向:輸配電工程,配網(wǎng)運(yùn)維管理、數(shù)字化轉(zhuǎn)型。
摘要:配網(wǎng)智能融合終端運(yùn)維信號(hào)多樣,數(shù)值范圍和波動(dòng)特性各異,增加了辨識(shí)難度。為提高精度,文章采用樸素貝葉斯算法進(jìn)行大數(shù)據(jù)分析,通過(guò)預(yù)處理運(yùn)維信號(hào),包括噪聲濾除和特征提取,將信號(hào)轉(zhuǎn)化為適合異常辨識(shí)的形式?;谪惾~斯理論和特征條件獨(dú)立假設(shè),對(duì)信號(hào)進(jìn)行并行化分類,實(shí)現(xiàn)異常運(yùn)維信號(hào)的辨識(shí)。實(shí)驗(yàn)結(jié)果顯示,該方法的相關(guān)系數(shù)高達(dá)0.968,證明了其辨識(shí)效果顯著,為配網(wǎng)智能融合終端的運(yùn)維管理提供了有力支持。
關(guān)鍵詞:大數(shù)據(jù);配網(wǎng)智能融合終端;運(yùn)維信號(hào);異常辨識(shí)
中圖分類號(hào):TP391.5" 文獻(xiàn)標(biāo)志碼:A
0" 引言
配網(wǎng)智能融合終端在運(yùn)行過(guò)程中生成的運(yùn)維信號(hào)數(shù)量巨大且多樣化,涵蓋了電壓、電流、功率、頻率等多種類型的信號(hào),數(shù)值范圍和波動(dòng)特性各不相同。這些信號(hào)具有實(shí)時(shí)性,需要實(shí)時(shí)監(jiān)測(cè)和處理。同時(shí),信號(hào)中存在噪聲干擾,對(duì)異常信號(hào)的準(zhǔn)確辨識(shí)造成干擾。這些特性影響了運(yùn)維信號(hào)異常辨識(shí)的準(zhǔn)確性。
嚴(yán)宇平等[1]構(gòu)建了配電網(wǎng)載波通信網(wǎng)絡(luò)模型,根據(jù)該模型獲取通信節(jié)點(diǎn)的載波通信信號(hào),并利用分類器實(shí)現(xiàn)載波通信異常信號(hào)的辨識(shí)。但該方法難以適應(yīng)高頻率的數(shù)據(jù)更新,同時(shí)對(duì)于高維特征空間的降維和特征選擇不夠高效。于海平等[2]考慮配電網(wǎng)量測(cè)終端故障數(shù)據(jù)不平衡的問(wèn)題,引入卷積神經(jīng)網(wǎng)絡(luò)-長(zhǎng)短記憶模型進(jìn)行故障數(shù)據(jù)的分類識(shí)別,具有較高的故障分類精度。但對(duì)于實(shí)時(shí)性要求較高的運(yùn)維信號(hào),該方法需要進(jìn)一步的優(yōu)化來(lái)降低計(jì)算延遲。王艷等[3]針對(duì)電力物聯(lián)感知背景下配電設(shè)備監(jiān)測(cè)信號(hào)特點(diǎn),提出壓縮感知及異常識(shí)別算法。離線訓(xùn)練采用動(dòng)態(tài)閾值原子自適應(yīng)奇異值分解,減少字典原子數(shù)量;在線階段,根據(jù)稀疏系數(shù)改變矩陣健康閾值進(jìn)行異常識(shí)別,并更新字典提升精度。但該方法字典的更新策略需要根據(jù)實(shí)際應(yīng)用場(chǎng)景進(jìn)行優(yōu)化調(diào)整,影響了自適應(yīng)性。這些方法雖然在一定程度上提高了配電網(wǎng)的運(yùn)維質(zhì)量,降低了設(shè)備異常的漏檢和誤檢率,但在處理大規(guī)模數(shù)據(jù)時(shí)存在效率低下、計(jì)算復(fù)雜度高等問(wèn)題,難以滿足實(shí)際運(yùn)維中的實(shí)時(shí)性要求。因此,本文提出了一種基于大數(shù)據(jù)的配網(wǎng)智能融合終端運(yùn)維信號(hào)異常辨識(shí)方法。
1" 預(yù)處理配網(wǎng)智能融合終端運(yùn)維信號(hào)
原始運(yùn)維信號(hào)數(shù)據(jù)常受噪聲、異常值干擾,制約了后續(xù)異常辨識(shí)。為提高辨識(shí)準(zhǔn)確率,需對(duì)采集到的運(yùn)維信號(hào)數(shù)據(jù)進(jìn)行一系列預(yù)處理操作。針對(duì)缺失值,本文采取了填充處理,以確保訓(xùn)練異常識(shí)別分類器的準(zhǔn)確性。拉格朗日插值法被運(yùn)用于缺失值填充,假設(shè)給定了n個(gè)數(shù)據(jù)點(diǎn),(x0,y0),(x1,y1),…,(xi,yi),…,(xn,yn),在處理缺失值時(shí),先找到配網(wǎng)智能融合終端運(yùn)維信號(hào)數(shù)據(jù)集中的已知點(diǎn)(這些點(diǎn)不包含缺失值),再使用這些已知點(diǎn)來(lái)計(jì)算拉格朗日插值多項(xiàng)式,并使用這個(gè)多項(xiàng)式來(lái)估計(jì)缺失值并進(jìn)行插補(bǔ)操作,具體如式(1)所示。
C(x)=∑n+1i=0L(xi)yi(1)
式中,C(x)表示缺失值的插值結(jié)果;L(xi)表示拉格朗日基函數(shù)。
對(duì)原始數(shù)據(jù)集進(jìn)行標(biāo)準(zhǔn)化處理即將不同屬性的數(shù)據(jù)轉(zhuǎn)換為具有相似數(shù)量級(jí)的數(shù)據(jù)。本文采用了最大-最小值法進(jìn)行數(shù)據(jù)標(biāo)準(zhǔn)化[4]。在標(biāo)準(zhǔn)化處理后,不同屬性的數(shù)據(jù)將具有相似的尺度,使得各個(gè)屬性對(duì)模型的影響權(quán)重更加平衡,提高了模型的訓(xùn)練效果和泛化能力。
2" 基于大數(shù)據(jù)分析技術(shù)辨識(shí)運(yùn)維信號(hào)異常
本文引入了大數(shù)據(jù)分析技術(shù)的樸素貝葉斯算法,分析預(yù)處理后的運(yùn)維信號(hào)數(shù)據(jù),實(shí)現(xiàn)數(shù)據(jù)的分類識(shí)別,根據(jù)分類結(jié)果辨識(shí)出異常的運(yùn)維信號(hào)[4]。樸素貝葉斯算法分類識(shí)別的原理就是確定每個(gè)終端運(yùn)維數(shù)據(jù)的分類概率,將樣本數(shù)據(jù)分配給概率最大的類別[5]。預(yù)處理后的配網(wǎng)智能融合終端運(yùn)維數(shù)據(jù)為(x1,x2,…,xm),其對(duì)應(yīng)的類別標(biāo)簽分別為B={B1,B2,…,Bm},B1、B2、…、Bm分別表示正常數(shù)據(jù)、由采購(gòu)錯(cuò)誤或設(shè)備替換未更新等原因造成的終端設(shè)備型號(hào)異常數(shù)據(jù)、由設(shè)備丟失或損壞未報(bào)等原因造成的終端設(shè)備數(shù)量異常數(shù)據(jù)、由作業(yè)人員疏忽或環(huán)境變化等原因造成的終端設(shè)備安裝位置異常數(shù)據(jù)、由設(shè)備老化或配置錯(cuò)誤等原因造成的終端設(shè)備技術(shù)參數(shù)異常數(shù)據(jù)等。計(jì)算各終端運(yùn)維數(shù)據(jù)分類的后驗(yàn)概率:
Q(Bixi)=Q(xiBi)Q(Bi)Q(xi)(3)
式中,Q(Bixi)表示配網(wǎng)智能融合終端運(yùn)維信號(hào)xi屬于類別標(biāo)簽Bi的后驗(yàn)概率;Q(Bixi)Q(Bi)表示先驗(yàn)概率;Q(xi)表示配網(wǎng)智能融合終端運(yùn)維信號(hào)異常的分類概率。對(duì)于樸素貝葉斯分類器而言,當(dāng)Q(xi)為常數(shù)時(shí),就可以將最大化的后驗(yàn)概率轉(zhuǎn)化為先驗(yàn)概率。假設(shè)這些異常特征相互獨(dú)立,即可得到如下式所示各異常特征分類的條件概率:
Q(xiBi)=∏mi=1Q(xmBi)(4)
式(4)中,Q(xmBi)的取值可以從配網(wǎng)智能融合終端運(yùn)維信號(hào)的訓(xùn)練樣本數(shù)據(jù)集中獲得。得到每個(gè)運(yùn)維信號(hào)分類的條件概率后,將各運(yùn)維信號(hào)辨識(shí)為條件概率最大的類別標(biāo)簽,利用訓(xùn)練集數(shù)據(jù)進(jìn)行處理,確定各異常信號(hào)的概率分布,并以此為依據(jù),將信號(hào)歸類至相應(yīng)的類別,即可完成配網(wǎng)智能融合終端運(yùn)維信號(hào)的分類識(shí)別,得到每個(gè)運(yùn)維信號(hào)數(shù)據(jù)的分類標(biāo)簽。根據(jù)樸素貝葉斯算法輸出的后驗(yàn)概率,設(shè)定一個(gè)概率閾值,區(qū)分正常和異常信號(hào)。
3" 仿真實(shí)驗(yàn)
3.1" 實(shí)驗(yàn)設(shè)置
實(shí)驗(yàn)環(huán)境選用了高性能的計(jì)算機(jī)集群??紤]到該方法在大數(shù)據(jù)環(huán)境下運(yùn)行,實(shí)驗(yàn)采用了Hadoop的分布式文件系統(tǒng)(Hadoop Distributed File System,HDFS)來(lái)存儲(chǔ)數(shù)據(jù),利用Hive數(shù)據(jù)倉(cāng)庫(kù)進(jìn)行數(shù)據(jù)管理。同時(shí),為了運(yùn)行Spark SQL和對(duì)比辨識(shí)算法,實(shí)驗(yàn)利用了Spark內(nèi)存計(jì)算框架。本文采集了2023年6月1日—2023年11月1日某電力公司的配網(wǎng)智能融合終端運(yùn)維信號(hào)作為實(shí)驗(yàn)樣本數(shù)據(jù),原始運(yùn)維信號(hào)數(shù)據(jù)集有100000條記錄,缺失值占比5%,拉格朗日插值法中的已知點(diǎn)數(shù)5,數(shù)據(jù)標(biāo)準(zhǔn)化的最大值100,最小值0,異常分類標(biāo)簽數(shù)量5,樸素貝葉斯算法迭代次數(shù)100,Hadoop集群的Map任務(wù)數(shù)量20,Reduce任務(wù)數(shù)量5。設(shè)定某個(gè)運(yùn)維信號(hào)被分類為異常的后驗(yàn)概率的閾值為0.7,超過(guò)0.7,則將其視為異常信號(hào)。其中,部分運(yùn)維信號(hào)如圖1所示。
本文分別利用本文方法、嚴(yán)宇平等[1]方法和于海平等[2]方法,對(duì)實(shí)驗(yàn)樣本數(shù)據(jù)進(jìn)行分類識(shí)別。
3.2" 結(jié)果分析
經(jīng)過(guò)預(yù)處理后,配網(wǎng)智能融合終端運(yùn)維信號(hào)的噪聲分量被去除,缺失值得到了補(bǔ)充,得到的信號(hào)如圖2所示。
本文分析運(yùn)維信號(hào),確定其信號(hào)特征,并與各信號(hào)異常類別標(biāo)簽相對(duì)比,確定分類的條件概率為0.68,確定為由設(shè)備丟失或損壞未報(bào)等原因造成的終端設(shè)備數(shù)量異常數(shù)據(jù)這一類別,具體結(jié)果如圖3所示。
在配網(wǎng)智能融合終端運(yùn)維信號(hào)的分配任務(wù)中,本文采用相關(guān)系數(shù)來(lái)評(píng)判不同方法對(duì)配網(wǎng)智能融合終端異常運(yùn)維信號(hào)的辨識(shí)精度。本文將原始樣本數(shù)據(jù)集劃分為10組,將運(yùn)維信號(hào)規(guī)模由1000增加到10000。不同數(shù)據(jù)規(guī)模下,利用各方法所得異常運(yùn)維信號(hào)辨識(shí)結(jié)果和實(shí)際數(shù)據(jù)的相關(guān)系數(shù)如表1所示。
由表1可知,本文方法在配網(wǎng)智能融合終端運(yùn)維信號(hào)異常辨識(shí)結(jié)果的相關(guān)系數(shù)平均為0.968,較其他方法分別提升了0.109、0.101,表明本文方法在運(yùn)維信號(hào)異常辨識(shí)方面具有更高的準(zhǔn)確性和可靠性。隨著配網(wǎng)智能融合終端運(yùn)維信號(hào)樣本數(shù)據(jù)規(guī)模的不斷增加,本文方法的辨識(shí)優(yōu)勢(shì)越來(lái)越明顯,這是因?yàn)楸疚姆椒ú捎昧舜髷?shù)據(jù)分析技術(shù)中的樸素貝葉斯算法對(duì)運(yùn)維信號(hào)進(jìn)行并行化分類識(shí)別,能夠快速處理大規(guī)模的數(shù)據(jù)集。
4" 結(jié)語(yǔ)
配網(wǎng)智能融合終端在日常運(yùn)行過(guò)程中勢(shì)必會(huì)產(chǎn)生海量運(yùn)維信號(hào),為提升配網(wǎng)智能融合終端運(yùn)維信號(hào)異常辨識(shí)的效果與效率,本文引入大數(shù)據(jù)分析技術(shù)設(shè)計(jì)辨識(shí)方法,首先采集并預(yù)處理了配網(wǎng)智能融合終端的運(yùn)維信號(hào)數(shù)據(jù),然后采用樸素貝葉斯算法進(jìn)行運(yùn)維信號(hào)異常的并行辨識(shí),最后通過(guò)仿真對(duì)比實(shí)驗(yàn)驗(yàn)證了該方法的可行性和有效性。未來(lái),本文將關(guān)注配網(wǎng)智能融合終端運(yùn)維信號(hào)的其他相關(guān)特性,以期發(fā)現(xiàn)更多的潛在信息和價(jià)值。
參考文獻(xiàn)
[1]嚴(yán)宇平,洪雨天,陳守明,等.基于參數(shù)估計(jì)的配電網(wǎng)載波通信異常信號(hào)識(shí)別方法[J].電測(cè)與儀表,2022(10):123-129.
[2]于海平,吳雪瓊,杜天碩.不平衡數(shù)據(jù)集下海量配電網(wǎng)量測(cè)終端故障診斷方法[J].電力系統(tǒng)及其自動(dòng)化學(xué)報(bào),2023(4):32-40.
[3]王艷,李煜,趙洪山,等.配電設(shè)備監(jiān)測(cè)信號(hào)的壓縮感知與設(shè)備異常識(shí)別[J].高電壓技術(shù),2022(1):11-19.
[4]盧曉強(qiáng),李剛,周萬(wàn)竣,等.基于最小二乘雙支持向量機(jī)的配電網(wǎng)短路故障辨識(shí)方法研究[J].武漢大學(xué)學(xué)報(bào)(工學(xué)版),2022(4):401-408.
[5]程曉磊,王鵬,王淵,等.基于大數(shù)據(jù)的配電網(wǎng)故障診斷預(yù)測(cè)模型設(shè)計(jì)[J].電氣傳動(dòng),2022(2):61-66.
(編輯" 王雪芬)
Abnormal identification method of operation and maintenance signal of distribution network
intelligent fusion terminal based on big data
CHANG" Nan
(State Grid Shaanxi Electric Power Co., Ltd., Xingping Power Supply Branch, Xingping 712000, China)Abstract:" The intelligent integration of distribution network terminal operation and maintenance signals is diverse, with different numerical ranges and fluctuation characteristics, which increases the difficulty of identification. To improve accuracy, this article adopts naive Bayesian algorithm for big data analysis. By preprocessing the operation and maintenance signal, including noise filtering and feature extraction, the signal is transformed into a form suitable for anomaly identification. Based on Bayesian theory and independent assumption of feature conditions, parallelized classification of signals is carried out to identify abnormal operation and maintenance signals. The experimental results show that the correlation coefficient of the design method is as high as 0.968, which proves its significant identification effect and provides strong support for the operation and maintenance management of intelligent integration terminals in the distribution network.
Key words: big data; intelligent fusion terminal of distribution network; operation and maintenance signal; abnormal identification