舒一飛,劉興杰,康潔瑩,劉鵬,樊博
1. 國(guó)網(wǎng)寧夏電力有限公司 營(yíng)銷服務(wù)中心,寧夏 銀川 750002
2. 寧夏大學(xué) 電氣工程及其自動(dòng)化系,寧夏 銀川 750021
居民用戶異常用電不僅會(huì)造成電網(wǎng)輸配電損失,破壞正常的經(jīng)濟(jì)秩序,而且存在一定的安全隱患。通常,對(duì)于異常用電的檢測(cè)主要依靠技術(shù)人員現(xiàn)場(chǎng)排查,費(fèi)時(shí)費(fèi)力,且無法避免網(wǎng)絡(luò)和通信中一些高級(jí)手段的應(yīng)用[1-2]。
隨著技術(shù)的發(fā)展,利用用電信息采集系統(tǒng)采集海量用戶數(shù)據(jù),使得開展數(shù)據(jù)驅(qū)動(dòng)的異常用電檢測(cè)、準(zhǔn)確識(shí)別成為可能[3-4]。對(duì)此研究人員提出了多種異常值檢測(cè)方法,主要涵蓋監(jiān)督學(xué)習(xí)和非監(jiān)督學(xué)習(xí)兩方面。監(jiān)督學(xué)習(xí)通過訓(xùn)練集來學(xué)習(xí)分類器,常用方法有K 近鄰、支持向量機(jī)、極限學(xué)習(xí)機(jī)、深度卷積神經(jīng)網(wǎng)絡(luò)等算法,這類方法準(zhǔn)確率較高,但在實(shí)際業(yè)務(wù)中,若訓(xùn)練集較少,可能影響分類的準(zhǔn)確性[5-12]。非監(jiān)督學(xué)習(xí)不使用樣本標(biāo)定信息,通常采用K-Means、模糊C 均值以及譜聚類等算法對(duì)數(shù)據(jù)進(jìn)行聚類,分析各類用戶的用電行為,適用于初期尚未構(gòu)建異常數(shù)據(jù)集時(shí)的檢測(cè),但這類方法對(duì)參數(shù)的依賴性較強(qiáng)[13-16]。
由于異常用電行為具有特定的時(shí)頻特性,這種特性必然引起線損數(shù)據(jù)發(fā)生異常,使其具有相應(yīng)的時(shí)頻特性,且與嫌疑用戶的用電數(shù)據(jù)產(chǎn)生時(shí)頻關(guān)聯(lián)。因?yàn)樵摃r(shí)頻特性往往具有強(qiáng)隨機(jī)不確定性,固定參數(shù)相關(guān)的分析方法無法很好地處理此類數(shù)據(jù)。經(jīng)驗(yàn)?zāi)J椒纸猓‥MD)方法是一種自適應(yīng)處理方法,不需要預(yù)設(shè)基函數(shù)和參數(shù),且不需要帶標(biāo)簽的數(shù)據(jù)集。另一方面,經(jīng)EMD 分解能夠得到有限個(gè)基本模式分量(intrinsic mode function,IMF)和剩余分量(residual component,RES),這些IMF 能夠突出原始數(shù)據(jù)的局部特征,有利于發(fā)掘數(shù)據(jù)內(nèi)部特有的時(shí)頻特征。EMD 已被證明在很多方面的應(yīng)用效果皆優(yōu)于其他信號(hào)處理方法[17-19]。
為此,將EMD 方法應(yīng)用于電力系統(tǒng)異常用電檢測(cè)中,提出一種基于EMD 的異常用電檢測(cè)方法。首先,針對(duì)供電線路中可能存在大量的小電量零電量用電戶的情況,給出了一種初步篩選方法,以提高檢測(cè)效率;采用EMD 方法對(duì)篩選用戶的用電量和線損電量時(shí)間序列進(jìn)行自適應(yīng)分解,獲取對(duì)應(yīng)的基本模式分量;進(jìn)一步提取EMD 分解所得高頻分量,通過對(duì)其變化趨勢(shì)和相關(guān)性進(jìn)行分析,最終標(biāo)定異常用電用戶。采用該方法對(duì)現(xiàn)場(chǎng)實(shí)采數(shù)據(jù)進(jìn)行了分析計(jì)算,驗(yàn)證了其有效性。
經(jīng)驗(yàn)?zāi)B(tài)分解方法是美籍華人Huang 提出的Hilbert-Huang 變換的核心內(nèi)容,其分解方法是基于以下假設(shè)條件:
1)數(shù)據(jù)至少有2 個(gè)極值,一個(gè)最大值和一個(gè)最小值;
2)數(shù)據(jù)的局部時(shí)域特性是由極值點(diǎn)間的時(shí)間尺度唯一確定;
3)如果數(shù)據(jù)沒有極值點(diǎn)但有拐點(diǎn),則可以通過對(duì)數(shù)據(jù)微分一次或多次求得極值,然后再通過積分來獲得分解結(jié)果。
可見,這種方法的本質(zhì)是通過數(shù)據(jù)的特征時(shí)間尺度來獲得本征波動(dòng)模式IMF,然后分解數(shù)據(jù)。在這一過程中,特征時(shí)間尺度及IMF 的定義都具有一定的經(jīng)驗(yàn)性和近似性。與其他信號(hào)處理方法相比,EMD 方法分解所用的特征時(shí)間尺度是源自于原始信號(hào),具有后驗(yàn)性和自適應(yīng)性。這種基于EMD 的時(shí)頻分析方法既適合于非線性、非平穩(wěn)信號(hào)的分析,也適合于線性、平穩(wěn)信號(hào)的分析,并且對(duì)于線性、平穩(wěn)信號(hào)的分析也比其他的時(shí)頻分析方法更好地反映了信號(hào)的物理意義。
采用EMD 方法對(duì)用戶異常行為進(jìn)行分析,具體流程如圖1 所示。
圖1 基于EMD 的異常用電行為檢測(cè)流程
由于通信失敗和設(shè)備故障等原因,可能導(dǎo)致抄表時(shí)出現(xiàn)數(shù)據(jù)缺失、數(shù)據(jù)錯(cuò)誤等問題,因此必須首先對(duì)從關(guān)口表和各用戶電能表獲取的計(jì)量數(shù)據(jù)進(jìn)行預(yù)處理,包括查漏補(bǔ)缺和數(shù)據(jù)更正。如對(duì)缺失數(shù)據(jù)使用插值進(jìn)行補(bǔ)充,全零數(shù)據(jù)直接進(jìn)行剔除等。計(jì)算得到總供入電量qSi(i為時(shí)間采樣點(diǎn),i=1,2 ,···,M)、總損耗電量qLi和各用戶消耗電量qKi(K為用戶編號(hào),K=1,2, ···,N)的時(shí)間序列。
當(dāng)進(jìn)行線損分析時(shí),主要以變壓器為單位(包括公變用戶和專變用戶),其用戶數(shù)量相對(duì)較少且電量一般較大,可直接對(duì)此類用戶在EMD 分解之后進(jìn)行異常用電分析。而針對(duì)公變臺(tái)區(qū)用戶數(shù)量較多且存在零電量和低電量用戶亦較多的實(shí)際情況,直接對(duì)此類用戶進(jìn)行EMD 分解將導(dǎo)致計(jì)算量大增且排查效率低下??紤]到除了暗線跨越表計(jì)外,用戶的異常用電量與其用電量一般成比例關(guān)系,且總損耗電量相關(guān)性強(qiáng),故本文提出預(yù)先采用相關(guān)性和用戶用電量等指標(biāo)相結(jié)合的方法對(duì)高損公變臺(tái)區(qū)用戶的異常用電初步篩選,以提高檢測(cè)效率。具體篩選過程如下:
4)將對(duì)應(yīng)的位次相加作為最終排序結(jié)果;
5)提取排序前5%用戶作為初篩用戶。
對(duì)初篩用戶進(jìn)行進(jìn)一步EMD 分析篩查,若未發(fā)現(xiàn)嫌疑用戶,則擴(kuò)大排查比例直至發(fā)現(xiàn)嫌疑用戶。對(duì)于用戶數(shù)較少的情況,如小于10 個(gè),可以將所有用戶都標(biāo)記為嫌疑用戶,直接進(jìn)行EMD 分析。需要指出的是,當(dāng)線路所帶變壓器較多且存在較多小電量用戶時(shí),也須預(yù)先采用上述方法進(jìn)行初步篩選。
EMD 的目的是將組成原始信號(hào)的各尺度分量不斷從高頻到低頻進(jìn)行提取,得到頻率由高到低排列特征模態(tài)函數(shù)。能量大的高頻分量代表原信號(hào)的主要特性,是最主要的組成分量。因此,根據(jù)EMD 方法對(duì)篩選所得用戶的qKi和qLi進(jìn)行分解,提取分解所得基本模式分量中的高頻分量,通過其變化趨勢(shì)和相關(guān)性指標(biāo)分析標(biāo)定嫌疑用戶。
某段線路由A、B 和D 這3 個(gè)專變用戶和1 個(gè)公變臺(tái)區(qū)C 組成,供出為某10 kV 變電站關(guān)口。利用采集系統(tǒng)每隔6 h 進(jìn)行一次線損計(jì)算,連續(xù)觀察一個(gè)月,其線損曲線圖2 所示。
圖2 線路線損率曲線
從圖2 中可以看出,該10 kV 線路日線損率在5%~25%波動(dòng),而正常線損率應(yīng)在5%以下,故存在異常用電行為。
由于該段線路僅有4 戶用戶,不需進(jìn)行初篩,直接對(duì)這4 戶的電量qKi和 線損電量qLi進(jìn)行EMD分解,得到若干IMF 和RES 分量。根據(jù)所得的EMD 結(jié)果,首先計(jì)算了各IMF 和RES 與其原始時(shí)間序列的Pearson 互相關(guān)系數(shù),結(jié)果如表1 所示。
表1 EMD 分解后各分量和原信號(hào)的Pearson 互相關(guān)系數(shù)
由表1 可見,各用戶電量EMD 分解后的高頻分量(HIMF)與原信號(hào)相關(guān)性最強(qiáng),都在0.77 以上;而中低頻分量的相關(guān)性在0.3 以下,即高頻信號(hào)占據(jù)了原始信號(hào)的主要成分,能體現(xiàn)原始信號(hào)的主要特性。因此,對(duì)高頻信號(hào)進(jìn)行分析即可有效揭示原信號(hào)的性質(zhì)和關(guān)聯(lián)性。為此,進(jìn)一步繪制了用戶的qKi和 線損電量qLi經(jīng)EMD 分解后的高頻分量對(duì)比結(jié)果,如圖3 所示。圖中SHIMF 為線損電量時(shí)間序列EMD 分解后的高頻分量。
圖3 各用戶和線損電量EMD 高頻分量對(duì)比
從圖3 可以看出,D 用戶用電量的時(shí)頻變化與線損的時(shí)頻變化具有高度一致性,說明該線路的線損產(chǎn)生與D 用戶密切相關(guān)。經(jīng)現(xiàn)場(chǎng)監(jiān)測(cè)排查,D 用戶存在異常用電行為。
為了進(jìn)一步驗(yàn)證所提算法的有效性,對(duì)另一高損公變臺(tái)區(qū)進(jìn)行了分析。該公變臺(tái)區(qū)有92 個(gè)用戶,臺(tái)區(qū)日線損率如圖4 所示,均處于15%~25%,顯然存在有異常用電行為的用戶。
圖4 某公變臺(tái)區(qū)日線損率
對(duì)于此類公變臺(tái)區(qū),由于用戶數(shù)量較多,且存在零電量用戶和低電量用戶,直接采用EMD 方法低效且意義不大,故采用互相關(guān)性和用戶用電量相結(jié)合的方法進(jìn)行初步篩查。
為此計(jì)算得到了各用戶日均用電量,如圖5所示,同時(shí)對(duì)用戶qKi線 損電量qLi的Pearson 互相關(guān)系數(shù)進(jìn)行了計(jì)算,結(jié)果
圖5 各用戶日均用電量
圖6 各用戶電量與損耗電量的Pearson 互相關(guān)系數(shù)
按照初步篩查方法對(duì)所有92 戶用戶進(jìn)行排序,篩選出編號(hào)為1、2、30、49、50 的用戶作為EMD 的對(duì)象。提取各用戶經(jīng)EMD 處理后的高頻分量,并進(jìn)行歸一化處理(各高頻分量序列除以該序列的最大值)。這是由于qLi和 用戶電量qKi之間存在數(shù)量級(jí)差別,歸一化能夠更清晰地展示其相對(duì)變化趨勢(shì),結(jié)果如圖7 所示。
如圖6 所示。
圖7 歸一化的各用戶高頻分量和線損高頻分量
從圖7 中可以看出,用戶30 的高頻分量在前30 d和線損高頻分量高度重合,后30 d 出現(xiàn)顯著差異;
用戶49 的高頻分量和線損高頻分量波形重合度相對(duì)較高,而其余3 個(gè)用戶的波形明顯差異較大。經(jīng)現(xiàn)場(chǎng)排查,用戶30 和49 確為異常用電用戶。
算例1 中用戶少、電量集中,數(shù)據(jù)為 h 平均用電量,算例2 中用戶多、電量分散,數(shù)據(jù)為日均用電量。對(duì)比圖3 和圖7 可以發(fā)現(xiàn),存在異常用電行為的用戶,其用電量qKi和 線損電量qLi經(jīng)EMD 處理后,高頻分量的變化趨勢(shì)在算例1 中幾乎完全一致,而在算例2 中局部存有偏差。為此,進(jìn)一步對(duì)2 個(gè)算例中的數(shù)據(jù)進(jìn)行了討論,計(jì)算了算例1 和算例2 中各用戶qKi和qLi原始序列的Pearson 互相關(guān)系數(shù)(rOL,K),經(jīng)EMD 分解得到的高頻分量時(shí)間序列的Pearson 互相關(guān)系數(shù)(rhL,K),結(jié)果分別示于表2 和表3。
表2 算例1 的Pearson 相關(guān)系數(shù)
表3 算例2 的Pearson 相關(guān)系數(shù)
從表2 和表3 中可以看出,算例1 中用戶D 的rOL,K和rhL,K均為最大;算例2 中用戶49 的rhL,K最 高,而用戶1 的rOL,K為最大,用戶49 次之。用戶49 和用戶1 的rOL,K都較大,說明這兩戶的電量時(shí)間序列和線損電量的變化密切關(guān)聯(lián)。我們知道,線損電量包含2 部分:一部分是技術(shù)損耗引起的,是固有的低頻變化部分;另一部分是管理損耗,是由異常用電引起的,其變化頻率與用戶用電量及用戶用電行為模式有關(guān),往往呈現(xiàn)出高頻變化,且隨著用電量的波動(dòng)呈一定比例波動(dòng)。用戶49 與線損的高頻分量波形高度重合且rhL,K最高,說明存在異常用電行的概率最大。用戶1 的rhL,K較小的原因應(yīng)是由其電量變化與技術(shù)損耗變化趨勢(shì)一致而引起的。
綜上分析,可見若直接通過用戶qKi和 線損電量qLi的相關(guān)性來檢測(cè)異常用電用戶,可能會(huì)形成誤判。而通過對(duì)用戶qKi和 線損電量qLi進(jìn)行EMD 處理,分析其高頻分量變化趨勢(shì)及互相關(guān)性,可有效檢測(cè)是否存在異常用電行為。同時(shí),對(duì)比算例1 和算例2,不難發(fā)現(xiàn),算例1 中數(shù)據(jù)顆粒度較細(xì)(h 間隔),其電量時(shí)間序列反映用戶用電行為和特征的信息更豐富,EMD 分解后得到的高頻分量在反映用戶用電行為方面更清晰直觀;而算例2 中,由于數(shù)據(jù)顆粒度較粗(d 間隔),導(dǎo)致很多隨晝夜變化的用電行為和特征信息丟失,EMD 分解后得到的高頻和次高頻分量的波形識(shí)別度較算例1 有所下降。因此,顆粒度更細(xì)的數(shù)據(jù)更有利于分析異常用電。
鑒于EMD 在數(shù)據(jù)處理中的優(yōu)越性,提出了一種基于EMD 的異常用電檢測(cè)方法,首先針對(duì)所分析對(duì)象的數(shù)據(jù)特點(diǎn)進(jìn)行初篩,采用EMD 方法對(duì)篩選用戶的用電量和線損電量時(shí)間序列進(jìn)行自適應(yīng)分解,提取其高頻分量,通過對(duì)比高頻分量變化趨勢(shì)和相關(guān)性分析,標(biāo)定異常用電用戶。通過2 個(gè)實(shí)際案例,驗(yàn)證了所提方法的有效性,得到了如下結(jié)論:
1)經(jīng)EMD 分解后的用戶用電量高頻分量與原信號(hào)相關(guān)性最強(qiáng),體現(xiàn)了原始信號(hào)的主要特性。
2)對(duì)于用戶數(shù)量多、用電量分散的公變臺(tái)區(qū)用戶,采用互相關(guān)性和用戶用電量相結(jié)合的方法進(jìn)行初篩,可有效提高排查效率。
3)存在異常用電行為的用戶,其用電量和線損電量的高頻分量變化趨勢(shì)一致性強(qiáng)且Pearson互相關(guān)系數(shù)高。
4)較細(xì)的原始數(shù)據(jù)的顆粒度有利于提高所提檢測(cè)方法的識(shí)別度。