劉 康,劉 鑫,張蓬鶴,薛 陽,李 彬,4,蘇 盛
(1. 智能電網(wǎng)運(yùn)行與控制湖南省重點(diǎn)實(shí)驗(yàn)室(長(zhǎng)沙理工大學(xué)),湖南省 長(zhǎng)沙市 410114;
2. 國(guó)網(wǎng)湖南省供電服務(wù)中心(計(jì)量中心),湖南省 長(zhǎng)沙市 410114;3. 中國(guó)電力科學(xué)研究院有限公司,北京市 100180;4. 湖南城市學(xué)院機(jī)械與電氣工程學(xué)院,湖南省 益陽市 413000)
電力用戶竊電是供電企業(yè)面臨的共性問題[1]。近年來,智能電表得到普及應(yīng)用,數(shù)據(jù)驅(qū)動(dòng)竊電檢測(cè)方法在其采集的海量數(shù)據(jù)基礎(chǔ)上發(fā)展迅猛[2]。由于現(xiàn)場(chǎng)稽查需要消耗大量人力和物力,降低誤報(bào)率是竊電檢測(cè)所要突破的關(guān)鍵瓶頸。供電企業(yè)基于長(zhǎng)期實(shí)踐經(jīng)驗(yàn)總結(jié)建設(shè)的同期線損管理系統(tǒng),極大地方便了高損臺(tái)區(qū)/線路的竊電檢測(cè)。以此為基礎(chǔ),學(xué)術(shù)界和工業(yè)界通過引入臺(tái)區(qū)/線路中異常用戶與線損關(guān)聯(lián)關(guān)系的增量信息[3-4],有力地推進(jìn)了面向高損線路/臺(tái)區(qū)的低誤報(bào)率竊電檢測(cè)技術(shù)應(yīng)用。需要指出的是,工程實(shí)際中在非高損線路中也存在竊電用戶,由于線損沒有明顯異常表現(xiàn),難以應(yīng)用前述方法。
目前竊電檢測(cè)研究可分為3 種類型:基于博弈論、基于系統(tǒng)狀態(tài)和基于知識(shí)與數(shù)據(jù)混合驅(qū)動(dòng)[5-7]?;诓┺恼摰臋z測(cè)方法難以確定參與者的效用函數(shù)及博弈策略[8]?;谙到y(tǒng)狀態(tài)估計(jì)的竊電檢測(cè)要求實(shí)時(shí)完整準(zhǔn)確地掌握網(wǎng)絡(luò)拓?fù)洹⒕€路參數(shù)以及線變戶表關(guān)系,且需要附加投資[9]。早期的數(shù)據(jù)驅(qū)動(dòng)竊電檢測(cè)方法多假設(shè)竊電用戶用電量會(huì)出現(xiàn)異常跌落,針對(duì)性設(shè)計(jì)特征指標(biāo)進(jìn)行異常檢測(cè)[10-11]。但根據(jù)日電量跌落來判斷異常,容易和某些正常用戶的用電行為混疊,造成較高的誤報(bào)率,難以滿足工程應(yīng)用要求[12-13]。以竊電用戶用電量跌落為前提將日電量作為輸入數(shù)據(jù),盡管能采用自編碼等方式自動(dòng)提取特征,但本身蘊(yùn)含的信息不足以可靠區(qū)分異常用戶和其他類型的正常用戶。文獻(xiàn)[14]分析了大量竊電用戶的負(fù)荷曲線,提出竊電用戶的負(fù)荷曲線形態(tài)可能具有相似性,并以此為出發(fā)點(diǎn)基于曲線形態(tài)的相似性來識(shí)別竊電用戶。本文通過比對(duì)實(shí)際竊電用戶與該文所列竊電用戶的負(fù)荷曲線,發(fā)現(xiàn)在曲線形態(tài)上表現(xiàn)為用電量尖峰特征。由于這些特征局限在局部點(diǎn)位,簡(jiǎn)單采用曲線形態(tài)的相似性可能難以準(zhǔn)確捕捉局部細(xì)節(jié)特征,但這些特征潛藏于單一用戶數(shù)據(jù)中而不依賴關(guān)聯(lián)線損數(shù)據(jù),可以為后續(xù)研究竊電檢測(cè)新機(jī)理提供的竊電檢測(cè)方法提供指引。
深度學(xué)習(xí)領(lǐng)域?qū)μ卣魈崛∫延猩钊胙芯浚?5],其中自編碼器(autoencoder,AE)因具備強(qiáng)大的特征提取能力被廣泛應(yīng)用于降維、表示學(xué)習(xí)和信息檢索中[16]。文獻(xiàn)[12-13]均利用AE 訓(xùn)練大量竊電樣本來提煉特征指標(biāo),再結(jié)合分類方法識(shí)別異常用戶,可取得較高的準(zhǔn)確率。然而實(shí)際中大量竊電樣本難以全面獲取,且自編碼未考慮用戶用電數(shù)據(jù)中的時(shí)序性,小時(shí)級(jí)局部特征由于存續(xù)時(shí)間短,難以可靠提取,容易造成誤報(bào)。
本文基于部分竊電用戶在小時(shí)級(jí)用電上存在異常特征這一先驗(yàn)知識(shí),從數(shù)據(jù)與知識(shí)混合驅(qū)動(dòng)思路出發(fā),提出基于負(fù)荷尖峰特征長(zhǎng)短期記憶(long short-term memory,LSTM)-AE 的用戶竊電識(shí)別方法。將具備時(shí)序記憶能力的LSTM 單元作為AE 的神經(jīng)元,在AE 的基礎(chǔ)上增強(qiáng)了模型對(duì)長(zhǎng)時(shí)間序列的處理能力,使其能捕捉用電序列之間的長(zhǎng)期依賴關(guān)系;根據(jù)用戶歷史負(fù)荷數(shù)據(jù)學(xué)習(xí)其潛在的用電規(guī)律,并自動(dòng)提取其特征的內(nèi)在聯(lián)系;隨后重構(gòu)輸入得到擬合值,采用擬合值與真實(shí)值的均方誤差設(shè)定自適應(yīng)預(yù)警閾值來識(shí)別異常尖峰時(shí)段。該方法考慮了用戶負(fù)荷的時(shí)序特性,無需大量竊電樣本訓(xùn)練模型,根據(jù)待檢用戶歷史負(fù)荷序列自適應(yīng)提取特征即可診斷異常。最后,通過仿真算例和專變用戶實(shí)際數(shù)據(jù)驗(yàn)證了所提方法的可行性和有效性。
在工程實(shí)踐中,用戶采集系統(tǒng)中竊電用戶的標(biāo)注存在著獲取難、數(shù)據(jù)集類別不平衡、樣本干擾等問題[14],給企業(yè)人員的分析排查工作帶來一定的困難。若能根據(jù)已知竊電用戶曲線形態(tài)進(jìn)行合理的特征提取,分析其特征產(chǎn)生背后隱藏的規(guī)律,有可能利用這一特點(diǎn)挖掘其中的特征項(xiàng)來識(shí)別異常。
將現(xiàn)場(chǎng)確認(rèn)典型竊電用戶的小時(shí)尺度用電曲線形態(tài)繪制在圖1 中,由圖中虛線部分可見其具有以下2 種形態(tài)表征:
1)如圖1(a)和(b)所示的日用電量驟降或持續(xù)跌落趨勢(shì),但此時(shí)容易與其他類型的電量下降混淆導(dǎo)致誤判。對(duì)此,文獻(xiàn)[17]提出了基于負(fù)荷特征的生產(chǎn)經(jīng)營(yíng)狀態(tài)識(shí)別方法,識(shí)別低電量驟降是用戶用電異常還是正常的低電量生產(chǎn)經(jīng)營(yíng)導(dǎo)致的電量驟降。
2)另一種是圖1(c)和(d)所示的小時(shí)電量尖峰異常, “用電量尖峰”的形態(tài)表征是持續(xù)竊電用戶在未竊電時(shí)間段的小時(shí)尺度電量尖峰[14]。用戶竊電時(shí),負(fù)荷尖峰被大幅壓縮,而在未竊電時(shí)會(huì)表現(xiàn)出明顯高于竊電時(shí)段的負(fù)荷尖峰,此“用電量尖峰”為該用戶實(shí)際最大負(fù)荷。
圖1 4 種典型竊電用戶Fig.1 Four typical users with electricity theft actions
正常專變用戶或大用戶因?yàn)樯a(chǎn)狀態(tài)的正常切換也會(huì)有類似的用電量尖峰,但因用戶大功率電器設(shè)備投用組合和用電行為模式固定[17],其用電量尖峰具有時(shí)序規(guī)律性。持續(xù)竊電用戶的用電量尖峰為小時(shí)尺度特性,基于日負(fù)荷形態(tài)的相似性檢測(cè)異常容易遮蔽局部特征的作用,因此本文以竊電用戶數(shù)據(jù)在小時(shí)尺度上隱含的差異為導(dǎo)向,利用LSTMAE 模型來識(shí)別用戶是否存在異常用電行為。
由于竊電行為一般通過繞過電表、篡改電表讀數(shù)或入侵電表來實(shí)現(xiàn),從而導(dǎo)致計(jì)量數(shù)據(jù)出現(xiàn)異常的用電曲線形態(tài)。對(duì)1.1 節(jié)數(shù)據(jù)集中用戶用電數(shù)據(jù)進(jìn)行分析。其包含200 個(gè)用戶180 d 內(nèi)的用電量數(shù)據(jù)。用戶日電量數(shù)據(jù)隨其負(fù)載波動(dòng),難以捕捉區(qū)分竊電用戶和正常用戶的關(guān)鍵特征,分時(shí)數(shù)據(jù)的數(shù)據(jù)采集頻率高,隱含用戶更多用電信息[10]。取典型竊電專變用戶及正常專變用戶以小時(shí)為單位繪制日用電量數(shù)據(jù),如圖2 所示。
圖2 典型竊電用戶和正常用戶的日負(fù)荷曲線Fig.2 Daily load curves of typical users with electricity theft actions and normal users
由圖2(a)可知,正常專變用戶的負(fù)荷曲線具有周期性,在每天的09:00 和14:00 達(dá)到高峰,在夜間23:00 至第2 天的07:00 進(jìn)入低谷。實(shí)際上,對(duì)整個(gè)數(shù)據(jù)集分析也有類似的結(jié)果,本文僅展示整個(gè)數(shù)據(jù)集中的一個(gè)用戶數(shù)據(jù)。分析6 個(gè)月的小時(shí)用電數(shù)據(jù)可以發(fā)現(xiàn),大多數(shù)正常專變用戶的用電規(guī)律均存在一定的時(shí)序周期性,且1.1 節(jié)指出的“用電量尖峰”特征存在隱含的周期規(guī)律。相比之下,圖2(b)所示典型專變竊電用戶有5 d(即第1、2、3、5、7 天)的小時(shí)電量呈周期性波動(dòng)。白天10:00—17:00 處于負(fù)荷高峰,其余時(shí)間負(fù)荷平穩(wěn)運(yùn)行。但第4 天和第7 天的小時(shí)電量不符合其周期,第6 天的小時(shí)電量一直處于高負(fù)荷狀態(tài),且明顯高于其他天周期性用電的負(fù)荷高峰。
為更深入分析正常專變用戶的周期性與竊電專變用戶的非周期性,對(duì)小時(shí)用電數(shù)據(jù)作相關(guān)性分析,如圖3 所示,其中分別展示了正常專變用戶和竊電專變用戶按日的小時(shí)電量皮爾遜相關(guān)系數(shù)(Pearson correlation coefficient,PCC)。
圖3 正常及竊電專變用戶的PCC 圖Fig.3 PCC diagrams of normal users and specialtransformer users with electricity theft actions
由圖3(a)可見,正常專變用戶的小時(shí)用電數(shù)據(jù)具有很強(qiáng)的相關(guān)性,即PCC 值絕大多數(shù)大于0.86(PCC 值越接近1,說明相關(guān)性越強(qiáng)[18])。但圖3(b)竊電專變用戶所示異常的第4、6 天的小時(shí)數(shù)據(jù)與其他天之間的相關(guān)性較低(即PCC 值小于0.7),第1、2、3、5、7 天的小時(shí)數(shù)據(jù)之間相關(guān)性較強(qiáng)。
通過對(duì)正常及竊電專變用戶小時(shí)用電數(shù)據(jù)的統(tǒng)計(jì)分析,發(fā)現(xiàn)竊電用戶小時(shí)用電數(shù)據(jù)與正常用戶相比,異常時(shí)段通常不具有時(shí)序周期性。同時(shí)文獻(xiàn)[10]中對(duì)用電數(shù)據(jù)的分析工作也證實(shí)了該統(tǒng)計(jì)結(jié)果。但僅根據(jù)統(tǒng)計(jì)分析進(jìn)行判斷容易誤報(bào)。當(dāng)專變用戶竊電時(shí),其在未竊電時(shí)段的用電量尖峰相較其他時(shí)段的用戶量尖峰不具備時(shí)序周期性。因此,本文利用LSTM-AE 模型捕捉用戶歷史用電數(shù)據(jù)點(diǎn)之間的長(zhǎng)期依賴關(guān)系,學(xué)習(xí)其負(fù)荷曲線中潛在的用電規(guī)律并自動(dòng)提取特征的內(nèi)在聯(lián)系,從而達(dá)到區(qū)分異常和正常用戶的目的。
為解決循環(huán)神經(jīng)網(wǎng)絡(luò)的長(zhǎng)期依賴問題,Hochreiter 等人提出了LSTM 網(wǎng)絡(luò),以挖掘時(shí)間序列中的隱含規(guī)律[19]。其循環(huán)單元結(jié)構(gòu)示意圖如圖4所示,LSTM 主要改進(jìn)在以下兩個(gè)方面[20-21]。
圖4 LSTM 網(wǎng)絡(luò)循環(huán)單元結(jié)構(gòu)示意圖Fig.4 Schematic diagram of loop unit structure of LSTM network
1)引入門控機(jī)制來調(diào)控信息傳遞路徑,從而實(shí)現(xiàn)記憶信息的選擇性傳遞。遺忘門(記作ft)控制上一時(shí)刻的內(nèi)部狀態(tài)ct?1來選擇性丟棄記憶單元中的信息,其計(jì)算公式如下:
式 中:Wf和bf分 別 為 遺 忘 門 權(quán) 重 和 偏 置;σ(?)表 示sigmiod 激活函數(shù);[ht?1,xt]表示行數(shù)相等的矩陣或向量進(jìn)行列合并。
輸入門(記作it)控制當(dāng)前時(shí)刻的候選狀態(tài)c?t來更新記憶單元中的信息,其計(jì)算公式如下:
式中:Wi和bi分別為輸入門的權(quán)重和偏置;Wc和bc分別為更新值的權(quán)重和偏置;tanh(?)表示雙曲正切激活函數(shù)。
結(jié)合ft、it、上一個(gè)記憶單元狀態(tài)ct?1和候選狀態(tài)來共同決定和更新記憶單元ct,其更新公式如下:
式中:“*”表示點(diǎn)乘。
輸出門(記作ot)通過sigmoid 層來控制當(dāng)前時(shí)刻的內(nèi)部狀態(tài)ct中將哪些信息輸出給外部狀態(tài)ht,其計(jì)算公式如下:
式中:Wo和bo分別為輸出門的權(quán)重和偏置。
2)引入了新的內(nèi)部狀態(tài)專門進(jìn)行線性的循環(huán)信息傳遞[22],同時(shí)(非線性地)輸出信息給隱藏層的外部狀態(tài)。其內(nèi)部狀態(tài)ct通過以下公式計(jì)算:
式中:⊙為向量元素乘積;ct?1為上一時(shí)刻的記憶單元。
在每個(gè)時(shí)刻t,LSTM 網(wǎng)絡(luò)的內(nèi)部狀態(tài)ct記錄了到當(dāng)前時(shí)刻為止的輸入用戶小時(shí)用電數(shù)據(jù)的歷史信息。因此,通過LSTM 循環(huán)單元,LSTM-AE 模型可以學(xué)習(xí)到用戶分時(shí)數(shù)據(jù)中隱含的用電周期規(guī)律[23]。
將具備時(shí)序記憶能力的LSTM 單元作為AE 的神經(jīng)元,其AE 是采用無監(jiān)督的學(xué)習(xí)方式,在異常檢測(cè)、數(shù)據(jù)去噪、電網(wǎng)設(shè)備故障診斷等領(lǐng)域應(yīng)用廣泛[24],其結(jié)構(gòu)如圖5 所示。假設(shè)采集的用戶k分時(shí)用電數(shù)據(jù)為Xk=[x1,x2,…,xn],xi∈RD,其中D表示輸入維度,n為樣本長(zhǎng)度。AE 將輸入數(shù)據(jù)X映射到特征空間,從而得到每個(gè)樣本的編碼Z=[z1,z2,…,zn],zi∈ZM,其中,M表示特征空間中樣本的維數(shù)。zi的表達(dá)式如式(9)所示。然后,再將Z映射到輸出層得到重構(gòu)的用戶分時(shí)數(shù)據(jù)為X?k=[x?1,x?2,…,x?n],x?i∈RD。x?i表達(dá)式如式(10)所示。
圖5 AE 的結(jié)構(gòu)Fig.5 Structure of AE
式中:w(1)、w(2)、b(1)和b(2)為網(wǎng)絡(luò)參數(shù)(權(quán)重和偏執(zhí));f(·)為 激 活 函 數(shù),如sigmoid、swish、rectified linear unit 等;運(yùn)算符“·”表示向量?jī)?nèi)積。
AE 的訓(xùn)練目標(biāo)是盡可能在重構(gòu)輸入時(shí)使重構(gòu)錯(cuò)誤最小化[25]。定義其重構(gòu)誤差L如式(11)所示。
式中:λ為正則化項(xiàng)系數(shù);W為AE 模型的參數(shù),用于防止模型過擬合;N為樣本總數(shù)。
當(dāng)單個(gè)待檢專變用戶分時(shí)數(shù)據(jù)經(jīng)LSTM-AE 模型訓(xùn)練的重構(gòu)誤差L趨于穩(wěn)定后,根據(jù)得到的擬合值X?k與用戶輸入數(shù)據(jù)Xk實(shí)際值計(jì)算均方誤差(mean squared error,MSE)[26],計(jì)算公式如下:
式 中:yi和y?i分 別 為 實(shí) 際 值 向 量 和 擬 合 值 向 量;ξ表示MSE。
專變用戶雖然用電行為模式具有固定模式,但其負(fù)載波動(dòng)是一個(gè)動(dòng)態(tài)的非平穩(wěn)過程,分時(shí)用電數(shù)據(jù)的MSE 也處于動(dòng)態(tài)變化中。為了有效辨別正常及竊電專變用戶的MSE,需要設(shè)定能隨不同用戶不同經(jīng)營(yíng)狀態(tài)[17]下隨MSE 自適應(yīng)變化的閾值。
考慮到專變用戶分時(shí)用電數(shù)據(jù)的非平穩(wěn)性,MSE 含有異常值且具有一定波動(dòng)性,本文自適應(yīng)閾值設(shè)定方法如式(14)所示,與傳統(tǒng)方法不同之處在于其不僅是基于標(biāo)準(zhǔn)差計(jì)算得到,還考慮了MSE 含有的異常值因素。因?qū)W冇脩舴謺r(shí)用電數(shù)據(jù)具有周期性,故MSE 在區(qū)間內(nèi)窄幅波動(dòng),對(duì)應(yīng)的標(biāo)準(zhǔn)差σ也較小。因此,如果單純基于3σ原則設(shè)置閾值,閾值會(huì)非常接近均值,容易導(dǎo)致較高的誤報(bào)率。
式中:ε為MSE 的平均變化率;ym為第m個(gè)MSE;n為 樣 本 長(zhǎng) 度;ξˉ為MSE 的 均 值;η表 示 預(yù) 警 閾 值;k取3。
專變用戶竊電后,1.1 節(jié)統(tǒng)計(jì)特征異常用電量尖峰時(shí)段會(huì)破壞MSE 的分布特性,使對(duì)應(yīng)時(shí)段MSE值超過預(yù)警閾值,可判斷該用戶存在竊電嫌疑,并提供其異常時(shí)段信息便于現(xiàn)場(chǎng)稽查。結(jié)合式(14)得到用戶異常判定準(zhǔn)則為:
以仿真算例專變用戶用電數(shù)據(jù)為例,識(shí)別單個(gè)待檢用戶是否竊電的整體流程示意如圖6 所示,具體說明如下。
圖6 整體檢驗(yàn)流程圖Fig.6 Flow chart of overall inspection
1)用電量數(shù)據(jù)經(jīng)常包含由智能電表故障、測(cè)量數(shù)據(jù)傳輸不可靠、系統(tǒng)不定時(shí)維護(hù)和存儲(chǔ)問題造成的數(shù)據(jù)缺失或異常問題[27]。在本文中利用式(16)插值方法恢復(fù)缺失值:
式中:xi表示某小時(shí)的用電量值;NaN表示空值。
考慮到LSTM-AE 模型對(duì)不同數(shù)據(jù)的敏感性,需要對(duì)用電量數(shù)據(jù)進(jìn)行歸一化處理。本文采用max-min 縮放方法對(duì)數(shù)據(jù)進(jìn)行歸一化,如式(17)所示。
式中:max {Xk}為Xk中的最大值;min {Xk}為Xk中的最小值。
2)將數(shù)據(jù)預(yù)處理后的歷史用電數(shù)據(jù)輸入LSTM-AE 模型,利用LSTM 學(xué)習(xí)用戶負(fù)荷曲線潛在的用電規(guī)律,自動(dòng)提取用電量尖峰特征;隨后在特征層重構(gòu)輸入,當(dāng)重構(gòu)誤差趨于穩(wěn)定時(shí)結(jié)束訓(xùn)練,得到擬合值。
3)計(jì)算擬合值與原序列的MSE,分析得到自適應(yīng)預(yù)警閾值。最后,將待檢用戶MSE 超出預(yù)警閾值的用戶識(shí)別為竊電嫌疑用戶,并提供其異常尖峰時(shí)段信息。
本文采用仿真數(shù)據(jù)模擬用戶竊電來驗(yàn)證所提方法的可行性,然后再采用實(shí)際數(shù)據(jù)證明所提方法的可靠性。所用LSTM-AE 模型各組成部分如附錄A圖A1,其配置如表1 所示。
表1 LSTM-AE 模型配置Table 1 Configuration of LSTM-AE model
為驗(yàn)證所提方法可行性,采用4 個(gè)行業(yè)30 個(gè)專變用戶的用電量數(shù)據(jù)為基礎(chǔ)進(jìn)行分析。從中隨機(jī)抽取9 個(gè)用戶,根據(jù)文獻(xiàn)[27]所述方法模擬分時(shí)段竊電。與剩余21 個(gè)正常用戶一同采用本文所提方法進(jìn)行竊電檢測(cè)。選取其中一個(gè)竊電用戶(定義為V1)和一個(gè)正常用戶(定義為V2)為例說明竊電檢測(cè)流程,其中用戶V1在整段中分別設(shè)置時(shí)長(zhǎng)0.75、1.5、3 d 未竊電,呈現(xiàn)篩選用電異常的流程和效果。
采集用戶V1120 d 的逐小時(shí)用電數(shù)據(jù)。經(jīng)數(shù)據(jù)預(yù)處理后采用T=24 d 的滑窗方式(即分別取時(shí)間序列長(zhǎng)度第1~24 h,第2~25 h,第3~26 h,…,第i~i+23 h 的時(shí)間窗形式,如圖7 所示)切片成含小時(shí)時(shí)序特征的時(shí)間序列X1,X2,…,Xn?23作為模型的輸入向量。
圖7 滑窗示意圖Fig.7 Sliding window diagram
將輸入向量輸入LSTM-AE 模型,當(dāng)模型重構(gòu)誤差最小化后結(jié)束訓(xùn)練輸出擬合值X?1,X?2,…,X?n?23,隨 后 根 據(jù) 擬 合 值 與 輸 入 向 量 計(jì) 算MSE 以及η。用戶V2同樣采用此檢測(cè)流程,得到用戶V1和V2的MSE 概率密度圖分布如附錄A 圖A2所示,將用戶小時(shí)用電量曲線與對(duì)應(yīng)MSE 和閾值可視化,如圖8 所示。由圖8 和圖A2 分析可得出以下結(jié)論。
圖8 竊電與正常用戶LSTM-AE 仿真結(jié)果對(duì)比圖Fig.8 Comparison of LSTM-AE simulation results between users with electricity theft actions and normal users
1)用戶V1和用戶V2因具有固定的生產(chǎn)經(jīng)營(yíng)模式,外在表現(xiàn)在小時(shí)用電量曲線形態(tài)上均存在周期性規(guī)律;正常用戶和竊電用戶的MSE 在概率密度分布上存在差異。
2)用戶V1分時(shí)竊電,整段時(shí)長(zhǎng)中出現(xiàn)竊電時(shí)段和未竊電時(shí)段2 種狀態(tài)(其中因竊電特性,一般而言竊電時(shí)段占比較高),對(duì)應(yīng)在曲線形態(tài)上的外在表征為具有周期性出現(xiàn)的用電量尖峰(非藍(lán)色框內(nèi),簡(jiǎn)記時(shí)段1)和相對(duì)顯著且極少出現(xiàn)的用電量尖峰(藍(lán)色框內(nèi),簡(jiǎn)記時(shí)段2)。LSTM-AE 模型學(xué)習(xí)了該用戶潛在的周期性用電規(guī)律,時(shí)段2 的擬合值符合時(shí)段1 的用電規(guī)律,從而其MSE 較大(相較整段的MSE而言可視為異常),超出預(yù)警閾值(按式(15)計(jì)算得η=0.009 8),故將用戶V1識(shí)別為竊電嫌疑用戶,在124~196 h、724~742 h、1 257~1 293 h 為 異 常 時(shí)段,其尖峰電量為其實(shí)際負(fù)載高峰電量,模型檢測(cè)結(jié)果與預(yù)設(shè)一致。
3)用 戶 V2的 MSE 均 小 于 預(yù) 警 閾 值(η=0.010 4),判定為正常用戶,與預(yù)設(shè)一致。從曲線形態(tài)上不難發(fā)現(xiàn)其正常用電量尖峰盡管在整個(gè)時(shí)段小幅度波動(dòng),但周期性地重復(fù)出現(xiàn),實(shí)際上是由于用戶設(shè)備正常投入生產(chǎn)導(dǎo)致的負(fù)荷規(guī)律性起伏變化。而LSTM-AE 模型由于引入了LSTM,考慮了用戶小時(shí)用電數(shù)據(jù)的時(shí)序特征,故能夠最大可能地記憶其生產(chǎn)經(jīng)營(yíng)狀態(tài)對(duì)應(yīng)的用電曲線趨勢(shì)。
為進(jìn)一步驗(yàn)證所提方法的有效性,采用經(jīng)現(xiàn)場(chǎng)稽查確認(rèn)竊電用戶的實(shí)際數(shù)據(jù)進(jìn)行驗(yàn)證。采集結(jié)構(gòu)行 業(yè) 竊 電 用 戶H1從2019 年6 月26 日 至2019 年10 月17 日以及正常用戶H2從2019 年2 月19 日至2019 年7 月15 日的小時(shí)電量。經(jīng)數(shù)據(jù)預(yù)處理后同樣采用T=24 d 滑窗方式得到輸入向量后依次輸入單獨(dú)的LSTM-AE 模型,得到的結(jié)果可視化如附錄A 圖A3 和圖A4 所示,進(jìn)一步分析如下:
1)用 戶H1在1~343 h 的MSE 超 過 預(yù) 警 閾 值(η=0.022 3),判定該用戶為竊電嫌疑用戶。現(xiàn)場(chǎng)稽查查證該用戶私下將某大功率設(shè)備繞表竊電,導(dǎo)致圖中非藍(lán)色框時(shí)段尖峰電量比藍(lán)色框時(shí)段低。藍(lán)色虛線內(nèi)MSE 較接近閾值,分析發(fā)現(xiàn)是由于其尖峰與藍(lán)色框非竊電時(shí)段尖峰相似導(dǎo)致。
2)用戶H2未超過預(yù)警閾值(η=0.015 7),判定為正常用戶,與實(shí)際結(jié)果一致。其在藍(lán)色虛線時(shí)段(1 182~1 206 h)的MSE 較大,接近預(yù)警閾值,從曲線形態(tài)上看不難發(fā)現(xiàn)是由于該時(shí)段用戶處于停產(chǎn)的生產(chǎn)經(jīng)營(yíng)狀態(tài)所導(dǎo)致。
3)結(jié)合3.1 節(jié)仿真算例分析,若基于3σ原則設(shè)定閾值會(huì)導(dǎo)致圖8 中用戶V2誤判。而自適應(yīng)閾值考慮了用戶分時(shí)數(shù)據(jù)的非平穩(wěn)波動(dòng)導(dǎo)致的MSE 波動(dòng),相較于傳統(tǒng)方法,其能夠有效判別異常用戶,降低誤報(bào)率。
異常檢測(cè)往往采用混淆矩陣及其衍生指標(biāo)來評(píng)價(jià)檢測(cè)效果。為綜合評(píng)價(jià)所提檢測(cè)模型和其他方法在本文場(chǎng)景下的性能,選用了分類方法中常用的評(píng)價(jià)指標(biāo):準(zhǔn)確率αACC、命中率αTPR、誤檢率αFPR和測(cè)度。計(jì)算公式分別如下:
式中:TP為異常用戶被檢測(cè)為異常用戶的用戶數(shù)量;FP為正常用戶被檢測(cè)為異常用戶的用戶數(shù)量;FN為異常用戶被檢測(cè)為正常用戶的用戶數(shù)量;TN為正常用戶被檢測(cè)為正常用戶的用戶數(shù)量。
文獻(xiàn)[14]認(rèn)為竊電用戶負(fù)荷曲線形態(tài)中隱含有竊電異常信息,并根據(jù)相似性來識(shí)別竊電嫌疑用戶。本文在其基礎(chǔ)上采用LSTM-AE 方法識(shí)別負(fù)荷曲線地局部特征,并將本文方法與基于AE 的方法及文獻(xiàn)[14]所提方法對(duì)3.1 節(jié)仿真算例數(shù)據(jù)進(jìn)行測(cè)試計(jì)算,得到4 種檢測(cè)評(píng)價(jià)指標(biāo)結(jié)果見表2。
表2 不同方法的評(píng)價(jià)結(jié)果Table 2 Evaluation results of different methods
表2 結(jié)果表明:
1)基于相似性檢索的異常檢測(cè)方法根據(jù)整個(gè)時(shí)段上的負(fù)荷曲線相似性識(shí)別異常,難以利用正常及竊電用戶在部分時(shí)間點(diǎn)位的細(xì)節(jié)特征識(shí)別異常,在準(zhǔn)確率、命中率和誤報(bào)率上效果不彰,容易誤判。
2)AE 方法能夠提煉利用正常和異常用戶在小時(shí)尺度上的用電細(xì)節(jié)特征,和本文所提方法在準(zhǔn)確度和命中率上相差不大。但由于未能有效提取短時(shí)局部特征,誤報(bào)率仍可達(dá)19.05%。
3)本文方法將AE 提煉的細(xì)節(jié)特征和LSTM 具有的時(shí)序記憶功能結(jié)合,在不借助關(guān)聯(lián)性線損增量信息條件下,僅利用用戶個(gè)體信息檢測(cè)專變用戶竊電即可達(dá)到優(yōu)異的檢測(cè)性能。各項(xiàng)指標(biāo)均優(yōu)于對(duì)比方法,而對(duì)現(xiàn)場(chǎng)應(yīng)用影響最突出的誤報(bào)率上表現(xiàn)尤佳。
綜上,本文所提方法在仿真設(shè)置場(chǎng)景下具有更好的適用性。
針對(duì)非高損線路中竊電用戶不伴隨有線路高損、難以借助關(guān)聯(lián)線損增量信息降低竊電檢測(cè)誤報(bào)率的問題,提出了基于負(fù)荷尖峰特征LSTM-AE 的用戶竊電識(shí)別方法。
1)在既有文獻(xiàn)指引下,分析發(fā)現(xiàn)相當(dāng)比例竊電用戶的用電曲線形態(tài)中均存在與正常用戶有別的用電量尖峰特征。
2)針對(duì)專變用戶具有固定生產(chǎn)模式的特點(diǎn),分析了其分時(shí)用電數(shù)據(jù)的周期性及時(shí)序相關(guān)性,提出了基于LSTM-AE 的用戶竊電識(shí)別方法。
3)基于實(shí)際數(shù)據(jù)構(gòu)造的仿真算例進(jìn)行了測(cè)試計(jì)算,測(cè)試結(jié)果驗(yàn)證了所提方法的有效性。
4)與對(duì)比方法相比,本文所提方法綜合利用LSTM 功能和AE 的特征自動(dòng)提取功能,提煉小時(shí)尺度用電異常特征,能可靠有效識(shí)別異常用戶。
需要指出的是,本文所提方法的局限性在于僅利用了用戶用電量數(shù)據(jù),對(duì)長(zhǎng)期等比例竊電用戶可能存在誤判。從工程應(yīng)用需求出發(fā),未來還需探索利用多源信息降低誤檢率。
附錄見本刊網(wǎng)絡(luò)版(http://www.aeps-info.com/aeps/ch/index.aspx),掃英文摘要后二維碼可以閱讀網(wǎng)絡(luò)全文。