王新娜, 郝寧, 鄭爽, 郭晨晨
(1.國網(wǎng)冀北電力有限公司技能培訓(xùn)中心,河北 保定 071000; 2. 國網(wǎng)冀北電力有限公司唐山供電公司,河北 唐山 063000)
基于水平遷移偵測的異常用電在線分析方法
王新娜1, 郝寧1, 鄭爽2, 郭晨晨2
(1.國網(wǎng)冀北電力有限公司技能培訓(xùn)中心,河北 保定 071000; 2. 國網(wǎng)冀北電力有限公司唐山供電公司,河北 唐山 063000)
針對電力用戶異常用電的偵查問題,研究了異常用電用戶平穩(wěn)化后日用電量時間序列的特點,提出了水平遷移的概念,根據(jù)異常用電用戶平穩(wěn)化后日用電量序列存在水平遷移的特點,進一步提出了運用累計和值方法判定平穩(wěn)化后日用電量序列是否存在水平遷移、進而判定其是否異常用電可疑的方法,最后將上述判定思想用于對居民日用電量時間序列的在線分析,提出了具體的算法流程,算例分析方法簡單、有效。
異常用電;累計和值法;水平遷移;在線分析;算例分析
異常用電廣義而言包括用戶有意識地通過非法手段減少抄表電量和電費(即竊電),也包括用戶突然改變用電規(guī)?;蛘哂秒娏?xí)慣而導(dǎo)致的用電量突增、功率因數(shù)突變等情況[1]。對上述異常用電情況的偵查、判斷、跟蹤、分析,對電力部門預(yù)測營銷收益、實施能耗監(jiān)測、規(guī)避電費損失具有重要意義。
目前國內(nèi)外基于數(shù)據(jù)挖掘的竊電偵查方法主要可歸結(jié)為基于聚類分析[2-3]和基于分類分析[4-9]兩大類方法。無論是聚類算法還是分類算法,其優(yōu)點都是準(zhǔn)確度高、節(jié)省人力資源、耗時短。缺點是需要大量準(zhǔn)確的歷史數(shù)據(jù)和當(dāng)前數(shù)據(jù),對計量裝置的穩(wěn)定性提出了很高的要求。另外,在上述兩類方法的應(yīng)用中,往往以用戶在過去一年中逐月的用電量數(shù)據(jù)作為樣本,根據(jù)月用電量波動曲線的異常性來判別用戶是否是竊電可疑用戶。這種做法并沒有充分利用智能電表的數(shù)據(jù)定時回傳特性。由于竊電往往具有時段性(夏季高發(fā)),基于整年逐月用電量的偵查方法不利于供電企業(yè)及時發(fā)現(xiàn)和制止竊電、及時規(guī)避電費的流失。如何提出實時性更高的在線稽查分析方法是一個值得探討的問題。
有利用數(shù)據(jù)挖掘的異常用電偵查方法主要基于多月用電量數(shù)據(jù),針對這些方法時效性低的缺點,本文提出面向用戶日用電量序列的異常用電在線分析方法。本文以居民竊電偵查為例,首先分析異常用電用戶日用電序列經(jīng)平穩(wěn)化處理后的特點,提出水平遷移的概念;其次針對一定時間跨度的平穩(wěn)化后的日用電量序列,提出判定水平遷移的累計和值方法;最后將累計和值方法應(yīng)用于異常用電的在線偵查情況,提出在線偵查流程。
在進行異常用電偵測之前,首先要確定的是異常用電偵測指標(biāo)。換言之,需要明確正常用電和異常用電的區(qū)別,正常用電和異常用電用戶負(fù)荷曲線的主要特征。
1.1 正常用電
對于正常用電的用戶,采用一定的平穩(wěn)化方法處理后的日用電量時間序列X呈平穩(wěn)時間序列的表象,如圖1所示。對竊電用戶歷史日用電量數(shù)據(jù)的分析表明,用戶竊電通常是持續(xù)性行為,日用電量短時間(通常為1、2天)水平下降往往并非由竊電引發(fā),而是可能源于用戶的偶然生活行為(如出差)或者計量儀器的故障。這些短時期的水平突升/突降,從時間序列來看,構(gòu)成一些離群點(outliers)[10]。這些離群點,并不影響其用電水平大致保持平穩(wěn)的特性。因此離群點并不作為異常用電偵測指標(biāo),例如圖1中的用戶屬于正常用戶。
圖1 某正常用戶平穩(wěn)化后的日用電量時間序列
1.2 異常用電
在時間序列的某一時刻T,系統(tǒng)發(fā)生了某種變化,使得T時刻之后所有的或者一段時間內(nèi)的數(shù)值均值發(fā)生了變化,稱為水平遷移[11]。從竊電行為定義推測,異常用電用戶表現(xiàn)為驟然出現(xiàn)持續(xù)一段時間的、明顯持續(xù)性地低于該用戶一般水平的負(fù)荷數(shù)據(jù),即用戶日用電量時間序列發(fā)生水平遷移。平穩(wěn)化處理后的時間序列中仍保留這種水平遷移特性,如圖2所示。這種水平遷移特性是由異常用電行為導(dǎo)致的干擾分量引起的。
圖2 某異常用戶平穩(wěn)化后的日用電量時間序列
此外,水平遷移分為向上水平遷移和向下水平遷移兩種。顯然,竊電行為的表現(xiàn)是日用電量曲線發(fā)生向下水平遷移。向上水平遷移雖然也可能暗示著某種異常用電事件,但暫不作為本文研究內(nèi)容。為此,在判定水平遷移后,若僅關(guān)心竊電問題,則還需要結(jié)合水平遷移是向上、向下來判斷是否竊電嫌疑。
根據(jù)現(xiàn)有竊電用戶日用電特征,可以總結(jié)為以下幾類:
圖3 單次下降型用戶的日用電量曲線
1)單次下降型:單次下降型的主要特征是日用電量水平突降后,較低值一直持續(xù)到時間跨度的結(jié)束點。日用電量水平突降可能下降為零,也可能下降為一個較低的值(如圖3所示)。
圖4 低谷型用戶日用電量曲線
2)低谷型下降:即日用電量水平的突降僅維持一段時間(幾天或幾周),然后日用電量水平又有突升。用電量突降前的用電水平可能是比較平穩(wěn)的,也可能是波動比較大的(如圖4所示),這與用戶的生活習(xí)慣有關(guān)。這一段時間的用電量突降也可能由非竊電因素引起(如出差、旅游等),但本文研究的是異常用電嫌疑用戶,故在人工目測時將此類情況也作為異常用電處理。對于該情況需結(jié)合外場檢查、當(dāng)場舉證后才能判定是否竊電,本文算例中暫作為竊電處理。
3)特殊型:主要特征是日用電量曲線整體持續(xù)低水平,但又偶爾出現(xiàn)單個或多個離群點,如圖5所示。
圖5 特殊型用戶日用電量曲線
本節(jié)將基于累計和值[12]的水平遷移判定方法應(yīng)用于固定時間跨度日用電量序列中異常用電的偵查,細(xì)化相應(yīng)的方法。為便于表述方法思想,舉例說明整個算法過程。所舉用戶在固定時間跨度(111天)下經(jīng)平穩(wěn)化后的日用電量序列如圖2所示??梢娫撚脩舻娜沼秒娏吭诖蠹s第20至第60個數(shù)據(jù)點間發(fā)生了明顯的水平遷移。
2.1 時間序列的累計和值定義
設(shè)已知日用電量數(shù)據(jù)的時間跨度中包含n個數(shù)據(jù)點,即對應(yīng)n天的日用電量數(shù)據(jù),記日用電量在平穩(wěn)化處理后所得的時間序列為X1,X2,X3…Xn。為偵查出水平遷移,累計和值法的判定步驟如下。
首先按下式計算出n個數(shù)據(jù)的平均值:
(1)
進而定義累計和值為各點數(shù)值與上述平均值差值的累積,即:
(2)
以圖2中的用戶為例,該用戶在n=111天中的平穩(wěn)化后日用電量時間序列數(shù)據(jù)如表1所示,易知111天中的均值為0.018 6,進而可以算得累計和值如式(3)所示。
表1 平穩(wěn)化后日用電量時間序列數(shù)據(jù)表
(3)
將這些值按時間順序繪制出來,得到累計和值圖,如圖6所示。需要注意的是,累計和值不是字面上的各點數(shù)值的累積,而是各點數(shù)值與數(shù)據(jù)平均值差值的累積。因為各點數(shù)值與數(shù)據(jù)平均值差值總和為0,所以累計和值總是以0為結(jié)束(Sn=0)。
圖6 示例用戶的日用電量時間序列的累計和值圖
2.2 水平遷移判斷判據(jù)
判斷水平遷移首先需要讀懂累計和值圖并挖掘其背后的信息。
假設(shè)在一段時間內(nèi)的所有數(shù)值都大于數(shù)據(jù)平均值,也即:
(4)
那么這段時間內(nèi)差值保持為正數(shù),累計和值持續(xù)上升,可以計算累積和值的斜率為:
(5)
累計和值圖中向上傾斜的部分線段意味著這段時間內(nèi)的數(shù)據(jù)點數(shù)值全都大于數(shù)據(jù)平均值。相應(yīng)的,累計和值圖中向下傾斜的部分線段意味著這段時間內(nèi)的數(shù)據(jù)點數(shù)值全都小于數(shù)據(jù)平均值。累計和值圖中相對平直的部分線段意味著這段時間內(nèi)的數(shù)據(jù)點沒有發(fā)生突變,而累計和值圖中的拐點意味著數(shù)據(jù)點出現(xiàn)了突然的水平變化。
以此方法來分析一下示例用戶日用電量時間序列的累計和值圖。圖2在20左右的時間點發(fā)生了方向上的變化。這意味著在這個時間點上,時間序列值相對于均值的大小關(guān)系發(fā)生了變化。在這個變化發(fā)生之前,累計和值線段呈向上傾斜狀,表明這段時間內(nèi)的數(shù)據(jù)點數(shù)值全部大于數(shù)據(jù)平均值;在這個變化發(fā)生之后,累計和值線段向下傾斜狀,表明這段時間內(nèi)的數(shù)據(jù)點數(shù)值全部小于數(shù)據(jù)平均值。同理,累計和值圖在60左右的時間點上也發(fā)生了方向上的變化。這意味著在20左右和60左右的時間點上都發(fā)生了水平遷移,進一步說,前者是水平向下遷移,后者是水平向上遷移。在80到120這個時間段內(nèi),累計和值線段相對平穩(wěn),表明這一時間段內(nèi)數(shù)據(jù)點數(shù)值相對平穩(wěn)。依據(jù)累計和值圖做上述分析,獲知該用戶日用電量時間序列至少發(fā)生了兩次水平遷移。
將固定窗口水平遷移偵測運用到在線異常用電分析,固定窗口水平遷移偵測的缺點是只能偵測到目前窗口中遷移幅度最大的水平遷移,解決的辦法是縮小窗口,并不斷移動窗口進行水平偵測。
設(shè)窗口大小為W,移動間距為I。初步的移動窗口水平遷移偵測算法流程如圖7所滇池。
首先導(dǎo)入經(jīng)過平穩(wěn)化處理后的用戶數(shù)據(jù),設(shè)定窗口的大小和移動間距后,開始以固定窗口大小循環(huán)對整個數(shù)據(jù)序列進行水平遷移偵測,直至整個數(shù)據(jù)序列全部偵測完,之后根據(jù)是否在各個窗口內(nèi)偵測到水平遷移,從而判斷該用電用戶是否有異常用電嫌疑。
圖7 在線異常用電分析初步算法流程
本文首先研究了異常用電用戶平穩(wěn)化后日用電量時間序列的特點,提出了水平遷移的概念。根據(jù)異常用電用戶平穩(wěn)化后日用電量序列存在水平遷移的特點,進一步提出了運用累計和值方法判定平穩(wěn)化后日用電量序列是否存在水平遷移、進而判定其是否異常用電可疑的方法。最后將上述判定思想推廣到移動窗口的情況,使判定過程適用于對居民日用電量時間序列的在線分析,提出了具體的算法流程。從示例用戶的偵測情況來看,本文提出的基于水平遷移偵測的異常用電在線分析方法可靠、有效。
[1] DEPURU S S S R, WANG L, DEVABHAKTUNI V. Electricity theft: Overview, issues, prevention and a smart meter based approach to control theft[J]. Energy Policy, 2011, 39(2): 1007-1015.
[2] WAGSTAFF K, CARDIE C, ROGERS S, et al. Constrained k-means clustering with background knowledge[C]// ICML. 2001, 1: 577-584.
[3] 竇全勝, 史忠植, 姜平, 等. 調(diào)和聚類-分類方法在電力負(fù)荷預(yù)測中的應(yīng)用[J]. 計算機學(xué)報, 2012, 35(12):2645-2651.
[4] 胡琛. 數(shù)據(jù)挖掘技術(shù)在電量管理與反竊電系統(tǒng)中的應(yīng)用與研究[D]. 武漢:武漢大學(xué), 2004.
[5] FOURIE J W, CALMEYER J E. A statistical method to minimize electrical energy losses in a local electricity distribution network[C]//AFRICON, 2004. 7th AFRICON Conference in Africa. IEEE, 2004, 2: 667-673.
[6] NIZAR A H, DONG Z Y, ZHAO J H, et al. A data mining based ntl analysis method[C]//Power Engineering Society General Meeting, IEEE, 2007: 1-8.
[7] SAFAVIAN S R, LANDGREBE D. A survey of decision tree classifier methodology[J]. IEEE transactions on systems, man, and cybernetics, 1991, 21(3): 660-674.
[8] BRUN A D M, PINTO J O P, PINTO A, et al. Fraud detection in electric energy using differential evolution[C]//Intelligent System Applications to Power Systems, 2009. ISAP'09. 15th International Conference on. IEEE, 2009: 1-5.
[9] NAGI J, YAP K S, TIONG S K, et al. Detection of abnormalities and electricity theft using genetic support vector machines[C]//TENCON 2008-2008 IEEE Region 10 Conference. IEEE, 2008: 1-6.
[10] ALARCON AQUINO V,BARRIA J A. Change detection in time series using the maximal overlap discrete wavelet transform[J]. Latin American applied research, 2009, 39(2): 145-152.
[11] MAS J F. Monitoring land-cover changes: a comparison of change detection techniques[J]. International Journal of Remote Sensing, 1999, 20(1): 139-152.
[12] ELLAWAY P H. Cumulative sum technique and its application to the analysis of peristimulus time histograms[J]. Electroencephalography and Clinical Neurophysiology, 1978, 45(2): 302-304.
Online Analysis of Abnormal Power Utilization Based on Detection of Horizontal Transfer
Wang Xinna1, Hao Ning1, Zheng Shuang2, Guo Chenchen2
(1.Skill Training Center,State Grid Jibei Electric Power Co., Ltd., Baoding Hebei 071000, China;2.Tangshan Power Supply Co. State Grid Jibei Electric Power Co., Ltd., Tangshan Hebei 063000, China)
With regards to the detection of abnormal power utilization of energy consumers, this paper studies the characteristics of the time sequence of daily electricity consumption of users of abnormal power utilization after stabilization, and presents the concept of horizontal transfer. According to the characteristics of the above mentioned horizontal transfer, it further proposes an approach for determining if abnormal power utilization exists: the cumulative sum method is used to judge if there exists horizontal transfer in the daily electricity consumption sequence after stabilization. Finally, the above criterion of judgment is applied to online analysis of the time sequence of residents’ daily electricity consumption, and a specific algorithm flow is presented. This approach is simple and effective as seen from the analysis of the example.
abnormal power utilization; cumulative sum method; horizontal transfer;online analysis;analysis of examples
10.3969/j.issn.1000-3886.2016.06.033
TM764.1
A
1000-3886(2016)06-0108-04
王新娜(1978-),女,河北保定人,講師,主要從事輸配電線路方面的研究。
定稿日期: 2016-07-04