竇健,劉宣,盧繼哲,吳迪,王學(xué)偉
(1. 中國電力科學(xué)研究院,北京 100085; 2. 北京化工大學(xué) 信息科學(xué)與技術(shù)學(xué)院,北京 100029)
電力工業(yè)是國民經(jīng)濟的基礎(chǔ)性產(chǎn)業(yè),保證電網(wǎng)企業(yè)及時收回電費是確保電力發(fā)展的必要條件。但是由于各種原因,目前竊電現(xiàn)象還普遍存在,部分地區(qū)甚至還很猖獗,給供電企業(yè)也造成巨大損失[1-2]。據(jù)不完全統(tǒng)計,我國每年竊電損失達(dá)200億元[3]。
常見的竊電方法可分為與計量裝置有關(guān)的竊電和與計量裝置無關(guān)的竊電兩大類。其中與計量裝置有關(guān)的竊電主要包括欠壓竊電法、欠流竊電法、移相竊電法、擴差竊電法等[4];而與計量裝置無關(guān)的竊電包括繞越計量裝置竊電、私自增加用電設(shè)備容量竊電等[5]。近年來,大數(shù)據(jù)技術(shù)在各個行業(yè)逐漸得到廣泛的應(yīng)用,大數(shù)據(jù)是指無法在可容忍的時間內(nèi)用傳統(tǒng)的IT技術(shù)、軟硬件工具和數(shù)學(xué)分析方法,對其進(jìn)行感知、獲取、管理、處理和分析的數(shù)據(jù)集合[6-7]。智能電網(wǎng)被看作是大數(shù)據(jù)應(yīng)用的重要技術(shù)領(lǐng)域之一,用電信息采集系統(tǒng)是國家電網(wǎng)公司信息化建設(shè)的重要基礎(chǔ),是提升服務(wù)能力、延伸電力市場、創(chuàng)新交易平臺的重要依托[8]。目前國家電網(wǎng)公司的用電信息采集已經(jīng)基本實現(xiàn)“全采集、全覆蓋”,能夠及時、完整、準(zhǔn)確掌控廣大電力用戶的用電數(shù)據(jù)和信息[9]。然而,如何應(yīng)用用電信息采集系統(tǒng)多年來運行采集與沉淀的大量數(shù)據(jù),研究防竊電的策略、分析數(shù)據(jù)處理方法、構(gòu)建防竊電模型等,是該領(lǐng)域面臨的具有挑戰(zhàn)性的問題。
根據(jù)用電信息采集系統(tǒng)的數(shù)據(jù),建立各種數(shù)據(jù)與各類異常事件與竊電行為之間的關(guān)聯(lián)關(guān)系,據(jù)此,建立基于大數(shù)據(jù)的防竊電結(jié)構(gòu)化模型,進(jìn)而解決大數(shù)據(jù)條件下的竊電行為監(jiān)控問題。
針對形式多種多樣的竊電手法,通過用電信息采集系統(tǒng)采集的數(shù)據(jù),實時監(jiān)測用戶的用電狀態(tài)參量。隨著大數(shù)據(jù)技術(shù)的發(fā)展,選取電壓、電流、功率、電量等作為竊電判據(jù)中的電氣參考量,通過當(dāng)前數(shù)據(jù)與歷史數(shù)據(jù)相結(jié)合分析用電行為,發(fā)現(xiàn)竊電可疑用戶,實現(xiàn)利用大數(shù)據(jù)技術(shù)進(jìn)行反竊電。采用大數(shù)據(jù)技術(shù)辨識竊電方法的關(guān)鍵是分析不同竊電方法的竊電特征,進(jìn)而給出監(jiān)測的相關(guān)特征電氣參量。
根據(jù)功率測量與電能計量的基本原理,用戶負(fù)荷功率、電流、電壓、以及電流和電壓間的相位關(guān)系這三個參量相關(guān),用戶負(fù)荷消耗電能與負(fù)荷運行功率和時間相關(guān),通過用電信息采集系統(tǒng)監(jiān)測電流、電壓、功率因數(shù)、電量、線損等電氣特征參量和各種事件的狀態(tài)特征參量,建立該特征參量與用戶用電行為的關(guān)聯(lián)關(guān)系,表1為建立大數(shù)據(jù)防竊電的結(jié)構(gòu)化模型奠定基礎(chǔ)。
表1 常見竊電方法與主要特征參量
盡管竊電手法多種多樣,然而這些竊電行為都會在竊電用戶用電量統(tǒng)計數(shù)據(jù)上反映出來,特定時期內(nèi)用戶用電統(tǒng)計數(shù)據(jù)與用戶的用電習(xí)慣與特征相關(guān)聯(lián),通過對海量的用電統(tǒng)計數(shù)據(jù)分析,提取出對決策者決策有價值的信息,可發(fā)現(xiàn)其背后隱藏的客觀規(guī)律,進(jìn)而實現(xiàn)防竊電目的。基于用電信息采集系統(tǒng)大數(shù)據(jù)的防竊電方法如圖1所示。該方法分為四部分:(1)用電信息采集系統(tǒng)的數(shù)據(jù)采集;(2)分布式數(shù)據(jù)存儲;(3)結(jié)構(gòu)化的防竊電模型;(4)竊電嫌疑預(yù)測。以下將分別進(jìn)行分析。
圖1 基于用電信息采集大數(shù)據(jù)的防竊電方法
用電信息采集系統(tǒng)表示為三層簡化物理結(jié)構(gòu)[10],如圖2所示。頂層系統(tǒng)主站負(fù)責(zé)整個系統(tǒng)的用電信息采集、數(shù)據(jù)管理與應(yīng)用,以及與其他系統(tǒng)的數(shù)據(jù)交換等功能,是用電信息采集系統(tǒng)的核心計算機網(wǎng)絡(luò)系統(tǒng);第二層是數(shù)據(jù)采集層,其主體為電能信息采集終端與集中器,主要負(fù)責(zé)對各采集點電參量信息的采集和監(jiān)控;第三層是采集點監(jiān)控設(shè)備層,包括智能電能表等,是電參量信息采集源和監(jiān)控對象。通過用電信息采集系統(tǒng)可以實現(xiàn)對電力用戶的“全采集、全覆蓋”,及時、完整、準(zhǔn)確掌控電力用戶的當(dāng)前數(shù)據(jù)和歷史數(shù)據(jù)等用電信息,為分析竊電行為提供穩(wěn)固的數(shù)據(jù)基礎(chǔ)。
用電信息采集系統(tǒng)的主站,根據(jù)監(jiān)測用戶的電參量數(shù)據(jù)和用電異常監(jiān)測模型,對相同的計量點通過不同方式采集的電參量數(shù)據(jù)進(jìn)行比對,或者對同一計量點的實時數(shù)據(jù)與歷史電參量數(shù)據(jù)進(jìn)行比對,依據(jù)對比曲線數(shù)值差距和趨勢差異,判斷用戶用電是否正常,如果發(fā)現(xiàn)異常,啟動異常處理流程,對此用戶其他的參數(shù)進(jìn)行持續(xù)監(jiān)測,并根據(jù)竊電嫌疑預(yù)測模型,將監(jiān)測的數(shù)據(jù)進(jìn)行綜合分析判斷給出“竊電概率系數(shù)”。
圖2 用電信息采集系統(tǒng)三層結(jié)構(gòu)
用電信息采集系統(tǒng)監(jiān)測的數(shù)據(jù)按照時間屬性可分為l類數(shù)據(jù)(實時和當(dāng)前數(shù)據(jù))、2類數(shù)據(jù)(歷史日數(shù)據(jù)和歷史月數(shù)據(jù))和3類數(shù)據(jù)(事件數(shù)據(jù))[11]。按照數(shù)據(jù)的物理屬性可分為:(1)電能數(shù)據(jù) (總電能量、各費率電能量、最大需量等);(2)交流模擬量(電壓、電流、有功功率、無功功率、功率因數(shù)等);(3)工況數(shù)據(jù)(開關(guān)狀態(tài)、終端及計量設(shè)備工況信息);(4)電能質(zhì)量越限統(tǒng)計數(shù)據(jù)(電壓、功率因數(shù)、諧波等越限統(tǒng)計數(shù)據(jù));(5)事件記錄數(shù)據(jù) (終端和電能表的事件記錄數(shù)據(jù));(6)其他數(shù)據(jù)(預(yù)付費信息等)。
1類數(shù)據(jù)主要反映電力用戶當(dāng)前的實時用電信息;2類數(shù)據(jù)具有時間序列屬性。此類數(shù)據(jù)可提供曲線數(shù)據(jù),并給出曲線時間周期,1、2類數(shù)據(jù)是分析竊電現(xiàn)象的基礎(chǔ)數(shù)據(jù)。3類數(shù)據(jù)為事件數(shù)據(jù),記錄事件的詳細(xì)狀態(tài)信息。其中電流回路異常、電壓回路異常、相序異常、有功總電能量差動越限事件記錄、電壓越限記錄、電流越限記錄、電能表示度下降、電能量超差等事件詳細(xì)信息可為分析竊電提供綜合判斷依據(jù)。
目前,用電信息采集系統(tǒng)主機架構(gòu)采用基于傳統(tǒng)的IOE 架構(gòu),采用IBM 系列主機及配套存儲與Oracle關(guān)系數(shù)據(jù)庫。但這種結(jié)構(gòu)越來越不適合于海量數(shù)據(jù)的存儲,因此為了適應(yīng)海量采集數(shù)據(jù)的存儲,可采用關(guān)系型數(shù)據(jù)庫 (Oracle) 和No SQL數(shù)據(jù)庫 ( HBase)相結(jié)合的存儲方式[12],使用Oracle 存儲全部參量關(guān)系數(shù)據(jù),而采用具有高可靠性、可伸縮性的海量數(shù)據(jù)分布式存儲系統(tǒng)HBase,保存系統(tǒng)的海量監(jiān)測數(shù)據(jù),經(jīng)過數(shù)據(jù)處理后轉(zhuǎn)存到Oracle。采用HBase技術(shù)可搭建起大規(guī)模、結(jié)構(gòu)化的存儲集群,同時采用Hadoop的MapReduce技術(shù),可對HBase分布式存儲系統(tǒng)中的海量數(shù)據(jù)進(jìn)行高效的計算和分析。通過上述方法解決使用Oracle數(shù)據(jù)庫進(jìn)行海量數(shù)據(jù)分析的性能問題。HDSF(Hadoop Distributed Filesystem)是一個分布式文件系統(tǒng),以流式數(shù)據(jù)訪問模式來存儲超大文件,從而實現(xiàn)一次寫入、多次讀寫的最高效訪問模式;并在普通的商用硬件上運行。
基于用電信息采集大數(shù)據(jù)防竊電的結(jié)構(gòu)化模型如圖3所示,主要包括以下三部分:數(shù)據(jù)預(yù)處理,用電異常檢測模型與竊電嫌疑預(yù)測模型。
圖3 大數(shù)據(jù)防竊電的結(jié)構(gòu)化模型
在用電信息采集系統(tǒng)的數(shù)據(jù)采集中,數(shù)據(jù)缺失是一個不可避免與必須面對的問題。尤其是電量和功率等數(shù)據(jù)的缺失會直接影響用電異常信息的挖掘和竊電嫌疑預(yù)測等準(zhǔn)確性。因此,對缺失數(shù)據(jù)的處理變得非常重要。文中把缺失屬性作為因變量,其他屬性作為自變量,利用n次多項式逼近法進(jìn)行缺失值插補,插補的步驟(以模擬有功功率參量的缺失屬性為例)如下:
第一步,選擇取3階(或5階)擬合方程。設(shè)有功功率參量x與屬性量時間t之間的函數(shù)擬合方程為:
x(ti)=a0+a1ti+a2ti2+a3ti3+……+a5ti5
(1)
第三步,依據(jù)最小二乘法原則,使插補[xn,tn]值的均方差達(dá)到最小,求解出系數(shù)a0,a1,a2,a3值,即使下述均方差方程:
(2)
對系數(shù)a0,a1,a2,a3求導(dǎo)數(shù)最小值,建立矩陣:
(3)
第四步,將式(1)函數(shù)結(jié)構(gòu)優(yōu)化,輸入缺失屬性參量值tn,求出有功功率缺失屬性數(shù)據(jù)[xn,tn];
x(tn)=a3tn3+a2tn2+a1tn+a0=
[(a3tn+a2)tn+a1tn]tn+a0
(4)
用電異常檢測模型如圖4~圖7所示,分別為:線損異常模型;交流電壓異常模型;功率因數(shù)異常模型;交流電流異常模型。
圖4 線損異常模型
圖5 交流電壓異常模型
(1)線損異常模型:根據(jù)國家電網(wǎng)電能損耗管理規(guī)定,城網(wǎng)線損率低于5%,農(nóng)網(wǎng)線損率低于7%。以此兩個閾值作為判定條件;
圖6 功率因數(shù)異常模型
(3)功率因數(shù)異常模型:根據(jù)《功率因數(shù)調(diào)整電費辦法》,工業(yè)用戶功率因數(shù)應(yīng)大于0.80,為了同時適用于100 kV·A及以上農(nóng)業(yè)用戶,功率因數(shù)異常的閾值設(shè)定為0.6;
(4)交流電流異常模型:根據(jù)電流失流異常、電流不平衡以及線損、電量等約束條件來判定。
線損異常模型適合表1中3~6的竊電情況。交流電壓異常模型適合表1中1、3、4、8的竊電情況;功率因數(shù)異常模型適合表1中7的竊電情況;交流電流異常模型適合表1中2~6的竊電情況。
圖7 交流電流異常模型
當(dāng)某用戶存在竊電行為時,該用戶必然會出現(xiàn)用電異常狀態(tài),而且大多數(shù)情況下用電異常狀態(tài)具有多面性與持續(xù)性,即幾種用電異常狀態(tài)同時持續(xù)發(fā)生。據(jù)此特性,通過綜合計算用戶不同類別用電異常狀態(tài)出現(xiàn)的次數(shù),設(shè)計一種竊電嫌疑預(yù)測模型,來判斷該用戶的“竊電嫌疑系數(shù)T”。
(14)
式中Ti表示在一天連續(xù)監(jiān)測中,用戶每種類別的用電異常模型中出現(xiàn)異常次數(shù);εi表示每種用電異常模型對應(yīng)的不同權(quán)值。
通過設(shè)定Ts1、Ts2、Ts33個竊電系數(shù)判別閾值,且Ts1>Ts2>Ts3,將判別輸出結(jié)果分為四種竊電嫌疑等級:無竊電,竊電等級A,竊電等級B,竊電等級C,如圖8所示。竊電等級從A~C的嫌疑程度減少,為稽查處理竊電提供依據(jù)。
圖8 竊電嫌疑預(yù)測模型
通過采用國內(nèi)某電力公司用電信息采集系統(tǒng)中多個用戶發(fā)生竊電行為時的用電數(shù)據(jù),驗證了該方法的正確性。
文中分析了常見的竊電方法及其特征,給出了相關(guān)特征參量;其次,設(shè)計了基于大數(shù)據(jù)的防竊電結(jié)構(gòu)化模型,其中用電異常檢測模型建立了竊電行為與用電信息采集系統(tǒng)中各種數(shù)據(jù)和各類異常事件之間的關(guān)聯(lián)關(guān)系,竊電嫌疑預(yù)測模型給出了用戶四種竊電嫌疑等級;最后,通過“竊電嫌疑系數(shù)”估計,鎖定竊電稽查的對象。為用電信息采集系統(tǒng)大數(shù)據(jù)防竊電方法提供了技術(shù)基礎(chǔ)。