劉寶云,崔 文,張曉華,生西奎,呂 曈
(國網(wǎng)延邊供電公司,吉林 延吉 133000)
隨著我國經(jīng)濟的快速發(fā)展,工業(yè)生產(chǎn)和居民用電需求不斷增大,用電數(shù)量逐年攀升,有部分用戶通過各種的手段竊取電能。傳統(tǒng)的竊電檢查一方面由于用戶數(shù)量多,現(xiàn)場逐戶排查工作量大,效率低;另一方面由于竊電手段多樣,用電檢查人員現(xiàn)場檢查有時難以發(fā)現(xiàn),造成電量持續(xù)丟失。
近年來,竊電手段新穎多變,一般有以下幾種常見的竊電方式:欠壓法、欠流法、移相法、擴差法等[1-3],現(xiàn)階段關于竊電檢測方法主要有統(tǒng)計學方法、支持向量機、聚類分析等[4-5],如文獻[6]基于離群點算法對竊電方法進行研究。隨著云計算、物聯(lián)網(wǎng)、人工智能等信息化技術的快速發(fā)展,以海量數(shù)據(jù)挖掘為代表的大數(shù)據(jù)技術得到了空前的發(fā)展,在很多行業(yè)得到了廣泛的應用[7-9]。近年來,電網(wǎng)企業(yè)在信息化建設和應用方面較為突出,在多個專業(yè)領域建成并應用了多套業(yè)務系統(tǒng),包括用電信息采集系統(tǒng)和SG186系統(tǒng)等[10],這些信息化系統(tǒng)在應用過程中產(chǎn)生了海量的電網(wǎng)運行數(shù)據(jù),具有大數(shù)據(jù)應用的典型特征:數(shù)據(jù)量大、數(shù)據(jù)類型多、價值密度低等特點[11-12]。將大數(shù)據(jù)技術應用到智能電網(wǎng)領域,是泛在電力物聯(lián)網(wǎng)的具體應用,也是國家“一帶一路”戰(zhàn)略的重要組成部分[13]。
本文采用人工智能和大數(shù)據(jù)技術,基于智能電表數(shù)據(jù)遠程采集技術和用電信息采集系統(tǒng)海量的多元數(shù)據(jù),從用電信息采集系統(tǒng)和SG186系統(tǒng)中的海量數(shù)據(jù)中提取出竊電用戶的關鍵特征,依據(jù)關鍵特征構建用戶竊電的關聯(lián)性多維度分析模型,實現(xiàn)自動判斷用戶是否存在竊電行為。
數(shù)據(jù)驅動下的竊電數(shù)據(jù)分析系統(tǒng)主要包括三個模塊:數(shù)據(jù)預處理模塊、竊電評價指標體系模塊、竊電識別檢測模塊。數(shù)據(jù)預處理模塊將用電信息采集系統(tǒng)中多元化的數(shù)據(jù)進行關聯(lián)性分析、降維處理、歸一化處理以及數(shù)據(jù)填充等,得到量化的電氣特征參量作為竊電評價指標模塊的輸入;竊電評價指標模塊將量化的電氣特征參量通過算法確定參數(shù)和量化權重,從而使評價指標集能夠準確表征竊電行為所具有的規(guī)律,建立竊電數(shù)據(jù)分析所需要的專家樣本數(shù)據(jù);竊電識別檢測模塊基于樣本數(shù)據(jù)采用神經(jīng)網(wǎng)絡算法建立竊電分類預測模型,得到竊電檢測結果。整個流程見圖1 。
隨著智能電表的推廣,實現(xiàn)了分鐘級(15 min)的數(shù)據(jù)采集,用電信息采集系統(tǒng)中采集到的用電負荷數(shù)據(jù)(各相電流、電壓、功率因數(shù)、臺區(qū)線損等)以及用電異常(終端報警及違約竊電處罰信息等)等數(shù)據(jù)信息能夠反映用戶的用電情況,同時,用戶每日、每月的用電量及用電異常情況也反映了用戶的用電行為。
用電信息采集系統(tǒng)中能夠采集到各相電流、電壓、功率因數(shù)等用電負荷數(shù)據(jù)以及用電異常數(shù)據(jù),系統(tǒng)中包含了各類用電用戶的實時及歷史電能信息(如計量在線監(jiān)測、線損分析等),計量在線監(jiān)測采集用戶電能信息進行對比分析,對各類異常事件進行告警提示,并與營銷系統(tǒng)進行閉環(huán)處理,因此,通過分析用電信息采集系統(tǒng)的電氣特征參量,建立電氣特征參量與竊電模型特征的關聯(lián)性關系,為甄選竊電模型的多維度特征值提供分析依據(jù)。
通過調(diào)研發(fā)現(xiàn),用電行業(yè)類別與竊電有著一定的關系,對計量數(shù)據(jù)根據(jù)用電行業(yè)采用決策樹算法進行驗證,證實了用戶用電行業(yè)、用電量、用電時間與竊電有著密切的關系,因此按行業(yè)類別如非工業(yè)用戶、居民用戶、供熱用戶、酒店餐飲用戶、普通工業(yè)用電用戶等進行有針對性的構建竊電預測模型,將大大提高預測的準確性。
將采集系統(tǒng)中的電氣參量與竊電模型特征參量按類別進行分類和對應,共分為三類:I類為物理電能數(shù)據(jù)(如相電壓、相電流、日用電量、有功功率等),II類為越限和線損率(如功率因數(shù)、線損及線損值變換率、電壓/電流不平衡度越限等),III類為異常事件記錄(如電流回路異常、電壓回路異常、電能表開蓋記錄、電壓斷相等)。
通過海量數(shù)據(jù),建立用電信息采集系統(tǒng)中各類數(shù)據(jù)、異常事件與竊電有關的關聯(lián)性關系,從中提取竊電用戶的關鍵特征,根據(jù)竊電多維度特征值,構建竊電關聯(lián)性多維度評價指標(見圖2),為供電企業(yè)反竊電稽查提供竊電預警模型的數(shù)據(jù)支撐。
三相電流不平衡率和三相電壓不平衡率表征的是用電過程中電壓和電流的波動情況。用戶改變計量電流是竊電中常用的一種方式,在三相供電系統(tǒng)中,正常用戶的電流和電壓基本保持平衡,若存在三相電流(電壓)不平衡率較大,則表明該用戶存在竊電嫌疑,其計算方式為三相電流(壓)的最大值與最小值之差比上最小值。
線損率作為衡量供電線路的損失比例,通過臺區(qū)線損結合局部線路拓撲關系,可計算出用戶所屬線路在某天的線損率。鑒于用戶每天所用電量存在一定的波動,采用統(tǒng)計該用戶t天的線損平均值,根據(jù)前后t天的線損增長率是否大于1%,從而判斷該用戶是否存在竊電行為。
功率因數(shù)異常是一個相對穩(wěn)定值,而且與用戶電量使用時間無關,因此,可將功率因數(shù)作為竊電的一個主要的參考評價依據(jù)?!豆β室驍?shù)調(diào)整電費辦法》中規(guī)定,工業(yè)用戶功率因數(shù)應大于0.8,考慮到系統(tǒng)其他行業(yè)用戶,可將功率因數(shù)異常的閾值進行調(diào)整,比如0.6,統(tǒng)計功率因數(shù)異常大于閾值的次數(shù)作為模型評價指標。
異常次數(shù)是用電異常事件的總和,異常事件主要包括電流回路異常、電壓回路異常、電能表開蓋事件記錄等,統(tǒng)計與竊電相關的異常事件的次數(shù),作為竊電模型評價指標。
用戶日用電量是表征電量使用最具代表性的指標特征,用戶竊電最終表現(xiàn)在用電量下降這一表象上,正常用戶的用電量相對平穩(wěn),竊電用戶的用電量則會出現(xiàn)陡降趨勢,因此,電量降幅應作為竊電評價指標中一個重要的特征指標。因節(jié)假日的關系,用戶電量降幅采用統(tǒng)計連續(xù)5天的日用電平均值的斜率作為衡量指標。
數(shù)據(jù)預處理包括數(shù)據(jù)清洗、缺失數(shù)據(jù)值處理、數(shù)據(jù)歸一化處理等。
數(shù)據(jù)清洗是將樣本數(shù)據(jù)中特別離譜的數(shù)據(jù)、標注不明確的無效數(shù)據(jù)等進行剔除,將贅余的數(shù)據(jù)過濾掉。
原始數(shù)據(jù)中不可避免的出現(xiàn)缺失值的現(xiàn)象,尤其是用戶電量、功率等參數(shù)的缺失將直接影響竊電分析和預測的準確性,常用的數(shù)據(jù)插補算法有K近鄰填充(KNNI)算法、拉格朗日插值算法等。本文采用最小二乘法的擬合算法對用戶日用電量進行缺失數(shù)據(jù)插補。
數(shù)據(jù)歸一化處理是根據(jù)竊電評價指標將原始數(shù)據(jù)進行標準化,一般將樣本數(shù)據(jù)處理為0~1的數(shù),數(shù)據(jù)歸一化的公式如為:
(1)
式中:xi為樣本數(shù)據(jù)中任意第i個樣本值;xmin為樣本數(shù)據(jù)中的最小值;xmax為樣本數(shù)據(jù)中的最大值。
神經(jīng)網(wǎng)絡作為人工智能中經(jīng)典的算法,具有自適應能力和很強的魯棒性、容錯能力,本文利用神經(jīng)網(wǎng)絡結合數(shù)據(jù)技術構建基于海量數(shù)據(jù)的竊電識別檢測模型,預測用電竊電嫌疑。
BP神經(jīng)網(wǎng)絡是一種按誤差逆?zhèn)鞑ニ惴ㄓ柧毜亩鄬忧梆伨W(wǎng)絡(輸入層、隱含層、輸出層),通過反向傳播不斷調(diào)整網(wǎng)絡的權值和閾值,使網(wǎng)絡的誤差平方和最小。
算法實現(xiàn)過程如下:有k個輸入樣本x(k);期望輸出值為d(k);實際輸出值為y(k);設定誤差函數(shù)e為:
(2)
計算隱含層各神經(jīng)元的激活函值sj:
(3)
式中:wji為輸入層到隱含層的連接權值;θj為隱含層各單元的閾值。
激活函數(shù)采用S型函數(shù):
(4)
計算隱含層j單元的輸出值bj:
(5)
計算輸出層第k個單元的激活值sk:
(6)
式中:vkj為輸出層到隱含層的連接權值;θk為輸出層各單元的閾值。
修正輸出層和隱含層的權值和閾值,輸出層的校正誤差為:
dk=(ok-yk)yk(1-yk)
(7)
式中:yk為實際輸出,ok為希望輸出。
最終得到神經(jīng)網(wǎng)絡的全局誤差E:
(8)
設定BP神經(jīng)網(wǎng)絡的輸入節(jié)點數(shù)為3,輸出節(jié)點數(shù)為1,隱層節(jié)點數(shù)為10,將表征用戶歷史用電數(shù)據(jù)的評價指標數(shù)據(jù)作為輸入,將竊電結果(是否竊電0或1)作為期望目標輸出,對BP神經(jīng)網(wǎng)絡進行訓練,當模型訓練達到精度要求時,將待檢測的用戶數(shù)據(jù)輸入到訓練好的模型中,進行竊電嫌疑預測。
因用戶行業(yè)類別與用電量、電費、用電時間密切相關,根據(jù)模型測試,發(fā)現(xiàn)用電行業(yè)與竊電行為有著一定的關聯(lián),所以本文根據(jù)模型特征,將數(shù)據(jù)分為供熱用戶、餐飲用戶、居民用戶、工業(yè)用戶進行模型檢測,提高模型預測的精確度。
以某供電局2014年1月至2018年12月的用電信息采集系統(tǒng)中的數(shù)據(jù)作為測試對象,經(jīng)現(xiàn)場勘查取證,確認竊電用戶數(shù)8個,系統(tǒng)模型預測結果見表1 。
表1 系統(tǒng)模型預測結果
從表1也可知預測竊電的預測值與實際竊電有很高的吻合度,在一定程度上反映了模型預測的準確性,為大數(shù)據(jù)背景下開展竊電偵查工作提供了技術依據(jù)。
隨著智能電表的推廣及用電信息采集系統(tǒng)建設的逐步完善,電網(wǎng)公司積累了海量用戶用電數(shù)據(jù),為大數(shù)據(jù)技術在電力領域的應用提供了基礎。本文提出一種基于神經(jīng)網(wǎng)絡和決策樹算法的竊電預測模型,從試驗比對和驗證結果看,基于優(yōu)化的神經(jīng)網(wǎng)絡能更快的收斂并且準確性也相對提高。