馬占海,張俊超,田光欣
(國網(wǎng)青海省電力公司信息通信公司,青海西寧 810008)
電力系統(tǒng)影響著人們的生活,關系著國家的發(fā)展。目前,工業(yè)企業(yè)及生活用電需求不斷攀升。在利益的驅(qū)使下,存在通過不合法的手段來獲取電量的情況[1]。近年來,竊電手段變得越來越多樣化,高科技的竊電手段會干擾計量裝置,破壞電子式電能表的計量裝置,導致裝置出現(xiàn)誤差[2]。目前,大量學者針對用電竊電行為進行了研究,劉海等人[3]提出了基于C-lightGBM 的用戶竊電檢測方法,建立竊電檢測模型,設置輕量級提升決策樹分類器,利用分類器進行檢測,同時使用CNN 深度特征進行電力檢測,從而達到快速分類的目的,該方法能夠有效提高檢測精度,但不具備自動檢測能力。趙云等人[4]提出了一種相關性與聚類自適應融合技術的竊電檢測方法,將最大互信息系數(shù)技術和密度峰值快速聚類實現(xiàn)融合檢測,分析用戶之間的相關性,提高檢測的適用性,但是這種方法的自動化能力相對較差。
大數(shù)據(jù)分析技術具有數(shù)據(jù)量大、速度快、種類多和價值豐富的優(yōu)點。因此,文中提出基于大數(shù)據(jù)分析的電網(wǎng)竊電行為特征自動提取模型,并通過實驗驗證了模型的實際應用效果。
以時間序列對電力數(shù)據(jù)進行存儲,通過合理的變換方式實現(xiàn)電力大數(shù)據(jù)矩陣隨機分析,利用預處理方法確定矩陣的隨機條件。在大維隨機矩陣理論中,電力數(shù)據(jù)會有更加靈活多樣的表現(xiàn)方式,變量處于隨機分布狀態(tài),能夠有效提高竊電識別效果。[5-6]。
在電力系統(tǒng)中確定觀測點,設定共有N個,建立時間序列維度并統(tǒng)計顯示,電力系統(tǒng)共有m個維度。設定電力系統(tǒng)工作時間為t,則在t時刻中,共有m個參量[7],則觀測點i(i=1,2,…N)在時間序列的電力數(shù)據(jù)樣本可以表示為:
在得到每個觀測點的矩陣后,使用疊加方式確定原始大維度隨機矩陣,行列比計算公式如下:
其中,c為得到的行列比。由于在正常狀況下,Nm的數(shù)值小于t,因此必須通過變換處理使原始矩陣更具多樣性。
選取觀測點i(i=1,2,…N),拆分矩陣,設定拆分段為k段,則有:
對得到的N個矩陣進行疊加,疊加處理后,能夠得到大維隨機矩陣,在N個觀測點內(nèi)部的大維隨機矩陣可以表示如表1 所示。
利用大維隨機矩陣能夠很好地監(jiān)測電力系統(tǒng)用戶狀態(tài),對用戶信息進行存儲,通過共享的方式反映用電的電流和電壓數(shù)據(jù),在得到合適的參量后,利用預處理實現(xiàn)分析[8-9]。
矩陣需要去量綱化和數(shù)值歸一化處理,在統(tǒng)一處理后,不同的矩陣具備可比性,根據(jù)極限譜分布理論對數(shù)據(jù)進行預處理[10]。通過標準化處理使數(shù)據(jù)矩陣從二維矩陣轉(zhuǎn)換成三維矩陣。由于元素內(nèi)部數(shù)據(jù)都為實數(shù),因此需要對樣本協(xié)方差矩陣進行奇異化處理,在復平面上完成處理。
在完成信息預處理后,對電網(wǎng)竊電行為特征進行識別。在對電網(wǎng)竊電行為特征進行識別后,首先確定線路是否存在線損異常,然后逐個臺區(qū)進行檢測,分析臺區(qū)是否存在異常[11]。在確定異常后,對不同用戶的竊電嫌疑程度進行判斷,通過全方位的分析確定竊電時間區(qū)段,最后根據(jù)竊電分析確定重點嫌疑用戶,從而更好地實現(xiàn)識別和監(jiān)測。在對電網(wǎng)竊電行為特征進行識別時,要采用針對性的方式,不斷尋找竊電用戶,從而實現(xiàn)識別,識別采用遞進的方式[12-13]。首先尋找所有線路中線損較高的線路;然后對線路上的臺區(qū)進行鎖定,確定電量異常高的臺區(qū)[14];最后在臺區(qū)內(nèi)部縮小到用戶單位,尋找臺區(qū)內(nèi)部竊電嫌疑最大的用戶,依次排序,尋找竊電時間數(shù)據(jù),從而能夠?qū)崿F(xiàn)快速識別竊電行為特征。
若用電用戶都屬于正常用戶,則線路處于正常狀態(tài),即使存在線損,波動值也在恒定值附近。一旦有用電用戶存在竊電行為,線路的線損就會瞬間陡增,本來呈現(xiàn)曲線變化的線損值會出現(xiàn)峰值[15]。
除了竊電行為之外,如果用戶在用電過程中存在負載三相不平衡或者電力設備異常,則會出現(xiàn)線損增加。因此線損異常只是判斷用戶存在竊電行為的一個指標,而并不是唯一指標,用戶可以通過分析線損異常狀況進行篩選,尋找竊電嫌疑大的用戶,通過逐步分析,使分析結果更加準確,提取的電網(wǎng)竊電行為特征更具有代表性。
分析圖1 滑動窗口構造可知,利用正向有功電量分析用電參數(shù),確定不同采樣時刻的不同時間區(qū)段內(nèi)電表示數(shù)差值,從而得到累積量,反映不同時刻用戶的用電情況。
利用大數(shù)據(jù)挖掘技術在電力系統(tǒng)中提取不同的線路,計算線損時間,并將計算結果輸入到樣本內(nèi)部,建立隨機矩陣,通過預處理得到有效的矩陣數(shù)據(jù),再進行標準化處理,計算線路特征,得到復平面上的分布圓環(huán),從而得到不同臺區(qū)線損的異常率,判斷異常程度,篩選出異常狀態(tài)較高的線路。
對異常狀態(tài)較高的線路進行臺區(qū)劃分,設定線路上共有M個臺區(qū),一旦用戶存在竊電行為,該用戶的竊電量必然會減少,則證明用電總量有可能存在異常情況?;诖髷?shù)據(jù)分析的電網(wǎng)竊電行為特征主要有視在功率、三相電壓不平衡率、三相電流不平衡率和功率因數(shù),分析用戶的用電量和用電負荷,由于二者蘊含的信息相同,因此可以相互轉(zhuǎn)化兩個指標,利用這兩個指標來反映用戶的用電行為狀態(tài),在大維隨機矩陣中尋找功率參量,從而更好地構建大維隨機矩陣。設定視在功率為隨機矩陣內(nèi)部的參數(shù),將視在功率分為有功功率和無功功率,從而更好地完成大數(shù)據(jù)挖掘[16-18]。
分別計算三相電壓不平衡率和三相電流不平衡率,根據(jù)計算結果判斷用戶是否存在欠流或者欠壓的情況,欠壓判別計算公式如下:
其中,ua、ub、uc表示A相、B相、C相對應的電壓;max{ua,ub,uc} 表示三相電壓最大值;min{ua,ub,uc} 表示三相電壓最小值;ξUt表示欠壓判別結果。
欠流判別計算公式如下:
其中,ia、ib、ic表示A相、B相、C相對應的電流;max{ia,ib,ic} 表示三相電流最大值;min{ia,ib,ic} 表示三相電流最小值;ξIt表示欠流判別結果。
在分析上述特征排序后,處理分離函數(shù),分析不同時間區(qū)段內(nèi)圓環(huán)點,從而比較竊電時間區(qū)段。識別內(nèi)部特征,從而判定用戶的用電量是否存在異常,如果存在異常,則需要對現(xiàn)場狀況進行勘察,及時解決問題。
為了驗證文中提出的基于大數(shù)據(jù)分析的電網(wǎng)竊電行為特征自動提取模型的有效性,進行實驗研究,選取某省級電網(wǎng)作為研究對象,分別部署基礎數(shù)據(jù)平臺,比較線損,實現(xiàn)竊電預警。將提出的自動提取模型接入到省級電網(wǎng)中,電網(wǎng)的存儲容量為12 TB,每條記錄400 個字節(jié),每日數(shù)據(jù)量的增長為8 GB。
建立的物理節(jié)點配置環(huán)境如圖2 所示。
圖2 物理節(jié)點配置環(huán)境
根據(jù)圖2 可知,當節(jié)點發(fā)展到一定模式后,出現(xiàn)竊電現(xiàn)象,分析各種不同節(jié)點的運行參數(shù),得到時間序列矩陣。實驗運行參數(shù)如表2 所示。
使用文中自動提取模型對電網(wǎng)正常運行狀態(tài)和竊電狀態(tài),得到的協(xié)方差特征值譜分布方式如圖3所示。
根據(jù)圖3 可知,在不存在竊電行為時,電網(wǎng)的特征值全部集中在圓環(huán)內(nèi)部,內(nèi)環(huán)和外環(huán)中間值與特征值譜半徑相吻合,一旦發(fā)生竊電行為,線損方差矩陣特征值以集中地方式分布在圓環(huán)中心。
表2 實驗運行參數(shù)
圖3 竊電發(fā)生前后特征譜分布實驗結果
發(fā)生竊電前后方差特征值密度函數(shù)如圖4所示。
圖4 竊電發(fā)生前后方差特征值密度函數(shù)
根據(jù)圖4 可知,電網(wǎng)的運行狀態(tài)為正常狀態(tài)時,特征值譜密度函數(shù)的規(guī)律為M-P 規(guī)律。而一旦出現(xiàn)竊電行為,電網(wǎng)內(nèi)部數(shù)據(jù)存在異常,分布方式不再是獨立分布,特征譜函數(shù)偏離M-P 定律。因此文中研究的特征自動提取模型,通過分析特征值譜密度函數(shù)與M-P 規(guī)律的重合度,判斷是否發(fā)生竊電行為。
電網(wǎng)竊電時間實驗結果如圖5 所示。
圖5 電網(wǎng)竊電時間實驗結果
觀察圖5 可知,當電力系統(tǒng)不存在竊電現(xiàn)象時,特征值平均譜半徑以平穩(wěn)的方式進行波動。而在出現(xiàn)竊電現(xiàn)象后,特征值平均譜半徑會產(chǎn)生兩個非常顯著的突變點,這兩個突變點正好對應竊電的起始時間和終止時間。因此,文中研究的特征提取模型能夠更好地反映出電網(wǎng)的運行狀態(tài),確定分析平均譜半徑的變化狀況后,可以確定系統(tǒng)運行的異常點。
文中利用大數(shù)據(jù)分析技術研究了電網(wǎng)竊電行為特征自動提取模型,對數(shù)據(jù)進行預處理,實現(xiàn)信息分析,從而完成特征自動提取。設計的特征自動提取模型同時分析了多個參數(shù),實現(xiàn)數(shù)據(jù)采集、數(shù)據(jù)存儲和數(shù)據(jù)處理,分析線損狀況和臺區(qū)狀況,完成電力數(shù)據(jù)的實際應用。文中研究的特征自動提取模型能夠充分利用大數(shù)據(jù)技術優(yōu)勢,更好地實現(xiàn)竊電。但是文中對電網(wǎng)實時運行分析的研究較少,難以更好地完成負荷預測,因此未來需要進一步深入研究這一問題。