肖濤,陳湘媛,劉樹來,許陽,肖建紅
(1.國網(wǎng)湖南省電力有限公司供電服務(wù)中心(計量中心)智能電氣量測與應(yīng)用技術(shù)湖南省重點實驗室,湖南長沙 410004;2.國網(wǎng)湖南省電力有限公司,湖南長沙 410004)
目前,社會上仍存在一些竊電不良行為,竊電者不僅打亂了供電秩序,也會給國家供電造成一定經(jīng)濟損失[1]。目前,低電壓電力用戶群分布廣泛,該群體中大量用戶存在偷電行為,總數(shù)可達(dá)98%以上,為電力用戶帶來極大危害[2]。尤其在用電高峰期間,低壓竊電會給部分臺區(qū)線路造成嚴(yán)重?fù)p毀。近年來,隨著智能電表及用電信息采集系統(tǒng)的廣泛應(yīng)用,積累了大量用戶的用電數(shù)據(jù)。如何將這些數(shù)據(jù)應(yīng)用于更全面、準(zhǔn)確的竊電探測,防止竊電發(fā)生,具有重要的現(xiàn)實意義。
針對這一問題,相關(guān)學(xué)者提出了兩種竊電行為識別方法,分別是線損異常判斷[3]和離群點算法[4]的行為識別方法。其中,基于線損異常判斷方法是結(jié)合曲線相似性方式判斷低壓臺區(qū)竊電行為;另外一種方法是基于離群點算法的行為識別方法,將數(shù)據(jù)采集系統(tǒng)與離群算法相結(jié)合,在低壓平臺上識別竊電行為。
盡管上述兩種方法識別通過局部迭代搜索,識別了部分竊電行為,但無法做到全局搜索,導(dǎo)致最終識別結(jié)果不精準(zhǔn)。為此,結(jié)合稠密度聚類技術(shù)識別低壓臺區(qū)用電竊電行為。
作為一種統(tǒng)計分析方法,稠密度聚類分析是通過對樣本或指數(shù)進行分析與研究。與不屬于同一集群的模式相比,集群模式之間的相似點更相似。
根據(jù)低壓臺區(qū)用戶用電的規(guī)律性,分析用戶用電記錄的負(fù)荷曲線,按照其規(guī)律性特點將用戶用電分為生活用電、辦公用電和生產(chǎn)用電三種。這三種用電量各不相同,一般情況下,生活用電是用電的底層,用電量較少,每天的用電量分布比較均勻;與生活用電相比,辦公用電量較多,由于這些機關(guān)事業(yè)單位是按照規(guī)定的作息時間用電,因此,辦公用電的使用范圍也比較廣,被稱為用電頂層[5];生產(chǎn)用電最多,其用電特點是具有嚴(yán)格的作息時間,具有鮮明的行業(yè)特點。從每日生產(chǎn)用電的最高水平分布中可以推斷出用戶日程安排和行業(yè)特征[6]。
為了有效測量這三種用電方法,采用同一塊電表進行連續(xù)24 小時的測量。根據(jù)所有用戶的用電時間和類型,對其生成的負(fù)荷曲線分布圖進行判斷。分別記錄用電用戶的上班時間、下班時間、加班以及全天工作的用電情況,分析當(dāng)前電流分配規(guī)律。
基于稠密度聚類的初始用電竊電行為數(shù)據(jù)中心點確定步驟如下所示。
步驟一:通過對數(shù)據(jù)集中兩兩對象間的d(i,j)進行計算,建立一個n×n維的上三角矩陣[7-9]。
步驟二:建立目標(biāo)密集區(qū),將每一個對象(編號0,1,…,n-1)作為核心對象,并設(shè)置參數(shù)MinPts,再根據(jù)式(1)計算,即可獲得第一層域的對象編號[10]:
式中,oi表示核心研究對象;p表示固定對象;ε0表示鄰域半徑;MinPts 表示對象個數(shù);coredis(oi,p)表示oi與對象的距離[11]。
步驟三:設(shè)定領(lǐng)域?qū)訑?shù)N,按式(2)計算稠密區(qū)域的物體數(shù)目,按半徑擴展逐層展開,把所產(chǎn)生的物體稠密區(qū)域集中起來:
式中,當(dāng)領(lǐng)域?qū)訑?shù)N≥2 時,需控制半徑增長速度,增強稠密度的凝聚性。
步驟四:對每個對象稠密區(qū)域的密度進行計算,如式(3)所示:
式中,Ci表示稠密區(qū)域?qū)ο髠€數(shù);U表示整個區(qū)域?qū)ο髠€數(shù)。設(shè)有n個稠密區(qū)域,確定稠密區(qū)域的平均密度計算公式:
按式(4)計算所有密集區(qū)的平均密度,剔除密度小于平均密度的對象密集區(qū),可得到致密區(qū)域,該方法能有效地消除密集區(qū)和離散點存在的噪聲[12]。
采用常規(guī)K-MedoID 算法計算量大,時間復(fù)雜度高,其時間復(fù)雜度為O(K(n-K)2),在此過程中,每次迭代處理都需要經(jīng)過重新聚類分析[13]。為了改善以往識別方法迭代次數(shù)多且收斂速度慢的問題,需及時搜索更新用電竊電行為數(shù)據(jù)中心點,滿足初始中心點的計算需求[14]。通過設(shè)定初始聚類中心后,確定o1,o2,…,ok為中心點,即為密集區(qū)域C1,C2,…,CK的中心點。將K中心點的搜索范圍劃分成不同密集的小區(qū)域,能夠有效改善傳統(tǒng)識別方法存在的問題,極大地縮短搜索時間[15]。
根據(jù)搜索及時更新的基于稠密度聚類的竊電行為數(shù)據(jù)中心點,可精準(zhǔn)獲取所需數(shù)據(jù),由此設(shè)計用電竊電行為識別流程。
步驟一:選擇數(shù)據(jù)源,進行數(shù)據(jù)篩選,準(zhǔn)備用戶用電數(shù)據(jù)[16]。利用電力信息采集系統(tǒng)和營銷業(yè)務(wù)應(yīng)用系統(tǒng),對近三年內(nèi)專變竊電用戶的用電負(fù)荷信息、事件記錄和檔案信息進行提取、驗證。對竊電用戶的原始數(shù)據(jù)進行篩選,以排除計量裝置故障造成的誤判數(shù)據(jù)和完整性差的數(shù)據(jù)。
步驟二:根據(jù)竊電行為特征進行變量選擇,由此得到原始竊電特征集。
步驟三:基于非負(fù)矩陣分解的竊電行為進行特征提取。
非負(fù)矩陣表達(dá)公式為:
式中,A表示竊電特征矩陣;B表示系數(shù)矩陣;V表示原始竊電特征矩陣。
利用竊電特征矩陣代替原始竊聽特征量,以提取竊電特征,并將其作為特征變量構(gòu)建用戶樣本數(shù)據(jù)集。
步驟四:根據(jù)非負(fù)矩陣表達(dá)公式,計算綜合分值,并且對所有用戶進行竊電嫌疑篩選,最終得到高竊電嫌疑用戶,由負(fù)責(zé)人員到現(xiàn)場進行核實確認(rèn)。
1)劃分層次
劃分用電異常指標(biāo)層次,由上至下的指標(biāo)層分別為0 層、A 層、B 層。其中0 層表示用電竊電嫌疑指標(biāo)層;A 層表示歷史數(shù)據(jù)分析層;B 層表示單項指標(biāo)層。依據(jù)B 層的指標(biāo),判斷用戶用電竊電行為,該指標(biāo)值越大,說明低壓臺區(qū)用電竊電嫌疑也就越大。
2)設(shè)置權(quán)重
設(shè)置B 層指標(biāo)對應(yīng)的用電竊電異常行為指數(shù)權(quán)重,主要為:
3)計算竊電行為指數(shù)
通過上述確定的權(quán)重,設(shè)定R=[]r1,r2,r3,…,rn為A 層指標(biāo)的狀態(tài)值。則該層指標(biāo)a1的竊電行為指數(shù)表達(dá)公式為:
基于式(7)的計算原理,確定ω為各項指標(biāo)的權(quán)重系數(shù),基于此,計算綜合分值:
采用累積法計算B 層指標(biāo)的方法獲得A 層指標(biāo)的特征值,并通過累積A 層指標(biāo)可以得到綜合的用電竊電異常行為評價指標(biāo),該指標(biāo)越大,低壓臺區(qū)用電竊電行為越明顯,由此完成用電竊電行為的識別。
為了驗證基于稠密度聚類的低壓臺區(qū)用電竊電行為識別方法的可行性,對實際低壓臺區(qū)用電竊電產(chǎn)生的數(shù)據(jù)進行仿真實驗分析,并統(tǒng)計低壓臺區(qū)供電所轄區(qū)內(nèi)的所有居民在2020 年12 月至2021 年11月的所有用電量。所管轄的低壓臺區(qū)內(nèi),共有155 個居民用戶,電能表共156個(1個總表,155個電能表)。
選擇編號為35 和52 的電能表,對比分析這兩個電能表對應(yīng)的用戶用電竊電情況,如圖1 所示。
圖1 兩個用戶竊電及線損情況對比分析
由圖1 可知,由于在同一低壓臺區(qū)的網(wǎng)絡(luò)線路是保持恒定不變的,因此,單一臺區(qū)內(nèi)線損變化相對穩(wěn)定。依據(jù)該指標(biāo),構(gòu)建5×350 高維隨機矩陣,并對該矩陣擴展處理后,轉(zhuǎn)化為50×350 高維隨機矩陣。在該矩陣中添加白噪聲后,經(jīng)過滑動窗口切割變換,轉(zhuǎn)為500×100 高維隨機矩陣。該矩陣在低壓臺區(qū)電能表正常運行和出現(xiàn)竊電行為時的屬性,如圖2所示。
圖2 竊電前后協(xié)方差特征值譜分布圖
由圖2 可知,當(dāng)電能表正常運行時,高維隨機矩陣屬性分布于內(nèi)環(huán)、外環(huán)以及高維隨機矩陣屬性值譜密度之間;當(dāng)電能表出現(xiàn)竊電行為后,由于構(gòu)成的高維隨機矩陣容易出現(xiàn)異常數(shù)據(jù),不能再獨立分布,此時的高維隨機矩陣屬性集中分布在內(nèi)環(huán)。
分別使用線損異常判斷、離群點算法的竊電行為識別方法和基于稠密度聚類識別方法,對比分析竊電發(fā)生后高維隨機矩陣屬性值譜密度函數(shù)示意圖,如圖3 所示。
圖3 三種方法竊電發(fā)生后高維隨機矩陣屬性值譜密度函數(shù)示意圖
由圖3 可知,當(dāng)?shù)蛪号_區(qū)內(nèi)電能表正常運行時,線損指標(biāo)構(gòu)成的矩陣特征平均譜半徑在整個觀測時間范圍內(nèi)處于平穩(wěn)狀態(tài),高維隨機矩陣屬性集中分布在內(nèi)環(huán),不會出現(xiàn)新的竊電行為。當(dāng)有竊電行為發(fā)生時,高維隨機矩陣屬性值的平均譜半徑在第100天和160 天時,出現(xiàn)兩個顯著突變點,存在新竊電的可能性較大,說明使用基于稠密度聚類的識別方法識別結(jié)果更加精準(zhǔn)。
文中提出的基于稠密度聚類的低壓臺區(qū)用電竊電行為識別方法,其優(yōu)點是通過定位搜索中心所在區(qū)域的中心點,大大減少了迭代次數(shù)和有效區(qū)域更新中心的搜索次數(shù),從而保證了聚類的準(zhǔn)確性。在同一時間利用現(xiàn)有數(shù)據(jù)來分析當(dāng)前和過去的竊電行為,可以及時發(fā)現(xiàn)異常用電行為。