程慧 王鏡芳 胡程平 吳方舟 劉愛禹 錢啟宇
關(guān)鍵詞:線路損耗;數(shù)據(jù)挖掘;層次分析;加權(quán)LOF算法;異常值檢測
低壓臺(tái)區(qū)作為配電網(wǎng)的末端,通常是指以380V或220V低壓變壓器供電的區(qū)域,其可為廣大居民用戶和小微企業(yè)用戶供電。低壓臺(tái)區(qū)變壓器端采集的電力數(shù)據(jù)量龐大、用電信息維度高導(dǎo)致分析困難,并且原始數(shù)據(jù)很難為電力用戶用電研究提供數(shù)據(jù)依據(jù)。線路損耗會(huì)影響到配電網(wǎng)的輸出效果,進(jìn)而對(duì)變壓器性能造成直接影響。線路損耗按結(jié)構(gòu)可分為統(tǒng)計(jì)線損、技術(shù)線損和管理線損。它不僅是指以熱能形式存在的能量損耗,而且還是指竊電行為引起的管理線路損耗。
針對(duì)低壓臺(tái)區(qū)內(nèi)竊電行為引起的線損研究,文獻(xiàn)提出了一種基于局部離群點(diǎn)檢測的低壓臺(tái)區(qū)用戶竊電識(shí)別方法。搭建了一套包含低壓臺(tái)區(qū)電網(wǎng)異常分析、用戶竊電預(yù)警以及采集缺陷判斷等數(shù)據(jù)診斷功能的云平臺(tái)。利用卷積神經(jīng)網(wǎng)絡(luò)Le Net5模型對(duì)日用電量數(shù)據(jù)進(jìn)行建模分析,為精確捕獲竊電奠定了基礎(chǔ)。電力系統(tǒng)線損計(jì)算和系統(tǒng)的精準(zhǔn)管理,對(duì)降低節(jié)能降耗、促進(jìn)線損管理具有重要的指導(dǎo)意義。
為了降低低壓臺(tái)區(qū)內(nèi)線損問題,結(jié)合數(shù)據(jù)挖掘中的離群點(diǎn)分析方法,對(duì)異常用電行為進(jìn)行了研究。此外,針對(duì)傳統(tǒng)異常功率檢測方法的局限性,提出了一種基于層次分析法(AHP)的加權(quán)LOF算法的電力線異常功率檢測方法。
1基于數(shù)據(jù)挖掘的異常電量檢測
數(shù)據(jù)挖掘作為一種新興的數(shù)據(jù)處理方法,能夠有效地處理海量且復(fù)雜情況的數(shù)據(jù)分析。因此,為了有效地應(yīng)對(duì)低壓臺(tái)區(qū)內(nèi)大規(guī)模用戶功耗數(shù)據(jù)中檢測異常用戶數(shù)據(jù)的問題,引入了數(shù)據(jù)挖掘技術(shù),基于數(shù)據(jù)挖掘的異常用電量檢測模型主要分為三個(gè)部分:用戶用電數(shù)據(jù)采集與處理、異常用電模型的構(gòu)建、檢測用戶結(jié)果分析與驗(yàn)證?;跀?shù)據(jù)挖掘的異常用電量檢測模型,如圖1所示。
2基于用電特征分析的異常檢測原理
2.1電能利用特征提取
竊電線損行為引起的異常用電數(shù)據(jù)信息提取往往不是孤立的,并且一個(gè)竊電場景可能引發(fā)多個(gè)異?,F(xiàn)象。如果測試是基于單個(gè)指標(biāo),則很可能會(huì)出現(xiàn)遺漏或誤判。因此,必須從各種異常用電現(xiàn)象中以及在由各種異常用電行為引起的可量化特征量中提取綜合特征來進(jìn)行有效的防竊電工作。
以單相用戶為例,整合現(xiàn)有文獻(xiàn)對(duì)功耗評(píng)估指標(biāo)如下:日平均電壓、日平均功率因數(shù)、日平均電流不平衡率、前7天平均日凍結(jié)功率、功率不平衡率。
2.2基于離群點(diǎn)檢測的竊電線損判定原理
離群點(diǎn)檢測又稱異常檢測,其目的是發(fā)現(xiàn)樣本組中具有不同行為特征的目標(biāo)。常用的檢測方法主要分為五類:基于分布的檢測、基于深度的檢測、基于距離的檢測、基于密度的檢測和基于偏移量的檢測。
考慮到電力用戶環(huán)境,基于密度的檢測算法能夠更好地適應(yīng)內(nèi)部結(jié)構(gòu)復(fù)雜的電力數(shù)據(jù)集。因此,選擇了密度檢測算法中最具代表性的LOF算法,并將其應(yīng)用到異常功率檢測中。為了更好帥理解算法,引入以下概念,
由公式(4)可以看出,數(shù)據(jù)目標(biāo)的密度越小,k距離鄰域中目標(biāo)的密度越大,LOF值越大,則異常程度越大。根據(jù)離散點(diǎn)檢測原理,利用LOF算法得到用戶異常度,并且表達(dá)用戶竊電導(dǎo)致的線損嫌疑程度,進(jìn)而根據(jù)嫌疑程度完成低壓臺(tái)區(qū)內(nèi)異常用戶檢測。
3加權(quán)LOF算法及其在竊電線損檢測中的應(yīng)用
由于低壓臺(tái)區(qū)內(nèi)用戶較多,且不同用戶的用電特性差異較大,這使得電力數(shù)據(jù)集內(nèi)部呈現(xiàn)出復(fù)雜的分布特性。LOF算法能有效地避免數(shù)據(jù)分布不均勻?qū)z測結(jié)果的影響,并且對(duì)密度不平衡的電力數(shù)據(jù)集具有良好的檢測效果。由于不同的電能指標(biāo)具有不同的含義,如果用傳統(tǒng)的LOF算法直接得到異常值來表示用戶竊電線損嫌疑程度,當(dāng)多個(gè)電能指標(biāo)對(duì)可疑的竊電線損具有不同的重要性時(shí),導(dǎo)致判斷結(jié)果并不合理。如果不同指標(biāo)數(shù)據(jù)具有相同程度的異常值,并不意味著兩個(gè)用戶具有相同的竊電線損嫌疑。
考慮到選定的電能指標(biāo)對(duì)涉嫌竊電用戶具有不同的重要性,因此,有必要分析可以代表竊電線損可能性的每個(gè)電能指標(biāo)數(shù)據(jù)異常程度。本文使用層次分析法(AHP)對(duì)每個(gè)檢測指標(biāo)分配合理權(quán)重,并結(jié)合加權(quán)LOF算法對(duì)用戶的竊電線損嫌疑進(jìn)行綜合量化,利用得到的綜合異常值來表征用戶對(duì)竊電線損的嫌疑程度,提高了對(duì)用戶竊電線損的檢測效率。最后,通過實(shí)驗(yàn)驗(yàn)證了該檢測方法的有效性。
3.1指標(biāo)權(quán)重的確定
傳統(tǒng)的LOF算法無法區(qū)分不同指標(biāo)數(shù)據(jù)的含義,且傳統(tǒng)的LOF算法得到的異常值只能代表用戶用電特性的異常程度,不能解釋用戶對(duì)竊電線損行為的嫌疑程度。因此,有必要對(duì)傳統(tǒng)LOF算法的不同維度數(shù)據(jù)分配相應(yīng)的權(quán)重。電能指標(biāo)異常程度越大代表竊電線損行為的概率越大,在整個(gè)涉嫌竊電線損行為分析中應(yīng)發(fā)揮的作用越大,則權(quán)重越大,反之亦然。因此,引入AHP作為權(quán)重量化的數(shù)學(xué)工具。
AHP的基本思想是根據(jù)優(yōu)勢關(guān)系分解復(fù)雜問題,并形成層次結(jié)構(gòu)。同時(shí),根據(jù)一定的比例尺度,通過兩兩比較對(duì)判斷過程進(jìn)行量化,計(jì)算相對(duì)判斷矩陣,進(jìn)而確定層次結(jié)構(gòu)要素的相對(duì)重要性。具體步驟如下:
(1)構(gòu)建竊電線損行為評(píng)價(jià)指標(biāo)體系:以用戶竊電線損嫌疑程度為評(píng)價(jià)目標(biāo),并使用由竊電線損現(xiàn)象引起的各種可量化的電能特性參數(shù)作為評(píng)估指標(biāo)集,從而構(gòu)建了竊電線損嫌疑評(píng)價(jià)體系,如圖2所示。
(2)電能參數(shù):根據(jù)與涉嫌竊電線損相關(guān)的重要程度,形成判斷矩陣P。指標(biāo)的相對(duì)權(quán)重使用9/9到9/1的比例進(jìn)行比較。具體比例尺度,如表1所示。
參照專家經(jīng)驗(yàn),根據(jù)電能指標(biāo)數(shù)據(jù)異常能夠代表竊電線損的概率所建立指標(biāo)判斷矩陣P:
綜合分析了用戶異常用電量中各電能參數(shù)的特點(diǎn),得出當(dāng)前涉嫌竊電線損的重要性高于其他指標(biāo)的結(jié)論。測量電壓、功率因數(shù)和功率不平衡率對(duì)試驗(yàn)結(jié)果影響很大。然而,由于功率因數(shù)不僅取決于電網(wǎng),還取決于用戶的負(fù)載性質(zhì),因此,低壓臺(tái)區(qū)變壓器存在一些正常的波動(dòng)。功率不平衡率受通信系統(tǒng)中的通信容量和電流采集頻率的限制,所得到的數(shù)據(jù)不可避免地會(huì)隨著實(shí)際功耗而呈現(xiàn)較小的波動(dòng)。因此,功率因數(shù)和功率不平衡率對(duì)試驗(yàn)結(jié)果影響略低于測量電壓對(duì)試驗(yàn)結(jié)果影響。
(3)判斷矩陣P
得到了對(duì)應(yīng)于矩陣最大特征值的特征向量,歸一化特征向量。為異常功耗指標(biāo)的權(quán)重。同時(shí),對(duì)判斷矩陣進(jìn)行一致性檢驗(yàn)。根據(jù)以上步驟,涉嫌竊電線損的評(píng)價(jià)指標(biāo)權(quán)重如表2所示。
3.2基于加權(quán)LOF算法的低壓臺(tái)區(qū)竊電線損分析
簡要討論距離度量對(duì)結(jié)果的影響。目前,使用較多的距離度量是歐氏距離,因此是用n個(gè)數(shù)值屬性描述的兩個(gè)目標(biāo)。目標(biāo)i和目標(biāo)J之間的歐氏距離定義為:
在對(duì)涉嫌竊電線損的分析中,由于電能指標(biāo)的含義不同,并且不同指標(biāo)對(duì)涉嫌竊電線損的影響有所不同。因此,在異常檢測中,針對(duì)不同的電能指標(biāo)設(shè)置相應(yīng)的權(quán)重。改進(jìn)的歐氏距離表達(dá)式為:
在計(jì)算綜合異常值時(shí),利用加權(quán)歐氏距離對(duì)任意用戶之間的綜合距離進(jìn)行加權(quán),從而得到能夠表示每個(gè)用戶對(duì)竊電線損行為涉嫌程度的綜合異常值。異常值越大,竊電線損的可能性越大?;诩訖?quán)LOF算法的低壓臺(tái)區(qū)竊電線損檢測系統(tǒng)的總體結(jié)構(gòu),如圖3所示。
4實(shí)驗(yàn)結(jié)果與分析
比較分析了傳統(tǒng)LOF算法和所提的基于AHP的加權(quán)LOF算法對(duì)低壓臺(tái)區(qū)竊電線損檢測的效果,所使用的數(shù)據(jù)集來自浙江省海寧市某低壓臺(tái)區(qū)的反竊電檢查裝置,該低壓臺(tái)區(qū)變壓器端采集的數(shù)據(jù)集覆蓋1143戶家庭。
4.1結(jié)果評(píng)價(jià)標(biāo)準(zhǔn)
采用多種分類器評(píng)價(jià)工具對(duì)算法的檢測效果進(jìn)行度量,根據(jù)真實(shí)類別和分類模型兩個(gè)準(zhǔn)則,將數(shù)據(jù)集中的記錄以混淆矩陣的形式進(jìn)行匯總。如下表3所示,表中的每一列表示一個(gè)預(yù)測類別,每一行表示數(shù)據(jù)的真實(shí)屬性類別?;诨煜仃嚳梢缘玫蕉鄠€(gè)評(píng)價(jià)標(biāo)準(zhǔn):
在實(shí)際應(yīng)用中,低壓臺(tái)區(qū)內(nèi)的正常用戶和異常用戶在類別分布上存在不平衡。為了更直觀地表達(dá)最終的檢測結(jié)果,引入了受試者工作特征(R()C)曲線和ROC曲線下與坐標(biāo)軸圍成的面積(AUC)的概念。其中,ROC曲線描述了混淆矩陣中FPR和TPR增長率之間的相對(duì)關(guān)系;ROC曲線下的面積AUC表示分類器的性能,AUC越大,性能越好。
4.2算法檢測結(jié)果
兩種檢測算法的召回率隨檢測率的變化,如圖4所示。從圖4可以看出,整個(gè)低壓臺(tái)區(qū)竊電線損檢測大致可以分為兩部分:當(dāng)檢測率較低時(shí),曲線增長較快。當(dāng)檢測率超過20%時(shí),上升趨勢減慢并最終趨于穩(wěn)定,即通過20%的檢測率就可以發(fā)現(xiàn)約80%的潛在竊電用戶。為了節(jié)省成本,異常功耗檢測可以將重點(diǎn)放在用戶具有較大懷疑系數(shù)的檢測算法輸出上,從而提高了異常功耗檢測的效率。
兩種檢測算法的ROC曲線,如圖5所示。根據(jù)電能參數(shù)的含義,綜合量化了不同電能指標(biāo)對(duì)配電網(wǎng)電能分析的重要性。改進(jìn)的加權(quán)LOF算法的檢測結(jié)果更合理地解釋了用戶對(duì)竊電線損的懷疑,因此改進(jìn)的加權(quán)LOF算法的ROC曲線下的面積AUC明顯高于傳統(tǒng)LOF算法,這說明了竊電用戶的整體檢測效果優(yōu)于傳統(tǒng)LOF算法。
5結(jié)論
通過對(duì)低壓臺(tái)區(qū)電壓器端用電信息采集系統(tǒng)獲取的用戶用電量數(shù)據(jù)進(jìn)行深入分析,可以有效揭示數(shù)據(jù)背后隱藏的用電行為信息,完成對(duì)各種異常用電行為的有效檢測?;跀?shù)據(jù)離群點(diǎn)分析理論,提出了一種基于AHP的加權(quán)LOF算法異常值分析方法,該方法綜合了多個(gè)電能指標(biāo)來評(píng)價(jià)用戶的全面性能。該方法通過監(jiān)測電壓臺(tái)區(qū)內(nèi)用戶竊電線損行為引起的多個(gè)可量化電能參數(shù),完成對(duì)多種線損檢測。同時(shí),只需要對(duì)輸出可疑系數(shù)高的用戶進(jìn)行異常值分析,即可完成對(duì)臺(tái)區(qū)內(nèi)大部分竊電用戶所導(dǎo)致的線損檢測。