劉 松
(1.國網(wǎng)江西省電力有限公司鷹潭供電分公司,江西鷹潭 335000;2.上海電力大學(xué),上海 200090)
目前,少數(shù)電力用戶受經(jīng)濟利益驅(qū)使,竊電現(xiàn)象屢有發(fā)生。隨著科學(xué)技術(shù)的快速發(fā)展,通過高科技手段進行竊電和違約用電的行為越來越多。這些技術(shù)手段不但隱蔽性強,而且查處困難?,F(xiàn)階段查處違約用電、反竊電的主要方法是安排人員進行現(xiàn)場巡視排查,通過儀表應(yīng)景設(shè)備進行排查。傳統(tǒng)反竊電偵查方法普遍耗時耗力,并且準(zhǔn)確性偏低?,F(xiàn)有的反竊電系統(tǒng),由于接入數(shù)據(jù)源少,分析模型單一,不具備自學(xué)習(xí)功能,造成研判角度單一,無法適應(yīng)針對性重點排查要求。為解決準(zhǔn)確判斷違約用電與竊電的技術(shù)難題,文中運用經(jīng)驗學(xué)習(xí)、標(biāo)簽庫、知識圖譜等技術(shù),構(gòu)建針對專變、一般工商業(yè)和居民的違約用電與竊電分析模型,可準(zhǔn)確定位違約用電和有效查處竊電行為,輔助用電稽查人員利用智能化手段開展用電治理。
該算法的目標(biāo)是建立經(jīng)驗算法和分類算法,構(gòu)建違約用電與竊電分析模型;通過各類模型訓(xùn)練、驗證和完善,優(yōu)化模型的計算效率,提升模型分析的準(zhǔn)確性、及時性和可靠性;實現(xiàn)違約用電、竊電的處理流程與經(jīng)驗算法、分類算法相互驗證、自我提升;若異常未消除,系統(tǒng)自動重新納入訓(xùn)練,更新分析模型,實現(xiàn)自學(xué)習(xí)和自優(yōu)化的功能。
以用電信息采集系統(tǒng)的數(shù)據(jù)為基礎(chǔ),結(jié)合營銷系統(tǒng)用戶檔案、發(fā)行電量與電費,構(gòu)建違約用電與竊電分析數(shù)據(jù)源,開展三方面工作[1]:一是建立海量數(shù)據(jù)存儲與計算平臺。由于違約用電和竊電分析涉及對用戶進行多維度、全方位、深層次的分析,運用分布式存儲與并行計算技術(shù),對檔案、負荷、電量和事件等數(shù)據(jù)進行處理;二是數(shù)據(jù)預(yù)處理。建立數(shù)據(jù)清洗規(guī)則,完善計量在線監(jiān)測模型,按照業(yè)務(wù)分析的需求開展數(shù)據(jù)處理和歸集工作;三是建立全省用戶的標(biāo)簽庫。根據(jù)不同用戶類別的用電屬性、異常狀態(tài)、用電特性、負荷特征與變化趨勢等,構(gòu)建全省專線、專公變、低壓工商業(yè)、分布式電源和居民的標(biāo)簽庫,滿足數(shù)據(jù)挖掘和機器學(xué)習(xí)的需求。
針對專線、專變和低壓工商業(yè)及居民的用電特征、違約用電與竊電行為方式及對負荷、電量的影響,結(jié)合營銷系統(tǒng)違約用電與竊電查處流程、計量在線監(jiān)測、國家企業(yè)征信信息和用戶標(biāo)簽信息,運用決策樹、邏輯回歸(Logistic regression)和支持向量機(SVM)等多種經(jīng)驗學(xué)習(xí)算法,及分類器組裝方法(Bagging和Boosting)構(gòu)建專線與專變違約用電分析模型、專變竊電分析模型、低壓工商業(yè)與居民竊電分析模型,通過樣本數(shù)據(jù)對各類模型進行訓(xùn)練、驗證和完善,及壓力測試優(yōu)化模型的計算效率,從而提升模型分析的準(zhǔn)確性、及時性和可靠性,滿足在用電信息采集系統(tǒng)大數(shù)據(jù)平臺上在線分析運行的要求。
通過違約用電與竊電模型分析的疑似用戶進入待辦事項進行觀察,如果在設(shè)定的一段時間內(nèi),相關(guān)異?,F(xiàn)象沒有消除,則直接進入異常處理流程,處理結(jié)束歸檔后,系統(tǒng)從二方面進行工作:一是監(jiān)控異常實際處理情況。如果一周內(nèi)疑似用戶的異?,F(xiàn)象是否再次發(fā)生,如果再次發(fā)生,則重新進入異常監(jiān)控與處理環(huán)節(jié);二是針對處理結(jié)果優(yōu)化分析模型。根據(jù)異常處理結(jié)果及重復(fù)發(fā)生處理結(jié)果,系統(tǒng)自動將分析不準(zhǔn)確的用戶重新納入模型進行訓(xùn)練,訓(xùn)練后自動更新分析模型,實現(xiàn)機器自學(xué)習(xí)和模型自優(yōu)化功能。
基于HPLC 高頻采集、計量在線監(jiān)測和用戶用電多維度統(tǒng)計的數(shù)據(jù),運用分布式存儲與并行計算框架、微服務(wù)和機器學(xué)習(xí)等技術(shù),在用采大數(shù)據(jù)平臺開發(fā)用戶違約用電與竊電智能分析軟件,具備五方面功能:一是數(shù)據(jù)集成與預(yù)處理模塊。實現(xiàn)用電信息采集系統(tǒng)內(nèi)部和外部數(shù)據(jù)接入,按分析需求進行清洗、存儲、統(tǒng)計和歸集;二是開發(fā)違約用電與竊電分析模塊。包括專線和專變用戶違約用電分析模塊,專變與三相工商業(yè)用戶竊電分析模塊,低壓用戶竊電分析模型;三是異常工單管理模塊。包括待辦事項工單、異常處理工單、處理結(jié)果監(jiān)控、異常處理結(jié)果統(tǒng)計分析等功能,形成多分析維度、多時間尺度、多異常類型的違約用電與竊電的統(tǒng)計分析模塊,多樣化對比展示;四是分析模型自學(xué)習(xí)模塊。根據(jù)異常處理的結(jié)果及一周內(nèi)的系統(tǒng)自驗證的情況,針對分析不準(zhǔn)確的用戶重新進行訓(xùn)練和驗證及模型更新功能;五是開展全景展現(xiàn)模塊?;谥R圖譜、單線圖和電網(wǎng)GIS開發(fā)違約用電與竊電全景展現(xiàn)模塊,輔助操作員精準(zhǔn)定位異常用戶,進行快速處理和排查。
為做好違約用電與竊電有關(guān)的數(shù)據(jù)分析與預(yù)測工作,基于歷史數(shù)據(jù)和訓(xùn)練內(nèi)容形成知識庫,結(jié)合經(jīng)驗學(xué)習(xí)實現(xiàn)模型的優(yōu)化,形成適應(yīng)業(yè)務(wù)發(fā)展的數(shù)據(jù)分析模型,知識庫需要包括知識名稱、知識類別、知識內(nèi)容等最終形成違約用電與竊電知識庫,滿足運用知識圖譜展現(xiàn)違約用電與竊電用戶的信息,并為以后竊電工作提供參考依據(jù)。違約用電與竊電知識庫管理包括:知識編輯、知識審核和知識展示三大功能?;诖髷?shù)據(jù)、經(jīng)驗學(xué)習(xí)技術(shù)建設(shè)的違約用電與竊電智能分析分為三步。
基于違約用電與竊電都會涉及失壓、失流、斷缺相、電能表開蓋、電能表停走等異常,及對應(yīng)不同維度負荷、電量的變化,通過對影響因素梳理,基于PCA、LDA、LLE 等數(shù)據(jù)降維方法的研究理論線損影響因素降維方法。對違約用電與竊電的影響因素多種多樣,考慮到影響因素關(guān)聯(lián)程度各有不同、回歸模型的性能,對其進行降維處理,LLE 是一種非線性降維算法,它能夠使降維后的數(shù)據(jù)較好地保持原有流形結(jié)構(gòu)[2],降維算法的思路可概括為:
1)對局部近臨點的選取。對于從電力公司獲取的停電故障數(shù)據(jù)集:
利用樣本點之間的在高維空間的距離尋找每個樣本點di對應(yīng)的n個近臨點。
2)計算樣本點的局部重建權(quán)值,即:
式中:dij(j=1,2,…,n)為di的j個近臨點;wij是di和dij之間的權(quán)值。
3)利用權(quán)值矩陣W降維,得到低維嵌入Y。即:
式中,M=(I-W)T(I-W)。使Lagrange 乘子法,取M的值最小的d個非零特征值所對應(yīng)的特征向量作為低維坐標(biāo)Y。通常最小特征值幾乎為零,因此取2~(d+1)間的特征值所對應(yīng)的特征向量作為輸出結(jié)果。
基于K-mean聚類方法研究違約用電與竊電用戶的分類方法,構(gòu)建不同類別用戶的分類指標(biāo),并進行專變、專線用戶與臺區(qū)(低壓用戶把臺區(qū)作為一個參考因素)分類。K-Means算法以歐式距離作為相似度測度,采用誤差平方和準(zhǔn)則函數(shù)作為聚類準(zhǔn)則函數(shù)。該算法分為4 個步驟:
1)初始化:確定類別數(shù)目k和初始聚類中心點。
2)類劃分:按照式(4)計算N個樣本和k個初始中心點的距離,按照距離大小將N個樣本分配給最近的中心點,形成k個聚類。
3)聚類中心點求解:計算每類中所有對象的平均值,并以此作為k個聚類新的聚類中心。
4)收斂判斷:用式(5)判斷是否收斂。
針對違約用電與各類竊電分析模型分類預(yù)測,分別應(yīng)用多元線性回歸、支持向量回歸機等回歸方法進行疑似率求解模型的構(gòu)建,并結(jié)合計量在線監(jiān)測的異常關(guān)聯(lián)負荷、電量的變化,及時排查并進行疑似率計算?;诹W尤簝?yōu)化(Particle Swarm Optimization,PSO)算法的支持向量回歸機(Support Vector Regression,SVR)的配電網(wǎng)理論線損計算方法,SVR 是支持向量機的一個子類,其特點是最終輸出函數(shù)為線性函數(shù),因而廣泛應(yīng)用于函數(shù)擬合、預(yù)測問題等領(lǐng)域。PSO 是一種優(yōu)秀的群智能優(yōu)化算法,具有收斂速度快、尋優(yōu)能力強等特點[3]。在SVR-PSO 訓(xùn)練過程中,利用粒子群算法動態(tài)地搜索支持向量回歸機的最優(yōu)訓(xùn)練參數(shù),提高SVR-PSO 的計算精度。
如圖1所示,在SVR-PSO 訓(xùn)練過程中,通過向支持向量回歸機SVR 輸入訓(xùn)練樣本集和PSO 訓(xùn)練參數(shù)。通過訓(xùn)練,并輸入測試樣本集形成臨時預(yù)測模型,輸出預(yù)測結(jié)果,計算f值,當(dāng)未達到閾值進行PSO迭代,修正PSO 上一次訓(xùn)練參數(shù)。繼續(xù)PSO 訓(xùn)練直到f值滿足閾值,形成最終預(yù)測模型。
圖1 SVR-PSO工作流程
為解決違約用電和竊電數(shù)據(jù)中的樣本平衡性問題、稀疏矩陣問題,從以下幾個方面對相關(guān)算法進行優(yōu)化:
1)解決樣本平衡性問題,即采樣問題。從豐富類別的樣本中隨機選取和竊電用戶相同數(shù)目的樣本,以平衡數(shù)據(jù)集。模型訓(xùn)練過程中反復(fù)從未經(jīng)訓(xùn)練的樣本集中抽取,以能夠識別更多的樣本數(shù)據(jù)特征。此過程優(yōu)勢有兩點,其一,解決樣本平衡性問題;其二,增強模型的魯棒性[4]。
2)解決稀疏矩陣問題。采用CNN 模型中池化層來解決該問題。池化(Pooling)實際上是一種形式的降采樣。其中“最大池化(Max pooling)”是最為常見的一種非線性池化函數(shù),如圖2所示。
圖2 池化過程
它將輸入數(shù)據(jù)劃分為若干個矩形區(qū)域,對每個子區(qū)域輸出最大值。直覺上,這種機制能夠有效的原因在于:在發(fā)現(xiàn)一個特征之后,它的精確位置遠不及它和其他特征的相對位置的關(guān)系重要。池化層會不斷地減小數(shù)據(jù)的空間大小,因此參數(shù)的數(shù)量和計算量也會下降,這在一定程度上也控制了過擬合。其優(yōu)勢在于三點:其一,特征不變形,池化操作是模型更加關(guān)注是否存在某些特征而不是特征具體的位置;其二,特征降維,池化相當(dāng)于在空間范圍內(nèi)做了維度約減,從而使模型可以抽取更加廣范圍的特征。同時減小了下一層的輸入大小,進而減少計算量和參數(shù)個數(shù)。其三,在一定程度上防止過擬合,更方便優(yōu)化。
3)通過對CNN 模型的損失函數(shù)進行優(yōu)化,將交叉熵損失函數(shù)及自定義損失函數(shù)二者之和作為模型訓(xùn)練最終損失函數(shù)。經(jīng)過反復(fù)訓(xùn)練,根據(jù)最終分類結(jié)果概率,再結(jié)合相關(guān)業(yè)務(wù)知識進行判定。若出現(xiàn)用電行為可疑,則將其竊電概率映射為較大概率。
4)自學(xué)習(xí)能力的構(gòu)建。從竊電用戶的數(shù)據(jù)特點以及卷積神經(jīng)網(wǎng)絡(luò)的局部連接、權(quán)值共享、下采樣等優(yōu)勢,利用卷積神經(jīng)網(wǎng)絡(luò)分別針對專變、低壓用戶(380 V、220 V)構(gòu)建反竊電模型,具體卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖3所示。
圖3 反竊電模型組織結(jié)構(gòu)圖
反竊電模型每一層都有多個Feature Map,每一個Feature Map 中均含有多個神經(jīng)元,輸入通過一種過濾器作用,提取輸入的一種特征,得到一個不同的Feature Map,其中卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練中相關(guān)參數(shù)分別為學(xué)習(xí)率為0.01、批次大小為30、訓(xùn)練次數(shù)為5000次;損失函數(shù)為交叉熵損失函數(shù)以及自定義損失函數(shù)之和;神經(jīng)元激勵函數(shù)選取relu,選取隨機梯度下降法;最后通過激活函數(shù)softmax輸出最終分類結(jié)果,反復(fù)訓(xùn)練,選取最優(yōu)分類模型。
針對低壓用戶竊電分析建立臺區(qū)線損與用戶用電關(guān)聯(lián)分析模型,分析哪些用戶在用電時候,臺區(qū)線損處于合理范圍,且不用電的時候,臺區(qū)線損屬于高損,結(jié)果卷積神經(jīng)網(wǎng)絡(luò)分析這些用戶竊電置信度,輔助開展現(xiàn)場精益排查。
通過該項目的實施,提升了對反竊電用戶的監(jiān)測水平,提高了反竊電工作準(zhǔn)確性,為電量電費追補提供有力的技術(shù)手段,為追補電費提供技術(shù)保證,大幅度提高了反竊電稽查工作效率,有效地提高公司整體經(jīng)濟效益。在近1 年的使用過程中,反竊電工單派發(fā)率99%,違約用電工單派發(fā)率99%,反竊電反饋及時率99%,違約用電工單反饋及時率99%,征信系統(tǒng)推送率99.5%。完成基于知識圖譜的違約用電與竊電智能分析、全景可視化軟件一套,集成在用電信息采集系統(tǒng)中,成果在江西公司11 地市97 縣開展應(yīng)用,已查獲違約用電與竊電案例28 件。
違約用電與竊電的多維度智能分析經(jīng)驗算法和分類算法解決了從海量數(shù)據(jù)中快速甄別定位竊電用戶,對用戶竊電時間、竊電方式、竊電地點進行準(zhǔn)確的定位,大大提高了防竊電的技術(shù)水平和竊電處理的效率,同時降低財務(wù)成本、物資成本、人力成本;提升了監(jiān)測水平和反竊電工作的準(zhǔn)確性,為電量電費追補提供有力的技術(shù)手段和技術(shù)保證,大幅度提高反竊電稽查工作效率,有效提高電力公司整體經(jīng)濟效益??蓮V泛應(yīng)用于各電力公司準(zhǔn)確判斷、定位電力專線用戶、專公變用戶、低壓工商業(yè)用戶和居民用戶違約用電及竊電的情況。