王玉豪 樊一辰 孫志航
【摘? 要】力竊漏電用戶自動識別通過現(xiàn)有的電力計量自動化系統(tǒng)能夠采集到各相電流、電壓、功率因數(shù)等用電負荷數(shù)據(jù)以及用電異常等終端報警信息。利用LM神經(jīng)網(wǎng)絡建立數(shù)據(jù)分析模型,來實時監(jiān)測竊漏電情況和發(fā)現(xiàn)計量裝置的故障。本項技術對人的依賴性低,抓竊查漏的目標十分明確,有利于提高防竊漏電系統(tǒng)的效率和準確性。且該技術無須進入設備內部,通過采集到的電負荷數(shù)據(jù)以及電異常等終端報警信息便可實現(xiàn)智能分析,具有簡單、經(jīng)濟、易于推廣與應用等優(yōu)勢。但是,由于測量數(shù)據(jù)較為復雜并且數(shù)據(jù)量較大,所以利用數(shù)據(jù)挖掘來進行電力竊漏電用戶自動識別具有重要的意義。
【關鍵詞】電力;數(shù)據(jù)挖掘;LM神經(jīng)網(wǎng)絡
引言
傳統(tǒng)的防竊漏電方法主要通過定期巡檢、定期校驗電表、用戶舉報竊電等手段來發(fā)現(xiàn)竊電或計量裝置故障。但這種方法對人的依賴性太強,抓竊查漏的目標不明確。目前很多供電局主要通過營銷稽查人員、用電檢查人員和計量工作人員利用計量異常報警功能和電能量數(shù)據(jù)查詢功能開展用戶用電情況的在線監(jiān)控工作,通過采集電量異常、負荷異常、終端報警、主站報警、線損異常等信息,建立數(shù)據(jù)分析模型,來實時監(jiān)測竊漏電情況和發(fā)現(xiàn)計量裝置的故障。根據(jù)報警事件發(fā)生前后客戶計量點有關的電流、電壓、負荷數(shù)據(jù)情況等,構建基于指標加權的用電異常分析模型,實現(xiàn)檢查客戶是否存在竊電、違章用電及計量裝置故障等。
以上防竊漏電的診斷方法,雖然能獲得用電異常的某些信息,但由于終端誤報或漏報過多,無法達到真正快速精確定位竊漏電嫌疑用戶的目的,往往令稽查工作人員無所適從。而且在采用這種方法建模時,模型各輸入指標權重的確定需要用專家的知識和經(jīng)驗,具有很大的主觀性,存在明顯的缺陷,所以實施效果往往不盡如人意。
現(xiàn)有的電力計量自動化系統(tǒng)能夠采集到各相電流、電壓、功率因數(shù)等用電負荷數(shù)據(jù)以及用電異常等終端報警信息。異常告警信息和用電負荷數(shù)據(jù)能夠反映用戶的用電情況,同時稽查工作人員也會通過在線稽查系統(tǒng)和現(xiàn)場稽查來查找出竊漏電用戶,并錄入系統(tǒng)。若能通過這些數(shù)據(jù)信息提取出竊漏電用戶的關鍵特征,構建竊漏電用戶的識別模型,就能自動檢查判斷用戶是否存在竊漏電行為。
1.模型分析
構建專家樣本集和竊漏電用戶識別模型(LM神經(jīng)網(wǎng)絡和CART決策樹模型),并且對模型進行分析,歸納優(yōu)缺點,則優(yōu)而用。良好的數(shù)據(jù)模型具有以下優(yōu)點:(1)能幫助我們快速查詢所需要的數(shù)據(jù)。(2)能極大地減少不必要的數(shù)據(jù)冗余,也能實現(xiàn)計算結果復用,極大地降低大數(shù)據(jù)系統(tǒng)中的存儲和計算成本。(3)能極大地改善用戶使用數(shù)據(jù)的體驗,提高使用數(shù)據(jù)的效率。(4)能改善數(shù)據(jù)統(tǒng)計口徑的不一致性,減少計算錯誤的可能。
據(jù)數(shù)據(jù)變換中的電量趨勢下降指標、線損指標和告警類指標構建樣本。電量下降趨勢指標:若電量趨勢為不斷下降的,則認為具有一定的竊電嫌疑。線損指標:線路的線損率可作為用戶線損率的參考值,若用戶發(fā)生竊漏電,則當天的線損率會下降,但由于用戶每天的用電量存在波動,所以應考慮前后幾天的線損率平均值。告警類指標:與竊漏電相關的終端報警主要有電壓缺相、電壓斷相、電流反極性等。計算發(fā)生與竊漏電相關的終端報警的次數(shù)總和,作為告警類指標。
2.模型建立
首先我們需要劃分測試樣本和訓練樣本,隨機選取20%作為測試樣本,剩下的作為訓練樣本。竊漏電用戶識別可通過構建分類預測模型來實現(xiàn),目前常用的模型有LM神經(jīng)網(wǎng)絡和CART決策樹。因為這兩個模型都有各自的優(yōu)缺點,所以我們分別建立模型并進行竊漏電用戶識別,并從中選擇最優(yōu)的分類模型。構建LM神經(jīng)網(wǎng)絡時輸入項包括電量趨勢下降指標、線損類指標和告警類指標,輸出項為竊漏電標識。
級聯(lián)相關神經(jīng)網(wǎng)絡是從一個小網(wǎng)絡開始,自動訓練和添加隱含單元,最終形成一個多層的結構。級聯(lián)神經(jīng)網(wǎng)絡(Cascaded Neural Network,以下簡稱CNN),該模型由神經(jīng)網(wǎng)絡組成瀑布結構。所有變量在輸入CNN之前都要被預處理程序標準化為[0,1]之間,同時,需通過最大相關性最小冗余(Maximum Relevance Minimum Redundancy,以下簡稱MRMR)法則的篩選。
CNN由神經(jīng)網(wǎng)絡1和神經(jīng)網(wǎng)絡2組成,兩個神經(jīng)網(wǎng)絡分別有不同的學習算法來預測,但具有相同的多層感知器結構(Multi-Layer Perceptron, 以下簡稱MLP) , MLP有足夠數(shù)量的隱藏神經(jīng)元,以至于能夠在期望的精度下近似任何連續(xù)的多元函數(shù)。此外,根據(jù)Kolmogorov定理, MLP有適當數(shù)量的神經(jīng)元能夠使用一個隱藏層解決問題,因此,本模型中的兩個神經(jīng)網(wǎng)絡的MLP都具有一個隱藏層。
神經(jīng)網(wǎng)絡1會傳輸兩種結果值到神經(jīng)網(wǎng)絡2一種是經(jīng)過神經(jīng)網(wǎng)絡1訓練獲得地可調參量,包括權重和偏差值,前文提到,兩個神經(jīng)網(wǎng)絡具有相同的MLP,因此,神經(jīng)網(wǎng)絡1獲得的權重和偏差值可以直接傳輸給神經(jīng)網(wǎng)絡2,從而使神經(jīng)網(wǎng)絡2的輸出目標變量更加準確;是神經(jīng)網(wǎng)絡1預測的目標變量。神經(jīng)網(wǎng)絡1向神經(jīng)網(wǎng)絡2傳輸結果值,神經(jīng)網(wǎng)絡1的訓練會終止,此時,神經(jīng)網(wǎng)絡2開始學習進程,以此來取代以往模型中神經(jīng)網(wǎng)絡2隨機開始。除了神經(jīng)網(wǎng)絡1的結果值,一組隨機的可調參數(shù)初始值也將進入到神經(jīng)網(wǎng)絡2的學習進程中,從而保證神經(jīng)網(wǎng)絡2獲得更加全面的信息。
人工神經(jīng)網(wǎng)絡(Artificial Neural Networks,ANN)是模擬生物神經(jīng)網(wǎng)絡進行信息處理的一種數(shù)學模型。常用的分類與預測的人工神經(jīng)網(wǎng)絡算法有BP神經(jīng)網(wǎng)絡和LM神經(jīng)網(wǎng)絡。BP神經(jīng)網(wǎng)絡是一種按誤差逆向傳播算法訓練的多層前饋網(wǎng)絡,LM神經(jīng)網(wǎng)絡是基于梯度下降法和牛頓法結合的多層前饋網(wǎng)絡,LM神經(jīng)網(wǎng)絡迭代次數(shù)少,收斂速度快和精確度高。
3.模型求解
使用Keras庫為我們建立神經(jīng)網(wǎng)絡模型,設定LM神經(jīng)網(wǎng)絡的輸入節(jié)點數(shù)為3,輸出節(jié)點數(shù)為2,隱層節(jié)點數(shù)為10,顯示間隔次數(shù)為25,最大循環(huán)次數(shù)為1000,目標誤差為0.0,初始mu為0.001,mu增長比率為10,mu最大值為10',最大校驗失敗次數(shù)為6,最小誤差梯度1e-7。
根據(jù)得到的混淆矩陣,通過計算可得分類的準確率約為91.2%,正常用戶被誤判為竊漏電用戶占正常用戶的2.1%,竊漏電用戶被誤判為正常用戶的占竊漏電用戶的3.8%。
4.結語
在線監(jiān)測用戶用電負荷及終端報警數(shù)據(jù),手機數(shù)據(jù),對數(shù)據(jù)進行補全等一系列的數(shù)據(jù)預處理,得到模型輸入數(shù)據(jù)。之后根據(jù)處理完成的數(shù)據(jù)構建樣本和模型,利用構建好的竊漏電用戶識別模型計算用戶的竊漏電診斷結果。通過LM神經(jīng)網(wǎng)絡得出結果,經(jīng)對比發(fā)現(xiàn)LM神經(jīng)網(wǎng)絡的ROC曲線下方的面積更大,故數(shù)據(jù)準確率更高,評估更優(yōu),作為預測模型更可靠并具有說服力。
參考文獻
[1]CART模型最早由Breiman等人提出,已經(jīng)在統(tǒng)計領域和數(shù)據(jù)挖掘技術中普遍使用.
[2]姜啟源, 謝金星, 葉俊. 數(shù)學模型[M]. 北京: 高等教育出版社, 2011.