田雪松,付瑤,王欣,王萱,陳瑩
(國網(wǎng)天津市電力公司營銷服務(wù)中心,天津 300120)
隨著電網(wǎng)營銷服務(wù)工作的深入推進(jìn),營銷工作日益面臨著業(yè)務(wù)快速變化、用電客戶數(shù)量激增、供電服務(wù)半徑增大、客戶需求差異增大、客戶與電力信息交互頻繁等方面的挑戰(zhàn)??蛻魧╇姺?wù)要求也越來越高,電力客戶對電網(wǎng)企業(yè)的服務(wù)方式、服務(wù)內(nèi)容和服務(wù)質(zhì)量不斷提出新要求[1]。
通過加強(qiáng)營銷稽查管控工作,防范企業(yè)經(jīng)營與服務(wù)風(fēng)險,促進(jìn)營銷轉(zhuǎn)型升級和高質(zhì)量發(fā)展,通過開展基于用戶用電大數(shù)據(jù)的稽查甄別技術(shù)的探索,有效解決依賴人工排查帶來的效率低、不準(zhǔn)確等問題[2]。
研究基于大數(shù)據(jù)的場景式稽查主要是基于電量類指標(biāo)、負(fù)荷類指標(biāo),電壓電流類指標(biāo),線損類指標(biāo)和報警類指標(biāo)等信息,進(jìn)行智能用電異常分析,需根據(jù)建模要求有選擇性地從用電信息采集系統(tǒng)及電力營銷業(yè)務(wù)系統(tǒng)中抽取電量、負(fù)荷、電壓、電流、報警及線損等數(shù)據(jù),基于數(shù)據(jù)預(yù)處理后的數(shù)據(jù),結(jié)合用電異常評價指標(biāo)體系,構(gòu)建專家樣本庫[3]。在樣本數(shù)據(jù)準(zhǔn)備完成后,即可以進(jìn)行模型預(yù)測、模型構(gòu)建、模型評估,并結(jié)合機(jī)器學(xué)習(xí)技術(shù)自動對模型進(jìn)行優(yōu)化和重構(gòu),對評價指標(biāo)進(jìn)行調(diào)整,使整個電智能診斷模型更智能,分析的結(jié)果更精確(圖1)。
圖1 研究思路
在電力側(cè)資源下,依托用電采集系統(tǒng)和營銷業(yè)務(wù)系統(tǒng)。主要包括以下信息,如表1所示。
表1 內(nèi)部數(shù)據(jù)信息表
基于Python獲取不同類別的用戶用電異常外部數(shù)據(jù)信息,進(jìn)行交叉驗(yàn)證。對于使用民電對外經(jīng)營類違約用戶,通過開放的商戶數(shù)據(jù)源以及地圖軟件開放數(shù)據(jù)接口,獲取用戶的地理位置、營業(yè)時間、經(jīng)營范圍等數(shù)據(jù),作為商業(yè)行為證據(jù)。對于使用民電辦公類用電異常用戶,通過工商部門企業(yè)注冊的地址、運(yùn)營狀況等數(shù)據(jù),對照居民用戶電力數(shù)據(jù)分析比對,得到驗(yàn)證結(jié)果。
電力營銷稽查需要遍歷全部關(guān)聯(lián)數(shù)據(jù),對用電采集數(shù)據(jù)進(jìn)行抽取與存儲,通過采集數(shù)據(jù)治理實(shí)現(xiàn)數(shù)據(jù)預(yù)處理,包括數(shù)據(jù)格式管理、數(shù)據(jù)完整性檢查、營銷數(shù)據(jù)格式校驗(yàn)、檔案問題管理、電壓電流缺失數(shù)據(jù)管理、重復(fù)數(shù)據(jù)管理、電壓電流錯誤數(shù)據(jù)管理、換表行為分析、用戶電表異常事件分析等[4]。
大數(shù)據(jù)建模采用深度學(xué)習(xí)框架TensorFlow搭建,利用GPU設(shè)備加速訓(xùn)練。采用K折交叉驗(yàn)證對模型效果進(jìn)行驗(yàn)證,其中異常用電識別模型采用準(zhǔn)確度、召回率、AUC等指標(biāo)進(jìn)行效果評估。模型部署后通過離線分析和線上分析同時進(jìn)行模型評估。離線部分,針對帶標(biāo)簽的測試集合,利用AUC指標(biāo)計算用電異常識別模型的準(zhǔn)確性,AUC越大,表示用電異常識別模型越準(zhǔn)確。線上實(shí)際運(yùn)行過程中,對接入用戶數(shù)據(jù)進(jìn)行近實(shí)時預(yù)測,將超過在建模過程中選擇的概率閾值的疑似用戶結(jié)果提供給業(yè)務(wù)人員使用,輔助進(jìn)行用電異常核實(shí),根據(jù)核實(shí)結(jié)果計算用電異常識別模型的查準(zhǔn)率,進(jìn)而評估實(shí)際運(yùn)行過程中的準(zhǔn)確性[5-6]。
用電歷史核查記錄中各種用電異常的標(biāo)簽y=1,其他用戶作為負(fù)樣本y=0。針對公變低壓用戶和專變用戶分別建立用電異常分析模型。對比并選擇梯度上升決策樹、LSTM神經(jīng)網(wǎng)絡(luò)時序模型、SVM等模型,通過模型訓(xùn)練,建立X與y的關(guān)聯(lián)。其中,LSTM模型結(jié)構(gòu)圖如下圖2所示。
圖2 用電異?;榉治瞿P蛨D
每一個時刻,神經(jīng)網(wǎng)絡(luò)模型的輸入包含當(dāng)前時刻的多維特征X,通過各隱藏層的變換,得到當(dāng)前時刻t的n個狀態(tài)節(jié)點(diǎn)St=<S1,S2, S3,…,Sn>。在此DNN網(wǎng)絡(luò)基礎(chǔ)上,結(jié)合時序長短期記憶模型(long short-term memory,LSTM),時刻t的輸出為當(dāng)前時刻狀態(tài)St和前一時刻狀態(tài)St-1的函數(shù)Ot=f(St+W×St-1)。LSTM能夠同時建??蛻糸L期和短期數(shù)據(jù)中依賴關(guān)系,并隨著時間發(fā)展迭代訓(xùn)練、預(yù)測。模型最終輸出稽查異常的概率Pi=1/(1+e-Ot)。
稽查模型根據(jù)人工核實(shí)結(jié)果,反饋到模型的訓(xùn)練過程中,形成數(shù)據(jù)優(yōu)化閉環(huán),持續(xù)優(yōu)化模型效果??紤]到不同地區(qū)的樣本數(shù)據(jù)千差萬別,在優(yōu)化過程中對特定地區(qū)的用戶特性相應(yīng)建模方法單獨(dú)進(jìn)行優(yōu)化。針對不同用電量規(guī)模的用戶,其用電行為有顯著差異,不同用電量等級的用戶的模型建模結(jié)果會有所不同。對于不同用電量的用戶,應(yīng)基于其電能表日凍結(jié)數(shù)據(jù)、用電用戶檔案、電能表規(guī)格等信息,分析其用電行為,判斷用電量不同對用電異常識別帶來的影響,將用電異常識別模型不斷完善及優(yōu)化,使得對不同特點(diǎn)的用戶識別更加準(zhǔn)確。針對不同承載用戶量的臺區(qū),其線損特性不同,其模型需要進(jìn)一步優(yōu)化和適配,不同地區(qū)的大用戶數(shù)臺區(qū)因供電半徑和用戶負(fù)荷特性不同,需針對具體情況進(jìn)行優(yōu)化和適配,并針對現(xiàn)場核查結(jié)果進(jìn)行不斷適配,對模型進(jìn)行調(diào)優(yōu),不斷提高模型計算的準(zhǔn)確性。
(1)反向電量分析:經(jīng)過對計量裝置在線監(jiān)測、線損、用戶電量等數(shù)據(jù)分析,高壓通過反接A、C相電流的竊電方式會在系統(tǒng)中產(chǎn)生反向電量異常,同時結(jié)合用戶用電量的變化和所屬線路的線損變化進(jìn)行分析,在竊電期間會直接導(dǎo)致用電量下降和線損率上升,以此綜合判斷疑似反接A、C相電流竊電用戶。
(2)電流不平衡分析:用戶通過短接電流線的方式竊電,系統(tǒng)數(shù)據(jù)反映出特征是電流不平衡,同時從用戶用電量下降和線損上升的變化綜合判斷疑似短接電流線的方式竊電。
(3)電表異常事件特征:全面梳理電能表倒走、電能表停走、電能表費(fèi)率設(shè)置異常、電壓斷相、電壓越限、電壓不平衡、高供高計B相異常、電流失流、電流不平衡、電能表開蓋、計量門開閉、恒定磁場干擾、電量差動異常、功率差動異常、負(fù)荷持續(xù)超下限、反向電量異常、相序異常、潮流反向和剩余金額異常等事件,針對每種事件建立統(tǒng)計量特征,以及復(fù)合事件相關(guān)性特征。
(4)相似用戶用電特征:針對不同類型用戶、用戶行業(yè)、容量、電壓、臺區(qū)位置等檔案數(shù)據(jù)和用戶歷史用電量數(shù)據(jù),對用戶進(jìn)行聚類,得到每個用戶的相似用戶。利用用戶本身的用電數(shù)據(jù)和相似用戶的用電數(shù)據(jù),進(jìn)行特征衍生,構(gòu)建用戶和相似用戶群體的差異性特征。
(1)用電量水平分析:針對專變用戶,輸入每15分鐘的電量數(shù)據(jù);針對低壓公變用戶,輸入其日總計電量和尖、峰、平、谷電量數(shù)據(jù)。針對這些數(shù)據(jù)構(gòu)建電量最大值、最小值、平均值、中位數(shù)、電力波動相關(guān)統(tǒng)計特征(包含方差、斜率等)。
(2)用電量分時占比分析:針對專變用戶的每日96個點(diǎn)的電量采集數(shù)據(jù)和低壓用戶尖峰平谷電量數(shù)據(jù),進(jìn)行特征衍生,構(gòu)建不同時間段的電量占比以及相關(guān)變化統(tǒng)計特征。
(3)臺區(qū)電量占比分析:針對低壓用戶,根據(jù)其用戶電量數(shù)據(jù)和臺區(qū)供電量數(shù)據(jù),構(gòu)建用戶用電臺區(qū)占比相關(guān)統(tǒng)計特征和變化特征。
(4)臺區(qū)線損相關(guān)性:針對低壓用戶,根據(jù)用戶電量數(shù)據(jù)和臺區(qū)供電量、售電量、線損電量、線損率等數(shù)據(jù),構(gòu)建多個統(tǒng)計量,得到相關(guān)性特征。
(5)相似用戶用電特征:針對不同類型用戶、用戶行業(yè)、容量、電壓、臺區(qū)位置等檔案數(shù)據(jù)和用戶歷史用電量數(shù)據(jù),對用戶進(jìn)行聚類,得到每個用戶的相似用戶。利用用戶本身的用電數(shù)據(jù)和相似用戶的用電數(shù)據(jù),進(jìn)行特征衍生,構(gòu)建用戶和相似用戶群體的差異性特征;
(6)電表異常事件特征分析:輸入用戶電能表異常事件記錄,如三相不平衡、潮流反向、電能表開蓋等,針對每種事件建立統(tǒng)計量特征,以及復(fù)合事件相關(guān)性特征。
通過建設(shè)用戶稽查大數(shù)據(jù)模型,從海量數(shù)據(jù)中挖掘計量異常及違約用電竊電嫌疑用戶。指導(dǎo)現(xiàn)場進(jìn)行反竊電及用電檢查工作,并通過電費(fèi)追補(bǔ)和違約用電處罰,對竊電行為形成有效的震懾,有效降低電網(wǎng)管理線損,提升企業(yè)經(jīng)濟(jì)效益。
(1)用電異?;樾畔⒅鲃油扑汀O到y(tǒng)定期對用戶的用電信息進(jìn)行識別分析,并將用電異常用戶主動推送至業(yè)務(wù)人員工作桌面,且提供簡潔、高效的工具快速定位和確認(rèn)異常行為。
(2)用能異常處理閉環(huán)管理。對于通過用戶用能稽查模型提交的異常用電客戶明細(xì),生成預(yù)警排查任務(wù),進(jìn)行排查任務(wù)的拆分、派工、處理、審核。支持單戶派工、批量派工、對排除處理任務(wù)回退的任務(wù)進(jìn)行重新派工。
(3)用能異常精準(zhǔn)排查支撐。解決目前人工進(jìn)行反竊電監(jiān)控、分析、排查工作量大、精準(zhǔn)度低的瓶頸,為一線用電檢查及反竊電人員精準(zhǔn)、高效開展反竊電分析和查處工作提供可靠的技術(shù)支撐。