◆趙長軍 傅瑤
基于實時多維數(shù)據(jù)的竊電行為分析平臺
◆趙長軍 傅瑤
(重慶工業(yè)職業(yè)技術學院 重慶 401120)
本文設計基于實時多維數(shù)據(jù)的竊電行為分析平臺,利用大數(shù)據(jù)分析建模技術,將與用戶相關的生產(chǎn)、生活、信用多維數(shù)據(jù)通過流水線方式注入,進而利用全景竊電行為分析模型進行計算,得到有效的竊電嫌疑用戶數(shù)據(jù)、竊電特征等結果,為電力企業(yè)精準的竊電定位提供支持。
多維數(shù)據(jù);竊電行為;大數(shù)據(jù)
隨著社會用電量的增大,各種用戶的用電費用增加,竊電問題變得越來越突出??茖W技術的發(fā)展也讓竊電手段日益高明,方法更加隱蔽,給查處帶來了很大的難度。每年因為偷電,導致供電單位損失巨大。據(jù)統(tǒng)計,上海一年經(jīng)過查處的竊電損失超過3000萬元,且還存在大量無法稽查到的情況;天津市2016年查處偷電案2256件,挽回經(jīng)濟損失七千萬。
本文設計基于實時多維數(shù)據(jù)的竊電行為分析平臺,通過Hadoop大數(shù)據(jù)分析,將與用戶相關的生產(chǎn)、生活多維數(shù)據(jù)通過流水線方式實時注入系統(tǒng)中,進行全景竊電行為模型計算分析。分析模型考慮了用戶的家庭情況、氣候、信用等多種參數(shù),從而得到更為精準的竊電嫌疑用戶數(shù)據(jù)、竊電特征等結果,為電力企業(yè)進行準確的竊電定位提供支持,提升企業(yè)的經(jīng)濟效益,保證社會用電安全。
本文利用云平臺的計算服務實現(xiàn)多維度竊電行為分析的大數(shù)據(jù)計算,采用部署于云端的Hadoop大數(shù)據(jù)平臺構建分析系統(tǒng),作為供電企業(yè)現(xiàn)有的本地數(shù)據(jù)中心的擴展;利用服務總線(Service Bus)實現(xiàn)服務共享,整合與其他系統(tǒng)如氣候系統(tǒng)、電商系統(tǒng)、企業(yè)經(jīng)營數(shù)據(jù)系統(tǒng)的服務與數(shù)據(jù)共享。通過數(shù)據(jù)共享方式,實現(xiàn)幾個分析維度數(shù)據(jù)的整合。平臺架構見圖1。
多維度的數(shù)據(jù)通過數(shù)據(jù)服務共享方式統(tǒng)一獲取到系統(tǒng)中,進一步進行竊電行為大數(shù)據(jù)分析?;贖adoop,將幾個維度的數(shù)據(jù)建立竊電分析模型。竊電分析模型設計基于上述幾個維度的數(shù)據(jù),模型采用幾個策略:
(1)用戶用電歷史:顆粒度分別到天、月、年,以及多年的歷史用電數(shù)據(jù)。此維度作為用電情況的參照數(shù)據(jù)。
(2)近期/實時用戶用電數(shù)據(jù):與歷史同期同顆粒度用電情況進行對照分析,分析是否有變化、變化的幅度、方差等。
(3)水表、氣表數(shù)據(jù):家庭的用水用氣情況基本能夠反映家庭的人口情況,例如人口的增加,一般會帶來持續(xù)的用水、用氣增加,反之亦然。此維度數(shù)據(jù)可作為判斷家庭人口變化的基準,而人口增加,必定也會帶來用電量的增加。當一個家庭的用水持續(xù)激增,而用電量反而在下降,同樣存在一定的竊電嫌疑。
(4)氣候數(shù)據(jù):參與對歷史同期用電量的分析。例如同日期、同天氣、同氣溫的情況下,歷史同期的用電變化情況。分析的粒度可以為天、周、月。特別是夏、冬兩個季節(jié),因為制冷和取暖會使用高功率設備,如果在家庭情況不產(chǎn)生大的變化情況下,同期連續(xù)用電量差異較大,則嫌疑增加。
(5)電商信用數(shù)據(jù):獲取此用戶消費信用數(shù)據(jù)、消費力數(shù)據(jù)。電商一般對用戶的消費、退貨、糾紛情況建立了對應的信用制度,可以作為個人信用的參考。同時從總體上來說,消費力較好的用戶,竊電概率也會降低,依次為一定權重的參照系數(shù),分析用戶情況。
(6)企業(yè)產(chǎn)量、營業(yè)數(shù)據(jù):對企業(yè)用電用戶來說,產(chǎn)量與營業(yè)數(shù)據(jù)仍然反映了用電的情況??梢垣@取同類型企業(yè)用電-產(chǎn)量比,得到單位產(chǎn)量的用電情況,進而分析此企業(yè)/用戶用電是否偏離正常。
圖1 平臺架構圖
根據(jù)上述接口,獲得全量多維數(shù)據(jù)后,可加載入系統(tǒng),可按照防竊電分析模型進行嫌疑分析等。例如,對幾個代表性的用戶進行了數(shù)據(jù)采集,多維數(shù)據(jù)如表1所示。
表1 用戶數(shù)據(jù)表
從氣象系統(tǒng)獲取歷年每月平均氣溫數(shù)據(jù)。在采集了上述數(shù)據(jù)后,加載竊電行為分析計算模型到Hadoop大數(shù)據(jù)分析引擎中。分析步驟為:
即計算出當前月份往前12個月的平均氣溫與上輪對應12個月份的平均氣溫偏離比。例如當前為6月,平均氣溫為25度,而對應偏離比為|(26.5-25)/26.5| = 0.0566。
每個用戶都有自己的信用值,主要參考阿里提供的芝麻信用。芝麻信用是一個綜合的信用評估報告值,結合了各個的資產(chǎn)、貸款、信用卡、生活繳費等多個維度的信用情況,具有很好的參考意義。
用戶家庭的水、氣的使用情況往往隨著人數(shù)變化而變化,根據(jù)抽樣,可近似為線性增長。
預估用電值,主要反映用戶在氣溫變化、人口變化情況下,預計的本月用電量。是根據(jù)過去兩年對應月份用電量,及家庭人口變化系數(shù)和每月用電影響因子,計算出預估本月用電量。
根據(jù)預估的用電量,對比當月用電量,結合用戶信用值,得到每個用戶嫌疑評估值。
通過上述驗證數(shù)據(jù),可得出用戶的竊電行為評估值結果。
本文通過設計基于實時多維數(shù)據(jù)的竊電行為分析平臺,將各類系統(tǒng)的數(shù)據(jù)進行數(shù)據(jù)集成,利用云計算大數(shù)據(jù)模型進行分析。構建竊電行為分析模型,將數(shù)據(jù)分析過程與結果提供給供電單位,讓他們能夠從中提取到自己關心的具有竊電嫌疑個體信息,開展針對性的稽查工作。利用大數(shù)據(jù)與云計算技術的優(yōu)勢整合現(xiàn)有的各類數(shù)據(jù),建立云端的竊電行為分析系統(tǒng),其有別于傳統(tǒng)的部署大量用電計量防竊終端的方式,也有別于拉網(wǎng)式的人工稽查方式,讓數(shù)據(jù)分析為工業(yè)生產(chǎn)服務。平臺不僅僅基于現(xiàn)有的用電數(shù)據(jù),更是引入了多維度的信息,包括天氣變化對用電的影響、個人信用因素的影響、生產(chǎn)經(jīng)營數(shù)據(jù)的影響等,這些數(shù)據(jù)讓分析的結果更準確,更有實用價值。
[1]張素香,劉建明,趙丙鎮(zhèn),等. 基于云計算的居民用電行為分析模型研究[J]. 電網(wǎng)技術,2013(6).
[2]郝然, 艾芊, 肖斐. 基于多元大數(shù)據(jù)平臺的用電行為分析構架研究[J]. 電力自動化設備,2017(8).
[3]徐磊, 楊秀, 張美霞. 基于數(shù)據(jù)挖掘的工業(yè)用戶用電行為分析[J]. 電測與儀表, 2017(16).
[4]李端超, 王松. 基于大數(shù)據(jù)平臺的電網(wǎng)線損與竊電預警分析關鍵技術[J]. 電力系統(tǒng)保護與控制,2018(5).