陳 帝
(江蘇省電力有限公司揚(yáng)州供電分公司)
電力營銷數(shù)據(jù)來源廣泛, 主要源自于電力調(diào)度中心, 電力營銷數(shù)據(jù)通常情況下具有非線性屬性, 并且大量數(shù)據(jù)是以狀態(tài)變量的形式體現(xiàn)出來, 因此電力營銷數(shù)據(jù)的處理是電力營銷管理的難點(diǎn)[1-2]。信息融合是一種將多源數(shù)據(jù)進(jìn)行整合、同一化處理的技術(shù)。隨著信息技術(shù)的發(fā)展, 信息融合的概念也逐步擴(kuò)大, 通過計(jì)算機(jī)和軟件的支持, 能夠?qū)崿F(xiàn)多源數(shù)據(jù)的高效融合, 也在電力營銷領(lǐng)域進(jìn)行了廣泛應(yīng)用[3-4]。本文所提出的基于信息融合的電力營銷數(shù)據(jù)回歸分析系統(tǒng),專門針對于電力營銷數(shù)據(jù)重新設(shè)計(jì)了回歸分析系統(tǒng),將多源數(shù)據(jù)整合到一起, 通過多元回歸分析實(shí)現(xiàn)了電力營銷數(shù)據(jù)的整合[5-6]。
基于信息融合的電力營銷數(shù)據(jù)回歸分析系統(tǒng)總體架構(gòu)上包含了四大部分, 即核心功能層、平臺層、邏輯層、應(yīng)用層, 具體架構(gòu)如圖1 所示。
圖1 系統(tǒng)總體架構(gòu)
該回歸分析系統(tǒng)主要是基于MongoDB 數(shù)據(jù)庫進(jìn)行的, 該類型數(shù)據(jù)庫能夠?qū)τ诒倔w模型的持續(xù)化存儲具有很好的支持[7-8]; 并且將關(guān)系型數(shù)據(jù)庫作為輔助, 這樣就能夠?qū)崿F(xiàn)從基礎(chǔ)信息到科研本體的過渡存儲。MongoDB 能夠?qū)崿F(xiàn)與系統(tǒng)上層的數(shù)據(jù)交換, 能夠完成對關(guān)系數(shù)據(jù)庫數(shù)據(jù)的交互, 實(shí)現(xiàn)從源數(shù)據(jù)到融合數(shù)據(jù)的變換[9]。
基于云的架構(gòu)的平臺層能夠保證系統(tǒng)具有較好的功能擴(kuò)展性。核心功能層涵蓋了數(shù)據(jù)處理的核心算法, 具體包括了數(shù)據(jù)提取、數(shù)據(jù)聚類、數(shù)據(jù)分類、數(shù)據(jù)辨識、數(shù)據(jù)特征值提取等[10]; 在進(jìn)行數(shù)據(jù)預(yù)處理時, 根據(jù)數(shù)據(jù)提取與數(shù)據(jù)辨識方法完成核心數(shù)據(jù)信息的提取, 數(shù)據(jù)聚類和數(shù)據(jù)分類用于實(shí)現(xiàn)數(shù)據(jù)融合; 在數(shù)據(jù)挖掘中應(yīng)用了數(shù)據(jù)特征值提取。該系統(tǒng)的數(shù)據(jù)分析流程為數(shù)據(jù)采集、數(shù)據(jù)預(yù)處理、分析本體構(gòu)建、數(shù)據(jù)融合、數(shù)據(jù)分析、數(shù)據(jù)展示[11-12]。
基于電力營銷數(shù)據(jù)回歸分析系統(tǒng)總體架構(gòu)進(jìn)行硬件設(shè)計(jì), 系統(tǒng)硬件主要包括了信息管理模塊、數(shù)據(jù)管理模塊、報(bào)警模塊和電力營銷數(shù)據(jù)管理模塊。系統(tǒng)硬件結(jié)構(gòu)如圖2 所示。
圖2 系統(tǒng)硬件結(jié)構(gòu)
信息管理模塊是通用模塊, 能夠?qū)?shù)據(jù)、用戶進(jìn)行管理, 能夠強(qiáng)化繼電保護(hù)設(shè)備的自主保護(hù)功能, 增強(qiáng)電網(wǎng)運(yùn)行穩(wěn)定性。信息管理模塊能夠?qū)﹄娋W(wǎng)內(nèi)部的安全數(shù)據(jù)信息導(dǎo)入到轉(zhuǎn)化空間, 完成電路數(shù)據(jù)傳輸通道的構(gòu)建, 并配置好數(shù)據(jù)監(jiān)管功能, 時刻監(jiān)測電網(wǎng)數(shù)據(jù)狀態(tài), 提取出精確度較高的初始繼電保護(hù)設(shè)備數(shù)據(jù), 提高繼電保護(hù)操作成功率,保證其安全性能。信息管理模塊能夠管理電力營銷數(shù)據(jù)中的用戶數(shù)據(jù)、用戶角色、用戶區(qū)域、基礎(chǔ)配置等。
數(shù)據(jù)管理模塊則能夠?qū)崿F(xiàn)對電力營銷數(shù)據(jù)的有效管理, 主要管理內(nèi)容包括了電力營銷合同、用戶電費(fèi)、運(yùn)營基站等。
報(bào)警模塊主要負(fù)責(zé)對故障進(jìn)行預(yù)警, 預(yù)警信息產(chǎn)生后都會及時通知負(fù)責(zé)人, 實(shí)時對要發(fā)生的故障進(jìn)行提醒。
電力營銷數(shù)據(jù)管理模塊作為整個系統(tǒng)的核心, 主要承擔(dān)了電量統(tǒng)計(jì)、電力監(jiān)控、數(shù)據(jù)分析、電量預(yù)估等。
電量預(yù)估就是根據(jù)用電設(shè)備的實(shí)際情況, 從理論角度進(jìn)行能耗估算, 專門針對于電力運(yùn)行變化頻繁,采用靈活有效的電力預(yù)估公式, 保證電量預(yù)估的準(zhǔn)確性。
功率監(jiān)測: 在電力運(yùn)行的動態(tài)過程中, 通過對配置了功率采集設(shè)備的電力設(shè)備進(jìn)行實(shí)時功率監(jiān)測。
電量分析: 能夠進(jìn)行電量消耗分析、實(shí)際用電量統(tǒng)計(jì)、理論用電量計(jì)算等, 由此來診斷用電設(shè)備老化情況、用戶偷電情況以及其他情況, 為節(jié)能和減排提供科學(xué)的數(shù)據(jù)依據(jù)。通過分析用電量來確定節(jié)能減排的方案, 并且可以調(diào)查用戶的偷電行為以及用電設(shè)備故障導(dǎo)致的用電量過大的原因。
電量統(tǒng)計(jì): 對采集到的電量進(jìn)行統(tǒng)計(jì), 具體包括了年用電量統(tǒng)計(jì)、月用電量統(tǒng)計(jì)、日用電量統(tǒng)計(jì)、實(shí)時用電量統(tǒng)計(jì)等。
對電力營銷數(shù)據(jù)進(jìn)行融合, 并引入回歸分析法對系統(tǒng)進(jìn)行功能升級, 電力營銷信息融合流程如圖3所示。
圖3 電力營銷信息融合
有電力營銷數(shù)據(jù)融合流程可知, 完成電力營銷數(shù)據(jù)采集后, 將采集得到的原始數(shù)據(jù)進(jìn)行數(shù)據(jù)關(guān)聯(lián), 再根據(jù)電力營銷信息的類別差異進(jìn)行歸類融合, 從而得到新的電力營銷數(shù)據(jù)。這樣便得到了電力營銷數(shù)據(jù)功能模型沒如圖4 所示。
圖4 電力營銷數(shù)據(jù)功能模型
通過傳感器可以實(shí)現(xiàn)對電力營銷數(shù)據(jù)的校準(zhǔn), 提取出有效的數(shù)據(jù)對電力營銷數(shù)據(jù)的狀態(tài)進(jìn)行估計(jì), 再通過數(shù)據(jù)辨識得到電力營銷數(shù)據(jù)中更加深入的信息。再將數(shù)據(jù)導(dǎo)入到電力營銷數(shù)據(jù)功能模型中, 也能用回歸分析方法對電力營銷數(shù)據(jù)進(jìn)行深入分析。
利用數(shù)據(jù)挖掘算法進(jìn)行數(shù)據(jù)提取, 提取過程如下:
(1) 對電力營銷數(shù)據(jù)進(jìn)行區(qū)域分割, 分割方法:
式中,λ描述了電力營銷數(shù)據(jù)所屬空間的數(shù)量,br描述了低密度下電力營銷數(shù)據(jù)的對象子區(qū)域空間,nr描述了電力營銷數(shù)據(jù)所處節(jié)點(diǎn)的值域。
(2) 電力營銷數(shù)據(jù)的分割是基于低密度條件進(jìn)行的, 完成后再基于高密度條件顯現(xiàn), 高密度條件的屬性值與低密度條件屬性值存在較大差異, 分別為ρ1和ρ2, 在高密度條件下, 電力營銷數(shù)據(jù)表現(xiàn)為:
式中,ar描述了低密度下電力營銷數(shù)據(jù)的對象子區(qū)域空間。
(3) 在對低密度條件下和高密度條件下的電力營銷數(shù)據(jù)表達(dá)式分析后, 進(jìn)行聚類計(jì)算:
式中,i描述了需要被處理的電力營銷數(shù)據(jù), 這樣便實(shí)現(xiàn)了電力營銷數(shù)據(jù)的聚類提取, 從樣本中提取出屬性值高的數(shù)據(jù), 得到數(shù)據(jù)集, 如果滿足條件則進(jìn)行下一步處理。
將提取出的電力營銷數(shù)據(jù)進(jìn)行回歸處理, 計(jì)算過程為:
(1) 構(gòu)建回歸運(yùn)算矩陣:
式中,m泛代表矩陣中電力營銷數(shù)據(jù)的對象,n泛代表與對象對應(yīng)的屬性。
(2) 根據(jù)度量值和絕對平均值實(shí)現(xiàn)電力營銷數(shù)據(jù)標(biāo)準(zhǔn)化處理, 進(jìn)而得到絕對偏差值為:
式中,mf描述了絕對平均值,sf描述了絕對偏差值,f描述了數(shù)據(jù)對象之間存在的差異, 絕對偏差值具有更好的魯棒性, 能夠最大限度避免異常數(shù)據(jù)造成的影響。
(3) 在進(jìn)行標(biāo)準(zhǔn)化處理后, 能夠得到不同電力營銷數(shù)據(jù)類型之間的相似程度, 以及差異程度, 進(jìn)行回歸計(jì)算:
式中,D(i,j) 描述了不同的電力營銷數(shù)據(jù)回歸分析對象之間的差異程度; 如果D(i,j) 的數(shù)值為0, 則對象之間是對稱的; 如果D(i,j) 的數(shù)值不為0, 則對象之間是不對稱的, 多元回歸分析結(jié)果為:
式中,ki描述了需要進(jìn)行回歸分析的數(shù)據(jù)量。
為了驗(yàn)證基于信息融合的電力營銷數(shù)據(jù)回歸分析系統(tǒng)的功能。在確定權(quán)重參數(shù)和聚類參數(shù)后, 如果得到的分析結(jié)果聚類數(shù)目比聚類樣本數(shù)小, 則不需要進(jìn)行分析了, 如果聚類數(shù)目為1, 則可以進(jìn)行回歸分析。權(quán)重參數(shù)要合理配置才能保證分析效果。電力營銷數(shù)據(jù)例子如表1 所示。
表1 電力營銷數(shù)據(jù)列表
采用多種方法進(jìn)行對比分析, 得到如圖5 所示結(jié)果。
圖5 電力營銷數(shù)據(jù)分析結(jié)果對比
不同的電力營銷數(shù)據(jù)分析方法, 其分析精度也是不同的, 當(dāng)電力營銷數(shù)據(jù)量達(dá)到300bit 時,COMTRADE 模型分析系統(tǒng)的精度能夠達(dá)到60%左右, 數(shù)據(jù)融合系統(tǒng)的分析精度僅僅能夠達(dá)到30%多一點(diǎn), 本文所提出的基于信息融合的電力營銷數(shù)據(jù)回歸分析方法能夠接近65% 左右, 具有較高的分析精度。
目前應(yīng)用的電力營銷數(shù)據(jù)回歸分析系統(tǒng)分析精度低, 分析耗費(fèi)時間也長, 本文將信息融合技術(shù)運(yùn)用到電力營銷數(shù)據(jù)回歸分析系統(tǒng)中, 實(shí)現(xiàn)了電力營銷數(shù)據(jù)的高精度、快速度分析, 對于提高電力營銷的運(yùn)行效率、提高電網(wǎng)的運(yùn)行穩(wěn)定性具有重要意義, 該方法可以進(jìn)行大規(guī)模推廣應(yīng)用。