楊峰, 劉勝?gòu)?qiáng), 吳麗賢
(廣東電網(wǎng)有限責(zé)任公司佛山供電局, 廣東, 佛山 528000)
由于電力營(yíng)銷數(shù)據(jù)來(lái)源種類很多,多是通過(guò)實(shí)時(shí)采集和調(diào)度中心收集而來(lái),所以數(shù)據(jù)是以非線性方式描述的,在描述過(guò)程中會(huì)涉及數(shù)以千計(jì)的狀態(tài)變量,如何處理電力營(yíng)銷數(shù)據(jù)已經(jīng)成為了亟待解決的問(wèn)題[1-2]。信息融合是將多種來(lái)源的資訊或資料組合、整合以形成統(tǒng)一結(jié)構(gòu)的技術(shù)。最初,信息融合在軍事領(lǐng)域得到了廣泛的應(yīng)用,分析并整合諸如傳感器、信號(hào)、信息以及人工產(chǎn)生的各種信息,以獲取隱藏的軍事情報(bào)[3]。今天,人們對(duì)信息融合的理解不僅僅來(lái)自傳感器,還來(lái)自因特網(wǎng)、數(shù)據(jù)庫(kù)、軟件等。隨著人們認(rèn)知領(lǐng)域的擴(kuò)大,信息融合的概念也不斷擴(kuò)大,通過(guò)計(jì)算機(jī)和軟件的支持,實(shí)現(xiàn)了多數(shù)據(jù)源的融合,擴(kuò)大了人們的認(rèn)知范圍,提高了人們的分析和決策能力,提高了問(wèn)題解決效率。相關(guān)學(xué)者進(jìn)行了研究,取得了一定的進(jìn)展。陸慧等[4]提出基于數(shù)據(jù)挖掘的電力營(yíng)銷數(shù)據(jù)分析系統(tǒng),通過(guò)挖掘電力營(yíng)銷數(shù)據(jù),分析電力企業(yè)營(yíng)銷對(duì)象情況,同時(shí)優(yōu)化電力營(yíng)銷數(shù)據(jù)分析系統(tǒng)的架構(gòu),此方法能夠有效提升數(shù)據(jù)分析準(zhǔn)確性,但是數(shù)據(jù)分析時(shí)間過(guò)長(zhǎng)、分析效率不佳。王奇等[5]提出基于數(shù)據(jù)融合的電網(wǎng)運(yùn)行全景可視化分析系統(tǒng),通過(guò)算術(shù)平均值去除電網(wǎng)數(shù)據(jù)誤差,并通過(guò)一致性檢驗(yàn)分析電網(wǎng)數(shù)據(jù)的數(shù)據(jù)序列,構(gòu)建關(guān)聯(lián)性模型實(shí)現(xiàn)電網(wǎng)運(yùn)行全景可視化分析,能夠全方位地實(shí)現(xiàn)電網(wǎng)運(yùn)行分析,但是此方法分析過(guò)程比較復(fù)雜,分析用時(shí)較長(zhǎng)。陳泗貞等[6]提出基于COMTRADE模型的電力系統(tǒng)多源故障數(shù)據(jù)融合分析方法,構(gòu)建于COMTRADE模型,采用集對(duì)分析方法有效整合可靠數(shù)據(jù)信息,利用BF算法進(jìn)行電力數(shù)據(jù)融合,此方法有效提升了數(shù)據(jù)分析時(shí)間,但是分析的準(zhǔn)確性不佳。王萍等[7]提出基于云計(jì)算的電力大數(shù)據(jù)分析系統(tǒng),通過(guò)云計(jì)算方法分析電力企業(yè)業(yè)務(wù)能力,給出對(duì)應(yīng)的電力營(yíng)銷管理策略,有效解決電力,實(shí)現(xiàn)數(shù)據(jù)融合,但是此方法的營(yíng)銷分析結(jié)果準(zhǔn)確性低。
針對(duì)以上問(wèn)題,本文基于信息融合技術(shù),應(yīng)用多元回歸分析理念,針對(duì)電力營(yíng)銷數(shù)據(jù)設(shè)計(jì)一種新的多元回歸分析系統(tǒng),將不同條件下的數(shù)據(jù)融合到一起,通過(guò)多元回歸分析實(shí)現(xiàn)數(shù)據(jù)的整合處理。
本文設(shè)計(jì)的基于信息融合的電力營(yíng)銷數(shù)據(jù)多元回歸分析系統(tǒng)整體架構(gòu)包括平臺(tái)層、核心功能層、系統(tǒng)邏輯層和應(yīng)用層構(gòu)成。系統(tǒng)整體架構(gòu)結(jié)構(gòu)如圖1所示。
圖1 電力營(yíng)銷數(shù)據(jù)多元回歸分析系統(tǒng)整體架構(gòu)圖
該平臺(tái)以 MongoDB數(shù)據(jù)庫(kù)為主庫(kù),支持本體模型的持久化存儲(chǔ);以關(guān)系型數(shù)據(jù)庫(kù)為補(bǔ)充,實(shí)現(xiàn)了從原始科學(xué)研究信息到科學(xué)研究本體的過(guò)渡存儲(chǔ)。MongoDB用于與系統(tǒng)上層模塊交換數(shù)據(jù),負(fù)責(zé)與關(guān)系數(shù)據(jù)庫(kù)的數(shù)據(jù)交換工作,支持將源數(shù)據(jù)轉(zhuǎn)化為融合數(shù)據(jù)的過(guò)程?;谠频募軜?gòu)在平臺(tái)層上,使系統(tǒng)的可擴(kuò)展性更強(qiáng)[8-10]。
核心功能層包括系統(tǒng)所需的核心算法,如信息提取、聚類、分類、實(shí)體識(shí)別、重復(fù)名稱消除、網(wǎng)絡(luò)特征值計(jì)算等。在數(shù)據(jù)預(yù)處理過(guò)程中,主要采用信息提取和實(shí)體識(shí)別算法對(duì)數(shù)據(jù)進(jìn)行有用信息提取[11-12]。聚類分類算法和重復(fù)名稱消除歧義算法是數(shù)據(jù)融合的一部分,主要用于消除歧義。在信息挖掘過(guò)程中主要應(yīng)用了網(wǎng)絡(luò)特征值的計(jì)算[13]。
從系統(tǒng)整體上看,其操作流程為數(shù)據(jù)采集、數(shù)據(jù)預(yù)處理、本體構(gòu)建、信息融合、數(shù)據(jù)分析、可視化。
在完成電力營(yíng)銷數(shù)據(jù)多元回歸分析系統(tǒng)整體架構(gòu)設(shè)計(jì)后,設(shè)計(jì)系統(tǒng)硬件。系統(tǒng)硬件有信息管理模塊、數(shù)據(jù)管理模塊、報(bào)警模塊和電力營(yíng)銷數(shù)據(jù)管理模塊。系統(tǒng)硬件結(jié)構(gòu)如圖2所示。
在系統(tǒng)硬件結(jié)構(gòu)中,信息管理模塊是公共模塊,能夠管理數(shù)據(jù)信息,實(shí)現(xiàn)用戶管理,增強(qiáng)繼電保護(hù)裝置的自主保護(hù)性能,取得較高的電路安全性。信息管理模塊通過(guò)調(diào)節(jié)電力系統(tǒng)內(nèi)部的安全信息,將數(shù)據(jù)信息全部錄入轉(zhuǎn)化空間中并構(gòu)建電路數(shù)據(jù)傳輸通道,配置數(shù)據(jù)監(jiān)管裝置,時(shí)刻掌控此時(shí)的數(shù)據(jù)狀態(tài),并獲取精準(zhǔn)程度較高的初始繼電保護(hù)裝置數(shù)據(jù),提高操作的成功率,提升其電路安全性。
圖2 系統(tǒng)硬件結(jié)構(gòu)圖
信息管理模塊主要負(fù)責(zé)管理電力營(yíng)銷數(shù)據(jù)用戶信息、角色信息、片區(qū)管理、數(shù)據(jù)配置等。
數(shù)據(jù)管理模塊實(shí)現(xiàn)了對(duì)電力營(yíng)銷數(shù)據(jù)的管理,主要內(nèi)容:合同管理、租約管理、電費(fèi)管理、基站管理、電表管理。
預(yù)警模塊主要負(fù)責(zé)預(yù)警各類信息,所有的預(yù)警信息在生成后都會(huì)以短信的形式傳給負(fù)責(zé)人,達(dá)到及時(shí)提醒的目的。
電力營(yíng)銷數(shù)據(jù)管理模塊是系統(tǒng)的核心模塊,負(fù)責(zé)預(yù)估、監(jiān)控、分析、統(tǒng)計(jì)電量。
電量估算:根據(jù)各機(jī)房設(shè)備的實(shí)際情況,從理論上估算能耗。針對(duì)電力頻繁變化或受氣候影響的設(shè)備,采用靈活的電力估算公式及相關(guān)系數(shù),保證電力估算的智能化。
功率監(jiān)測(cè):在動(dòng)態(tài)環(huán)境監(jiān)測(cè)系統(tǒng)中,通過(guò)對(duì)裝有功率采集模塊的設(shè)備進(jìn)行實(shí)時(shí)的功率采集來(lái)實(shí)現(xiàn)功率監(jiān)測(cè)。
用電分析:分析用電消耗、實(shí)際用電量和理論用電量,以檢查設(shè)備老化、用戶偷電和其他情況,并為今后節(jié)能和減排提供決策依據(jù)。分析用電量以實(shí)現(xiàn)節(jié)能減排,通過(guò)科學(xué)合理地分析用電量,可以調(diào)查業(yè)主偷電行為和設(shè)備故障導(dǎo)致用電量過(guò)大的原因,從而實(shí)現(xiàn)節(jié)能減排。
用電統(tǒng)計(jì):對(duì)收集到的電量進(jìn)行統(tǒng)計(jì),包括日用電統(tǒng)計(jì)、月用電統(tǒng)計(jì)、年用電統(tǒng)計(jì)、隨時(shí)用電統(tǒng)計(jì)等。
對(duì)電力營(yíng)銷數(shù)據(jù)進(jìn)行信息融合,通過(guò)引入回歸分析方法對(duì)系統(tǒng)進(jìn)行優(yōu)化。首先,分析電力營(yíng)銷信息融合過(guò)程,具體融合過(guò)程如圖3所示。
圖3 電力營(yíng)銷信息融合過(guò)程
分析圖3可知,采集電力營(yíng)銷信息,通過(guò)數(shù)據(jù)關(guān)聯(lián)對(duì)原始電力營(yíng)銷信息進(jìn)行分析,并根據(jù)電力營(yíng)銷信息的不同類別進(jìn)行融合,獲得新的電力營(yíng)銷數(shù)據(jù)。在此基礎(chǔ)給出電力營(yíng)銷數(shù)據(jù)功能模型如圖4所示。
根據(jù)圖4可知,通過(guò)傳感器對(duì)電力營(yíng)銷數(shù)據(jù)進(jìn)行校準(zhǔn),提取相關(guān)數(shù)據(jù)并對(duì)電力營(yíng)銷數(shù)據(jù)狀態(tài)進(jìn)行估計(jì),通過(guò)模式識(shí)別獲得電力營(yíng)銷數(shù)據(jù)中更加細(xì)致的信息。通過(guò)信息融合的功能模型,引入回歸分析方法對(duì)系統(tǒng)進(jìn)行優(yōu)化。工作流程如圖5所示。
圖4 信息融合的電力營(yíng)銷數(shù)據(jù)分析系統(tǒng)功能模型
圖5 電力營(yíng)銷數(shù)據(jù)多元回歸分析流程
利用挖掘算法篩選數(shù)據(jù),篩選過(guò)程如下:
(1) 通過(guò)低密度區(qū)域分割電力營(yíng)銷數(shù)據(jù)。分割計(jì)算過(guò)程如下:
nd=(v-b1)nr
(1)
其中,v表示研究的電力營(yíng)銷數(shù)據(jù)所屬空間的數(shù)目,b1表示在低密度下電力營(yíng)銷數(shù)據(jù)的對(duì)象子區(qū)域空間,nr表示電力營(yíng)銷數(shù)據(jù)所處節(jié)點(diǎn)的值域。
(2) 電力營(yíng)銷數(shù)據(jù)的分割是在低密度下分割的,在完成分割后,從高密度中顯示出來(lái)。高密度的屬性值與低密度不同,低密度的屬性值為φ,高密度的屬性值為δ,在高密度對(duì)象區(qū)域,電力營(yíng)銷數(shù)據(jù)的表現(xiàn)式為
(2)
其中,a1表示在高密度下電力營(yíng)銷數(shù)據(jù)的對(duì)象子區(qū)域空間。
(3) 在綜合分析低密度和高密度電力營(yíng)銷數(shù)據(jù)的表達(dá)式后,對(duì)電力營(yíng)銷數(shù)據(jù)進(jìn)行聚類,得到聚類公式為
ni=p(nd+ng)i
(3)
其中,i表示所處理的電力營(yíng)銷數(shù)據(jù),由此實(shí)現(xiàn)電力營(yíng)銷聚類數(shù)據(jù)篩選值后,在樣本數(shù)據(jù)中選擇屬性最高的數(shù)據(jù),總結(jié)成數(shù)據(jù)集,如果數(shù)據(jù)集滿足特殊條件執(zhí)行下一步。
在篩選系統(tǒng)營(yíng)銷數(shù)據(jù)后進(jìn)行多元回歸處理?;貧w過(guò)程如下:
(1) 根據(jù)數(shù)據(jù)結(jié)構(gòu)構(gòu)建矩陣,矩陣表示為A:
(4)
矩陣A是t×p形式的相異度矩陣,t泛指矩陣的電力營(yíng)銷數(shù)據(jù)對(duì)象,p代表該對(duì)象所對(duì)應(yīng)的屬性。
(2) 根據(jù)度量值和絕對(duì)平均值進(jìn)行標(biāo)準(zhǔn)化處理,進(jìn)而得到絕對(duì)偏差值為
(5)
其中,mf表示絕對(duì)平均值,sf表示絕對(duì)偏差值,f表示數(shù)據(jù)對(duì)象之間的差異。與其他數(shù)值相比,絕對(duì)偏差值的魯棒性更好,這樣可以更好地避免異常數(shù)據(jù)而帶來(lái)的降低效果。
(3) 在實(shí)現(xiàn)上述標(biāo)準(zhǔn)化處理后,確定不同電力營(yíng)銷數(shù)據(jù)類型之間的相似程度,尋找不同對(duì)象之間的距離?;貧w分析距離公式為
(6)
式中,d(i,j)表示分析的不同電力營(yíng)銷數(shù)據(jù)多元回歸分析對(duì)象之間的距離:如果d(i,j)的數(shù)值是0,則2個(gè)對(duì)象之間是具有對(duì)稱性的;如果d(i,j)的數(shù)值不為0,則2個(gè)對(duì)象之間不具備對(duì)稱性,對(duì)象具備相異性,計(jì)算式為
W=d(i,j)×ki
(7)
其中,ki表示需要進(jìn)行回歸分析的數(shù)據(jù)量,W表示多元回歸分析結(jié)果。
為驗(yàn)證基于信息融合的電力營(yíng)銷數(shù)據(jù)多元回歸分析系統(tǒng)的可行性和操作效果,設(shè)定實(shí)驗(yàn),選取電力營(yíng)銷數(shù)據(jù)分析網(wǎng)站(https:// yq. aliyun. com/zt/437092)得到電力營(yíng)銷數(shù)據(jù)回歸分析測(cè)試所需實(shí)驗(yàn),在確定重要參數(shù)即權(quán)重系數(shù)和聚類數(shù)目之后,探討本文研究的多元回歸分析系統(tǒng)的分析效果:如果分析結(jié)果顯示聚類數(shù)目小于聚類樣本的總數(shù)量,則表明數(shù)據(jù)分析是無(wú)意義的;若聚類的數(shù)量等于1,表示該數(shù)據(jù)多元回歸很有意義。權(quán)值指標(biāo)是數(shù)據(jù)多元回歸分析的重要參數(shù),參量過(guò)大,分析效果不好,因此,必須保證權(quán)值指標(biāo)一直在合理范圍之內(nèi)。選擇的電力營(yíng)銷數(shù)據(jù)數(shù)值如表1所示:
對(duì)表1中的電力營(yíng)銷數(shù)據(jù)進(jìn)行多元回歸分析,回歸分析過(guò)程如圖6所示。
根據(jù)圖6可知,實(shí)驗(yàn)過(guò)程如下:
(1) 對(duì)電力營(yíng)銷數(shù)據(jù)內(nèi)部的空缺值進(jìn)行填充,通過(guò)填充處理糾正內(nèi)部數(shù)據(jù),防止電力營(yíng)銷數(shù)據(jù)存在不一致。
(2) 將所有的電力營(yíng)銷數(shù)據(jù)源統(tǒng)一結(jié)合到一起,在一個(gè)相同的數(shù)據(jù)倉(cāng)庫(kù)中。
(3) 將數(shù)據(jù)倉(cāng)庫(kù)中的樣本數(shù)據(jù)轉(zhuǎn)換,并統(tǒng)一存放在數(shù)據(jù)庫(kù)中。
(4) 在進(jìn)行多元回歸分析之前,需要壓縮數(shù)據(jù),從而提高數(shù)據(jù)多元回歸的速度。
表1 電力營(yíng)銷數(shù)據(jù)數(shù)值
圖6 回歸分析過(guò)程
(5) 通過(guò)多元回歸消除電力營(yíng)銷數(shù)據(jù)內(nèi)部無(wú)關(guān)數(shù)據(jù)。
(6) 在決策樹(shù)下將數(shù)據(jù)轉(zhuǎn)換。
選擇本文研究的基于信息融合的電力營(yíng)銷數(shù)據(jù)多元回歸分析系統(tǒng)和傳統(tǒng)的基于數(shù)據(jù)融合的電力營(yíng)銷數(shù)據(jù)分析系統(tǒng)、基于COMTRADE模型的電力營(yíng)銷數(shù)據(jù)分析系統(tǒng)進(jìn)行對(duì)比實(shí)驗(yàn),得到的回歸分析用時(shí)結(jié)果如圖7所示。
圖7 回歸分析用時(shí)結(jié)果
分析圖7可知,不同方法下電力營(yíng)銷數(shù)據(jù)分析速度不同。當(dāng)實(shí)驗(yàn)次數(shù)為700次時(shí),基于COMTRADE模型系統(tǒng)的回歸分析用時(shí)為1.8 s,基于數(shù)據(jù)融合系統(tǒng)的回歸分析用時(shí)為1.65 s,所設(shè)計(jì)系統(tǒng)的回歸分析用時(shí)為0.8 s。所設(shè)計(jì)系統(tǒng)的回歸分析用時(shí)始終在1.0 s內(nèi),分析速度較快。由此可以證明,本文提出的信息融合電力營(yíng)銷數(shù)據(jù)的回歸分析能力更強(qiáng)。在此基礎(chǔ)上測(cè)試系統(tǒng)的分析精準(zhǔn)度,精準(zhǔn)度計(jì)算式為
(8)
其中,m表示多元回歸分析的電力營(yíng)銷數(shù)據(jù)數(shù)量,w表示實(shí)際的分析數(shù)量,w′表示預(yù)測(cè)的分析數(shù)量,Z表示分析結(jié)果精準(zhǔn)度。得到的實(shí)驗(yàn)結(jié)果如圖8所示。
圖8 分析結(jié)果精準(zhǔn)度
分析圖8可知,不同方法的分析精準(zhǔn)度不同。當(dāng)電力營(yíng)銷數(shù)據(jù)量為300 bit時(shí),COMTRADE模型分析系統(tǒng)的精準(zhǔn)度為58%,數(shù)據(jù)融合系統(tǒng)的精準(zhǔn)度為35%,所設(shè)計(jì)系統(tǒng)的精準(zhǔn)度為65%。所設(shè)計(jì)系統(tǒng)始終具有較高分析精度。這是由于本文在研究的過(guò)程中不斷提高分析數(shù)據(jù)的位置跟蹤力度,按照故障數(shù)據(jù)流動(dòng)曲線查找相應(yīng)的位置信息,利用相關(guān)程度較高的信息數(shù)據(jù)轉(zhuǎn)化不同的數(shù)據(jù)系統(tǒng),并整合具體的診斷信息,最終獲取較高的分析結(jié)果精準(zhǔn)度。
目前研究的電力營(yíng)銷數(shù)據(jù)信息多元回歸分析系統(tǒng)分析精準(zhǔn)度低,耗時(shí)過(guò)長(zhǎng),本文利用信息融合技術(shù)研究了一種新的電力營(yíng)銷數(shù)據(jù)多元回歸分析系統(tǒng)。根據(jù)實(shí)驗(yàn)結(jié)果可以得出以下結(jié)論:
(1) 所設(shè)計(jì)系統(tǒng)的回歸分析用時(shí)短,當(dāng)實(shí)驗(yàn)次數(shù)為700次時(shí),所設(shè)計(jì)系統(tǒng)的回歸分析用時(shí)僅為0.8 s。
(2) 所設(shè)計(jì)系統(tǒng)的分析精準(zhǔn)確較高,當(dāng)電力營(yíng)銷數(shù)據(jù)量為300 bit時(shí),所設(shè)計(jì)系統(tǒng)的精準(zhǔn)度為65%。