肖勇,馬喆非,羅鴻軒,石少青,胡珊珊
(1. 南方電網(wǎng)科學(xué)研究院,廣州510663; 2. 中國南方電網(wǎng)有限責(zé)任公司,廣州510663)
近年來,隨著消費(fèi)者對用電需求和用電質(zhì)量的日益提升,電網(wǎng)基礎(chǔ)設(shè)施正逐漸被一系列數(shù)字系統(tǒng)所取代,智能電網(wǎng)(smart grid,SG)應(yīng)運(yùn)而生。SG很大程度上提升了消費(fèi)者和能源供應(yīng)方(energy suppliers,ES)對電能檢測、控制和預(yù)測的能力,盡管SG的技術(shù)優(yōu)勢、社會(huì)效益明顯,但存在一些安全問題[1]。從早期的能源計(jì)費(fèi)開始,能源竊取一直是困擾ES的問題,目前已提出了多種預(yù)防能量盜竊檢測方案,以減少由非技術(shù)損失(non-technical losses, NTL)造成的經(jīng)濟(jì)損失[2 - 3]。由于SG先進(jìn)的計(jì)量基礎(chǔ)設(shè)施中配備的智能電表(smart meters,SM)會(huì)改變能源盜取的性質(zhì),即盜取者需要發(fā)起更復(fù)雜的網(wǎng)絡(luò)攻擊[4 - 5],很難再從物理系統(tǒng)進(jìn)行能源盜取,因此智能電表的普及能夠減少能量損耗,是一種有效的預(yù)防能量竊取措施[6 - 7]。
隨著通信技術(shù)的快速發(fā)展以及對網(wǎng)絡(luò)攻擊的日益關(guān)注,SM代替?zhèn)鹘y(tǒng)模擬儀表廣泛應(yīng)用于SG中,其能夠解決傳統(tǒng)儀表中存在的斷開、傾斜、倒轉(zhuǎn)等攻擊問題[8]。此外,ES通過利用高級量測體系(advanced metering infrastructure,AMI)數(shù)據(jù)的精細(xì)粒度,將事件與其他信息相關(guān)聯(lián),從而更準(zhǔn)確地識別NTL[9]。文獻(xiàn)[10]中采用博弈論檢測SG中的電量竊取,將能源盜取檢測問題看作欺詐消費(fèi)者與ES之間的能量損耗與檢測概率的博弈。然而,針對竊取者和ES制定效用函數(shù)以及潛在策略,仍然是一個(gè)具有挑戰(zhàn)性的問題。文獻(xiàn)[11]提出了一種基于上下分解法(lower-upper decomposition,LUD)的方案,構(gòu)造一個(gè)線性方程組用于評估消費(fèi)者的誠實(shí)系數(shù),同時(shí)確保消費(fèi)者的隱私。文獻(xiàn)[12]提出了一種基于預(yù)測模型的能量盜竊檢測方案,該模型基于配電系統(tǒng)的SM數(shù)據(jù)檢測NTL?,F(xiàn)有的NTL檢測方案主要的缺點(diǎn)是容易受到污染攻擊/非惡意因素的影響,并且高度依賴歷史數(shù)據(jù)集,需要大量的完整樣本進(jìn)行檢測分析,限制了其檢測率。
針對上述問題,提出了一種基于深度信念網(wǎng)絡(luò)與數(shù)據(jù)聚合模型的智能電表數(shù)據(jù)異常檢測方法,以克服與現(xiàn)有NTL檢測方案相關(guān)的技術(shù)問題。其創(chuàng)新點(diǎn)總結(jié)如下。
1)為了保證用戶數(shù)據(jù)傳輸中的隱私安全,當(dāng)SM向智能配變終端發(fā)送用戶用電特征數(shù)據(jù)時(shí),采用分布式數(shù)據(jù)模型對數(shù)據(jù)進(jìn)行聚合,以提高數(shù)據(jù)信息安全性;
2)引入深度信念網(wǎng)絡(luò)(deep believe network, DBN)將實(shí)測數(shù)據(jù)與期望數(shù)據(jù)進(jìn)行對比,更好地獲取數(shù)據(jù)特征,并且對數(shù)據(jù)進(jìn)行降維處理,以減少算法的計(jì)算時(shí)間,更快地獲得異常數(shù)據(jù);
3)智能配變終端將所有消費(fèi)者的SM從1到N進(jìn)行標(biāo)記,并將執(zhí)行數(shù)據(jù)經(jīng)過深度信念網(wǎng)絡(luò)提取特征傳送至電表能量管理系統(tǒng),檢查并更換了故障或受損的SM,能夠獲得更精確的NTL檢測分析。所提方法能靈活地實(shí)現(xiàn)智能電表數(shù)據(jù)缺陷異常檢測,并提高了能源/電表不規(guī)則檢測的實(shí)用性,相對于傳統(tǒng)檢測方法具有更高的準(zhǔn)確率。
在AMI中,電氣和通信流是雙向的,且彼此重疊。SG中的AMI和電氣網(wǎng)絡(luò)架構(gòu)如圖1所示。
圖1 AMI和電氣網(wǎng)絡(luò)架構(gòu)Fig.1 AMI and electrical network architecture
其中,先進(jìn)的AMI是一個(gè)集成的框架,其中包括智能電表、智能配變終端、電表數(shù)據(jù)計(jì)量管理系統(tǒng)(meter data management system , MDMS)和各種通信網(wǎng)絡(luò),將收集的數(shù)據(jù)集成到軟件平臺和接口中[13]。AMI由兩種類型的網(wǎng)絡(luò)組成,即鄰域網(wǎng)(neighborhood area network,NAN)和廣域網(wǎng)(wide area network,WAN),其中,NAN安裝在用戶側(cè),由智能配變終端和通信網(wǎng)絡(luò)中的智能電表組成;WAN將智能配變終端連接到運(yùn)營中心。MDMS是管理系統(tǒng)的核心模塊,監(jiān)視分發(fā)系統(tǒng),負(fù)責(zé)SG的數(shù)據(jù)分析、維護(hù)和操作。
在配電站房中安裝用于數(shù)據(jù)收集的智能配變終端,以測量在ti時(shí)間內(nèi)流經(jīng)站房所有用戶的用電量,用sti表示總電量。為了統(tǒng)計(jì)每個(gè)用戶n∈{1,2,…,N}的電量損耗,在每個(gè)用戶的屋內(nèi)安裝具有網(wǎng)絡(luò)接口的數(shù)字SM,第n個(gè)SM在ti時(shí)間間隔內(nèi)消耗的電量計(jì)為qti,n。
由于實(shí)際大多數(shù)低壓配電網(wǎng)都是放射狀的,NAN放射狀拓?fù)浣Y(jié)構(gòu)如圖2所示,其中葉節(jié)點(diǎn)(即消費(fèi)者和電損耗)連接到根節(jié)點(diǎn)(即配電站房)。
由于有功功率是可加的,根節(jié)點(diǎn)提供給NAN的總能量是所有葉子節(jié)點(diǎn)在時(shí)間間隔ti用電量之和,為:
(1)
式中:λ為技術(shù)損失;θ和γ分別為由于能量盜竊和故障SM造成的不準(zhǔn)確儀表讀數(shù)。
圖2 NAN拓?fù)浣Y(jié)構(gòu)Fig.2 NAN topology
假設(shè)能源消費(fèi)者通過損壞SM以偽造電表讀數(shù)并降低其能源成本。廣泛地說,存在各種已知能源欺詐技術(shù)從電網(wǎng)竊取能量,大致分為3類,即物理攻擊、網(wǎng)絡(luò)攻擊和數(shù)據(jù)攻擊[14 - 15],其中,數(shù)據(jù)攻擊可通過網(wǎng)絡(luò)和物理攻擊來實(shí)現(xiàn)。
表1 SM的可能狀態(tài)Tab.1 Possible status of SM
表1中總結(jié)了5種電表能量異常狀況。c1為消費(fèi)者如實(shí)上傳電表實(shí)際讀數(shù);c2為消費(fèi)者按恒定百分比縮放SM讀數(shù);c3為某些消費(fèi)者僅在某些時(shí)段內(nèi)竊取能量;c4為SM僅在特定時(shí)間段內(nèi)發(fā)送零讀數(shù)或沒有測量值;c5為假定有缺陷的SM一直上傳的數(shù)值超過相應(yīng)消費(fèi)者實(shí)際消費(fèi)的數(shù)值。
所提方法通過SM上傳的數(shù)據(jù)進(jìn)行能源竊取和缺陷異常的檢測。其中,利用數(shù)據(jù)聚合模型將分布式電表的數(shù)據(jù)匯聚于智能配變終端,并上傳至MDMS。MDMS利用DBN獲取數(shù)據(jù)的特征,以明確異常的智能電表。
考慮由N個(gè)消費(fèi)者組成的集合,令qti和sti分別表示消費(fèi)者n和智能配變終端在時(shí)間間隔ti∈T={t1,t2,…,tT}內(nèi)記錄的實(shí)時(shí)能耗,為每個(gè)消費(fèi)者定義一個(gè)異常系數(shù),設(shè)為an, 如果消費(fèi)者的電量是準(zhǔn)確的,則an=0, 任何非零的an表示存在數(shù)據(jù)異常的狀況。為估算由技術(shù)損失的電量,引入因子kti, 技術(shù)損失量λ與比例系數(shù)kti、sti成正比,表示如下。
λ=ktisti
(2)
在NAN中,ES測得的總負(fù)荷消耗與SM中記錄的能量之和可表示為:
(a1+1)qti,1+(a2+1)qti,2+…+(aN+1)qti,N+ktisti=sti
(3)
式(3)可整理為:
(4)
在NAN中,如果既沒有能源竊取也沒有電表故障,能量供應(yīng)方提供的總功率應(yīng)與在每個(gè)時(shí)間間隔測量的計(jì)量用戶的能耗之和大致相同[16]。
對于式(1),對于θ>0(即存在能量竊取)且γ<0(即至少一個(gè)SM存在故障)的情況,在時(shí)間ti時(shí)抄表的誤差,以yti表示為[17]:
(5)
式中:λ=ktisti>0表示NAN中存在技術(shù)誤差。
假設(shè)在一天T個(gè)時(shí)間間隔內(nèi)對電量消耗進(jìn)行采樣[18],用于檢測電表能量竊取和故障缺陷的線性方程組可表示為:
(6)
式(6)可用于評估每個(gè)消費(fèi)者的異常行為或每個(gè)家庭所擁有的SM的可靠性。
深度信念網(wǎng)絡(luò)是由多個(gè)RBM疊加合成的深度學(xué)習(xí)網(wǎng)絡(luò)。該網(wǎng)絡(luò)通過對RBM一層層的訓(xùn)練,下層RBM的輸出作為上層RBM的輸入,在DBN的最后一層設(shè)置BP神經(jīng)網(wǎng)絡(luò),用來接收RBM訓(xùn)練后的特征數(shù)據(jù)。由于每一層RBM的訓(xùn)練都只能保證自身的最優(yōu),因此一層一層訓(xùn)練也無法保證全局最優(yōu),BP神經(jīng)網(wǎng)絡(luò)能夠?qū)⒌玫降臄?shù)據(jù)與期望數(shù)據(jù)對比,并進(jìn)行自頂層向下的調(diào)整從而優(yōu)化訓(xùn)練結(jié)果[19 - 20]。
另外,DBN還可作為數(shù)據(jù)的降維工具,將高維的輸入向量X∈Rn×d通過DBN 進(jìn)行壓縮提取后,輸出低維的特征向量Y∈Rn×s, 其中s SM向智能配變終端發(fā)送用戶的用電數(shù)據(jù),會(huì)對用戶的隱私造成威脅,為了保證用戶的隱私安全,采用分布式的數(shù)據(jù)聚合模型將數(shù)據(jù)聚合,如圖3所示。 圖3 分布式數(shù)據(jù)聚合模型Fig.3 Distributed data aggregation model 分布式數(shù)據(jù)聚合模型包括SM和智能配變終端(聚合器),SM用于測量家庭用電數(shù)據(jù),并把數(shù)據(jù)傳輸給智能配變終端。智能配變終端匯集SM傳送的數(shù)據(jù)并進(jìn)行加密,在規(guī)定的時(shí)間間隔內(nèi)傳送至MDMS,MDMS作進(jìn)一步用戶用電費(fèi)用的統(tǒng)計(jì)或電能負(fù)載平衡分析。 區(qū)域A中的SM既可以向聚合器n發(fā)送用電數(shù)據(jù),也可以向聚合器p發(fā)送用電數(shù)據(jù);區(qū)域B、C中的SM由兩個(gè)聚合器負(fù)責(zé)搜集數(shù)據(jù);區(qū)域D中的SM則可以向任意一個(gè)聚合器發(fā)送數(shù)據(jù),由聚合器和智能電表之間的多對多的關(guān)系實(shí)現(xiàn)了用電數(shù)據(jù)的分布式存儲(chǔ)。 (7) 則可以形成用于檢測異常系數(shù)變化的算式如式(8)所示: (8) 為了檢測電量竊取者以不同速率竊取能量的情況,將根據(jù)特定時(shí)間間隔ti在更長的時(shí)間內(nèi)分析消費(fèi)者報(bào)告的SM讀數(shù),直到計(jì)算出的值收斂為止。 基于異常系數(shù)和損耗因子的值,智能配變終端可以查明能量轉(zhuǎn)移和/或故障SM的位置和周期以及估算NTL的百分比[23]?;贒BN和數(shù)據(jù)聚合模型的SM異常檢測方法如圖4所示。 圖4 SM異常檢測方法流程圖Fig.4 Flow chart of SM anomaly detection method 步驟1:SM將用戶用電數(shù)據(jù)傳至智能配變終端,利用數(shù)據(jù)聚合模型對數(shù)據(jù)進(jìn)行匯總并作加密處理,確保區(qū)域內(nèi)用戶的隱私安全。 步驟2:智能配變終端將區(qū)域內(nèi)的數(shù)據(jù)傳送至MDMS,MDMS利用深度信念網(wǎng)絡(luò)算法計(jì)算異常系數(shù),用于提取數(shù)據(jù)特征,獲得更精確的NTL檢測分析。 步驟3:根據(jù)提取的數(shù)據(jù)特征與降維處理后的數(shù)據(jù),計(jì)算總供電量與每天用戶報(bào)告的能耗之和間的匹配失衡,以查找異常數(shù)據(jù),從而找出數(shù)據(jù)異常的電表。 實(shí)驗(yàn)中SM的時(shí)間粒度為15 min,其記錄的測量非常準(zhǔn)確,其中的誤差模型通常由零相關(guān)且標(biāo)準(zhǔn)偏差為0的白色不相關(guān)噪聲構(gòu)建。因此,為進(jìn)一步驗(yàn)證所提方法的性能,將測量誤差設(shè)定如下: (9) 長時(shí)間觀察計(jì)量數(shù)據(jù)會(huì)增加約束條件數(shù)量,也進(jìn)一步提高了NTL檢測分析的準(zhǔn)確性。一旦檢測到可疑用戶,將會(huì)在很長時(shí)間內(nèi)持續(xù)監(jiān)視其電表數(shù)據(jù),直到計(jì)算出異常系數(shù),以派遣技術(shù)人員進(jìn)行現(xiàn)場檢查。 考慮部分能源竊取者僅在一天的特定時(shí)間段內(nèi)欺騙其能源報(bào)告,即針對5個(gè)用戶設(shè)置不同的能量竊取/故障情況,并且提取其30 d的能耗數(shù)據(jù)(即D=30)進(jìn)行統(tǒng)計(jì)分析,其中異常的最短時(shí)間取決于SM的時(shí)間粒度(15 min)。統(tǒng)計(jì)結(jié)果如圖5所示。 圖5 5個(gè)用戶在不同電表異常狀況下的異常系數(shù)Fig.5 Abnormal coefficients of 5 users under different abnormal conditions of electricity meters 從圖5中可看出,有2個(gè)能量竊取者和1個(gè)故障SM。具體來說,用戶4和5的SM一直存在能量竊取行為,而用戶1的SM始終處于故障狀態(tài)。同時(shí),用戶2篡改SM以從第20個(gè)時(shí)隙到第37個(gè)時(shí)隙低報(bào)能耗,而用戶3僅在一天的第18至第36個(gè)時(shí)間間隔內(nèi)竊取電量。 如果用戶數(shù)量增加至10,也可得到相似的結(jié)果,如圖6所示,其中提取150 d的能耗數(shù)據(jù)(即D=150),以解決較大服務(wù)區(qū)域中變化的能量竊取問題。 從圖6可以看出,用戶4的能源消耗從15日到19日低報(bào)了60%,用戶6的SM從35日到39日異常系數(shù)減少了50%,因此即使在間歇時(shí)間也能檢測出能量竊取者。結(jié)果還表明,該方法能夠根據(jù)少量消費(fèi)者的功耗數(shù)據(jù)樣本檢測出能量竊取或者損耗的電量,而與技術(shù)損失(technical loss,TL) /噪聲的存在無關(guān),因?yàn)門L/噪聲對數(shù)據(jù)的影響是穩(wěn)定、持續(xù)的,圖6中的異常系數(shù)曲線不存在這一特征。 圖6 10個(gè)用戶在不同電表異常狀況下的異常系數(shù)Fig.6 Abnormal coefficients of 10 users under different abnormal conditions of electricity meters 綜上所示,通過數(shù)據(jù)的異常系數(shù)分析,可檢測出智能電表中能量竊取與缺陷異常的情況,由此論證了所提方法的有效性。 實(shí)驗(yàn)中采用準(zhǔn)確度這一指標(biāo)評估各方法的性能,其中實(shí)驗(yàn)數(shù)據(jù)是從UCI機(jī)器學(xué)習(xí)庫網(wǎng)站下載的多維真實(shí)基于消費(fèi)者的良性消費(fèi)數(shù)據(jù)。準(zhǔn)確度包含了檢測率、誤檢率和召回率。 針對SM能量竊取方面的檢測,將所提方法與文獻(xiàn)[10 - 12]中的方法在準(zhǔn)確度方面進(jìn)行對比,結(jié)果如圖7所示。 從圖7中可看出,文獻(xiàn)[10 - 11]隨著異常維度的增加變化平穩(wěn),且檢測率和召回率穩(wěn)步提升,誤檢率平穩(wěn)下降。所提方法在高維度異常情況下檢測率明顯高于其他方法,檢測率接近100%,誤檢率區(qū)域0,且保持較高的召回率。由此可論證,所提方法在能量竊取方面檢測的準(zhǔn)確率高于其他方法。 圖7 不同異常維度下SM能量竊取檢測的準(zhǔn)確度Fig.7 Accuracy of SM energy theft detection under different abnormal dimensions 針對SM缺陷異常方面的檢測,將所提方法與文獻(xiàn)[10 - 12]中的方法在準(zhǔn)確度方面進(jìn)行對比,結(jié)果如圖8所示。 圖8 不同異常維度下SM缺陷異常檢測的準(zhǔn)確度Fig.8 Accuracy of SM defect anomaly detection in different anomaly dimensions 從圖8中可看出,相比于其他方法,所提方法的檢測率最高,尤其是在高維度條件下,接近100%。文獻(xiàn)[10]和所提方法的誤檢率隨著維度的上升呈直線下降,但所提方法的誤檢率更低,接近于0。所提方法的召回率較高,由此論證了其在電表異常檢測方面的準(zhǔn)確度高于其他方法。 此外檢測時(shí)間也是衡量其性能的一個(gè)重要指標(biāo),所提方法與文獻(xiàn)[10 - 12]中方法在異常檢測時(shí)間方面的對比結(jié)果如圖9所示。 圖9 不同方法的檢測時(shí)間對比Fig.9 Comparison of detection time of different methods 從圖9中可以看出,隨著用戶數(shù)量的增加,檢測時(shí)間會(huì)隨之增長,但相比于其他方法,所提方法的檢測時(shí)間最短。由于所提方法對分布式數(shù)據(jù)進(jìn)行聚合處理,批量處理能夠縮短檢測的時(shí)間。 基于深度信念網(wǎng)絡(luò)和數(shù)據(jù)聚合模型的智能電表數(shù)據(jù)異常檢測方法,能夠識別進(jìn)行能源盜竊的消費(fèi)者,并找出故障缺陷,以減少由于能源竊取和智能電網(wǎng)中的設(shè)備缺陷而導(dǎo)致的成本和收入損失。該方法把智能電表的偷竊能量建模為異常系數(shù),任何非零的異常系數(shù)都表示能量竊取或故障缺陷。利用數(shù)據(jù)聚合模型將電表數(shù)據(jù)傳至智能配變終端,確保用戶隱私安全,基于深度信念網(wǎng)絡(luò)提取數(shù)據(jù)特征,以獲得異常數(shù)據(jù),低維度的計(jì)算模式減少了檢測時(shí)間。該法能夠基于少量消費(fèi)者的功耗數(shù)據(jù)樣本檢測能量盜竊/損耗的數(shù)量,而與技術(shù)損失和消費(fèi)者類型無關(guān),顯著提高了異常檢測的準(zhǔn)確度。 但所提方法是基于能量平衡分析檢測NTL,無法檢測逃避余量檢查的竊取攻擊,即能量竊取者通過物理方式盜用其他用戶的電能,以規(guī)避自身SM的異常檢測。因此,將針對此類異常檢測作進(jìn)一步的探究。3.3 數(shù)據(jù)聚合模型
3.4 基于DBN和數(shù)據(jù)聚合模型的SM異常檢測方法
4 實(shí)驗(yàn)結(jié)果與分析
4.1 變化的異常系數(shù)
4.2 與其他方法的對比分析
5 結(jié)論