郭治遠(yuǎn) ,李志勇 ,邵潔 ,黃婷,周歡 ,范帥,何光宇
(1.電力傳輸與功率變換控制教育部重點實驗室(上海交通大學(xué)),上海市 200240;2.上海交通大學(xué)電子信息與電氣工程學(xué)院,上海市 200240;3.國網(wǎng)上海浦東供電公司張江科學(xué)城能源服務(wù)中心,上海市 201210;4.國網(wǎng)上海市電力公司電力調(diào)度控制中心,上海市 200122)
用電側(cè)是智能電網(wǎng)的重要組成部分,包含多類電器設(shè)備,產(chǎn)生的數(shù)據(jù)量巨大。目前基于物聯(lián)網(wǎng)技術(shù)將海量電器負(fù)荷聚合形成的智能用電網(wǎng)絡(luò)已具備可觀的產(chǎn)業(yè)規(guī)模。在此背景下,將負(fù)荷辨識技術(shù)和智能用電網(wǎng)絡(luò)的主動控制手段結(jié)合起來,對內(nèi)可促進(jìn)需求側(cè)安全、經(jīng)濟(jì)運行,對外可作為虛擬電廠參與電力系統(tǒng)調(diào)節(jié),促進(jìn)新能源消納,有效推動國家“雙碳”目標(biāo)的實現(xiàn)。
智能用電網(wǎng)絡(luò)是由智慧網(wǎng)關(guān)及其管轄的插座、開關(guān)等終端組成的用電側(cè)管理系統(tǒng)[1],相關(guān)產(chǎn)業(yè)技術(shù)日趨成熟、市場規(guī)模巨大,目前智能控制產(chǎn)品市場已達(dá)200 億元以上[2]?;谥悄苡秒娋W(wǎng)絡(luò)的負(fù)荷辨識能夠提供監(jiān)、管、控一體的閉環(huán)管理,是以直接控制負(fù)荷為手段的需求側(cè)管理的先決條件[3],能夠為違禁電器檢測、故障自動診斷等應(yīng)用提供信息基礎(chǔ)[4],具有重要的研究價值。
目前,電器負(fù)荷的狀態(tài)辨識暫無統(tǒng)一的定義,在非侵入式負(fù)荷監(jiān)測領(lǐng)域,較常用的定義包括兩類:1)將功率數(shù)據(jù)聚類產(chǎn)生的類別作為電器狀態(tài)[5-6];2)視電器功率每1 W 為一檔,每個檔位為一個狀態(tài)[7]。然而,這些定義常適用于能量分解,不能明確地反映電器實際的運行工況。在設(shè)備故障與健康監(jiān)測研究中,電器狀態(tài)則往往指電器的退化或健康狀態(tài)[8],一般針對特定設(shè)備,缺乏通用性。其他關(guān)于電器狀態(tài)的定義還有:光、聲、電等信息反映出的電器具體動作狀態(tài)[9];暫態(tài)層面家用負(fù)荷啟動及關(guān)閉的數(shù)據(jù)形態(tài)[10]。以上定義均不能從易于量測的功率數(shù)據(jù)中挖掘電器的運行工況,為狀態(tài)這一含義的擴(kuò)展應(yīng)用帶來了局限性。
在負(fù)荷類型辨識方面,文獻(xiàn)[11]采用Bagging、Boosting 等多種方法對辦公環(huán)境下的插座負(fù)荷類型進(jìn)行在線識別,文獻(xiàn)[12]提取了功率、使用時間和地點等19 種特征,采用隨機(jī)森林方法對插座類型進(jìn)行識別,其插座負(fù)荷辨識采用了多分類視角,且特征提取選取了數(shù)據(jù)的統(tǒng)計特征,導(dǎo)致擴(kuò)展性較差。在非侵入式負(fù)荷監(jiān)測領(lǐng)域,文獻(xiàn)[13]對高頻場景下的負(fù)荷投切采用模擬退火方法進(jìn)行特征提取并利用貝葉斯算法進(jìn)行分類,文獻(xiàn)[14]對低頻數(shù)據(jù)使用多特征融合及隱馬爾可夫模型(hidden Markov model,HMM)實現(xiàn)類型辨識及能量的分解,但采用的前向算法需依賴較長一段時間的跟蹤。智能用電網(wǎng)絡(luò)數(shù)據(jù)采集周期在秒級以上,而非侵入的方式在低頻場景更多關(guān)注于負(fù)荷能量的正確分解,對類型的辨識難以同時兼顧實時性和準(zhǔn)確率,同時可擴(kuò)展性的討論也相對較少。
鑒于此,本文提出改進(jìn)分段算法并結(jié)合隱馬爾可夫模型識別具有漸變特征的電器狀態(tài)功率數(shù)據(jù),實現(xiàn)識別狀態(tài)與電器工況的對應(yīng);在低頻數(shù)據(jù)場景實現(xiàn)接入2 min 即可準(zhǔn)確辨識電器類型,并通過單分類視角,結(jié)合特殊工況的特征提取手段以及未知負(fù)荷的增量辨識方法加強(qiáng)算法的可擴(kuò)展性。實證表明,所提方法對于負(fù)荷的類型和工況狀態(tài)能夠準(zhǔn)確、快速地進(jìn)行識別。
智能用電網(wǎng)絡(luò)一般特指基于高級量測體系(advanced metering infrastructure,AMI)的用電側(cè)能源管理系統(tǒng),其典型網(wǎng)絡(luò)拓?fù)淇煞譃楦兄獙?、傳輸層、平臺層與應(yīng)用層,如圖1 所示。其中,感知層包含了插座、開關(guān)、紅外遙控等具備量測與控制功能的智能終端;傳輸層一般為網(wǎng)關(guān)或協(xié)調(diào)器,用于聚合底層各終端設(shè)備,并與平臺和應(yīng)用層進(jìn)行交互。智能用電網(wǎng)絡(luò)旨在為用戶提供智能化的用電服務(wù),以及對需求側(cè)進(jìn)行管理[15]。
智能用電網(wǎng)絡(luò)通常以自趨優(yōu)的節(jié)能或安全用電作為實施目標(biāo)。自趨優(yōu)控制的先決條件即為網(wǎng)關(guān)自主辨識所轄負(fù)荷類型和運行狀態(tài),繼而基于評價模型來調(diào)節(jié),該過程隱含了量測—辨識—控制—量測的閉環(huán)管理[16]。智慧網(wǎng)關(guān)先基于來自智能插座的負(fù)荷數(shù)據(jù)進(jìn)行快速負(fù)荷類型和狀態(tài)辨識,再結(jié)合辨識結(jié)果和運行數(shù)據(jù)對電器進(jìn)行優(yōu)化控制,最后通過反饋的電器運行數(shù)據(jù)進(jìn)行下一次優(yōu)化控制,這樣循環(huán)直至滿足停止條件?;诖?智能用電網(wǎng)絡(luò)中的負(fù)荷辨識具有如下挑戰(zhàn):
1)以實現(xiàn)控制為目標(biāo):辨識的目標(biāo)是為后續(xù)的負(fù)荷控制提供信息基礎(chǔ),因此需建立電器類型、接入插座和運行狀態(tài)之間的強(qiáng)映射關(guān)系。
2)低頻場景下的準(zhǔn)確率要求:智能插座的采樣頻率通常不高,為1/60~1 Hz,需在低頻的數(shù)據(jù)條件下保證負(fù)荷辨識準(zhǔn)確率,避免錯誤的控制。
3)實時性要求:優(yōu)化控制要求負(fù)荷類型和狀態(tài)辨識具有高時效性,否則將失去控制的意義。
綜上所述,在低頻場景下,以智能電表數(shù)據(jù)為基礎(chǔ)的非侵入式負(fù)荷辨識技術(shù)并不完全適用于智能用電網(wǎng)絡(luò)的閉環(huán)管理控制體系,特別是在房間內(nèi)有多臺相同類型電器時無法明晰具體哪個電器需調(diào)控,這增加了智慧網(wǎng)關(guān)自趨優(yōu)式控制的難度。因此,本文提出了適用于智能用電網(wǎng)絡(luò)的電器負(fù)荷辨識方法及其技術(shù)架構(gòu)。
智能用電網(wǎng)絡(luò)是以事件驅(qū)動方式進(jìn)行量測數(shù)據(jù)上傳的[16],即在智能插座內(nèi),當(dāng)前量測結(jié)果與上一時間周期的量測結(jié)果產(chǎn)生一定變化后再進(jìn)行上報,該方式實現(xiàn)了動態(tài)可變的精準(zhǔn)數(shù)據(jù)采集和穩(wěn)定實時通信。因此,量測到的電器功率具有連續(xù)性,需先從連續(xù)數(shù)據(jù)點中對電器的接入或斷開進(jìn)行檢測,負(fù)荷辨識算法僅在電器接入時進(jìn)行。
基于該方式,將電器的工作周期定義為:在插座無負(fù)荷時,產(chǎn)生了事件則認(rèn)為電器已接入,當(dāng)檢測到功率持續(xù)接近0 一段時間時,認(rèn)為電器工作已結(jié)束,插座進(jìn)入無負(fù)荷狀態(tài),如此循環(huán)往復(fù)。基于該方法的負(fù)荷在線類型及狀態(tài)辨識流程如圖2 所示。
由圖2 可知,在首次事件產(chǎn)生后,可對每個事件突變發(fā)生點進(jìn)行負(fù)荷狀態(tài)序列辨識和更新;在電器接入后的2 min,可結(jié)合已有狀態(tài)序列進(jìn)行電器類型識別。實際應(yīng)用中一段數(shù)據(jù)的辨識過程如附錄A 中圖A1 所示。
圖2 事件驅(qū)動量測機(jī)制下的負(fù)荷在線辨識流程Fig.2 Load monitoring method based on event-driven multi-agent measurement mechanism
狀態(tài)感知的目標(biāo)是檢測當(dāng)前電器工作的運行工況,主要應(yīng)用在電器故障自動診斷和不可中斷工作環(huán)節(jié)的控制中。
2.2.1 電器工況的數(shù)據(jù)形態(tài)
電器工況的轉(zhuǎn)變一般可由功率數(shù)據(jù)出現(xiàn)不同趨勢和形態(tài)來表征,如附錄圖A1 和表A1 所示。常見電器工況的功率形態(tài)可分為以下2 種:1)平直片段,如圖3(a)所示的阻抗型電器;2)曲線片段,如圖3(b)、(c)所示的壓縮機(jī)功率、正溫度系數(shù)(positive temperature coefficient,PTC)熱敏電阻元件加熱啟動時的非恒溫工況[17],以及充電電池類電器恒壓或涓流浮充工況[18]。
圖3 電器功率數(shù)據(jù)形態(tài)Fig.3 Patterns of appliance power data
為此,可將實際電器的量測數(shù)據(jù)組合為不同形態(tài)功率片段序列。
式中:PMeasure為電器工作的量測曲線;為第i個功率片段。
2.2.2 基于改進(jìn)CUSUM的分段算法電器的運行工況?;陔p邊累積和(cumulative sum,CUSUM)算法[19]進(jìn)行判別,其通過累積統(tǒng)計量En判斷是否發(fā)生分段,如式(2)所示:
式中:xn為第n個點的量測值;μ0為上一異變點到當(dāng)前時刻的量測均值;β為可能存在的噪聲水平或穩(wěn)定閾值;或表示數(shù)據(jù)整體的分布向增大或減小偏移的累積量,當(dāng)En大于某一閾值H時判斷發(fā)生分段。
在該算法中,其弊端為難以劃分具備相同趨勢的數(shù)據(jù)段[20]。因此,本文做出如下改進(jìn):
1) 將累積量改為一階均差值xn=fdiff[PMeasure(t)],旨在刻畫累計的數(shù)據(jù)趨勢。
2)增加穩(wěn)定時間累積判據(jù),在趨勢累積判定異變點之外,當(dāng)xn<β,累積時間Tn超過一定閾值,也視作異變點。
3)改進(jìn)異變點判據(jù),當(dāng)且僅當(dāng)以下條件均滿足才視作產(chǎn)生異變點,式中sgn(·)為符號函數(shù),x0為上一異變點的一階均差值,TH為穩(wěn)定時間閾值:
以上改進(jìn)中,前兩個改進(jìn)點實現(xiàn)了將數(shù)據(jù)的增大、減小或平穩(wěn)時間進(jìn)行累積以判斷異變點,改進(jìn)點3)則避免了同一趨勢下的數(shù)據(jù)因閾值變化而導(dǎo)致的錯誤分段。
2.2.3 基于k-medoids 聚類和隱馬爾可夫模型的電器狀態(tài)參數(shù)刻畫
為實現(xiàn)電器工況的實時跟蹤,需對分段后的功率片段進(jìn)行對應(yīng)狀態(tài)的辨識。本文以隱馬爾可夫過程刻畫電器的狀態(tài)變遷,其過程如下:首先,在訓(xùn)練階段采用k-medoids 聚類方法對歷史數(shù)據(jù)中的同一狀態(tài)片段進(jìn)行聚合;然后,基于頻數(shù)統(tǒng)計法分別計算隱馬爾可夫模型中的各參量;最后,在實時辨識階段采用維特比算法進(jìn)行狀態(tài)序列的跟蹤。類似方法已在較多文獻(xiàn)中被提及[7],在此不過多贅述。
需要說明的是,對于HMM 模型參數(shù)中的觀測輸出概率,采用二元正態(tài)分布fGuassian-2d(·)進(jìn)行計算,統(tǒng)計量為:與擬標(biāo)準(zhǔn)曲線間的動態(tài)時間規(guī)劃距離fdtw(Pstandard,Pseg) 和持續(xù)時間Tseg,如式(4)所示。
式中:表示第t段狀態(tài);ot表示第t段觀測,即分段得到的功率片段;si為電器模型中的第i個狀態(tài);Pseg為當(dāng)前分段得到的功率片斷,表示由該狀態(tài)歷史數(shù)據(jù)擬合得到的標(biāo)準(zhǔn)曲線,如圖3(c)中紅線所示。
為充分考慮實際應(yīng)用,類型辨識需具備較好的擴(kuò)展性[21],具體體現(xiàn)在:
1)獨立性:未知電器負(fù)荷不影響已有類型的識別效果,所提技術(shù)路線是通過單分類模型實現(xiàn)的。
2)泛化性:同類但不同品牌的電器同樣能夠識別,所提技術(shù)路線是通過結(jié)合電器特有工作環(huán)節(jié)實現(xiàn)的。
3)自動擴(kuò)展性:接入的未知負(fù)荷能夠自主創(chuàng)建新的標(biāo)簽,所提技術(shù)路線是通過提出擴(kuò)展半徑的增量支持向量數(shù)據(jù)描述(incremental support vector data description,ISVDD)算法實現(xiàn)的。
2.3.1 單分類模型
在未經(jīng)特殊處理的有監(jiān)督多分類模型中,輸出結(jié)果必為某已知類。若接入新型電器負(fù)荷,則會產(chǎn)生誤識別現(xiàn)象,不滿足獨立性要求。其原因在于一般的多分類算法默認(rèn)樣本標(biāo)簽屬于訓(xùn)練集中的某一類,但該假設(shè)不適用于設(shè)備類型豐富的用戶側(cè)。
而在單分類模型中,單一電器模型僅判斷輸入樣本是否為自身類別,頂層分類器中的各單分類模型結(jié)果互不影響,因此可以不為任何一類。新負(fù)荷分類正確則全部輸出,否則辨識為未知電器,避免了誤識別現(xiàn)象,可滿足獨立性要求。因此,本文采用單分類支持向量數(shù)據(jù)描述方法(support vector data description,SVDD)[22]來解決此問題。
2.3.2 特征選取
不同品牌的同類電器可能在功率范圍上有所區(qū)別,且有時會具有不同的暫態(tài)特征。即便如此,同類電器卻無法避免存在類似的運行工況,例如,冰箱必然具有壓縮機(jī)工作這一工況。所以從這種特殊工況出發(fā),采用方差較大[23]的算法選取寬松的范圍,即可實現(xiàn)對不同品牌的同類電器辨識,解決泛化性要求。為此,本文提出基于特殊工況的特征選取方式,選取的特征如下:
1)特殊狀態(tài)統(tǒng)計特性:功率均值μstate、功率持續(xù)時間Tstate以及平均均差,即在本狀態(tài)Tstate持續(xù)時間內(nèi),累積功率的一階均差xk的絕對值并求平均。對同類電器的特殊工況,利用HMM匹配后,提取此狀態(tài)的統(tǒng)計特征作為分類屬性。
2) 狀態(tài)序列的觀測概率-log[p(Pmeasure|:該特征表示對于某類電器的HMM 模型,產(chǎn)生當(dāng)前量測數(shù)據(jù)的對數(shù)概率,這樣既能反映每個狀態(tài)是否得到正確匹配,又可驗證狀態(tài)彼此間的轉(zhuǎn)移是否符合電器模型。
取2 min 長度的電飯煲量測數(shù)據(jù),上述特征歸一化后的分布如圖4 所示。在選取典型研究[12]所述特征重要性最高、區(qū)分度最好的統(tǒng)計特征時,特征分布不僅存在與其他電器類別的交疊,而且品牌不同的2類電飯煲特征向量分離較遠(yuǎn)。而本文提出的特征中,在消除了與其他類別交疊的現(xiàn)象的同時電飯煲自身類別數(shù)據(jù)分布更加緊密。
圖4 電器功率數(shù)據(jù)特征分布對比Fig.4 Comparison of characteristic distribution of power data
2.3.3 擴(kuò)展半徑ISVDD 算法
新型電器負(fù)荷的擴(kuò)展需要以增量的方式處理無標(biāo)簽數(shù)據(jù),相關(guān)算法理論基礎(chǔ)較少,為此提出啟發(fā)式的擴(kuò)展半徑ISVDD 算法來實現(xiàn)對新接入的類別進(jìn)行自動標(biāo)注。對于未匹配到任何現(xiàn)有類別的負(fù)荷數(shù)據(jù),采用如下所示的額外流程處理。
1)構(gòu)建特征向量:取工作全過程的數(shù)據(jù)經(jīng)CUSUM 算法分段后,以每段數(shù)據(jù)的功率均值、持續(xù)時間、最大最小值構(gòu)建特征向量。
2)初始數(shù)據(jù)集建立:樣本量較少時無法進(jìn)行參數(shù)的訓(xùn)練,因此首先以范圍選取的方式積累同類的初始數(shù)據(jù)集。
式中:yj為第j個偽標(biāo)簽;為預(yù)測標(biāo)簽;為實測特征向量;為標(biāo)簽j全部樣本特征向量的中位數(shù),取每個維度元素的1/10;εj為判別范圍。
3)當(dāng)積累數(shù)據(jù)量達(dá)到10 條,擴(kuò)展半徑ISVDD 算法開始運行,流程如圖5 所示。
圖5 擴(kuò)展半徑ISVDD 算法Fig.5 Incremental support vector data description with extended radius algorithm
圖5 中,Xj表示偽標(biāo)簽類別j的全部樣本,fISVDD(·) 表示通過增量SVDD 算法[24]計算得到新半徑rt的函數(shù),D() 表示SVDD 算法定義的輸入樣本的球心距離。半徑的自動擴(kuò)展主要通過參數(shù)C、ρ和δ實現(xiàn)。C為初始半徑擴(kuò)展超參數(shù);ρ為小于1的衰減系數(shù),用于控制半徑收斂;δ為增量放大系數(shù),用于發(fā)現(xiàn)距當(dāng)前超球面較遠(yuǎn)的樣本時進(jìn)一步增大半徑。
區(qū)別于常規(guī)SVDD 僅將落在超球面內(nèi)的樣本劃分至自身類別,擴(kuò)展半徑ISVDD 算法中,對落在超球面附近的樣本,也視為自身類別,即增加擴(kuò)展半徑以增大判定范圍。同時,為避免其他類別與自身類別的樣本由于密度相連現(xiàn)象導(dǎo)致的超球面無限擴(kuò)展,在半徑更新階段利用小于1的衰減系數(shù)ρ來控制半徑收斂。
以實地部署的智能用電網(wǎng)絡(luò)及在線辨識系統(tǒng)進(jìn)行分析。插座采用 RN7211 芯片作為主芯片、CS5460C-ISZ 電能計量芯片作為采集芯片、CC2530 Zigbee 芯片作為通信模塊;網(wǎng)關(guān)除Zigbee 模塊外,采用Cortex-A7 作為CPU,并配置1 GB DDR3 作為內(nèi)存,8 GB EMMC 作為存儲設(shè)備,Mali400MP2 作為GPU,基于Linux 平臺進(jìn)行開發(fā);服務(wù)器采用IBM System x3550 M3 服務(wù)器。
各插座接入電飯煲、冰箱、電視、燒水壺、飲水機(jī)、空調(diào)這幾種電器進(jìn)行功率測量及識別,如附錄圖A3所示,數(shù)據(jù)經(jīng)過重采樣后精度為1 Hz。部分?jǐn)?shù)據(jù)如圖6 所示,各實驗中數(shù)據(jù)集的具體情況如附錄表A1、A2 所示。
圖6 本文建立的數(shù)據(jù)集Fig.6 The data set built in this paper
作為對照,選取了上述6 種不同品牌的電器進(jìn)行對比,以筆記本電腦、打印機(jī)、電磁爐等附加電器的功率數(shù)據(jù)作為未知電器組成補充數(shù)據(jù)集。相關(guān)數(shù)據(jù)詳見附錄圖A2 和附錄表A3。
采用滑動窗分段[25]和直接聚類[6]方法與所提改進(jìn)CUSUM 分段方法分別作用于電熱飯盒和電動汽車的電池,旨在驗證所提狀態(tài)劃分算法的準(zhǔn)確性,結(jié)果如圖7 所示。
由圖7 可知,所提改進(jìn)CUSUM 方法對漸變特征的工作環(huán)節(jié)辨識效果顯著好于聚類及滑動窗算法。在電熱飯盒啟動時,內(nèi)部PTC 電阻溫度不斷升高,功率逐漸下降,恒溫后功率保持恒定,滑動窗算法將升溫和恒溫階段劃分為了同一段,而聚類算法則將升溫階段劃分為三段,改進(jìn)CUSUM 算法做出了正確的劃分。對于電動汽車的電池充電,其平直段為恒流充電,下降段為恒壓充電,最后功率較低的平直段為涓流浮充,滑動窗算法混淆了恒流和恒壓階段,且將恒壓部分分為兩段,聚類算法對恒壓階段的檢測存在較大延遲,且誤分為兩段,改進(jìn)CUSUM 算法做出了正確劃分。
圖7 本文方法與滑動窗、聚類方法對比Fig.7 Comparison of segmentation results
進(jìn)一步,以F1 值和平均絕對誤差(mean-absolute error,MAE)作為量化指標(biāo),旨在說明準(zhǔn)確性和實時性,2 個指標(biāo)的計算方式如式(7)和式(9)所示。
式中:γF1為F1 值;TP為真正例,即實際為真且預(yù)測為真的樣本數(shù);FP為假正例,即實際為假而預(yù)測為真的樣本數(shù);FN為假反例,即實際為真而預(yù)測為假的樣本數(shù)。F1 值越大分段效果越好[26]。
式中:CP為出現(xiàn)的分段點總數(shù);P(i) -A(i)為預(yù)測分段點與實際分段點的間隔采樣數(shù)。MAE 越小表示分段延遲越少。
用改進(jìn)CUSUM 算法、滑動窗分段、直接聚類算法分別判定16 次電器運行的81 個分段點,F1 值和MAE 如表1 所示。
表1 分段效果對比Table 1 The result of segmentation
由表1 可知,所提的改進(jìn)CUSUM 算法的F1 值高于其他兩類算法,且檢測延遲MAE 更小,表明在準(zhǔn)確性和實時性上所提算法均優(yōu)于滑動窗算法和聚類算法。其原因在于改進(jìn)CUSUM 方法更符合以趨勢反映工況變化的特點。
以基于功率統(tǒng)計量特征的k 近鄰(k-nearest neighbor,KNN)和Bagging 方法[11]與所提的基于特殊工況特征的單分類算法進(jìn)行對比。評價指標(biāo)選取式(8)所示查準(zhǔn)率P與查全率R,查全率反映對本類電器的識別效率,查準(zhǔn)率反映對非本類電器數(shù)據(jù)能否有效過濾。
3.3.1 準(zhǔn)確率分析
將原始數(shù)據(jù)集以3∶1的方式劃分為訓(xùn)練集和測試集,基于特殊工況特征提取的單分類方法和基于統(tǒng)計特征的多分類方法查全率和查準(zhǔn)率如表2 所示。
表2 訓(xùn)練集/測試集的類型識別結(jié)果Table 2 Type classification result of train/test set
從表2 可知,各方法均能達(dá)到較高準(zhǔn)確率,故對算法的擴(kuò)展性進(jìn)行驗證。
3.3.2 擴(kuò)展性分析
1)獨立性與泛化性。
擴(kuò)展性體現(xiàn)在獨立性和泛化性兩方面。維持訓(xùn)練集不變,在測試集中,正類為同類但與訓(xùn)練集電器品牌不同的90 條數(shù)據(jù),反類為44 條未知電器樣本。查全率為正類誤識別指標(biāo),反映泛化性要求;查準(zhǔn)率為反類誤識別指標(biāo),反映獨立性要求,結(jié)果表3 所示。
表3 訓(xùn)練集/補充測試集的類型識別結(jié)果Table 3 Type classification result of train/extend test set
由表3 可知,所提基于狀態(tài)和單分類的方法獨立性和泛化性顯著好于單純利用統(tǒng)計特征且采用多分類模型的方法。對正類,識別冰箱、電視等功率隨品牌變化的電器時,傳統(tǒng)方法的查全率大幅下降,而所提的基于電器特殊工況特征方法更具普適性,查全率能維持較高水平;對于反類,多分類模型中大量未知樣本被誤識別,冰箱的查準(zhǔn)率甚至低于20%,而單分類模型查準(zhǔn)率受未知負(fù)荷的影響較小。
2)自動擴(kuò)展性。
為驗證本文所提擴(kuò)展半徑ISVDD 算法能夠增量式地對未知電器進(jìn)行分類,將表2 訓(xùn)練集中的電飯煲數(shù)據(jù)和反類數(shù)據(jù)打亂后依次輸入算法進(jìn)行訓(xùn)練。首先驗證分類半徑在長時間電飯煲數(shù)據(jù)的輸入下能否有效收斂,其次分別考察新增數(shù)據(jù)后的查全率和查準(zhǔn)率能否最終能達(dá)到理想的水平。計算查全率和查準(zhǔn)率時,正類測試集為表2 電飯煲的測試集,反類測試集為表3的反類數(shù)據(jù)。實驗結(jié)果如圖8 所示。
圖8 擴(kuò)展半徑ISVDD 算法結(jié)果Fig.8 Result of incremental support vector data description with extended radius algorithm
從圖8 中半徑變化規(guī)律可見,在新數(shù)據(jù)加入后,擴(kuò)展半徑ISVDD 算法一開始由于新增了距離較遠(yuǎn)的支持向量,超球面半徑逐漸增加;后續(xù)更新中,由于超球面已覆蓋較大范圍,新數(shù)據(jù)大多出現(xiàn)在超球面內(nèi),ISVDD 算法半徑不變[24],衰減系數(shù)ρ使半徑逐步收斂。此特點意味著算法會先貪心式地尋找更多可能的同類數(shù)據(jù),再收斂以避免無限擴(kuò)展。
對于查準(zhǔn)率和查全率的變化,由于特征向量考慮了CUSUM 分段后每一段功率的輸入,對數(shù)據(jù)形態(tài)相似性的要求極高,因此反類數(shù)據(jù)不會誤識別,查準(zhǔn)率嚴(yán)格為100%。而對正類,經(jīng)過增量式的擴(kuò)展學(xué)習(xí)后,查全率能夠達(dá)到90% 以上。鑒于擴(kuò)展半徑ISVDD 算法并未有先驗的帶標(biāo)簽數(shù)據(jù)輸入,而是在第1 條電飯煲數(shù)據(jù)出現(xiàn)后自動進(jìn)行同類數(shù)據(jù)的發(fā)現(xiàn),因此能夠隨系統(tǒng)運行自動實現(xiàn)新類別數(shù)據(jù)集的擴(kuò)展,使得智能用電網(wǎng)絡(luò)中無標(biāo)簽的量測數(shù)據(jù)也能夠發(fā)揮更大價值。
具備電器級負(fù)荷控制功能的智能用電網(wǎng)絡(luò)自趨優(yōu)運行的前提是對負(fù)荷信息的感知。本文提出了擴(kuò)展應(yīng)用潛力較高的負(fù)荷狀態(tài)與類型辨識算法,經(jīng)實證分析有以下結(jié)論:
1)本文提出的改進(jìn)CUSUM 方法的狀態(tài)劃分結(jié)果能夠?qū)?yīng)電器工況;而基于狀態(tài)的SVDD 類型辨識算法以及擴(kuò)展半徑ISVDD 算法則具備較好的可擴(kuò)展性。
2)以上辨識算法都具有實時、準(zhǔn)確的特點,能夠滿足智能用電網(wǎng)絡(luò)低頻量測場景下自趨優(yōu)控制的需要。
對智能用電網(wǎng)絡(luò)的電器負(fù)荷數(shù)據(jù)的挖掘可結(jié)合類型和狀態(tài)信息進(jìn)一步擴(kuò)展,如基于狀態(tài)進(jìn)行電器故障辨識、效用檢測,基于負(fù)荷工作時間特性進(jìn)行用戶行為的刻畫等,這些多元化信息的探索將是未來的研究方向。
附錄A
圖A1 實時識別過程及各步驟中間數(shù)據(jù)形式Fig.A1 Real-time identification process and intermediate data of each step
圖A2 部分電器的狀態(tài)分析結(jié)果Fig.A2 Analysis results of some electrical appliances states
圖A3 基于智能用電網(wǎng)絡(luò)的數(shù)據(jù)收集過程Fig.A3 Data collection process based on Smart Electric Appliance Network
表A1 算法獨立性與泛化性實驗數(shù)據(jù)集構(gòu)成Table A1 Data set for the experiment of algorithm independece and generalization
表A2 算法自動擴(kuò)展性實驗數(shù)據(jù)集構(gòu)成Table A2 Data set for the experiment of algorithm outomatic scalability
表A3 電器功率狀態(tài)特征統(tǒng)計Table A3 State characteristic statistics of electrical appliances power