嚴永輝,李新家,王淑云,鄧士偉,黃時
(1.江蘇方天電力技術有限公司,南京211100;2.江蘇智臻能源科技有限公司,南京211111)
隨著智能電網的加速發(fā)展及智能終端的更新換代,電力需求側管理逐步受到電力公司的重視,負荷辨識技術隨之應運而生[1—3]。傳統(tǒng)上,居民用電信息以電費形式告知客戶,客戶僅能了解到自身一段時期的總用電量,而負荷辨識技術能將能源消耗數據分解到單個電器的水平,用戶可以基于自身更加詳細的用電信息從而制定節(jié)能策略。此外,通過負荷辨識技術分析居民各類電器的使用情況可以更加準確的預測電力需求,應用管理手段避免能源網絡過載或停電同樣是負荷辨識存在的意義之一[4—6]。
傳統(tǒng)的負荷監(jiān)測方法采用介入式設計原理,在用戶側對每個用電設備安裝采集裝置從而進行設備狀態(tài)監(jiān)測,其固有形態(tài)必然導致成本高,方案難以大規(guī)模推廣。非介入式負荷監(jiān)測(non-intrusive load monitoring,NILM)相較于介入式技術僅需在入戶側安裝一臺智能終端,且在不入戶的情況下做到負荷辨識,因此成為現階段負荷辨識的主要實現方式[7—9]。
近年來,基于終端的負荷辨識技術重點在于構建負荷特征庫后的特征辨識[10—12],有學者提出了一種高頻采集模式下的非侵入式負荷在線監(jiān)測方法,基于構建的負荷種類庫通過貝葉斯分類模型實現負荷種類判斷。也有學者提出通過有功和無功功率、動態(tài)時間彎曲(DTW)算法、K近鄰算法與核Fisher判別算法進行負荷識別[13—14]。當前的NILM方法主要通過2種方法構建數據庫,第一是通過預先試驗,對常用的電器進行錄波;第二是依賴于公共數據集。2種方法對于預先得到數據的質量均有很高的要求,且只能得到常用的家用電器,而對各個用戶的個性化電器無從下手。隨著家用電器種類越來越多,相似原理的電器其暫態(tài)的“啟?!碧匦灶愃?,終端由于內存限制,無法大量存儲數據特征,導致電器辨識成功率越來越低。
因此,為克服終端辨識存在的不確定電器無法辨識的現象,本文提出云端協同的優(yōu)化方式,利用云端大量數據存儲的優(yōu)勢協助終端完成負荷辨識。該方法以現有的終端負荷辨識體系為基礎,對于不確定電器基于CUSUM事件檢測算法提取事件特征并上送云端,云端依據歷史特征數據基于最鄰近原則分類從而實現負荷辨識,云端完成辨識后將個性化信息回饋終端,輔助終端實現實時辨識。
基于非侵入式終端的數據量測是進行負荷辨識的第一步,通過部署在特定區(qū)域的終端設備實現。數據采集主要考慮2個因素:采樣頻率和數據源基礎。
高頻采集的典型參數有電流周波、諧波、電磁干擾等,能夠較為全面地捕獲電器設備特征參數,同時采集設備的成本相對較高,且對數據的傳輸和存儲提出了較高的要求。本文采用的終端設備采樣頻率為6 400 Hz,通過先進的分布式計算架構可以獲取到較多的數據源基礎,包括3次諧波、2次諧波、有功功率、無功功率等。
CUSUM算法是一種變化檢測方法,它可以檢測到統(tǒng)計過程均值的變化。CUSUM理論基礎是序貫分析原理中的序貫概率比檢驗理論,算法原理是:如果從某點開始有異常出現,則序列的概率分布會發(fā)生改變。整個數列的均值或者方差也發(fā)生變化,可判定從該點起為異常。CUSUM設計思想是對樣本數據信息加以累積,將過程的小偏移累積起來,達到放大的效果,從而提高檢測過程中對小偏移的靈敏度。
以有功功率序列P為例,以m大小的滑動窗口連續(xù)檢測事件,首先以式(1)計算[ ]i,i+m-1窗口內有功功率平均值Pav為
然后,基于式(2)生成有功檢測序列ZP,其第i個分量為
圖1 原始功率信號Fig.1 Original power signal
圖2 基于CUSUM算法后的事件檢測信號Fig.2 Event detection signal based on CUSUM algorithm
各戶家用電器種類相對是固定的,各種類波形類似,所提取的暫態(tài)特征近似,因此終端負荷辨識方式是提前構造一般電器的基礎特征庫。由于終端緩存的數據有限,因此常常只能判斷秒級數據特征,例如電器的啟停功率變化、諧波變化、無功變化等如表1所示。為保證算法的一般性,并降低運算量,首先海量獲取不同家用電器一般波形,將獨立運行的負荷特征作為先驗知識體系。
將不同類特征構建基于K最鄰近法(K-nearest neighbor,KNN)的分類模型,KNN算法屬于監(jiān)督學習算法,訓練需要有監(jiān)督信息,通過歐式距離計算公式,依據多數原則,將未知數據特征樣本歸類至距離最近的聚類中心,其基本訓練步驟如下。
假設有一組歷史電器特征樣本集合定義為S。其中S由n個電器特征樣本組成,每個電器特征樣本由9個屬性變量及1個標志量構成,9個屬性變量如表1所示,其數據表達式為
式中:Fij為第i個電器第j個特征;Li為第i個電器標簽,屬性變量如表1所示,即為電器種類;i取1,2,…,n;j取1,2,…,9。
表1 終端特征庫Table 1 Terminal feature database
生成特征樣本集合后,再各個特征空間內形成測試樣本,表示為Y={F1,F2,…,F9},預測時,首先在訓練樣本集S集合中找到與測試樣本Y歐式距離最近的k個近鄰,然后找到k個樣本的標志量(電器分類)集合L={L1,L2,…,Lk},最后按照少數服從多數原則判斷預測電器結果。
由此先驗預測知識在終端處構建各類電器的空間閾值,寫入終端后,終端進行實時對電器進行辨識,總體算法流程如圖3所示。
圖3 負荷辨識算法流程圖Fig.3 Flowchart of load identification algorithm
基于終端采集數據的負荷辨識技術,一方面由于相似電器數量過多,僅憑負荷啟停事件檢測無法實現相似電器的準確辨識;另一方面,由于終端的內存有限,無法提供足夠長時的電器特征量,終端難以憑借自身的硬件條件進行學習,導致終端負荷辨識技術存在瓶頸。圖4給出了電飯鍋、電烤箱、電水壺、電熱水器4類相似電器的功率波形,4種電器都屬于電熱類電器,其特點是隨著電器的啟停,有功功率進行瞬時的變化,無功、諧波等變化不明顯,然而電熱類的有功功率大小類似,僅僅依靠短時的啟停有功功率大小變化這一特征難以對電器進行準確辨識,因此本章突破終端限制,增加個人用電行為習慣等特征進行輔助辨識。
圖4 4種典型相似電器功率波形圖Fig.4 Four typical similar electrical power waveforms
協同設計的前提是利用雙方的各自優(yōu)勢,否則便是無端增加了設備的成本。由于終端內存的限制,導致終端無法基于長時特征進行負荷辨識,云端雖然無法辨識每個用戶特征,但是可以基于這些特征進行海量數據的計算,二者相輔相成。
圖5為云端協同負荷辨識基本架構圖,圖中可見終端模塊一共包含4個關鍵部分:數據采樣模塊、特征上送模塊、數據上送模塊、任務時間管理模塊,可完成與云端的主要電器特征上送。
圖5 云端協同負荷辨識基本架構圖Fig.5 Basic architecture diagram of load identification by cloud collaborative
云端利用分布式數據庫可以結合用戶歷史數據完成長時的特征計算,例如,每月電器的開啟次數等,平時此電器的開啟時間等。云端基于更加海量的特征進行綜合辨識從而確定用戶的電器種類,并將更加詳細的特征描述(例如某用戶習慣19:00開一臺1 800 W的熱水壺)回傳終端,輔助終端辨識。
云端協同的基本原理即為終端無法辨識電器通過特征上送從而在云端構建海量特征庫輔助辨識。本文構造云端特征庫一共包含3類特征,第一類為電器基礎固有特征如啟動時有功、無功、3次諧波、2次諧波變化,連續(xù)啟停次數等;第2類為電器的時間特征,如開啟時間、關斷時間、運行時間;第3類長時統(tǒng)計特征,如表示波動程度的變異系數(coefficient of variation,CV),表示窗口內電器狀態(tài)變換次數的狀態(tài)系數,其計算如式(4)至式(6)所示。本文云端特征庫具體構建的特征如表2所示。
假設窗口信號為X={x1,x2,…,xm},xi為X的第i個量測信號,m為窗口大小。其變異系數CV為
式中:σ為樣本數據標準差;μ為樣本數據平均值。
為計算狀態(tài),設定突變閾值為H,基于差分算法計算其計算流程如下:①遍歷窗口信號內x1至xm,并分別計算其差分序列D,其中D={x2-x1,x3-x2,…,xm-xm-1};②統(tǒng)計數值正負變換點,并計算2個區(qū)域的差值絕對值是否大于閾值H;③統(tǒng)計突破閾值的次數為狀態(tài)系數。
表2 云端特征庫典型特征表Table 2 Typical feature table of cloud feature database
典型的基于云端特征庫的負荷辨識流程包括構造終端負荷特征庫、常規(guī)負荷辨識、暫態(tài)特征上送云端、構造云端負荷特征庫、基于KNN算法進行云端負荷辨識幾個重要環(huán)節(jié),從而實現終端無法確認的電器在云端實現電器的精細化識別。完成云端識別后,用戶終端再一次遇到此種電器依舊需要借助云端,無法實現在線的短時辨識。因此云端辨識后反饋終端此電器的特異性特征,例如具體的有功階躍,常開的時間等,從而此用戶在一般終端特征庫中更新自身特異性的特征庫,從而實現此電器的特異性識別,其云端協同的流程如圖6所示。
隨著電器類型激增,云端協同不僅可以保證所有用戶大類基本電器辨識的準確度,而且對用戶的特異性電器存在良好的辨識度,解決了辨識精細化的問題。
圖6 基于云端特征庫的負荷辨識流程圖Fig.6 Flowchart of load identification based on cloud feature database
在南京“文馨苑”臺區(qū)安裝非介入式負荷監(jiān)測智能終端,利用終端采集的細粒度數據為基礎進行云端協同負荷辨識。以2棟801戶為例,終端實時捕獲到2種典型電器功率波形如圖7和圖8所示。
圖7 電腦有功功率波形Fig.7 Active power waveform of computer
圖8 電視機有功功率波形Fig.8 Active power waveform of television
由于這2種典型電器工作原理近似,基本都屬于屏幕的功耗,因此各種特征波形圖非常相似,功率大小均在70 W左右,其余特征并不明顯,終端無法根據窗口時間內特征進行辨別,因此需要更高維度的特征信息上送云端。
將負荷特征上送云端后,云端根據獲取的特征,云端對于此用戶的歷史特征數據進行統(tǒng)計,并在時間特征中存在明顯差異如表3所示。
表3 801用戶電視機和電腦時間特征對比Table 3 Comparison of time characteristics of television and computer in room 801
顯然,此用戶在使用電腦和使用電視的頻次和時間是不同的,因此基于KNN進行云端2次負荷辨識并將其特異性特征反饋終端。例如上午開了此類電器大概率為電腦非電視,為其構造此用戶的特異性電器特征庫。
完成訓練后,在線測試現場801戶電腦與電視機用電情況,結合錄波數據與用戶反饋,1個月內整體算法抓取此類電器124次,辨識正確次數83次,辨識成功率67%。檢查發(fā)現此用戶的周末用電習慣與工作日有明顯區(qū)分。因此,終端補充更詳細的2類時間特征(周末和工作日),離線測試,改正后辨識正確次數高達113次,辨識成功率為91%。
綜合整個“文馨苑”臺區(qū),電熱類為常見不易區(qū)分電器,終端辨識及云端負荷協同辨識結果對照如表4。
表4 負荷辨識結果對照表Table 4 Comparison table of load identification results
由表4可知,由于相似電器種類繁多,各類電器工作原理差異并不大,因此導致終端在基于一般性和特殊性上存在技術性的難點使得辨識成功率不足以支撐用戶的需求。本文云端協同的構思在滿足終端一般性的要求下,結合了各個用戶的特異性使得辨識成功率大幅度提升。
(1)基于CUSUM事件檢測方法挖掘電氣數據的變化,實現了用戶電器啟停的相關特征提取。
(2)云端基于固有、事件、統(tǒng)計特征進行負荷辨識,并將辨識結果反饋終端,從而建立用戶的個性化特征庫輔助辨識。
(3)所提方法除了能提高用戶電器辨識率外還可以對波形相似的電器進行識別,提升辨識的細粒度。
在實際用戶測試中,受電器波形的特異性以及各種電器疊加的影響,所提算法的識別準確率未能達到100%。因此在后續(xù)的研究中,將考慮提取高頻特征,提高算法的魯棒性。