白東壯,田世明,鄒毅豪,周 穎,徐玉婷,韓凝暉,李永軍
(1.中國電力科學(xué)研究院有限公司,北京 100192;2.需求側(cè)多能互補優(yōu)化與供需互動技術(shù)北京市重點實驗室,北京 100192)
由于當(dāng)前城市化進(jìn)程發(fā)展迅速,城市居民對各類電器的需求增加,尤其是居民對空調(diào)的需求。我國夏季時間較長,居民長時間使用空調(diào)。居民各類電器中空調(diào)使用的階段性極強,從而導(dǎo)致城市供電網(wǎng)負(fù)荷階段性增加,給電力系統(tǒng)平穩(wěn)運行帶來了不小的隱患[1]。用電行為包含了電力用戶在外界環(huán)境影響下進(jìn)行的用電活動及背后的行為規(guī)律,可以通過管理手段使得全社會用電量趨于平衡[2-3]。因此對居民空調(diào)用電行為進(jìn)行分析尤為重要。目前很多專家學(xué)者均提出不同理論方法的居民空調(diào)用電行為分析方法,陸俊等人[4]提出一種基于極限學(xué)習(xí)機(jī)算法的用戶用電行為分類方法。在前期用戶行為的特征優(yōu)選策略的基礎(chǔ)上,采用特征優(yōu)選策略提取負(fù)荷曲線的最佳特征集對用戶用電數(shù)據(jù)進(jìn)行分類分析,但該算法在提取居民用電優(yōu)選級時,并未考慮時間序列問題,導(dǎo)致極限學(xué)習(xí)機(jī)算法輸出的分類結(jié)果精度不足。馮志穎等人[5]提出一種考慮負(fù)荷縱向隨機(jī)性的基于推土機(jī)距離的用戶用電行為識別新方法。該方法通過統(tǒng)計電力用戶同一時刻多天的負(fù)荷分布情況,從橫向和縱向2 個角度全面表征用戶的用電行為,但該方法僅針對電網(wǎng)負(fù)荷變化情況作了居民用電行為分析,家用電器用電時間和季節(jié)不同對電網(wǎng)造成的負(fù)荷也不盡相同,由此該方法具有一定的片面性。面對當(dāng)前居民空調(diào)用電行為分析方法存在的問題,提出基于非介入式的居民空調(diào)用電行為分類分析方法,為電網(wǎng)安全運行提供更高的保障。
針對居民用電行為,使用多重分形方法[6]提取居民用電行為特征。多重分形方法是非線性科學(xué)的分支,是一種分為多個區(qū)域的復(fù)雜分形結(jié)構(gòu)。為了對分形的復(fù)雜性和不均勻性進(jìn)行更細(xì)致地刻畫,需引進(jìn)它的概率分布函數(shù)及其各階矩的計算。利用該方法進(jìn)行特征提取時,使用計算盒子數(shù)方式將復(fù)雜的數(shù)據(jù)分為具備不同奇異度的小區(qū)域,使數(shù)據(jù)的特征表達(dá)更為充分。使用多重分形方法提取居民用電行為特征詳細(xì)流程為:
令居民用電行為標(biāo)準(zhǔn)化數(shù)值為1,使用盒子對居民用電行為實施覆蓋處理,盒子的尺度由ε表示,ε≤1。經(jīng)過盒子對居民用電行為覆蓋后,每個盒子內(nèi)存在n個居民用電行為。計算第i個盒子內(nèi)用戶用電行為概率測度Pi(ε),即:
式中:Ii為居民用電行為總數(shù),i=1,2,…,m。
令ψq(ε)表示配分函數(shù),使用該函數(shù)獲取居民用電質(zhì)量指數(shù),且該配分函數(shù)可作為式(1)的s階矩,s表示權(quán)重因子。配分函數(shù)ψq(ε)為:
τ(s)為質(zhì)量指數(shù),其表達(dá)式為:
特征選擇的合理與否對聚類結(jié)果準(zhǔn)確性有重要影響[7],多重分形方法在進(jìn)行特征提取時,使用指數(shù)和奇異多重分形譜描述居民用電行為特征,二者分別由α(s),f(α) 表示,奇異多重分形譜使用Legendre 轉(zhuǎn)換得到[8]:
式中:τ′為特征集。
將式(3)結(jié)果代入到式(5)中可得到指數(shù)α(s)數(shù)值,該指數(shù)數(shù)值可描述居民用電特征的局部奇異性。而奇異多重分形譜則可描述居民用電特征的完整奇異性,且特征參數(shù)分布的統(tǒng)計結(jié)果同樣反映出空調(diào)行為驅(qū)動特性的個體差異[9]。依據(jù)式(4)與式(5)結(jié)果可獲取居民用電特征的局部奇異性和完整奇異性,由此得到居民用電特征。
使用函數(shù)型數(shù)據(jù)分析算法[10](Functional Data Analysis,F(xiàn)DA)對居民用電特征進(jìn)行投影處理后,利用支持向量機(jī)算法對居民用電行為進(jìn)行分類處理,得到居民空調(diào)用電行為。FDA 投影的核心思想是通過數(shù)據(jù)自身具備的連續(xù)性與平滑性,利用相應(yīng)函數(shù)表達(dá)數(shù)據(jù)序列,經(jīng)過FDA 投影處理后的局部用電行為特征信息內(nèi)不存在聚類噪音點干擾[11]。FDA 投影過程如下:將每個居民用電特征作為觀測樣本包,令第i個觀測樣本包內(nèi)存在的列離散觀測數(shù)值由yi1,yi2,…,yin表示,使用FDA 投影將列離散觀測數(shù)值轉(zhuǎn)換為基函數(shù),由于居民用電行為特征不具備周期性,在此使用B 樣條基函數(shù)[12]描述FDA 投影,令a表示B 樣條基函數(shù)階數(shù),ζ(ζl,l=1,2,…,l-1)表示節(jié)點序列,則B 樣條基函數(shù)遞歸表達(dá)式為:
式中:Bl,0為第l個0 次B 樣條基函數(shù);Bl,a(t)為第l個a次B 樣條基函數(shù);t為自變量[13]。
將FDA 投影系數(shù)向量引入到B 樣條基函數(shù)內(nèi),即:
式中:E(y|c),Pm(x),κ分別為FDA 投影后的誤差平方和、粗糙乘法函數(shù)、平滑參數(shù);c為投影系數(shù)向量。
使用一次導(dǎo)數(shù)方法對式(8)進(jìn)行求解后,可獲取到FDA 投影系數(shù)向量數(shù)值并將該數(shù)值代入到B樣條基函數(shù)內(nèi),完成FDA 投影。
居民用電行為特征觀測樣本包內(nèi)的離散觀測數(shù)值經(jīng)過FDA 投影處理后,結(jié)合FDA 聚類理論,使用支持向量機(jī)算法對居民用電特征進(jìn)行聚類處理[14],獲取居民空調(diào)用電行為特征。支持向量機(jī)算法是通過在超平面內(nèi)令類別間距最大的同時保持類別間距離最小的分類實現(xiàn)聚類的方法[15]。通過對居民日常負(fù)荷曲線進(jìn)行聚類,分析其整體的能耗類型和用電特性[16],使用sigmoid 函數(shù)計算多類別樣本邊界點。
令X表示局部用電行為特征不均衡樣本,其正樣本集合負(fù)樣本集分別由表示,其中U+,U-分別表示少類樣本點數(shù)量和多類樣本點數(shù)量,且U=U++U-。設(shè)置Fisher 判別聚類目標(biāo)函數(shù)[17]為:
式中:η為投影方向;ω為系數(shù)向量;T為訓(xùn)練點集。
其中:
支持向量機(jī)在聚類居民用電行為特征時,聚類內(nèi)的新樣本點經(jīng)過FDA 投影后與包含新樣本的少類樣本中心距離小于某個正數(shù),為避免聚類新樣本點時,其向多類樣本集中區(qū)間擴(kuò)散,通過分析將總電力負(fù)荷分解為獨立電器的用電信息[18-19],設(shè)置聚類約束條件為:
式中:j=1,2,…,zk;k=1,2,…,K;zk為新生成的少類樣本點第k個聚類的容量;?為核函數(shù);hj,k為第k個聚類中心的第j個樣本點;,其中l(wèi)k為少類樣本點中第k個聚類樣本點容量,為少類樣本點內(nèi)第k個聚類內(nèi)的第l個樣本點。
設(shè)置符合新生成的靠近多類樣本邊界點條件,即:
經(jīng)過式(12)和式(13)步驟不斷迭代,擬形成的少類樣本與支持向量機(jī)的支持向量數(shù)量相同,則獲取到居民空調(diào)用電行為特征。
動態(tài)時間規(guī)整(Dynamic Time Warping,DTW)算法是專門處理具備時間序列數(shù)據(jù)的一種方法,通過對比數(shù)據(jù)時間序列的相似性判斷數(shù)據(jù)類別[20]。該方法被廣泛應(yīng)用于語音識別、時間序列數(shù)據(jù)分類等方面[21]。居民空調(diào)用電行為特征具備時間序列特征,因此使用DTW 算法對居民空調(diào)用電行為特征進(jìn)行分類。由于在計算居民空調(diào)用電行為特征相似度時存在大量根號運算[22],為使計算過程更加便捷,DTW 算法使用卡方檢驗算法計算居民空調(diào)用電行為特征,詳細(xì)過程如下:
使用居民空調(diào)用電行為特征構(gòu)建參考模板和待分類模板,分別由R={R(1),R(2),…,R(m)}、Q={Q(1),Q(2),…,Q(m)} 表示,參考模板和待分類模板的特征矢量和維數(shù)數(shù)值均相同[23],分別由R(m),Q(n)表示。參考模板R(mi)和待分類模板Q(ni)的特征矢量的失真量由d[Q(ni),R(mi)]表示,d[Q(ni),R(mi)]為兩個矢量之間的歐式距離。獲取與多個特征矢量節(jié)點相對應(yīng)的累計失真量,其表達(dá)公式為:
DTW 算法進(jìn)行分類的目的為計算特征矢量節(jié)點的最佳路徑,使該路徑的累計失真量數(shù)值最小[24]。則迭代后的累計失真量表達(dá)公式為:
在式(15)-式(16)迭代過程中,受居民空調(diào)用電行為時間序列內(nèi)元素間距離影響,導(dǎo)致對居民空調(diào)用電行為分類時,計算特征矢量節(jié)點的最佳路徑寬松,使分類結(jié)果不夠精準(zhǔn),在此通過定義矢量編碼距離d(t1,t2),對DTW 算法進(jìn)行改進(jìn),即:
式中:t1表示Q(ni);t2表示R(mi);g為居民空調(diào)用電行為特征維數(shù)。
經(jīng)過式(14)-式(17)步驟迭代后,得到居民空調(diào)用電行為參考模板和待分類模板的累計最小失真量,對比兩個模板,相似度接近數(shù)值1 的居民空調(diào)用電行為即為同一類。
為驗證本文方法實際應(yīng)用效果,以江蘇省某城市非介入式負(fù)荷量測設(shè)備采集到的近2 年居民用電數(shù)據(jù)作為實驗對象,使用R 語言對本文方法進(jìn)行仿真分析。非介入式負(fù)荷量測設(shè)備借助在智能電表中嵌入硬件裝置,通過負(fù)荷識別算法得到用戶內(nèi)容各類電器的準(zhǔn)確信息,比如開停機(jī)時間,各時段用電量等[25]。
居民用電行為特征提取是分析居民空調(diào)用電特征的基礎(chǔ),以配分函數(shù)的線性擬合作為衡量本文方法提取居民用電行為特征能力,測試在權(quán)重因子數(shù)值不同情況下,本文方法提取居民用電行為特征時配分函數(shù)線性擬合變化情況見圖1。
圖1 特征提取測試結(jié)果Fig.1 Test results of feature extraction
分析圖1 可知,隨著提取居民用電特征時間的增加,配分函數(shù)的質(zhì)量指數(shù)(無量綱)呈現(xiàn)為直線上升趨勢。雖然權(quán)重數(shù)值大小可影響配分函數(shù)質(zhì)量指數(shù)數(shù)值,但在提取居民用戶特征時間為6.5 s 左右時,不同權(quán)重數(shù)值時的配分函數(shù)質(zhì)量指數(shù)達(dá)到重合,在提取居民用戶特征時間為1~6.5 s 之間,權(quán)重數(shù)值較大時的配分函數(shù)質(zhì)量指數(shù)數(shù)值較低且不同權(quán)重數(shù)值時的質(zhì)量指數(shù)數(shù)值差值較大,隨著時間的增加,不同權(quán)重數(shù)值時的質(zhì)量指數(shù)差值逐漸降低,在時間為6.5 s 左右時,其差值為0。當(dāng)提取居民用電行為特征時間超過6.5 s 后,權(quán)重數(shù)值較低時的配分函數(shù)質(zhì)量指數(shù)數(shù)值較大,在特征提取時間為8 s時,權(quán)重數(shù)值為1 時的質(zhì)量指數(shù)數(shù)值達(dá)到1.0,權(quán)重數(shù)值為4 時的質(zhì)量指數(shù)數(shù)值為0.93 左右。結(jié)果表明本文方法在受權(quán)重取值影響較小及質(zhì)量指數(shù)曲線表現(xiàn)為線性關(guān)系時,提取居民用電行為特征精度達(dá)到了0.93 以上。
以該市2 000 個居民用電行為數(shù)據(jù)作為實驗對象,使用本文方法對該2 000 條居民用電行為數(shù)據(jù)進(jìn)行聚類處理,獲取居民冰箱、洗衣機(jī)、空調(diào)、電視和其他家用電器所占百分比并與實際數(shù)量進(jìn)行對比,分析本文方法對居民用電行為聚類能力,結(jié)果如圖2 所示。
圖2 居民用電行為聚類測試結(jié)果Fig.2 Test results of residential electricity consumption behavior clustering
分析圖2 可知,在該市的2 000 條居民用電數(shù)據(jù)內(nèi),空調(diào)占比高達(dá)59%,其次依次為冰箱、洗衣機(jī)、電視以及其他家用電器。使用本文方法對居民用電數(shù)據(jù)聚類后得到的該居民用電數(shù)據(jù)內(nèi)空調(diào)、洗衣機(jī)、電視所占比例均與實際數(shù)值相同,雖然所有家用電器的總比值與實際比值相同,但在聚類冰箱和其他家用電器時出現(xiàn)較小數(shù)值偏差,偏差數(shù)值僅為1%。該結(jié)果表明本文方法可有效聚類居民用電行為類別且數(shù)值較為準(zhǔn)確。
以失真量作為衡量本文方法分類居民空調(diào)用電行為的精度指標(biāo),測試居民空調(diào)用電特征維數(shù)不同情況下,本文方法分類居民空調(diào)用電行為精度,為更充分呈現(xiàn)本文方法應(yīng)用效果,使用文獻(xiàn)[3]方法與文獻(xiàn)[4]方法與其進(jìn)行對比。其中文獻(xiàn)[3]方法表示極限學(xué)習(xí)機(jī)的居民用電行為分類,文獻(xiàn)[4]方法表示用戶用電行為聚類方法,結(jié)果如圖3 所示。
圖3 分類精度測試結(jié)果Fig.3 Test results of classification accuracy
分析圖3 可知,居民空調(diào)用電行為特征維數(shù)與其分類精度呈反比例關(guān)系。在不同特征維數(shù)時,本文方法的分類精度數(shù)值始終較高,尤其是在特征維數(shù)分別為1,2,3 時,本文方法的分類精度接近1.0,而隨著居民空調(diào)用電行為特征維數(shù)的增加,本文方法的分類精度呈現(xiàn)緩慢下降趨勢。文獻(xiàn)[3]方法和文獻(xiàn)[4]方法均在居民空調(diào)用電行為特征維數(shù)超過3 后呈現(xiàn)下降趨勢,且下降幅度稍大,兩種方法的分類精度也較本文方法低,表明本文方法分類居民空調(diào)用電行為時受其特征維數(shù)影響較小,分類精度接近1.0。
分析圖4 可知,3 種方法的分類耗時隨著數(shù)據(jù)量的增加而增加。其中文獻(xiàn)[3]方法和文獻(xiàn)[4]方法的分類耗時曲線隨著數(shù)據(jù)量的增加呈現(xiàn)迅速上升趨勢,分類耗時較長,而本文方法在數(shù)據(jù)量為2 000條之前分類耗時曲線呈現(xiàn)小幅度增加趨勢,當(dāng)數(shù)據(jù)量超過2 000 條之后其增長幅度相對較大。當(dāng)數(shù)據(jù)量為4 000 條時,本文方法較文獻(xiàn)[3]方法和文獻(xiàn)[4]方法的分類耗時較低,其中本文方法分類耗時僅為8 s。結(jié)果表明本文方法在分類居民空調(diào)用電行為時可有效縮短其消耗時間。
圖4 分類耗時測試結(jié)果Fig.4 Test results of classification time consuming
以該城市某小區(qū)居民8 月份日空調(diào)用電情況作為實驗對象,使用本文方法對該居民空調(diào)用電行為進(jìn)行分類后,分析該居民用空調(diào)用電行為結(jié)果如表1 所示。
表1 不同時刻居民空調(diào)用電情況Table 1 Residential air conditioning electricity consumption at different time points
分析表1 可知,該小區(qū)居民同時使用空調(diào)的高峰期在上午10:00 至下午14:00 和夜間22:00 至凌晨02:0 之間,說明中午室內(nèi)溫度較高,居民對空調(diào)的需求度較強,而夜間開啟空調(diào)則利用空調(diào)控制室內(nèi)溫度平衡,使睡眠環(huán)境更為舒適。而在凌晨04:00至上午08:00 之間,室外溫度較低使室內(nèi)外溫差降低,此時無需開啟空調(diào)室內(nèi)即可達(dá)到人體適宜溫度數(shù)值。而從居民開啟空調(diào)的耗電量來看,依據(jù)當(dāng)前一級能效的空調(diào)來計算,1 臺一級能耗空調(diào)的耗電量為1.03 kWh,通過計算得到該小區(qū)同時開啟空調(diào)時的耗電量均高于一級能耗空調(diào)耗電量的計算值,表明該小區(qū)所安裝的空調(diào)有一部分高于一級能耗,從環(huán)保角度來看,該小區(qū)的能源消耗量存在一定程度資源浪費情況。
針對居民非介入式的居民空調(diào)用電行為分類中存在分類分析耗時長,結(jié)果不準(zhǔn)確的問題,提出基于非介入式的居民空調(diào)用電行為智能分類分析方法。該方法將FDA 算法和DTW 算法應(yīng)用到居民空調(diào)用電行為分析過程中,并對DTW 算法運算過程中存在的不足進(jìn)行了改進(jìn),實現(xiàn)了居民空調(diào)用電行為分析。同時通過R 語言仿真處理實驗對象并進(jìn)行多角度驗證后,得出以下結(jié)論:本文方法提取居民用電行為特征時的配分函數(shù)質(zhì)量指數(shù)達(dá)到1.0,特征提取能力強;對居民用電行為聚類偏差較小且具備分類居民空調(diào)用電行為精度高耗時短的特點,可有效獲取居民空調(diào)開啟習(xí)慣以及電量消耗情況,具備較好的應(yīng)用性。