牟婷婷, 陸 微, 王蘭君, 辛潔晴
(1. 電力傳輸與功率變換控制教育部重點實驗室(上海交通大學(xué)), 上海市 200240; 2. 國網(wǎng)上海市電力公司市北供電公司, 上海市 200072)
基于主成分分析的用電模式穩(wěn)定性分析
牟婷婷1, 陸 微2, 王蘭君2, 辛潔晴1
(1. 電力傳輸與功率變換控制教育部重點實驗室(上海交通大學(xué)), 上海市 200240; 2. 國網(wǎng)上海市電力公司市北供電公司, 上海市 200072)
用電模式穩(wěn)定性分析是實施用戶用電量預(yù)測的前提,其本質(zhì)是考察不同歷史時間段用電模式的相似性。過長的基礎(chǔ)數(shù)據(jù)時間跨度會降低用電模式穩(wěn)定性分析的可行性和準(zhǔn)確性,而在短期內(nèi)基于日用電量數(shù)據(jù)評估的用電特征指標(biāo)又受隨機(jī)因素干擾,難以準(zhǔn)確反映用電模式。為此,提出一種以過往幾周日用電系數(shù)和日用電波動率為原始特征指標(biāo)提取用電模式主成分,進(jìn)而用兩個歷史時間段內(nèi)用電模式主成分因子載荷的歐氏距離衡量用電模式穩(wěn)定性的方法。針對某小區(qū)的算例結(jié)果表明,用所提方法判定為用電模式穩(wěn)定、不穩(wěn)定的用戶組的用電量預(yù)測精度存在明顯差異,且相似性距離與預(yù)測誤差存在正相關(guān)性。算例分析表明,合適的歷史數(shù)據(jù)時間跨度對提升方法的適用性和準(zhǔn)確性至關(guān)重要,所提方法采用16周歷史數(shù)據(jù)較為合理。
用電模式穩(wěn)定性; 主成分分析; 相似性判定; 負(fù)荷預(yù)測
長期以來負(fù)荷預(yù)測主要關(guān)注于預(yù)測方法的準(zhǔn)確性,對預(yù)測的適用性鮮有分析。近年來,隨著集中抄表系統(tǒng)和智能家居的發(fā)展,針對單個用戶的負(fù)荷(或用電量)預(yù)測日益受到關(guān)注。在集抄領(lǐng)域,估計用戶月用電量合理范圍可為集抄數(shù)據(jù)異常分析提供更科學(xué)的判據(jù);而在智能家居領(lǐng)域,用戶用電量預(yù)測是優(yōu)化家居運行方式、制定需求響應(yīng)措施的基礎(chǔ)[1-2]。各種預(yù)測方法本質(zhì)都是根據(jù)歷史用電規(guī)律推測未來用電趨勢,僅對用電模式穩(wěn)定的用戶適用。因此,用電模式穩(wěn)定性分析構(gòu)成上述工作的基礎(chǔ)。
用電模式的變化可能因轉(zhuǎn)租、生活作息變化、更換大型用電設(shè)備等原因引起,不能單從是否更戶來加以判定,而需借助一定的數(shù)據(jù)分析方法。從數(shù)學(xué)上講,用電模式穩(wěn)定性分析本質(zhì)上是對兩個時間跨度的用電模式的相似性判定,其核心問題是用電模式,即序列特征的表示,相似性則可用一定的距離測度判定。
序列特征提取方法目前主要有分段聚合近似[3]、符號化算法[4]、分段線性表示[5]、奇異值分解[6]等。這些方法的目標(biāo)都是將復(fù)雜長序列進(jìn)行降維,以降低相似性判定的難度。而在用電模式穩(wěn)定性分析中,由于房地產(chǎn)發(fā)展等因素,歷史數(shù)據(jù)時間跨度很長(如將用戶過去兩年月用電量或月份系數(shù)進(jìn)行對比[7]),不僅會降低判定方法的適用性,也可能使近期用電模式穩(wěn)定的用戶被錯判為不穩(wěn)定,因此序列特征降維不是關(guān)鍵性問題。
事實上,采用集抄之后,供電企業(yè)可掌握低壓用戶每日用電量數(shù)據(jù),可運用日用電量信息提取用電模式,以縮短穩(wěn)定性判定問題對歷史數(shù)據(jù)時間跨度的依賴。不過,日用電量受隨機(jī)因素干擾大,且由于氣溫或用戶特殊用電行為的延續(xù)性,相鄰日用電量的相關(guān)性高。如何剔除隨機(jī)因素和日間用電量相關(guān)性的干擾,構(gòu)建反映用戶內(nèi)在用電習(xí)慣的用電模式是核心問題。
顯然,剔除隨機(jī)因素干擾、正確提取用電模式宜采用統(tǒng)計學(xué)方法,而主成分分析不僅是一種統(tǒng)計學(xué)方法,由于主成分提取時的正交性,在剔除樣本數(shù)據(jù)各維度相關(guān)性干擾方面也具有很強(qiáng)的優(yōu)勢[8-9]。鑒于此,本文對低壓用戶提出一種基于主成分分析(principal-component-analysis-based,PCAB)提取用電模式,進(jìn)而判定用電模式穩(wěn)定性的方法。該方法本質(zhì)上以主成分表征用電模式,但鑒于主成分本身缺乏可觀測性,用表征主成分因子與各原始特征指標(biāo)相關(guān)性的因子載荷(factor loading)來描述主成分因子,用兩個時期因子載荷的一致性判定主成分的一致性,進(jìn)而判定用電模式的相似性(穩(wěn)定性)。
值得指出的是,目前有較多文獻(xiàn)基于主成分構(gòu)建預(yù)測模型,起到降維、簡化預(yù)測模型的目的[10-12]。本文思想有所不同,實施主成分分析的目的是獲取主成分的因子載荷,進(jìn)而實施用電模式穩(wěn)定性分析,并不是構(gòu)建負(fù)荷預(yù)測模型。本文算例部分涉及負(fù)荷預(yù)測,但負(fù)荷預(yù)測采用了其他方法,目的是檢驗用電模式穩(wěn)定性分析結(jié)果的合理性。
1.1 用電模式穩(wěn)定性的定義
用電模式穩(wěn)定性分析是為了判斷能否依據(jù)歷史用電規(guī)律對當(dāng)前月的用電量進(jìn)行預(yù)測。若某用戶不存在如下情況,則稱該用戶是用電模式穩(wěn)定的。
1)因?qū)嶋H住戶變更、作息變化等原因?qū)е碌挠秒娏?xí)慣的變化。
2)因購入或更換節(jié)能水平不同的大功率用電設(shè)備而導(dǎo)致用電量的顯著變化。
3)因?qū)嶋H用電性質(zhì)變更、設(shè)備構(gòu)成變化而導(dǎo)致的用電特性變化。
值得留意的是,用電模式不穩(wěn)定不包括氣象條件變化、用戶偶發(fā)性活動等因素導(dǎo)致的用電行為變化。此類偶發(fā)性波動視作隨機(jī)擾動。
1.2 用電模式穩(wěn)定性的判定流程
用戶用電模式穩(wěn)定性判定流程包括以下4步。
1)數(shù)據(jù)預(yù)處理:對低壓用戶集抄所得的是每日零點的凍結(jié)電量數(shù)據(jù)。由于信道不佳、采集終端軟件故障等問題,個別日的集抄數(shù)據(jù)可能存在缺失或異常(突降/增),需采用插值法對此類缺陷進(jìn)行修正;其次,通過相鄰兩日凍結(jié)電量相減得到日用電量序列;最后,鑒于節(jié)日與非節(jié)日用電往往有很大區(qū)別,對節(jié)日用電進(jìn)行非節(jié)日等值處理,方法是用節(jié)日前、后周的用電量均值和日用電系數(shù)均值(即日用電量與當(dāng)周日均用電量的比值)對節(jié)日期間每日用電量做出估計。經(jīng)上述處理后,所考慮的歷史時間跨度內(nèi)的每周日用電量具有可比性。
2)用電模式提取:選擇用電特征指標(biāo),將歷史時間跨度劃分為兩個時期,對每一時期的用電特征指標(biāo)實施主成分分析,并根據(jù)累計方差貢獻(xiàn)率選取主成分。用主成分的因子載荷描述各時期的用電模式,以剔除隨機(jī)因素和日間用電相關(guān)性對用電模式的干擾。
3)用電模式穩(wěn)定性判定:每一主成分與原用電特征指標(biāo)的相關(guān)系數(shù)(即因子載荷)的相似性可表征主成分一致性。因此,通過量度兩個時期主成分因子載荷的歐氏距離考察兩個時期用電模式的穩(wěn)定性。
4)模式判定結(jié)果的檢驗:對所有用戶采用多種負(fù)荷預(yù)測方法實施月用電量預(yù)測,評估用電模式穩(wěn)定、不穩(wěn)定用戶組月用電量預(yù)測結(jié)果的平均絕對百分誤差(mean absolute percentage error,MAPE)δMAPE,考察MAPE與相似性距離之間的關(guān)系來檢驗用電模式穩(wěn)定性評估結(jié)果的合理性。其中,MAPE定義為:
(1)
為縮短用電模式提取對歷史數(shù)據(jù)時間跨度的依賴,考慮基礎(chǔ)數(shù)據(jù)時間跨度為前nw周(為偶數(shù))并將其等分為兩期(用上標(biāo)k?、窈蚹?、虮碚?,基于日用電數(shù)據(jù),而非月用電數(shù)據(jù),評估兩期的用電特征指標(biāo)。鑒于日用電量受偶發(fā)性事件的影響較大且用電量日間關(guān)聯(lián)性高,以用電特征指標(biāo)的主成分,而非用電特征指標(biāo)本身來描述兩期用電模式。具體步驟如下。
1)用電特征指標(biāo)的選取和指標(biāo)矩陣的定義
對每一用戶,根據(jù)其前第w周(w=1,2,…,nw)的日用電量數(shù)據(jù),評估每日用電系數(shù)和一周的日用電量波動率作為8個用電特征指標(biāo)。其表達(dá)式為:
(2)
(3)
本文未選用日用電量或氣溫靈敏度是因為當(dāng)基礎(chǔ)數(shù)據(jù)跨越不同季節(jié)時,即便同一用戶的此類指標(biāo)差異也很大,這種差異并不意味著對該用戶利用歷史數(shù)據(jù)預(yù)測用電量沒有意義。與此相比,選用的日用電系數(shù)和用電量波動率反映的是用戶一周內(nèi)日間用電量的相對變化關(guān)系,受氣溫影響小,故可在不同季節(jié)間比對,以判定用電模式的穩(wěn)定性和用電量預(yù)測的意義。
這樣,對于每一時期k(k?、?Ⅱ),可由所包含的各周的用電特征指標(biāo)組成如下指標(biāo)矩陣:
(4)
式中:下標(biāo)8表示式(2)和式(3)定義的用電特征指標(biāo)的個數(shù);n=nw/2為每一時期內(nèi)包含的周數(shù)。
2)標(biāo)準(zhǔn)化處理
用電特征指標(biāo)若量度單位不同或取值范圍差異非常大,會使數(shù)據(jù)較大的指標(biāo)起到明顯的支配作用。為避免該現(xiàn)象,將數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,具體公式為:
(5)
(6)
(7)
由此,對每一時期k(k取Ⅰ,Ⅱ)得到用電特征指標(biāo)的標(biāo)準(zhǔn)化陣,即
(8)
3)對標(biāo)準(zhǔn)化陣Zk求相關(guān)系數(shù)陣
對每一時期k,利用用電特征指標(biāo)標(biāo)準(zhǔn)化陣的數(shù)據(jù),求每兩個用電特征指標(biāo)之間的相關(guān)系數(shù)。第k時期第i和第j個用電特征指標(biāo)的相關(guān)系數(shù)計算為:
(9)
進(jìn)而構(gòu)成相關(guān)系數(shù)矩陣:
(10)
4)選取主成分
(11)
(12)
定義前p個主成分的累計方差貢獻(xiàn)率為:
(13)
主成分分析中,通常保留累計方差貢獻(xiàn)率達(dá)到85%以上的前p個主成分,舍去其余主成分,由此可在不顯著丟失信息量的條件下達(dá)到降維和剔除隨機(jī)因素的效果[9]。這前p個主成分可以式(11)中的特征向量為系數(shù),表示為原用電特征指標(biāo)標(biāo)幺值的如下線性組合。
(14)
在對第Ⅰ和第Ⅱ期數(shù)據(jù)求取主成分時,以同時滿足兩期主成分的累計方差貢獻(xiàn)率均達(dá)到85%以上為標(biāo)準(zhǔn)確定主成分個數(shù)p。
5)計算主成分因子載荷
(15)
6)得到用電模式矩陣
每一時期的主成分表征了用戶在該時期的用電模式,但主成分本身難以觀測,故用表達(dá)主成分與各原始用電特征指標(biāo)之間相關(guān)性的因子載荷描述各主成分。用戶在第k個時期的p個主成分的因子載荷構(gòu)成如下p×8階用電模式矩陣:
(16)
與k?、?Ⅱ?qū)?yīng)的因子載荷矩陣的相似性,反映了這兩段時間用電模式的相似性。為此,先求兩段時間內(nèi)每個主成分的因子載荷的歐氏距離:
(17)
式中:i=1,2,…,p。
進(jìn)而,以兩段時期所有主成分因子載荷歐氏距離的均值(如式(18)所示)定義該用戶兩段時間內(nèi)用電模式的相似性距離。D越大,則該用戶在兩段時間內(nèi)的用電模式越不相似,即用電模式越不穩(wěn)定。
(18)
以上海某小區(qū)728戶低壓用戶為例,開展用電模式穩(wěn)定性分析。搜集的集抄數(shù)據(jù)的時間跨度為2013年1月至2015年7月。
4.1 用戶用電模式判定結(jié)果
以2015年7月1日前的16周為基礎(chǔ)數(shù)據(jù)時間跨度(即nw=16),運用所提方法對728戶進(jìn)行用電模式穩(wěn)定性分析。該16周跨越了氣象條件迥異的3~6月,是提取用電模式難度較大的時期。進(jìn)而,采用有源自回歸(auto-regressive with extra inputs,ARX)模型[14](代表趨勢分析類方法)、反向傳播神經(jīng)網(wǎng)絡(luò)(back-propagation neural network,BPNN)[15](代表非趨勢分析類)兩種方法,對用戶實施2015年7月用電量預(yù)測,考察預(yù)測誤差與D之間的關(guān)聯(lián)性,以檢驗用電模式穩(wěn)定性分析方法所得結(jié)果的合理性。
附錄A中列舉了對一個用戶按第2節(jié)和第3節(jié)方法實施用電模式穩(wěn)定性分析的過程。對所有用戶實施該分析過程,所得D散點圖如圖1所示。若以D=2.15為閾值(對應(yīng)90%用戶為用電模式穩(wěn)定的情況),判定為用電模式穩(wěn)定的用戶有655家,這些用戶2015年7月用電量預(yù)測結(jié)果的MAPE為2.94%;而判定為用電模式不穩(wěn)定的73家用戶的同月MAPE為6.92%,明顯高于用電模式穩(wěn)定組。附錄B列舉了兩個用戶在16周所包含的兩個時期中的日用電量曲線。可見,被判定為模式不穩(wěn)定(D=2.353)的用戶在兩個時期的日用電量曲線差異顯著,而模式穩(wěn)定用戶(D=1.789)在兩個時期的日用電量波動規(guī)律具有一定的相似性。上述結(jié)果一定程度上表明了用電模式穩(wěn)定性判定結(jié)果的合理性。在實際應(yīng)用時,判定用電模式穩(wěn)定性的D閾值與一個地區(qū)用戶的生活內(nèi)容和作息習(xí)慣有關(guān),可根據(jù)歷史數(shù)據(jù)進(jìn)行多月的用電模式相似性判定、月用電量預(yù)測和相應(yīng)的預(yù)測精度檢驗,根據(jù)預(yù)測效果確定合適的閾值,以保證判定為穩(wěn)定的用戶組具有足夠高的預(yù)測精度。
圖1 PCAB法下所有用戶的D散點圖Fig.1 Scatter diagram of D with PCAB method for all customers
進(jìn)一步,考慮逐步增大不穩(wěn)定組用戶的比例(unstable user proportion,UUP)TUUP,此時有更多的用戶從穩(wěn)定組轉(zhuǎn)移到不穩(wěn)定組(轉(zhuǎn)移順序按D由大到小,D大的先轉(zhuǎn)移),重新統(tǒng)計穩(wěn)定組、不穩(wěn)定組2015年7月用電量預(yù)測結(jié)果的δMAPE,由此得到δMAPE-TUUP關(guān)系圖。PCAB方法下用ARX與BPNN預(yù)測時用電模式穩(wěn)定、不穩(wěn)定用戶組月用電量預(yù)測δMAPE與TUUP的關(guān)系如圖2所示。
圖2 PCAB方法下兩組用戶月電量δMAPE與TUUP的關(guān)系Fig.2 Relationship between δMAPE and TUUP of monthly consumption for two customer groups judged by PCAB method
由圖2可以得出以下結(jié)論。
1)在所采用的兩種預(yù)測方法中,由于ARX模型中帶有白噪聲序列,考慮了隨機(jī)因素對日用電量序列的干擾,所以預(yù)測精度比BNPP法高。
2) 無論ARX預(yù)測方法還是BNPP預(yù)測方法,δMAPE-TUUP的變化規(guī)律相似——當(dāng)TUUP增大時,穩(wěn)定組的δMAPE變化不大,而不穩(wěn)定用戶組的δMAPE呈下降趨勢,這說明穩(wěn)定用戶組里絕大多數(shù)用戶的D相近且很小,同時這部分用戶的δMAPE較低;當(dāng)TUUP增大時,穩(wěn)定組中D較大的用戶會優(yōu)先轉(zhuǎn)移到不穩(wěn)定組,且先轉(zhuǎn)移的用戶的預(yù)測誤差比后轉(zhuǎn)移用戶的大,即D與預(yù)測誤差之間存在正向關(guān)聯(lián)性。該現(xiàn)象進(jìn)一步驗證了本文所提用電模式穩(wěn)定性分析方法的合理性。
4.2 最佳歷史數(shù)據(jù)時間跨度分析
本節(jié)在nw=8~88周的范圍內(nèi)調(diào)節(jié)歷史數(shù)據(jù)時間跨度(每次增加2個月),考察時間跨度對用電模式穩(wěn)定性分析結(jié)果的影響。值得注意的是,增大nw時,歷史月集抄數(shù)據(jù)齊全,而可以實施分析的用戶數(shù)逐漸減少(例如:nw=88周時可分析用戶僅為372戶),下文中的結(jié)果是對可分析的用戶實施分析的結(jié)果。
各種時間跨度時PCAB方法下穩(wěn)定、不穩(wěn)定用戶組2015年7月用電量預(yù)測的δMAPE與TUUP的三維關(guān)系如圖3所示(兩種預(yù)測方法下趨勢規(guī)律相仿,故只選用精度較高的ARX法預(yù)測的δMAPE值)。
圖3 不同時間跨度時兩組用戶月電量δMAPE與TUUP關(guān)系Fig.3 Relationship between δMAPE and TUUP of monthly consumption for two customer groups with different time spans
附錄C將該三維圖旋轉(zhuǎn)到TUUP軸垂直于紙面的位置,以更直接地觀察兩組用戶的δMAPE與時間跨度之間的關(guān)系。從這些圖可得出以下結(jié)論。
1)無論哪個歷史數(shù)據(jù)時間跨度下,隨著TUUP的增大,穩(wěn)定組用戶的δMAPE變化不大,而不穩(wěn)定組用戶的δMAPE均呈下降趨勢。這說明D與預(yù)測誤差間的正向關(guān)聯(lián)性不依賴于歷史數(shù)據(jù)時間跨度。
2)在一定的TUUP下,隨著nw的加大,不穩(wěn)定組與穩(wěn)定組的δMAPE差值整體呈先增大、后縮小的趨勢。在過小的nw下穩(wěn)定組、不穩(wěn)定組δMAPE差距較小,這可能是因為歷史數(shù)據(jù)時間跨度過短且日用電量受隨機(jī)因素干擾大,主成分分析結(jié)果沒有準(zhǔn)確反映用電模式。而當(dāng)nw>24周時,兩組用戶的δMAPE又難以區(qū)分,這是因為當(dāng)歷史數(shù)據(jù)跨越兩個不同性質(zhì)的氣溫靈敏季節(jié)(一冬、一夏)時,即便是同一用戶在兩個時期的日用電系數(shù)和日用電波動率也有較大差異,這就使得基于上述指標(biāo)評估所得的D喪失了反映用電模式穩(wěn)定性的意義。
3)隨著閾值增大和TUUP的相應(yīng)增大,兩組用戶預(yù)測精度差異在縮小,但與nw取其他周數(shù)相比,nw=16周時穩(wěn)定、不穩(wěn)定用戶組δMAPE的差值最大,意味著此時所提方法可最好地區(qū)分兩組用戶。附錄D對負(fù)荷預(yù)測目標(biāo)月取2015年6月、5月、4月等多種情況做了類似的分析,所得δMAPE-nw-TUUP三維圖均表明,nw=16周時兩組用戶δMAPE值區(qū)分最明顯??梢?對于本文所提用電模式穩(wěn)定性分析方法而言,16周是歷史數(shù)據(jù)時間跨度的最佳選擇。
4.3 與其他方法的對比
4.3.1 與直接用用電特征指標(biāo)進(jìn)行相似性判定的對比
為揭示提取用電模式主成分的必要性,本節(jié)嘗試直接用用電特征指標(biāo)進(jìn)行相似性距離分析。具體做法是:仍取2015年7月為預(yù)測目標(biāo)月,將該月前16周分為兩期,將每期8周的日用電系數(shù)和日用電波動率8個指標(biāo)分別求取均值,得到兩個特征指標(biāo)向量;按90%用戶為穩(wěn)定組設(shè)定距離閾值,據(jù)兩個特征指標(biāo)向量的歐氏距離判定出用電模式穩(wěn)定、不穩(wěn)定組。
圖4為基于日用電特征指標(biāo)直接做相似性分析所判定的用電模式穩(wěn)定、不穩(wěn)定用戶組的月用電量預(yù)測δMAPE值與TUUP的關(guān)系圖。從中可見,兩種預(yù)測方法下,隨著TUUP的增大,不穩(wěn)定用戶組的δMAPE均呈先升后降的態(tài)勢,甚至出現(xiàn)穩(wěn)定用戶組的δMAPE高于不穩(wěn)定用戶組,說明日用電特征指標(biāo)的相似性未能很好地反映用電模式穩(wěn)定性。這是因為日用電特征指標(biāo)源于日用電量數(shù)據(jù),而后者受偶發(fā)因素的干擾大,直接對日用電特征指標(biāo)取均值并不能很好地刻畫用戶實際的用電特征。
圖4 基于日用電指標(biāo)兩組用戶月電量δMAPE與TUUP關(guān)系Fig.4 Relationship between δMAPE and TUUP of monthly consumption for two customer groups based on daily consumption factor
4.3.2 與現(xiàn)有用電模式穩(wěn)定性判定方法的對比
相關(guān)文獻(xiàn)很少,文獻(xiàn)[7]中提出了一種基于月份系數(shù)判定用戶用電模式穩(wěn)定性的方法,即以每年12個月的月份系數(shù)(月用電量占全年用電量的比重)表示用電模式,計算過去兩年月份系數(shù)的歐氏距離,以此判定用電模式的穩(wěn)定性。
將上述方法應(yīng)用于本例時,具有兩年集抄數(shù)據(jù)的用戶僅81戶。判定為穩(wěn)定、不穩(wěn)定用戶組2015年7月用電量預(yù)測結(jié)果的δMAPE值(采用精度較高的ARX法)與TUUP之間的關(guān)系如圖5所示。從中可見:TUUP較小時不穩(wěn)定用戶的δMAPE反而比穩(wěn)定用戶小,TUUP較大時兩組用戶的δMAPE也很相近。這說明相似性距離與負(fù)荷預(yù)測適用性之間失去了正關(guān)聯(lián)性。導(dǎo)致該現(xiàn)象的本質(zhì)原因是由于拉大時間跨度會弱化近期用電模式的變化對整個時間跨度內(nèi)用電模式相似性判定結(jié)果的影響,從而將一些近期用電模式發(fā)生變化的用戶錯判為穩(wěn)定。
圖5 基于月份系數(shù)法兩組用戶月電量δMAPE與TUUP關(guān)系Fig.5 Relationship between δMAPE and TUUP of monthly consumption for two customer groups based on monthly coefficient method
用電模式穩(wěn)定性分析是對用戶實施負(fù)荷(用電量)預(yù)測的前提,其本質(zhì)是對不同歷史時間段內(nèi)用戶用電模式相似性的判定?;诙唐?幾周)歷史數(shù)據(jù)的分析可提高方法的適用性,但日用電量受隨機(jī)因素干擾,準(zhǔn)確提取用電模式較為困難。針對上述問題,本文提出一種以日用電系數(shù)、日用電波動率為原始用電特征指標(biāo)提取用電模式主成分的方法,以不同歷史時間段內(nèi)用電模式主成分的因子載荷的歐氏距離D來判定用電模式的穩(wěn)定性。針對實際小區(qū)的算例分析,可以得出以下結(jié)論。
1)所提方法可顯著區(qū)分用電模式穩(wěn)定、不穩(wěn)定的用戶組,兩組用戶的月用電量預(yù)測誤差有明顯偏差,且D與用電量預(yù)測誤差呈正向關(guān)聯(lián)性。
2)選取適當(dāng)?shù)臍v史數(shù)據(jù)時間跨度對用電模式穩(wěn)定性分析至關(guān)重要。過大的時間跨度會限制穩(wěn)定性分析的適用范圍并降低分析結(jié)果的準(zhǔn)確性;而過小的時間跨度也會降低用電模式提取的準(zhǔn)確性。本文所提方法采用16周的歷史數(shù)據(jù)時間跨度較為適宜。
值得一提的是,目前對負(fù)荷預(yù)測問題多關(guān)注預(yù)測算法和預(yù)測精度,而本文的研究結(jié)果如下:當(dāng)負(fù)荷預(yù)測針對單個用戶時,用電模式穩(wěn)定性分析是負(fù)荷預(yù)測有無價值的前提;另一方面,目前對主成分分析在負(fù)荷預(yù)測中的應(yīng)用主要局限于降維的目的,而本文的研究表明,主成分分析也具有剔除隨機(jī)因素干擾、提取用電模式的應(yīng)用價值。不過,本文主要提出了用電模式穩(wěn)定性分析的思想和方法,對判定用電模式穩(wěn)定的D閾值的設(shè)定方法還有待后續(xù)研究。
附錄見本刊網(wǎng)絡(luò)版(http://www.aeps-info.com/aeps/ch/index.aspx)。
[1] BARBATO A, CAPONE A, RODOLFI M, et al. Forecasting the usage of household appliances through power meter sensors for demand management in the smart grid[C]// Proceedings of the 2011 IEEE International Conference on Smart Grid Communications (SmartGridComm), October 17-20, 2011, Brussels, Belgium: 404-409.
[2] LOGENTHIRAN T, SRINIVASAN D, PHYU E. Particle swarm optimization for demand side management in smart grid[C]// Proceedings of the 2015 IEEE Innovative Smart Grid Technologies-Asia, November 3-6, 2015, Bangkok, Thailand: 1-6.
[3] 李海林,郭崇慧.基于云模型的時間序列分段聚合近似方法[J].控制與決策,2011,26(10):1525-1529.
LI Hailin, GUO Chonghui. Piecewise aggregate approximation method based on cloud model for time series[J]. Control and Decision, 2011, 26(10): 1525-1529.
[4] STYLIOS C D, KREINOVICH V. Symbolic aggregate approximation (SAX) under interval uncertainty[C]// Proceedings of the Annual Conference of the North American Fuzzy Information Processing Society, August 17-19, 2015, Redmond, WA, USA: 1-7.
[5] 李海林.時間序列數(shù)據(jù)挖掘中的特征表示與相似性度量方法研究[D].遼寧:大連理工大學(xué),2012.
[6] 唐昆明,蔡明,羅建,等.基于奇異值分解的非線性負(fù)荷諧波源定位方法[J].電力系統(tǒng)自動化,2012,36(1):96-100.
TANG Kunming, CAI Ming, LUO Jian, et al. Harmonic source location based on singular value decomposition method[J]. Automation of Electric Power Systems, 2012, 36(1): 96-100.
[7] 王衛(wèi)公,牟婷婷,王蘭君,等.基于灰色分析的集抄數(shù)據(jù)異常判定[J].電網(wǎng)與清潔能源,2016,32(4):6-11.
WANG Weigong, MOU Tingting, WANG Lanjun, et al. Data anomaly determination for centralized metering systems based on the grey analysis methods[J]. Power System and Clean Energy, 2016, 32(4): 6-11.
[8] 李磊,嚴(yán)正,馮冬涵,等.結(jié)合主成分分析及生產(chǎn)函數(shù)的電網(wǎng)智能技術(shù)評價探討[J].電力系統(tǒng)自動化,2014,38(11):56-61.DOI:10.7500/AEPS20130327014.
LI Lei, YAN Zheng, FENG Donghan, et al. Discussion on intelligent technology evaluation of electrical power grid based on principal component analysis and production function[J]. Automation of Electric Power Systems, 2014, 38(11): 56-61. DOI: 10.7500/AEPS20130327014.
[9] 何曉群,多元統(tǒng)計分析[M].北京:中國人民大學(xué)出版社,2015:113-141.
[10] 周松林,茆美琴,蘇建徽.基于主成分分析與人工神經(jīng)網(wǎng)絡(luò)的風(fēng)電功率預(yù)測[J].電網(wǎng)技術(shù),2011,35(9):128-132.
ZHOU Songlin, MAO Meiqin, SU Jianhui. Prediction of wind power based on principal component analysis and artificial neural network[J]. Power System Technology, 2011, 35(9): 128-132.
[11] HE Dong, LIU Ruiye. Ultra-short-term wind power prediction using ANN ensemble based on PCA[C]// Proceedings of the 7th International Power Electronics and Motion Control Conference, June 2-5, 2012, Harbin, China: 2108-2112.
[12] LIU Baoying, YANG Rengang. A novel method based on PCA and LS-SVM for power load forecasting[C]// Proceedings of the Third International Conference on Electric Utility Deregulation and Restructuring and Power Technologies, April 6-9, 2008, Nanjing, China: 759-763.
[13] 李慶揚,王能超,易大義.數(shù)值分析[M].北京:清華大學(xué)出版社,2013:138-142.
[14] BAI Feifei, BHATT N, ROSSO A D, et al. Input signals selection for measurement-based power system ARX dynamic model response estimation[C]// Proceedings of the 2014 IEEE PES T&D Conference and Exposition, April 14-17, 2014, Chicago, IL, USA: 1-7.
[15] 張大海,畢研秋,畢研霞,等.基于串聯(lián)灰色神經(jīng)網(wǎng)絡(luò)的電力負(fù)荷預(yù)測方法[J].系統(tǒng)工程理論與實踐,2004,12:128-132.
ZHANG Dahai, BI Yanqiu, BI Yanxia, et al. Power load forecasting method base on serial grey neural nework[J]. System Engineering Theory and Practice, 2004, 12:128-132.
Stability Analysis of Consumption Mode Based on Principal Component Analysis
MOUTingting1,LUWei2,WANGLanjun2,XINJieqing1
(1. Key Laboratory of Control of Power Transmission and Conversion (Shanghai Jiao Tong University), Ministry of Education, Shanghai 200240, China; 2. Shibei Electricity Supply Company, State Grid Shanghai Municipal Electric Power Company, Shanghai 200072, China)
Consumption mode stability analysis (CMSA) is the precondition of load forecasting, the essence of which is to judge the similarity of a customer’s consumption features in different historical time periods. Extracting consumption features from data of a long time period reduces the feasibility and accuracy of CMSA, using the short-time data might also be of low accuracy because daily consumption data are influenced by random factors. A method is therefore proposed to extract the customers’ consumption modes by principal component analysis and taking daily consumption coefficients and daily consumption volatility as original consumption features. The stability of consumption mode is further judged by the Euclidean distance between the factor loading vectors of the principal components in two historical periods. A numerical example is provided by a residential community. Results show that the monthly consumption forecast accuracy is apparently different from the consumers in stable and unstable consumption modes judged by the proposed method and there is significant positive correlation between the similarity distance and the forecast error. It's also concluded that proper data period is of utmost importance to the feasibility and accuracy of CMSA. It seems 16 weeks will be appropriate for the CMSA problem.
This work is supported by National Natural Science Foundation of China (No. 51337005) and State Grid Corporation of China (No. 5209141500QW).
stability of consumption mode; principal component analysis; similarity judgment; load forecasting
2016-12-22;
2017-03-30。
上網(wǎng)日期: 2017-06-14。
國家自然科學(xué)基金資助項目(51337005);國家電網(wǎng)公司科技項目(5209141500QW)。
牟婷婷(1992—),女,碩士研究生,主要研究方向:數(shù)據(jù)挖掘技術(shù)在集抄數(shù)據(jù)分析中的應(yīng)用。E-mail: fallen_mtt@sjtu.edu.cn
陸 微(1982—),男,經(jīng)濟(jì)師,主要研究方向:電力營銷和電量電費。E-mail: 13917109982@139.com
王蘭君(1983—),女,經(jīng)濟(jì)師,主要研究方向:電力營銷和營業(yè)管理。E-mail: lanlanwang_@163.com
辛潔晴(1973—),女,通信作者,副教授,主要研究方向:電力營銷與電力市場。E-mail: jqxin@sjtu.edu.cn
(編輯 孔麗蓓)