陳毅波,鄭 玲,姚建剛
?
基于粗糙集理論與D-S證據(jù)理論改進(jìn)的多元回歸負(fù)荷預(yù)測方法研究
陳毅波1,鄭 玲2,姚建剛2
(1.國網(wǎng)湖南省電力公司通信公司,湖南 長沙 410007;2.湖南大學(xué)電氣與信息工程學(xué)院,湖南 長沙 410012)
當(dāng)前,中長期負(fù)荷預(yù)測大多采用多元回歸算法,但在建模時(shí)對影響因子及歷史年的選擇缺乏良好的依據(jù),很難在考慮更多影響因子及歷史年數(shù)據(jù)與降低回歸模型誤差之間做出平衡。這使多元回歸算法在實(shí)際負(fù)荷預(yù)測中的精準(zhǔn)度很不穩(wěn)定。將粗糙集理論與D-S證據(jù)理論引入多元回歸算法,利用粗糙集理論對影響因子進(jìn)行重要性排序。分別以歷史年和影響因子為對象進(jìn)行聚類,以此建立多個(gè)多元回歸模型。利用D-S證據(jù)理論對多個(gè)組合預(yù)測的權(quán)重分配方案進(jìn)行權(quán)重融合,得出最終基于多元回歸分析法的組合預(yù)測模型。經(jīng)算例驗(yàn)證,該模型能較好地平衡影響因子和歷史年的選取,能有效提高多元回歸算法在中長期負(fù)荷預(yù)測中的準(zhǔn)確性,適用性強(qiáng)。
中長期負(fù)荷預(yù)測;多元回歸;粗糙集方法;D-S證據(jù)理論
電力系統(tǒng)中長期負(fù)荷預(yù)測中負(fù)荷受經(jīng)濟(jì)、社會和氣象等不確定因素影響較大,如何從多因素中提取關(guān)鍵影響因子和減小多因素綜合所帶來的不確定性并提高預(yù)測結(jié)果的精確性成為亟待解決的問題。
目前常用的中長期負(fù)荷預(yù)測算法中,偏最小二乘回歸預(yù)測模型對影響因子的利用比較有效,國內(nèi)外相關(guān)研究也較多。文獻(xiàn)[1]對最小二乘法做了一定改進(jìn)后運(yùn)用于中長期負(fù)荷預(yù)測中,取得了一定效果。但是利用偏最小二乘法進(jìn)行中長期負(fù)荷預(yù)測,由于歷史樣本跨越時(shí)間較長,在建模過程中往往會帶入過于久遠(yuǎn)的數(shù)據(jù)信息,會較大地影響回歸模型在預(yù)測年的適用性。并且在主成份分析時(shí),過多的影響因子會使主成份的構(gòu)成變得復(fù)雜,從而使各主成份的實(shí)際含義解釋變得模糊,最終影響整個(gè)模型的解釋能力。
本文將粗糙集理論及D-S證據(jù)理論引入偏最小二乘法回歸分析對負(fù)荷預(yù)測的計(jì)算中。首先本算法對中長期負(fù)荷預(yù)測中各影響因子的重要性即與負(fù)荷的相關(guān)程度進(jìn)行排序,并利用K-means聚類分析法得出多組影響因子聚集;將歷史年的各影響因子狀況作為其屬性,以歷史年為對象進(jìn)行聚類,得出多組歷史年聚集。再分別利用偏最小二乘回歸分析法對各組歷史年的各組影響因子聚集進(jìn)行建模,每一組歷史年聚集可得出多個(gè)不同影響因子的多元回歸分析模型。利用方差協(xié)方差權(quán)重優(yōu)化算法,對相同年組內(nèi)的不同預(yù)測模型進(jìn)行權(quán)重值優(yōu)化分配。最后采用基于D-S證據(jù)理論的信息融合算法對全部預(yù)測模型的權(quán)重方案進(jìn)行融合,得出最終的組合預(yù)測模型。該建模過程充分利用了各影響因素及其對預(yù)測的關(guān)聯(lián)性,考慮了建模中歷史數(shù)據(jù)的廣度及相似性,加強(qiáng)了多元回歸模型的數(shù)學(xué)關(guān)系在預(yù)測年的適用性。最終目的是使建立的模型能考慮所有影響因子及歷史年數(shù)據(jù),同時(shí)能強(qiáng)化其中最優(yōu)的數(shù)據(jù)組合,提高預(yù)測精度。經(jīng)過算例驗(yàn)證,該方法有效提高了負(fù)荷預(yù)測的精確性。
1.1 粗糙集理論
粗糙集方法是一種有效的軟計(jì)算方法,不需要預(yù)先給定相關(guān)屬性的數(shù)量描述,并能夠直接從數(shù)據(jù)中提取出簡潔且有效的決策規(guī)則,這為解決多因素綜合電力負(fù)荷預(yù)測存在的冗余信息和噪音數(shù)據(jù)等問題提供了一條途徑[2-4]。本文將粗糙集應(yīng)用于電力負(fù)荷預(yù)測中,分析負(fù)荷(決策屬性)對各影響因素(條件屬性)的依賴度及各條件屬性在條件屬性集中的重要性。
粗糙集屬性約簡的具體步驟為
(1)?數(shù)據(jù)預(yù)處理和特征化數(shù)據(jù)。采用一定的粗糙集離散化算法將決策表中的條件屬性和決策屬性變量歷史數(shù)據(jù)進(jìn)行離散化。對離散化后的新決策表進(jìn)行屬性約簡并得到約簡后的決策規(guī)則。
(3)?計(jì)算屬性的權(quán)系數(shù),并進(jìn)行屬性集的各因素的重要性排序。用式(2)、式(3)計(jì)算屬性在屬性集中的重要性。
(3)
1.2 D-S證據(jù)理論
1.2.1 D-S證據(jù)理論基礎(chǔ)
D-S證據(jù)理論[5-6]是對貝葉斯統(tǒng)計(jì)推斷理論的一種推廣。D-S證據(jù)理論用“識別框架”表示所感興趣的命題集,若識別框架在集函數(shù)(其中為的冪集)上滿足:
1.2.2 基于證據(jù)理論的權(quán)重融合
(1)?方差協(xié)方差權(quán)重分配方法
本文選用方差協(xié)方差權(quán)重優(yōu)化方法進(jìn)行組合預(yù)測模型中各單一預(yù)測模型的權(quán)重分配[7]。假設(shè)有種預(yù)測模型,進(jìn)行了期預(yù)測,則第種模型的第期預(yù)測值為,預(yù)測誤差為,預(yù)測誤差方差為,預(yù)測模型構(gòu)成的組合預(yù)測結(jié)果為
(6)
(8)
(2)?證據(jù)理論Dempster合成法則
在權(quán)重進(jìn)行融合時(shí),對預(yù)測精度較高的預(yù)測值賦予較大的權(quán)重,對預(yù)測精度較低的預(yù)測值賦予較小的權(quán)重,這與證據(jù)理論中基本可信度分配滿足的條件類似,因此可以通過類比的思想,利用證據(jù)理論的Dempster合成法則對多組權(quán)重進(jìn)行融合,在負(fù)荷預(yù)測融合模型中,模型權(quán)重就類似于證據(jù)理論的基本信度值。利用式(10)信度的合成法則進(jìn)行融合,融合后的基本信度值可作為預(yù)測模型融合的權(quán)重。
電力系統(tǒng)負(fù)荷預(yù)測的過程通常包括許多不確定因素,如原始數(shù)據(jù)觀測誤差、特征屬性選擇、預(yù)測算法選擇等。針對單因素不確定性的分析和處理方法有很多種,但電力系統(tǒng)是受多種因素影響的復(fù)雜非線性系統(tǒng),負(fù)荷預(yù)測過程復(fù)雜,只有同時(shí)減少多種因素帶來的不確定性才能達(dá)到較好的預(yù)測效果。為減少負(fù)荷預(yù)測屬性選擇的影響,可采用粗糙集方法計(jì)算各屬性的影響程度并排序[8-11],用K-means聚類算法對歷史年和排序后的影響因子進(jìn)行分組,然后對各組統(tǒng)一采用偏最小二乘回歸分析方法進(jìn)行預(yù)測得到各組的預(yù)測結(jié)果,再利用D-S證據(jù)理論融合為一個(gè)最終的預(yù)測結(jié)果[12-15]。
基于粗糙集理論和D-S證據(jù)理論的多元回歸組合預(yù)測方法如圖1所示的6個(gè)步驟。
圖1 負(fù)荷預(yù)測算法流程圖
步驟1:利用粗糙集算法對影響因子進(jìn)行分析,得出各影響因子對電量的影響程度,并利用K-means算法,對影響因子進(jìn)行聚類分析,再根據(jù)建模需求簡化得出組影響因子。
步驟2:以影響因子為對象屬性,對歷史年進(jìn)行K-means聚類,再根據(jù)建模需求進(jìn)行簡化,得到組歷史年。
步驟3:依次利用組歷史年中的組影響因子進(jìn)行多元回歸建模,可得到個(gè)模型,如式(11)所示。
步驟5:利用D-S證據(jù)理論將組權(quán)重進(jìn)行融合,得到最終權(quán)重分配方案。1個(gè)組合預(yù)測模型中有個(gè)多元回歸模型,分別對應(yīng)了組影響因子聚集。
步驟6:利用與預(yù)測年為同一聚集的歷史年數(shù)據(jù)建立組合預(yù)測模型,并進(jìn)行負(fù)荷預(yù)測。
采用XX地區(qū)1999~2013年社會經(jīng)濟(jì)及全社會電量數(shù)據(jù),如表1,對該地區(qū)2014年的用電量進(jìn)行預(yù)測。
步驟1:利用1999至2013年的歷史值,計(jì)算出各影響因子在條件屬性集中對決策屬性全社會用電量的重要程度,其結(jié)果如表2所示。以影響因子的重要程度為對象屬性對影響因子進(jìn)行聚類分析,其結(jié)果如下:
上述5組簡化為3組可得
根據(jù)建模的需要變化為
經(jīng)過簡化后的分組既保持了原本的重要性分級,也簡化了后面的建模數(shù)量。
步驟2:以1999至2014年為對象,以影響因子為屬性對歷史年進(jìn)行聚類,其結(jié)果如下:
將以上5組簡化為3組可得
步驟3:由于2014年為預(yù)測年,因此不將其用于建模,利用以上分組依次建立回歸模型如下:
表1 XX地區(qū)1999~2014年社會經(jīng)濟(jì)指標(biāo)及全社會用電量
表2 條件屬性集合中各條件屬性的重要程度
步驟4:對各組中的三個(gè)預(yù)測模型進(jìn)行組合權(quán)重分配,其結(jié)果如表3所示。
表3 各組預(yù)測模型對應(yīng)權(quán)重
步驟5:利用D-S證據(jù)理論關(guān)于基本可信度分配概念,結(jié)合前述的數(shù)學(xué)模型,將表3中的權(quán)重轉(zhuǎn)化為相應(yīng)的基本信度值,再通過信度函數(shù)的Dempster合成法則將對應(yīng)的信度函數(shù)進(jìn)行多重融合,即可得到預(yù)測年各組的預(yù)測模型權(quán)重。權(quán)重的具體融合結(jié)果如表4所示。
表4 權(quán)重的具體融合結(jié)果
步驟6:根據(jù)上述歷史年的聚類結(jié)果可知,2014與2008~2013的發(fā)展情況最為相似,因此選用2008~ 2013年的數(shù)據(jù)建立回歸模型,即。
選用表4中二重融合權(quán)重值為組合預(yù)測模型中三個(gè)預(yù)測模型的權(quán)重,則最終的預(yù)測模型為
最終預(yù)測結(jié)果如表5所示。
表5 2014年年電量預(yù)測結(jié)果分析
由表5中五種預(yù)測模型的結(jié)果分析可知:
②方差-協(xié)方差組合預(yù)測模型準(zhǔn)確率比任意單一預(yù)測模型準(zhǔn)確率都高。說明組合預(yù)測模型比單一預(yù)測模型預(yù)測效果更好。
③粗糙集D-S模型的準(zhǔn)確率較方差-協(xié)方差組合預(yù)測模型有一定提高,對單一預(yù)測模型有較大提高,說明其權(quán)重分配方法效果更好,能有效提高預(yù)測結(jié)果。
本文提出了基于粗糙集方法和D-S證據(jù)理論改進(jìn)的多元回歸中長期負(fù)荷預(yù)測方法。本算法利用粗糙集理論對影響因子進(jìn)行重要性排序,并以重要性為其屬性進(jìn)行聚類。之后對歷史年進(jìn)行聚類,并以不同的影響因子組與歷史年組進(jìn)行搭配建立多個(gè)多元回歸模型,利用相同年組的多個(gè)回歸模型建立組合預(yù)測模型,得到多組權(quán)重值。最后利用D-S證據(jù)理論對多組權(quán)重值進(jìn)行融合,得出最終權(quán)重分配方案。此方法即保留了全部歷史資料信息,又優(yōu)化了各影響因子及歷史年對模型建立的影響程度,使多元回歸建模過程中對歷史資料的運(yùn)用更加合理。由算例結(jié)果分析可知,基于粗糙集理論和D-S證據(jù)理論改進(jìn)的多元回歸算法相對于單一多元回歸預(yù)測模型在預(yù)測精度上有較大的提高,有較好的實(shí)用性。
[1] 季澤宇, 袁越, 鄒文仲. 改進(jìn)偏最小二乘回歸在電力負(fù)荷預(yù)測中的應(yīng)用[J]. 電力需求側(cè)管理, 2011, 13(1): 10-14.
JI Zeyu, YUAN Yue, ZOU Wenzhong. Application of improved partial least square regressive model in power load forecasting[J]. Power Demand Side Management, 2011, 13(1): 10-14.
[2] 尹東陽, 盛義發(fā), 蔣明潔, 等. 基于粗糙集理論-主成分分析的Elman神經(jīng)網(wǎng)絡(luò)短期風(fēng)速預(yù)測[J]. 電力系統(tǒng)保護(hù)與控制, 2014, 42(11): 46-51.
YIN Dongyang, SHENG Yifa, JIANG Mingjie, et al. Short-term wind speed forecasting using Elman neural network based on rough set theory and principal components analysis[J]. Power System Protection and Control, 2014, 42(11): 46-51.
[3] WANG Guoyin, HE Li. Rough set extensions in incomplete information systems[J]. Frontiers of Electrical and Electronic Engineering in China, 2008, 35(4): 68-79.
[4] 肖河, 肖盛.基于粗糙集理論的遺傳神經(jīng)網(wǎng)絡(luò)風(fēng)速預(yù)測模型[J]. 電網(wǎng)與清潔能源, 2012, 28(9): 82-87.
XIAO He, XIAO Sheng. Wind speed forecasting model of genetic algorithm neural network based on rough set theory[J]. Power System and Clean Energy, 2012, 28(9): 82-87.
[5] 朱建全, 劉鋒, 梅生偉, 等.基于證據(jù)推理的電力負(fù)荷建模[J]. 電工技術(shù)學(xué)報(bào), 2015, 30(15): 89-95.
ZHU Jianquan, LIU Feng, MEI Shengwei, et al. Electric load modeling based on evidence reasoning[J]. Transactions of China Electrotechnical Society, 2015, 30(15): 89-95.
[6] 李玲玲, 劉敬杰, 凌躍勝, 等.物元理論和證據(jù)理論相結(jié)合的電能質(zhì)量綜合評估[J]. 電工技術(shù)學(xué)報(bào), 2015, 30(12): 383-391.
LI Lingling, LIU Jingjie, LING Yuesheng, et al. Power quality comprehensive evaluation based on matter-element theory and evidence theorys[J]. Transactions of China Electrotechnical Society, 2015, 30(12): 383-391.
[7] 賀輝. 電力負(fù)荷預(yù)測和負(fù)荷管理[M]. 北京: 中國電力出版社, 2013.
[8] 張慶寶, 程浩忠, 劉青山, 等. 基于粗糙集屬性約簡算法和支持向量機(jī)的短期負(fù)荷預(yù)測[J]. 電網(wǎng)技術(shù), 2006, 30(8): 56-59, 70.
ZHANG Qingbao, CHENG Haozhong, LIU Qingshan, et al. Short-term load forecasting based on attribute reduction algorithm of rough sets and support vector machine[J]. Power System Technology, 2006, 30(8): 56-59, 70.
[9] 李偉, 閆寧, 張振剛. 基于粗糙集的混合支持向量機(jī)長期電力負(fù)荷預(yù)測研究[J]. 電力系統(tǒng)保護(hù)與控制, 2010, 38(13): 31-34.
LI Wei, YAN Ning, ZHANG Zhengang. Study on long-term load forecasting of MIX-SVM based on rough set theory[J].Power System Protection and Control, 2010, 38(13): 31-34.
[10] 李永德, 李紅偉, 張炳成, 等. 融合粗糙集與神經(jīng)網(wǎng)絡(luò)的燃?xì)廨啺l(fā)電機(jī)組振動故障診斷方法[J]. 電力系統(tǒng)保護(hù)與控制, 2014, 42(8): 90-94.
LI Yongde, LI Hongwei, ZHANG Bingcheng, et al. Fault diagnosis of gas turbine generator set by combination of rough sets and neural network[J]. Power System Protection and Control, 2014, 42(8): 90-94.
[11] 蔣亞坤, 李文云, 趙瑩, 等. 粗糙集與證據(jù)理論結(jié)合的電網(wǎng)運(yùn)行優(yōu)質(zhì)性綜合評價(jià)[J]. 電力系統(tǒng)保護(hù)與控制, 2015, 43(13): 1-7.
JIANG Yakun, LI Wenyun, ZHAO Ying, et al. Evaluation of power quality performance based on rough set and evidence theory[J]. Power System Protection and Control, 2015, 43(13): 1-7.
[12] 吳京秋, 孫奇, 楊偉, 等. 基于D-S證據(jù)理論的短期負(fù)荷預(yù)測模型融合[J]. 電力自動化設(shè)備, 2009, 29(4): 66-70.
WU Jingqiu, SUN Qi, YANG Wei, et al. Short-term load forecasting model fusion based on D-S evidence theory[J]. Electric Power Automation Equipment, 2009, 29(4): 66-70.
[13] 李玲玲, 曹麗鵬, 劉伯穎, 等. 多屬性系統(tǒng)中的屬性權(quán)重分配方法[J]. 電工技術(shù)學(xué)報(bào), 2015, 30(1): 422-527.
LI Lingling, CAO Lipeng, LIU Boying, et al. The method of attribute weight distribution in multi-attribute system[J]. Transactions of China Electrotechnical Society, 2015, 30(1): 422-527.
[14] 齊振忠. 多信息融合的變壓器實(shí)時(shí)狀態(tài)評估[J]. 高壓電器, 2012, 48(1): 95-99.
QI Zhenzhong. Real-time status evaluation of transformer with multi-information fusion technology[J]. High Voltage Apparatus, 2012, 48(1): 95-99.
[15] 趙云峰, 張永強(qiáng), 聶德鑫, 等.基于模糊和證據(jù)理論的變壓器本體絕緣狀態(tài)評估方法[J]. 電力系統(tǒng)保護(hù)與控制, 2014, 42(23): 57-62.
ZHAO Yunfeng, ZHANG Yongqiang, NIE Dexin, et al. Application of fuzzy and evidence theory in power transformers condition assessment[J]. Power System Protection and Control, 2014, 42(23): 57-62.
(編輯 魏小麗)
Improved multiple regression load forecasting method based on rough set theory and D-S evidence theory
CHEN Yibo1, ZHENG Ling2, YAO Jiangang2
(1. State Grid Information & Communication Company of Hunan Province, Changsha 410007, China;2. College of Electrical and Information Engineering, Hunan University, Changsha 410012, China)
Nowadays, multivariate regression algorithm is mostly adopted in the mid-long term load forecasting, but it lacks good theoretical foundation for the selecting of the impact factors and the past years when modeling. It is difficult to make a balance between considering more affecting factors, historical data and reducing the regression model error, which leads to the inaccuracy of the multivariate regression algorithm in actual load forecasting. Rough set theory and D-S evidence theory are applied to the multivariate regression algorithm. First, rough set theory is used to sort the importance of influencing factors, and then the impact factors and the historical years are clustered respectively, so that several multiple regression models can be built. Additionally, the weights of different models are fused by using D-S evidence theory. In this way, the final combination forecasting model based on the multivariate regression analysis method can be built. According to the valid example, it can be concluded that the final model can preferably balance the selection of impact factors and past years while effectively improve the accuracy of the multiple regression algorithm in the mid-long term load forecasting, which provides stronger applicability at the same time.
mid-long term load forecasting; multivariate regression algorithm; rough set theory; D-S evidence theory
10.7667/PSPC150852
2015-05-20;
2015-07-14
陳毅波(1982-),男,博士,工程師,主要從事面向電力信息基礎(chǔ)平臺的信息關(guān)鍵技術(shù)研究;E-mail: chenyibo8224@gmail.com 鄭 玲(1991-),女,通信作者,碩士研究生,研究方向?yàn)殡娏ο到y(tǒng)負(fù)荷預(yù)測;E-mail: 15116403583@163.com 姚建剛(1952-),男,教授,博士生導(dǎo)師,主要從事高電壓絕緣技術(shù)、電力系統(tǒng)自動化和電力市場理論及其應(yīng)用方面的研究。E-mail: yaojiangang@126.com