馬立新,鄭曉棟,尹晶晶
(上海理工大學(xué) 光電信息與計(jì)算機(jī)工程學(xué)院,上海 200093)
基于粗糙特征量的短期電力負(fù)荷預(yù)測(cè)
馬立新,鄭曉棟,尹晶晶
(上海理工大學(xué) 光電信息與計(jì)算機(jī)工程學(xué)院,上海200093)
摘要針對(duì)負(fù)荷特征一直是實(shí)際電力負(fù)荷預(yù)測(cè)中的重大問(wèn)題。提出了基于粗糙特征量的約簡(jiǎn)算法。通過(guò)對(duì)天氣及負(fù)荷歷史數(shù)據(jù)進(jìn)行挖掘,找到負(fù)荷的關(guān)鍵特征,并與徑向基網(wǎng)絡(luò)結(jié)合建立了負(fù)荷預(yù)測(cè)模型。算例結(jié)果表明,與按經(jīng)驗(yàn)選取輸入的傳統(tǒng)網(wǎng)絡(luò)相比,預(yù)測(cè)準(zhǔn)確度有了明顯的提高,更適用于電力負(fù)荷預(yù)測(cè)。
關(guān)鍵詞電力系統(tǒng);徑向基;粗糙特征量;負(fù)荷預(yù)測(cè)
Short-term Load Forecasting Based on Rough Characteristic-component Algorithm
MA Lixin,ZHENG Xiaodong,YIN Jingjing
(School of Optical-Electrical and Computer Engineering,University of Shanghai for
Science and Technology,Shanghai 200093,China)
AbstractThe key characteristic of mining influence the load is always an important problem in power load forecasting.A reduction algorithm through rough characteristic-component algorithm is introduced.The key characteristics of the date of weather and history load data are discussed,and then a model combined with radical basis function neural network is established.Forecasting results of calculation examples show that the forecasting accuracy is obviously improved and more suitable for short-term load forecasting compared with traditional radical basis function neural network model that chooses input parameters in the light of experience.
Keywordspower system;RBF;rough characteristic-component;load forecasting
負(fù)荷預(yù)測(cè)是電力系統(tǒng)規(guī)劃、用電、調(diào)度等部門的基礎(chǔ),但是有許多因素會(huì)影響預(yù)測(cè)的準(zhǔn)確度,如歷史負(fù)荷數(shù)據(jù)、天氣情況、日類型等。
由于人工神經(jīng)網(wǎng)絡(luò)算法[1]能獲得較高的預(yù)測(cè)準(zhǔn)確度,近年來(lái)成為了負(fù)荷預(yù)測(cè)的主要方法。本文將使用徑向基神經(jīng)網(wǎng)絡(luò)(RBF)對(duì)短期負(fù)荷進(jìn)行預(yù)測(cè)。RBF網(wǎng)絡(luò)的結(jié)構(gòu)簡(jiǎn)單、訓(xùn)練簡(jiǎn)潔、并在學(xué)習(xí)收斂速度上有更強(qiáng)的優(yōu)勢(shì)。但RBF最主要的問(wèn)題是不能提取數(shù)值的特征,一切學(xué)習(xí)都是算術(shù)運(yùn)算,其結(jié)果是信息丟失,預(yù)測(cè)準(zhǔn)確度下降。考慮到粗糙集(Rough Set)是數(shù)據(jù)挖掘方法之一,因其能夠直接從已知的數(shù)據(jù)中建立起決策規(guī)則,故成為了一種有效挖掘數(shù)據(jù)特征的方法。但基于原始粗糙集的約簡(jiǎn)算法有較大的局限性,文獻(xiàn)[2~3]采用了基于屬性重要性的啟發(fā)式約簡(jiǎn)算法,改善了約簡(jiǎn)性能,但是計(jì)算比較復(fù)雜,而且基于原始粗糙集算法法雖然具有約簡(jiǎn)屬性,提取數(shù)值的特征,但也有可能無(wú)法得到核屬性。本文在研究粗糙集基礎(chǔ)上,提出了一種基于粗糙特征量的約簡(jiǎn)算法。針對(duì)有核或者是無(wú)核的決策表,該算法可以通過(guò)計(jì)算屬性在差別矩陣中的出現(xiàn)的次數(shù)與頻率進(jìn)行約簡(jiǎn),提取特征。算例結(jié)果表明,新模型與標(biāo)準(zhǔn)RBF方法相比,獲得了較高的預(yù)測(cè)準(zhǔn)確度,進(jìn)而體現(xiàn)了該算法的優(yōu)越性。
1粗糙集簡(jiǎn)介
定義
S=〈U,A,V,f〉
(1)
式(1)中,S是帶有決策的信息系統(tǒng);U={x1,x2,…,xn}為論域;A=C∪D是屬性集合;C={c1,c2,…,cm}為條件屬性集合;D=j5i0abt0b為決策屬性集合;V={V1,V2,…,Vm}是屬性的值域集,其中,Vi是屬性Ai的值域;f∶U×A→V是信息函數(shù),其為論域U中每個(gè)條件屬性C設(shè)定一個(gè)信息值V。單個(gè)決策屬性的決策表如表1所示,其中,f(xi,ci)∈uj,i,f(xi,d)∈yi,且ui,j為對(duì)象xi與條件屬性ci對(duì)應(yīng)的值,yi為對(duì)象xi與決策屬性d對(duì)應(yīng)的值。
表1 決策表的表達(dá)形式
約簡(jiǎn)具體過(guò)程:(1)在論域中設(shè)定條件屬性和決策屬性,并建立成決策表;(2)如果決策表中的條件屬性是連續(xù)變量,則使用粗糙集[4-5]離散化算法將決策表離散化;(3)對(duì)離散化的決策表進(jìn)行屬性約簡(jiǎn),得到約簡(jiǎn)屬性和決策規(guī)則。
2RBF結(jié)構(gòu)模型
RBF[6-7]網(wǎng)絡(luò)的神經(jīng)元模型結(jié)構(gòu)如圖1所示。RBF網(wǎng)絡(luò)的節(jié)點(diǎn)激活函數(shù)采用徑向基函數(shù),通常定義為空間任意一點(diǎn)到某一個(gè)中心之間歐幾里得距離的單調(diào)函數(shù)。
圖1 RBF神經(jīng)元模型
由輸入層、隱藏層和輸出層建立的普通徑RBF網(wǎng)絡(luò)的結(jié)構(gòu)如圖2所示。
圖2 RBF網(wǎng)絡(luò)結(jié)構(gòu)
在RBF網(wǎng)絡(luò)中,輸入層只是有傳輸數(shù)值的作用,輸入層和隱藏層之間連接的權(quán)值可以看做是1,輸出層和隱藏層各有各的任務(wù),所以它們的學(xué)習(xí)策略也是不同的。輸出層是對(duì)線性權(quán)進(jìn)行調(diào)整,使用的是線性優(yōu)化方法,所以學(xué)習(xí)收斂的速度比較快。但是隱藏層是對(duì)激活函數(shù)的參數(shù)進(jìn)行調(diào)整,使用的是非線性優(yōu)化的方法,所以學(xué)習(xí)收斂的速度較慢。
3基于粗糙特征量的約簡(jiǎn)算法
設(shè)有決策信息系統(tǒng)S,f(x)是對(duì)象x在屬性a上的值;cij表示差別矩陣m中的第i行及第j列的元素,則cij定義為
(2)
式中,i=1,2,…,n;j=1,2,…,m。
根據(jù)上述差別矩陣的特點(diǎn),構(gòu)造出粗糙特征量函數(shù)。屬性ai的粗糙特征函數(shù)為
(3)
式中
(4)
式中,count(ai)表示屬性ai出現(xiàn)的次數(shù);card(mij)表示集合的基數(shù)。
粗糙特征量函數(shù)綜合評(píng)定了屬性ai的重要程度。避免單一考慮屬性出現(xiàn)次數(shù)多,但元素mij寬度大,屬性在元素中占據(jù)比值小,而選入約簡(jiǎn)中。也避免單一考慮屬性在元素中的比值,而忽略了出現(xiàn)次數(shù)這種情況。粗糙特征函數(shù)值越大,該屬性就越重要。使用差別矩陣提取出核屬性,隨后在剩下所有沒有出現(xiàn)核屬性的元素中找到分量值最大的屬性納入約簡(jiǎn)中。如果差別矩陣不能得到核屬性,則直接尋找粗糙特征值最大的若干個(gè)屬性作為近似約簡(jiǎn)集,這樣就可以減少對(duì)原決策表的遍歷搜索,使得約簡(jiǎn)算法更加簡(jiǎn)單、靈活。本文給出了粗糙特征量約簡(jiǎn)算法。
輸入決策表DT=〈U,C∩D,V,f〉。
輸出條件屬性C相對(duì)于決策屬性D的相對(duì)約簡(jiǎn)Nred。
具體步驟:
(1)求出差別矩陣M;
(3)根據(jù)式(1)計(jì)算差別矩陣中各屬性的粗糙特征值。并從合并后的差別矩陣中找到所有不包含核屬性且mij≠0的屬性元素M*,即
(5)
(4)對(duì)M*中剩下的所有屬性根據(jù)粗糙特征fmc(ai)函數(shù)值進(jìn)行降序排列,即
(6)
(5)在排序后的屬性中選擇前m個(gè)最大特征值所對(duì)應(yīng)的屬性作為約簡(jiǎn)集,即
(7)
(8)
如要選取所有屬性中>75%特征值的屬性,即選取前25%的屬性,則設(shè)定m=25%n。因此把這m個(gè)屬性稱為粗糙特征量。
算法的優(yōu)點(diǎn)是:1)算法在約簡(jiǎn)過(guò)程中大幅減少了對(duì)原決策表的遍歷搜索,約簡(jiǎn)算法更加簡(jiǎn)單、靈活;2)分量函數(shù)所提供的啟發(fā)知識(shí)無(wú)論對(duì)有核或者是無(wú)核的決策表,都能保證得到的是最小約簡(jiǎn)或次優(yōu)約簡(jiǎn);3)算法由于不需要對(duì)差別矩陣化簡(jiǎn),避免了傳統(tǒng)算法中的“組合爆炸”問(wèn)題。
4算例分析
為檢驗(yàn)本文的方法,使用江蘇某地區(qū)2012年提供的負(fù)荷數(shù)據(jù)及氣象數(shù)據(jù)。因不同日類型有不同的負(fù)荷數(shù)據(jù)特征,所以把日類型分為工作日和周末兩類,每類建立24個(gè)RBF來(lái)預(yù)測(cè)每天24h的負(fù)荷值。
選擇待預(yù)測(cè)日當(dāng)天的氣象狀況、前3天同一時(shí)刻及前3h、前1星期同一天同一時(shí)刻、前2星期同一天同一時(shí)刻及前3h的歷史負(fù)荷數(shù)據(jù)以及各種氣象數(shù)據(jù)等。氣象數(shù)據(jù)包括最高溫度、最低溫度、天氣類型、風(fēng)向、風(fēng)力大小等,條件屬性共計(jì)50個(gè)。決策屬性是待預(yù)測(cè)日的負(fù)荷值。
因粗糙集只能處理離散數(shù)據(jù),所以在約簡(jiǎn)前需要將屬性離散化。本文使用經(jīng)典的最小信息熵離散化算法[9-10]。
對(duì)離散后的決策表采用粗糙特征量約簡(jiǎn)算法,并選取前25%屬性的粗糙特征量后得到的約簡(jiǎn)集為L(zhǎng)(d-7,t)、L(d-7,t-1)、L(d-7,t-2)、L(d-14,t)、L(d-14,t-1)、Wd、Wd-1、Wd-2、Wd-3、Wd-7、Wd-14、Dd-1,其中,L(d,t)為待預(yù)測(cè)日t時(shí)刻的負(fù)荷值;Wd為待預(yù)測(cè)日的天氣類型;Dd為待預(yù)測(cè)日的風(fēng)向。
將約簡(jiǎn)后的屬性集作為輸入?yún)?shù),使用RBF算法對(duì)其進(jìn)行訓(xùn)練并對(duì)該地區(qū)2012年8月某天全天的整點(diǎn)負(fù)荷進(jìn)行預(yù)測(cè),本文選取σ=2。使用粗糙集屬性約簡(jiǎn)算法的RBF方法(簡(jiǎn)稱RSRBF)與按經(jīng)驗(yàn)選取輸入屬性的標(biāo)準(zhǔn)RBF方法的預(yù)測(cè)結(jié)果如表2所示。其中標(biāo)準(zhǔn)RBF的輸入屬性按照經(jīng)驗(yàn)選取為最高溫度、最低溫度、風(fēng)力。結(jié)果的平均相對(duì)誤差為
(9)
式中,R(i)、F(i)分別為負(fù)荷的實(shí)際值和預(yù)測(cè)值;N=24為一天內(nèi)的整點(diǎn)數(shù)。
RBF方法的預(yù)測(cè)結(jié)果如表2所示。其中標(biāo)準(zhǔn)RBF的輸入屬性按照經(jīng)驗(yàn)選取為最高溫度、最低溫度、風(fēng)力。結(jié)果的平均相對(duì)誤差為
(10)
式中,R(i)、F(i)分別為負(fù)荷的實(shí)際值和預(yù)測(cè)值;N=24為一天內(nèi)的整點(diǎn)數(shù)。
由表2可知,使用RSRBF方法與標(biāo)準(zhǔn)RBF方法相比,能夠大幅提高預(yù)測(cè)的準(zhǔn)確度。
表2 預(yù)測(cè)比較結(jié)果
經(jīng)檢驗(yàn)選取不同的粗糙特征量對(duì)預(yù)測(cè)的準(zhǔn)確度有影響,如何選取最優(yōu)的特征量有待進(jìn)一步研究。在本文算法中采用粗糙集方法挖掘了與負(fù)荷影響較大的因素,使輸入維數(shù)大幅下降,簡(jiǎn)化了神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu),并與預(yù)測(cè)負(fù)荷建立了更加密切的關(guān)系,提高了訓(xùn)練的效率,使網(wǎng)絡(luò)能快速滿足預(yù)測(cè)準(zhǔn)確度,取得了較為理想的效果。
5結(jié)束語(yǔ)
提出一種基于粗糙集的粗糙特征函數(shù)的算法,該算法通過(guò)計(jì)算屬性的特征函數(shù)值來(lái)確定約簡(jiǎn)集,避免了常規(guī)算法按經(jīng)驗(yàn)選取輸入?yún)?shù)的盲目性。通過(guò)與RBF結(jié)合進(jìn)行仿真驗(yàn)證了該算法的有效性與可行性,并使所建的RSRBF模型具有優(yōu)良的預(yù)測(cè)能力,更趨穩(wěn)定。所提出的算法計(jì)算方便、靈活,并且提高了預(yù)測(cè)準(zhǔn)確度。
參考文獻(xiàn)
[1]周志華,陳世福.神經(jīng)網(wǎng)絡(luò)集成[J].計(jì)算機(jī)學(xué)報(bào),2002,25(1):1-8.
[2]苗奪謙,李道國(guó).粗糙集理論、算法與應(yīng)用[M].北京:清華大學(xué)出版社,2008.
[3]Pawlak Z.Rough set theory for intelligent industrial applications[C].Hawaii:Proceedings of the Second International Conference on intelligent Processing and Manufacturing of Materials,1999.
[4]閆敏倫.新型變精度多粒化粗糙集模型[J].南京理工大學(xué)學(xué)報(bào),2014(4):496-500.
[5]郭敏,賈修一,商琳.基于模糊化的決策粗糙集屬性約簡(jiǎn)和分類[J].模式識(shí)別與人工智能,2014(8):701-707.
[6]彭顯剛,胡松峰,呂大勇.基于RBF神經(jīng)網(wǎng)絡(luò)的短期負(fù)荷預(yù)測(cè)方法綜述[J].電力系統(tǒng)保護(hù)與控制,2014(17):144-148.
[7]喬俊飛,韓紅桂.RBF神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)動(dòng)態(tài)優(yōu)化設(shè)計(jì)[J].自動(dòng)化學(xué)報(bào),2010,36(6):865-872.
[8]胡可云.基于概念格和粗糙集的數(shù)據(jù)挖掘方法研究[D].北京:清華大學(xué),2001.
[9]Fayyad U M,Irani K B.Multi-interval discretization of continuous-valued attributes as preprocessing for machine learning[C].San Fransisco:Proceedings of the 13th International Joint Conference on Artificial Intelligence,1993.
[10]謝宏,程浩忠,牛東曉.基于信息熵的粗糙集連續(xù)屬性離散化算法[J].計(jì)算機(jī)學(xué)報(bào),2005,28(9):1570-1574.
作者簡(jiǎn)介:馬立新(1960—),男,教授,博士。研究方向:電力系統(tǒng)穩(wěn)定性等。
基金項(xiàng)目:國(guó)家自然科學(xué)基金資助項(xiàng)目(6120576);國(guó)家科技部政府間科技合作基金資助項(xiàng)目(2009014)
收稿日期:2014- 11- 10
中圖分類號(hào)TM715
文獻(xiàn)標(biāo)識(shí)碼A
文章編號(hào)1007-7820(2016)01-040-04
doi:10.16180/j.cnki.issn1007-7820.2016.01.011