林 佳,程浩忠,顧 潔,楊宗麟,王 崢
(1.上海交通大學(xué)電氣工程系,上海 200240;2.華東電網(wǎng)有限公司發(fā)展計劃部,上海 200002)
中長期電力負(fù)荷預(yù)測模型由于受到多因素交互影響,具有復(fù)雜系統(tǒng)的非線性動態(tài)特性,加之我國正處在政策、經(jīng)濟(jì)狀況變動較大的發(fā)展階段,諸如結(jié)構(gòu)調(diào)整、政策變化以及經(jīng)濟(jì)危機等,均可能導(dǎo)致預(yù)測模型結(jié)構(gòu)發(fā)生變化。結(jié)構(gòu)突變是復(fù)雜非線性系統(tǒng)建模中的常見問題,模型變量間的函數(shù)關(guān)系發(fā)生變化,有新的變量進(jìn)入系統(tǒng)或某一變量分布規(guī)律發(fā)生變化,均可能引起結(jié)構(gòu)突變[1]。因此,在我國當(dāng)前的中長期負(fù)荷預(yù)測中充分考慮結(jié)構(gòu)突變問題是十分必要的。
傳統(tǒng)的時序外推負(fù)荷預(yù)測方法通過動平均、指數(shù)平滑等方法[2]平穩(wěn)數(shù)據(jù)序列,從而丟失了結(jié)構(gòu)突變點可能包含的重要信息;而結(jié)合傳統(tǒng)結(jié)構(gòu)突變方法的的預(yù)測方法,如干預(yù)分析模型、變結(jié)構(gòu)協(xié)整模型等[3~5]雖考慮了結(jié)構(gòu)突變問題,但模型選擇仍依賴于主觀的先驗信息(如窮舉所有可能的影響事件及其發(fā)生時間),而先驗信息的主觀差異(如政策實施時點與起效時點的偏差等)往往造成分析結(jié)論的偏差。此外,也無法證明多少個結(jié)構(gòu)突變才是對系統(tǒng)動態(tài)特征的最好描述。
因此,為了提高模型的適應(yīng)性,近年來采用復(fù)雜系統(tǒng)分析方法[6]改進(jìn)傳統(tǒng)結(jié)構(gòu)突變方法的研究逐漸受到重視。如文獻(xiàn)[7]提出了一種非參數(shù)的系統(tǒng)變結(jié)構(gòu)檢測方法,利用神經(jīng)網(wǎng)絡(luò)技術(shù)對系統(tǒng)的運行規(guī)律的結(jié)構(gòu)變化情況進(jìn)行診斷。而文獻(xiàn)[8]則將遞歸遺傳規(guī)劃方法引入多變量非線性時間序列的系統(tǒng)識別和變結(jié)構(gòu)分析中,提出了對具有長記憶分量序列的向量時間序列的多結(jié)構(gòu)突變分析方法。然而由于人工神經(jīng)網(wǎng)絡(luò)不具有顯式表達(dá),而遺傳算法又存在搜索效率及時間復(fù)雜度問題,使得以上方法在實際中的應(yīng)用受到局限。
數(shù)據(jù)分組處理方法GMDH(group method of data handling)作為自組織數(shù)據(jù)挖掘方法的核心,由于其自組織和全局選優(yōu)特性,建模不依賴于先驗信息,能夠充分保證模型選擇的客觀性,不僅具有比人工神經(jīng)網(wǎng)絡(luò)更優(yōu)越的顯式表達(dá),又通過內(nèi)、外準(zhǔn)則篩選改善了遺傳算法的搜索效率[9,10],成為多結(jié)構(gòu)突變建模中值得考慮的一種有效方法。目前,GMDH方法在電力負(fù)荷預(yù)測中的應(yīng)用常見于相關(guān)因素的篩選以及向量自回歸模型VAR(vector auto-regressive model)滯后長度的確定[5,11],本文則考慮采用GMDH結(jié)合多結(jié)構(gòu)突變理論,實現(xiàn)變點自動搜索建模以改進(jìn)傳統(tǒng)的時序外推負(fù)荷預(yù)測模型。
GMDH最早由Ivakhnenko(1967)提出,是一種復(fù)雜非線性動態(tài)系統(tǒng)建模方法[10]。它將樣本集劃分為訓(xùn)練集和測試集,從參考函數(shù)構(gòu)成的初始模型出發(fā),在訓(xùn)練集上利用內(nèi)準(zhǔn)則進(jìn)行參數(shù)估計,生成競爭模型集,在測試集上利用外準(zhǔn)則進(jìn)行模型篩選。重復(fù)這一"進(jìn)化-遺傳-變異-選擇"過程,使競爭模型的復(fù)雜度不斷增加,直至得到最優(yōu)模型。
GMDH的主要算法有組合算法和多層算法,取決于競爭模型集的生成規(guī)則。組合算法運用單層的網(wǎng)絡(luò)結(jié)構(gòu)生成輸入變量的所有可能組合的模型;多層算法則基于迭代原理,對具有線性輸入項的局部函數(shù)產(chǎn)生一個并行有界的多層網(wǎng)絡(luò)結(jié)構(gòu),前向網(wǎng)絡(luò)流中僅含線性輸入變量和信息,是采用不完全歸納法對組合算法的改進(jìn)。本文主要介紹GMDH多層算法。
選擇高階的K-G多項式作為參考函數(shù),則系統(tǒng)的數(shù)學(xué)模型可表述為關(guān)于系統(tǒng)變量 xi及其高階項、延遲變量等的非線性函數(shù),即
將式(1)中每個加法單元的非系數(shù)部分作為新的自變量,則函數(shù) f轉(zhuǎn)化為線性函數(shù)
式中:ui是新的自變量;ai(i=1,2,…,m)是系數(shù);m是新的自變量的個數(shù)。將這m個新的自變量作為網(wǎng)絡(luò)第一層的輸入,則該層將產(chǎn)生M1=個局部函數(shù) ,即
重復(fù)上述過程,且定義閾值滿足m≥F1≥F2≥……≥Fl=1,則在第l層上得到唯一的局部函數(shù),即為系統(tǒng)的最優(yōu)模型。
由于GMDH的自組織特性能大大降低模型選擇的主觀性,本文結(jié)合GMDH多層算法與多結(jié)構(gòu)突變理論,建立了基于GMDH多結(jié)構(gòu)自動搜索算法的負(fù)荷預(yù)測模型,其建模步驟如下,其流程見圖1。
步驟1 建立初始模型。假設(shè)電量序列yt共存在m(m ≥0)個突變點,則yt可描述為
式中:k表示滯后長度,GMDH算法將從最大可能滯后長度kmax中自動選擇最優(yōu)的k值;u0、β0分別表示第一層模型(不考慮任何突變點情況下)的截距與斜率;δ Uj、δ T?tj兩項分別表示發(fā)生結(jié)構(gòu)突變時在截距、斜率上的變化,且有
式中,tBj表示第j(j≤m)個突變點對應(yīng)的時間。
步驟2 數(shù)據(jù)分組。將樣本集劃分為訓(xùn)練集NA和測試集NB。對應(yīng)m個突變點,構(gòu)造m個相應(yīng)的虛擬變量 δ Uj、δ T ?tj(j=1 ,…,m)。對于第 j個突變點,將NA中所有點作為可能的突變點tBji,構(gòu)造相應(yīng)的虛擬變量 δ Uji、δ T ?tji(i=1,2 ,…,nA)。GMDH將自動產(chǎn)生大量的競爭模型探測變量之間、變量與滯后變量之間的關(guān)系,以確定模型結(jié)構(gòu)和輸出變量。
圖1 GMDH多結(jié)構(gòu)自動搜索模型的流程Fig.1 Flow chart of GMDH variable-structure auto-searching model
步驟3 確定外準(zhǔn)則??墒褂梅€(wěn)定性準(zhǔn)則,選出全局殘差平方和最小的作為最優(yōu)模型,即
步驟4 確定循環(huán)終止條件。定義新增突變點tBj引入后,模型的F增量統(tǒng)計量為
式中:ξ為新模型中的參數(shù)個數(shù);ζ為模型中的新變量個數(shù)。逐漸增加突變點個數(shù),重復(fù)程序。直至某新增突變點tBj使得F值首次小于1,則模型存在j個突變點,程序終止;否則,若F值仍大于1,R2增加,即認(rèn)為tBj的引入是增加了模型的解釋能力,應(yīng)接受其加入模型,令j=j+1,繼續(xù)搜尋。
注意到由于初始劃分的測試集NB中仍可能存在突變點,需進(jìn)行二次數(shù)據(jù)分組,使二次訓(xùn)練集中完全包含原NB中所有數(shù)據(jù)。返回步驟2重新計算,即可得到序列的所有突變點及其對應(yīng)的最優(yōu)模型,整個計算過程實際上需要遍歷2次流程。
采用上述模型,對華東地區(qū)1992~2008年產(chǎn)業(yè)電量數(shù)據(jù)進(jìn)行預(yù)測與分析。分別以1992~2005年數(shù)據(jù)為初始訓(xùn)練集,2006~2008年數(shù)據(jù)為一次測試集;以1995~2008年數(shù)據(jù)為二次訓(xùn)練集,1992~1994年數(shù)據(jù)為二次測試集,采用MATLAB編程計算,求取突變點及最優(yōu)預(yù)測模型。
突變點搜索結(jié)果如表1所示。
表1 突變點搜索結(jié)果Tab.1 Results of discontinuity points
根據(jù)穩(wěn)定性準(zhǔn)則,程序搜索得到3個突變點,顯著性排序為:t1998>t2008>t2001。其中,t1998和t2008是兩個較為顯著的突變點,引入后,模型殘差平方和減小了0.746 1(×102億kW?h)2。它們分別解釋了1997~1998年間(亞洲金融危機、國企改革、洪災(zāi)等)以及2007~2008年間(次貸危機)對電量走勢的影響是使電量增速大大減緩。t2001為相對不顯著的突變點,主要解釋我國大面積電荒引發(fā)的電量需求增長。值得注意的是,該結(jié)果并未對2005年的節(jié)能減排政策的施行給出解釋信息,可能原因在于政策的時滯效應(yīng),實施初期由于二產(chǎn)用電單耗的不降反升而尚未見其對電量走勢的顯著影響。
對應(yīng)突變點的搜索結(jié)果,得到對應(yīng)3個突變點情況下的最優(yōu)預(yù)測模型為
采用Eviews5.1軟件求取該最優(yōu)模型的ADF=-2.9891<-2.5968,小于1%臨界值,認(rèn)為原電量時間序列為結(jié)構(gòu)突變的趨勢穩(wěn)定過程。從模型上看,1998、2008年處的斜率變動正反映了兩次經(jīng)濟(jì)危機對電量增長速度的抑制作用。
為對比起見,本文同時采用二次指數(shù)平滑模型及一階滯后回歸模型[12]進(jìn)行了預(yù)測,三種模型預(yù)測結(jié)果及殘差分布情況分別如圖2和圖3所示。
圖2 三種模型的負(fù)荷預(yù)測結(jié)果Fig.2 Load forecast results of each method
圖3 三種模型預(yù)測結(jié)果的相對誤差Fig.3 Relative error of each method
由此可見,與傳統(tǒng)時序外推模型相比,本模型顯著改善了各突變點附近的負(fù)荷預(yù)測精度,提高了殘差的平穩(wěn)性,最大相對誤差為2.09%(其余兩種模型約為6%),平均相對誤差僅0.77%(其余兩種模型約為2.7%),模型的整體預(yù)測精度有了顯著提高。
本文結(jié)合GMDH多層算法與多結(jié)構(gòu)突變理論,提出了基于GMDH多結(jié)構(gòu)自動搜索算法的負(fù)荷預(yù)測模型。采用該模型對華東地區(qū)1992~2008年全產(chǎn)業(yè)電量數(shù)據(jù)進(jìn)行了預(yù)測分析,結(jié)果表明了該模型的有效性。該模型通過自組織優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu),能夠客觀準(zhǔn)確地識別時間序列中的所有突變點,并充分利用突變點信息修正由于經(jīng)濟(jì)環(huán)境和突發(fā)事件引起的預(yù)測偏差,大大提高了傳統(tǒng)負(fù)荷預(yù)測模型的精度。
由于可同時考慮所有可能的結(jié)構(gòu)突變點,且不對突變類型和選擇模型進(jìn)行先驗設(shè)定,該模型在建模思想、預(yù)測精度以及對復(fù)雜問題的處理能力上,均優(yōu)于傳統(tǒng)的時序外推負(fù)荷預(yù)測方法,尤其適用于我國當(dāng)前經(jīng)濟(jì)、政策變化較大時期的負(fù)荷預(yù)測。
[1] Bai Jushan.Likelihood ratio tests for multiple structural changes[J].Journal of Econometrics,1999,91(2):299-323.
[2] 康重慶,夏清,劉梅,等.電力系統(tǒng)負(fù)荷預(yù)測[M].北京:中國電力出版社,2007.
[3] 王慶露,葛虹(Wang Qinglu,Ge Hong).基于協(xié)整理論和干預(yù)分析的中國電力需求預(yù)測(The forecasting of power demand in China using cointegration theory and intervention analysis)[J].數(shù)理統(tǒng)計與管理(Application of Statistics and Management),2007 ,26(5):753-758.
[4] 李翔,高山,陳昊(Li Xiang,Gao Shan,Chen Hao).基于變結(jié)構(gòu)協(xié)整理論的中長期電力負(fù)荷預(yù)測模型(A new medium-and long-term load forecasting model based on variable structure cointegration theory)[J].電網(wǎng)技術(shù)(Power System Technology),2007,31(9):48-52.
[5] 吳宏曉(Wu Hongxiao).基于軟計算方法的電力系統(tǒng)負(fù)荷預(yù)測(Load Forecasting Based on Soft Computing)[D].上海:上海交通大學(xué)電氣工程系(Shanghai:College of Electrical Engineering,Shanghai Jiao Tong University),2007.
[6] 康銀勞(Kang Yinlao).基于自組織建模的成都GDP增長及影響因素研究(Study of GDP Increase and the Influencing Factors in Chengdu Based on Self-Organization Theory)[D].成都:西南交通大學(xué)管理科學(xué)與工程(Chengdu:College of Science and Engineering,Southwest Jiaotong University),2007.
[7] 李松臣,張世英(Li Songchen,Zhang Shiying).變結(jié)構(gòu)門限t-GARCH模型及其偽持續(xù)性研究(Research on threshold t-GARCH model with structural change and its spurious persistence)[J].數(shù)量經(jīng)濟(jì)技術(shù)經(jīng)濟(jì)研究(The Journal of Quantitative and Technical Economics),2006,23(7):126-133.
[8] Sun Qinghua,Zhang Shiying,Liang Xiongjian.A model-free method for structural change detection in multivariate nonlinear time series[J].Journal of Systems Engineering and Electronics,2003,14(2):36-46.
[9] Muller J A.GMDH algorithms for complex systems modeling[J].Mathematical and Computer Modeling of Dynamical Systems,1998 ,4(4):276-316.
[10]Ivakhnenko A G,Savchenko E A,Ivakhnenko G A.Problems of further GMDH algorithms development[J].System Analysis Modeling Simulation,2003,10(43):1301-1309.
[11] 田益祥(Tian Yixiang).基于GMDH的 VAR滯后選擇方法及實證分析(A new method of choosing variable lag in the model of VAR and its application)[J].武漢科技大學(xué)學(xué)報:自然科學(xué)版(Journal of Wuhan University of Science and Technology:Natural Science Edition),2002,25(1):105-107.
[12] 虞瑄,程浩忠,游仕洪,等(Yu Xuan,Cheng Haozhong,You Shihong,et al).中長期電力負(fù)荷預(yù)測軟件包的開發(fā)與應(yīng)用(Development and application of power system mid-long term load forecasting software package)[J].電力系統(tǒng)及其自動化學(xué)報(Proceedings of the CSU-EPSA),2004,16(2):9-12,57.