朱 雙,周建中,丁小玲,謝蒙飛,吳 江
(華中科技大學(xué)水電與數(shù)字化工程學(xué)院,湖北武漢430074)
基于GM-SVR耦合的月徑流預(yù)測(cè)模型研究與應(yīng)用
朱 雙,周建中,丁小玲,謝蒙飛,吳 江
(華中科技大學(xué)水電與數(shù)字化工程學(xué)院,湖北武漢430074)
考慮到某月徑流與該月歷史同期徑流以及臨近月徑流均有較強(qiáng)相關(guān)性,而通常預(yù)報(bào)方法只采用其中一種徑流序列,導(dǎo)致了可用信息損失。為此,提出一種基于灰色理論和支持向量機(jī)回歸的組合預(yù)報(bào)模型。提出的模型綜合利用了徑流年內(nèi)變化和年際變化信息,與單一灰色模型和支持向量機(jī)模型進(jìn)行預(yù)測(cè)對(duì)比,結(jié)果表明基于灰色支持向量機(jī)的月徑流模型預(yù)測(cè)精度明顯高于單一模型,尤其是對(duì)徑流變化劇烈的汛期表現(xiàn)出更優(yōu)越的預(yù)測(cè)性能。
支持向量機(jī);灰色理論;核函數(shù);月徑流
河川徑流的中長(zhǎng)期預(yù)報(bào)是水資源配置與管理的重要組成部分,對(duì)防汛、抗旱、發(fā)電及流域水利規(guī)劃均有重要意義。目前徑流中長(zhǎng)期預(yù)測(cè)方法大致可以分成兩類(lèi):一是基于徑流本身變化規(guī)律建立預(yù)測(cè)模型,二是基于徑流與其影響因素之間關(guān)系建立預(yù)測(cè)模型[1]。徑流的形成受水文、地形、氣候和人類(lèi)活動(dòng)等諸多因素的影響,呈現(xiàn)高度的非線性、隨機(jī)性和不確定性特征[2];因而傳統(tǒng)的徑流預(yù)測(cè)方法只能近似描述徑流過(guò)程,模擬精度大多不高。支持向量機(jī)實(shí)現(xiàn)了低維空間到高維空間的非線性映射,近年來(lái)在中長(zhǎng)期徑流預(yù)報(bào)領(lǐng)域應(yīng)用廣泛[3- 4]。支持向量機(jī)是建立在統(tǒng)計(jì)學(xué)習(xí)理論的VC維理論和結(jié)構(gòu)風(fēng)險(xiǎn)最小原理基礎(chǔ)上的[5],它將具體問(wèn)題轉(zhuǎn)化為一個(gè)二次型尋優(yōu)問(wèn)題,理論上可以得到全局最優(yōu)解,且對(duì)于小樣本學(xué)習(xí)具有良好的泛化性能,能夠進(jìn)行高效、精確的預(yù)測(cè),較好地解決了傳統(tǒng)方法的經(jīng)驗(yàn)依賴(lài)、局部極值等問(wèn)題[6- 7]。近年來(lái),采用支持向量機(jī)回歸方法進(jìn)行水文預(yù)測(cè)的研究逐漸增多,郭俊等[8]將改進(jìn)的支持向量機(jī)回歸模型應(yīng)用于流域徑流預(yù)測(cè),于國(guó)榮等[9]建立了混沌時(shí)間序列的支持向量機(jī)水文序列預(yù)測(cè)模型,劉芳等[10]提出一種基于相關(guān)向量回歸的非線性時(shí)間序列預(yù)測(cè)方法。盡管支持向量機(jī)回歸模型在水文領(lǐng)域得到了廣泛的應(yīng)用,但其仍存在一些不足。在有限樣本學(xué)習(xí)下,支持向量機(jī)回歸模型針對(duì)振蕩較劇烈徑流時(shí)間序列的預(yù)測(cè)仍表現(xiàn)出泛化能力較差、預(yù)測(cè)精度偏低的缺陷。
灰色系統(tǒng)理論是鄧聚龍教授1982年提出的系統(tǒng)分析方法[11],通過(guò)對(duì)已知信息的灰色生成盡可能提取有效信息并進(jìn)行灰色建模,實(shí)現(xiàn)系統(tǒng)演化規(guī)律和發(fā)展趨勢(shì)的正確描述?;疑A(yù)測(cè)是一種對(duì)含有不確定因素的系統(tǒng)進(jìn)行預(yù)測(cè)的方法,通過(guò)鑒別系統(tǒng)因素之間發(fā)展趨勢(shì)的相異程度,即進(jìn)行關(guān)聯(lián)分析,并對(duì)原始數(shù)據(jù)進(jìn)行生成處理來(lái)削弱隨機(jī)擾動(dòng)因素的影響,尋找系統(tǒng)變動(dòng)的規(guī)律,生成規(guī)律性較強(qiáng)的數(shù)據(jù)序列,然后建立相應(yīng)的微分方程模型,從而預(yù)測(cè)事物未來(lái)發(fā)展趨勢(shì)的狀況[12],對(duì)時(shí)間序列變化趨勢(shì)有良好的預(yù)測(cè)性能?;疑A(yù)測(cè)在預(yù)報(bào)領(lǐng)域應(yīng)用廣泛,馮利華[13]利用灰色分析預(yù)測(cè)水資源的變化趨勢(shì),王渺林[14]應(yīng)用灰色系統(tǒng)理論預(yù)測(cè)了寸灘站年最高水位。灰色預(yù)測(cè)模型主要通過(guò)對(duì)原始數(shù)據(jù)的累加生成序列建立指數(shù)模型來(lái)實(shí)現(xiàn)數(shù)據(jù)預(yù)測(cè),GM(1,1)模型是其基礎(chǔ)和核心[15];但是GM(1,1)僅從序列本身尋找數(shù)據(jù)變化規(guī)律進(jìn)行預(yù)測(cè),因此模型的預(yù)測(cè)精度不穩(wěn)定。
關(guān)于支持向量機(jī)的月徑流預(yù)測(cè)研究大多利用前幾個(gè)月徑流信息來(lái)預(yù)報(bào)后一個(gè)月,這種方式對(duì)徑流信息的利用效率低,預(yù)測(cè)精度不高??紤]到灰色模型對(duì)歷史同期徑流序列趨勢(shì)變化良好的預(yù)測(cè)性能,本文嘗試將支持向量機(jī)回歸和灰色模型相結(jié)合,提出基于GM-SVR耦合的月徑流預(yù)測(cè)模型。該模型充分利用徑流年內(nèi)、年際變化信息,在提高徑流預(yù)測(cè)精度的同時(shí)增強(qiáng)模型的泛化性能,為徑流的中長(zhǎng)期預(yù)測(cè)提供了一種可靠的新方法。
1.1 灰色動(dòng)態(tài)模型
灰色預(yù)測(cè)方法首先對(duì)原始數(shù)據(jù)進(jìn)行累加,從而生成(AGO)得到新的序列,新序列削弱了原始數(shù)據(jù)的隨機(jī)性,增強(qiáng)了規(guī)律性;然后再利用新序列進(jìn)行建模和預(yù)測(cè),預(yù)測(cè)模型是一階單變量微分灰色模型 GM (1,1)。
設(shè)有非負(fù)的時(shí)間序列
X(0)={X(0)(1),X(0)(2),…,X(0)(n)}
(1)
將原始序列進(jìn)行一次累加,獲得新數(shù)據(jù)系列X(1)。GM(1,1)模型的微分方程
(2)
式中,a為發(fā)展系數(shù);u為灰色作用量。累加序列為
(t=1,2,…,n)
(3)
(4)
1.2 SVR預(yù)測(cè)模型
支持向量機(jī)事先通過(guò)樣本訓(xùn)練模型訓(xùn)練好的模型輸入預(yù)測(cè)因子,就可以得到相應(yīng)的預(yù)測(cè)輸出。支持向量機(jī)原理如下:
設(shè)訓(xùn)練樣本數(shù)據(jù)為(Xi,yi),其中i=1,2,…,L, Xi∈RD, yi∈R,Xi為輸入,yi為相應(yīng)的輸出。亦即擬合函數(shù)
yi=W·Xi+b
(5)
式中,W為空間超平面;b為偏置量。
若用ti表示模型的輸出,當(dāng)|ti-yi|<ε,誤差損失取零;當(dāng)|ti-yi|≥ε,誤差取|ti-yi|-ε。其中,ε為不靈敏參數(shù),用來(lái)反映對(duì)誤差的容忍度。
根據(jù)結(jié)構(gòu)化風(fēng)險(xiǎn)最小原理,擬合函數(shù)估計(jì)問(wèn)題可以等價(jià)于
(6)
式中,C為誤差懲罰系數(shù)。
通過(guò)引入Lagrange乘子,給定相應(yīng)的輸入X′,即可計(jì)算對(duì)應(yīng)的預(yù)測(cè)輸出
(7)
通過(guò)引入核函數(shù)技術(shù),將低維問(wèn)題高維化,使無(wú)法用線性函數(shù)擬合或線性擬合精度較差的問(wèn)題在高維空間中能達(dá)到較好的線性擬合效果,并同時(shí)不增加問(wèn)題求解的復(fù)雜度。核函數(shù)一般應(yīng)滿足Mercer條件,常用的核函數(shù)有線性核函數(shù)、多項(xiàng)式核函數(shù)、徑向基核函數(shù)。Hsu[16]曾對(duì)各個(gè)常用的核函數(shù)做了比較分析研究,并指出徑向基核函數(shù)是比較通用的核函數(shù);因此,本文的核函數(shù)選擇徑向基核函數(shù)。
基于GM-SVR的月徑流預(yù)測(cè)模型針對(duì)1年12個(gè)月分別建模,首先利用模型預(yù)測(cè),輸入為歷史同期月徑流,利用徑流趨勢(shì)變化信息獲得GM(1,1)模型的預(yù)報(bào)月徑流;然后利用SVR模型預(yù)測(cè),輸入為預(yù)報(bào)月的前12個(gè)月徑流,利用徑流年內(nèi)變化信息獲得SVR模型的預(yù)報(bào)月徑流;最后對(duì)預(yù)測(cè)結(jié)果進(jìn)行加權(quán)耦合,得到GM-SVR模型的預(yù)測(cè)結(jié)果。由于GM-SVR模型綜合利用了徑流年際變化趨勢(shì)信息和徑流年內(nèi)分配不均勻信息,因此能表現(xiàn)出更優(yōu)越的預(yù)測(cè)性能。
設(shè)GM(1,1)和SVR預(yù)測(cè)結(jié)果分別為Qgt和Qst,則GM-SVR模型預(yù)測(cè)結(jié)果
(8)
式中,ωg和ωs分別為GM(1,1)和SVR模型的耦合權(quán)重,滿足ωg+ωs=1。GM-SVR模型采用最小二乘法求解ωg,ωs。
(9)
引入拉格朗日乘子求解方程組,即可得到各個(gè)水文模型的耦合權(quán)重ωg,ωs的值,從而得到組合模型預(yù)測(cè)結(jié)果。
3.1 研究流域概況
金沙江上游河段長(zhǎng)970 km,流域面積7.65萬(wàn)km2,落差約1 715 m,河道平均比降1.76%,干流年內(nèi)降雨與徑流皆集中于 6月~10月,多年平均徑流量和控制面積占金沙江流域出口屏山站的29.2% 和46.7%。豐富的水資源量和水能蘊(yùn)藏量使其成為金沙江水電基地的重點(diǎn)布局區(qū)域,在我國(guó)水能資源開(kāi)發(fā)中占有極其重要的地位。石鼓為金沙江上游控制站,本文選用石鼓1953年~2004年共52年月徑流資料,對(duì)石鼓站進(jìn)行徑流中長(zhǎng)期預(yù)測(cè)研究。依據(jù)石鼓水文站52年月徑流資料,分析得到該站多年年平均流量為1 349 m3/s,離勢(shì)系數(shù)0.16,偏態(tài)系數(shù)0.75,年內(nèi)徑流極值比為8.6,因此徑流年際變化不大,但年內(nèi)分配極不均勻。采用M-K秩檢驗(yàn)法,得到石鼓站1953年~2004年徑流總量呈上升趨勢(shì)。
3.2 預(yù)報(bào)方法
本文建立了基于GM-SVR耦合的月徑流預(yù)測(cè)模型,對(duì)石鼓進(jìn)行徑流預(yù)報(bào)。為了驗(yàn)證模型的有效性,采用GM(1,1)和SVR模型進(jìn)行對(duì)比。以石鼓水文站11月徑流預(yù)報(bào)為例。
GM-SVR模型預(yù)報(bào)步驟如下:①選取石鼓站1953年~2004年月徑流資料,1953年~1999年為模型建立期,2000年~2004年為模型檢驗(yàn)期;②用GM(1,1)模型和SVR模型分別預(yù)報(bào)11月徑流,GM(1,1)輸入為歷史同期11月徑流實(shí)測(cè)值,輸出為11月徑流預(yù)報(bào)值;SVR輸入為前一年11月到次年10月共計(jì)12個(gè)月徑流實(shí)測(cè)值,輸出為11月徑流預(yù)報(bào)值;③利用最小二乘法確定GM、SVR模型權(quán)重分別為0.15和0.85,將預(yù)報(bào)結(jié)果加權(quán)得到石鼓站2000年~2004年11月徑流預(yù)報(bào)值。
3.3 預(yù)測(cè)結(jié)果
石鼓站11月預(yù)報(bào)詳細(xì)結(jié)果見(jiàn)表1。
表1 石鼓11月徑流預(yù)報(bào)結(jié)果
年份實(shí)測(cè)流量/m3·s-1GM(1,1)/m3·s-1GM(1,1)誤差/%SVR/m3·s-1SVR誤差/%GM-SVR/m3·s-1GM-SVR誤差/%2000年9548936910596712001年89391328307773132002年80492415829380702003年9529174864991042004年937926188369311MRE664
由表1可知,三種模型均能較好模擬石鼓水文站11月徑流,相比之下,GM-SVR模型的平均相對(duì)誤差只有4%,GM-SVR的預(yù)測(cè)性能更好。石鼓站2000年~2004年共計(jì)60個(gè)月的徑流實(shí)測(cè)值和三種模型預(yù)報(bào)值見(jiàn)圖1。
圖1 石鼓2000年~2004年逐月預(yù)報(bào)結(jié)果
圖1顯示的是2000年~2004年共計(jì)60個(gè)月的徑流實(shí)測(cè)值和三種模型預(yù)報(bào)值。由圖2可知,GM(1,1)模型的汛期徑流預(yù)測(cè)值比實(shí)測(cè)值普遍偏低;SVR模型對(duì)枯水期徑流有較好的預(yù)測(cè)能力,但是對(duì)徑流峰值的擬合不理想,預(yù)測(cè)的徑流峰值明顯高于其實(shí)測(cè)值;而GM-SVR模型對(duì)枯期和汛期徑流都有較好的預(yù)測(cè)能力。表2顯示的是三種模型預(yù)測(cè)性能統(tǒng)計(jì)結(jié)果,包括平均相對(duì)誤差和誤差在5%、10%和20%內(nèi)的百分比以及確定性系數(shù)。GM-SVR模型的平均相對(duì)誤差為9%,低于GM(1,1)模型和SVR模型;GM-SVR模型誤差在5%、10%和20%內(nèi)百分比分別為68%、83%和95%,均高于GM(1,1)模型和SVR模型;GM-SVR模型確定性系數(shù)0.92,與GM(1,1)模型相同,遠(yuǎn)高于SVR模型。因此分析多種指標(biāo)后表明 GM-SVR模型預(yù)測(cè)結(jié)果更逼近徑流實(shí)測(cè)值,具有最佳的預(yù)測(cè)性能。
表2 石鼓2000年~2004年逐月預(yù)報(bào)統(tǒng)計(jì)值
模型模型誤差在各誤差范圍內(nèi)所占比例/%MRE≤5%≤10%≤20%確定性系數(shù)RGM(1,1)125382930.92SVR116582900.85GM-SVR96883950.92
汛期(6月~10月)預(yù)報(bào)結(jié)果誤差統(tǒng)計(jì)如表3所示,GM-SVR模型汛期平均相對(duì)誤差為12%,低于GM(1,1)模型的14%,遠(yuǎn)低于SVR模型的20%;GM-SVR模型誤差5%、10%、20%內(nèi)百分比為48%、60%、80%,均遠(yuǎn)高于GM(1,1)和SVR模型。因此,GM-SVR模型對(duì)汛期徑流的預(yù)測(cè)精度更高,可見(jiàn)GM-SVR模型更有利于指導(dǎo)水資源的發(fā)電和防洪調(diào)度,具有更大的工程應(yīng)用價(jià)值。
表3 石鼓6~10月預(yù)報(bào)結(jié)果誤差統(tǒng)計(jì) %
綜合比較表2和表3結(jié)果可看出,SVR模型對(duì)變化劇烈的汛期徑流預(yù)測(cè)能力較差,原因是在小樣本情況下,SVR模型對(duì)變化劇烈的徑流序列泛化能力較弱;而GM(1,1)模型對(duì)較平穩(wěn)枯期徑流的逼近能力弱于SVR;GM-SVR模型克服了GM(1,1)和SVR模型的缺陷,不論在全年還是汛期都表現(xiàn)出了最高的預(yù)測(cè)精度。
針對(duì)支持向量機(jī)在有限樣本情況下泛化能力較差的缺陷,本文建立了一種基于GM-SVR耦合的月徑流預(yù)測(cè)模型并應(yīng)用于金沙江上游控制站石鼓水文站。其月徑流的預(yù)測(cè)充分說(shuō)明了該模型的實(shí)用性和優(yōu)越性。研究表明:
(1)將灰色預(yù)測(cè)和支持向量機(jī)相結(jié)合,利用了灰色預(yù)測(cè)對(duì)徑流趨勢(shì)良好的預(yù)報(bào)性能和支持向量機(jī)回歸對(duì)隨機(jī)非線性徑流強(qiáng)大的逼近能力,為月徑流可靠預(yù)報(bào)奠定了基礎(chǔ)。
(2)GM-SVR模型將歷史同期徑流數(shù)據(jù)融入到傳統(tǒng)支持向量機(jī)預(yù)測(cè)中,在有限數(shù)據(jù)長(zhǎng)度情況下,提高了數(shù)據(jù)利用效率,充分挖掘了月徑流年際趨勢(shì)和年內(nèi)變化不均勻特性,在有限樣本學(xué)習(xí)下,增強(qiáng)了模型泛化性能。
(3) GM-SVR模型月徑流預(yù)測(cè)精度較單一的GM(1,1)和SVR模型有較大的提高,尤其是對(duì)于劇烈變化的汛期徑流預(yù)測(cè),相比傳統(tǒng)的GM(1,1)和SVR模型魯棒性更好、預(yù)測(cè)精度更高,是一種很有應(yīng)用前景的月徑流預(yù)測(cè)方法。
[1]廖杰, 王文圣, 李躍清, 等. 支持向量機(jī)及其在徑流預(yù)測(cè)中的應(yīng)用[J]. 四川大學(xué)學(xué)報(bào): 工程科學(xué)版, 2006, 38(6): 24228.
[2]王文圣, 丁晶, 李躍清. 水文小波分析[M]. 北京: 化學(xué)工業(yè)出版社, 2005.
[3]張衛(wèi)國(guó), 鐘平安, 張玉蘭, 等. 季節(jié)性支持向量機(jī)中長(zhǎng)期徑流預(yù)報(bào)模型[J]. 水力發(fā)電, 2014, 40(4): 17- 21.
[4]周秀平, 王文圣, 黃偉軍. 支持向量機(jī)回歸模型在徑流預(yù)測(cè)中的應(yīng)用[J]. 水電能源科學(xué), 2006, 24(4): 4- 6.
[5]CORTES C, VAPNIK V. Support-vector networks[J]. Machine Learning, 1995, 20(3): 273- 297.
[6]VAPNIK V. The Nature of Statistical Learning Theory[M]. New York: Springer Verlag, 1999.
[7]SMOLA A J, SCHOELKOPF B. A tutorial on support vector regression[J]. Statistics and Computing, 2004, 14: 199- 222.
[8]郭俊, 周建中, 張勇傳, 等. 基于改進(jìn)支持向量機(jī)回歸的日徑流預(yù)測(cè)模型[J]. 水力發(fā)電, 2010, 36(3): 12- 15.
[9]于國(guó)榮, 夏自強(qiáng). 混沌時(shí)間序列支持向量機(jī)模型及其在徑流預(yù)測(cè)中應(yīng)用[J]. 水科學(xué)進(jìn)展, 2008, 19(1): 116- 122.
[10]劉芳, 周建中, 邱方鵬, 等. 基于相關(guān)向量回歸的非線性時(shí)間序列預(yù)測(cè)方法[J]. 計(jì)算機(jī)工程, 2008, 34(3): 1- 2, 5.
[11]鄧聚龍. 灰色理論基礎(chǔ)[M]. 武漢: 華中科技大學(xué)出版社, 2002.
[12]劉思峰, 楊英杰, 吳利非, 等. 灰色系統(tǒng)理論及其應(yīng)用 [M]. 北京: 科學(xué)出版社, 2000.
[13]馮利華. 水資源變化趨勢(shì)的灰色聚類(lèi)預(yù)測(cè)[J]. 資源科學(xué), 1999, 21(3): 11- 15.
[14]王渺林. 長(zhǎng)江上游寸灘站年最高水位預(yù)測(cè)模型研究[J]. 水資源研究, 2005, 26(3): 35- 36.
[15]DENG J. L. Introduction to grey system theory [J ]. The Journal of Grey System (U K), 1989, 1(1): 1- 24.
[16]HSU C W, CHANG C C, LIN C J. A practical Guide to Support Vector Classification[J]. Technical report, Department of Computer Science and Information Engineering, 2003.
(責(zé)任編輯陳 萍)
Research and Application of Monthly Runoff Forecast Model Based on GM-SVR Coupling
ZHU Shuang, ZHOU Jianzhong, DING Xiaoling, XIE Mengfei, WU Jiang
(Huazhong University of Science and Technology, Wuhan 430074, Hubei, China)
The monthly runoff has a strong correlation with both the same period runoff in the history and nearby runoff. The previous prediction methods for monthly runoff often use only one kind of runoff series, which led to the loss of available information. So, a combination forecasting model based on Grey Theory and Support Vector Machine regression is presented. The model comprehensively utilizes annual and inter-annual runoff information. Compared to single grey model and support vector machine model, the results show that the performance of combination model is obviously better, especially for the flood season runoff predictions.
Support Vector Machine; Gray Theory; Kernel Function; monthly runoff
2014- 07- 26
國(guó)家自然科學(xué)基金項(xiàng)目(51239004);高等學(xué)校博士學(xué)科點(diǎn)專(zhuān)線科研基金資助項(xiàng)目(20100142110012)
朱雙(1990—),女,湖北武漢人,博士研究生,研究方向?yàn)樗乃Y源;周建中(通訊作者).
P338.2
A
0559- 9342(2015)12- 0017- 04