李慶昕
(遼寧省沈陽(yáng)水文局,遼寧 沈陽(yáng) 110094)
降雨徑流模型經(jīng)過(guò)多年的研究與發(fā)展已日趨成熟,其中數(shù)據(jù)驅(qū)動(dòng)模型和概念性模型為目前應(yīng)用較為廣泛且發(fā)展較為成熟的預(yù)測(cè)模型,尤其是數(shù)據(jù)驅(qū)動(dòng)模型,因其具有明顯的計(jì)算簡(jiǎn)潔、運(yùn)行效率較高等優(yōu)點(diǎn),在降雨徑流模擬中應(yīng)用最為廣泛,并在實(shí)際工程中取得了良好的效果[1]。其中最近鄰模型、神經(jīng)網(wǎng)絡(luò)模型以及時(shí)間序列模型等為較常見(jiàn)數(shù)據(jù)驅(qū)動(dòng)模型。然而在降雨徑流模擬中數(shù)據(jù)驅(qū)動(dòng)模型仍存在一定的問(wèn)題,如輸入變量和建模方式的確定[2]。實(shí)時(shí)校正模式即模型輸入對(duì)出流量利用實(shí)測(cè)前期流量和降雨量進(jìn)行預(yù)測(cè),該模式為傳統(tǒng)驅(qū)動(dòng)模型的基本理論,且通常只能對(duì)單步外推進(jìn)行預(yù)報(bào),因此具有預(yù)見(jiàn)期短等缺陷[3]。另外,該模式通常利用大量離散單時(shí)間降雨量作為模型的降雨量最優(yōu)輸入向量,而在實(shí)際降雨過(guò)程中一定歷時(shí)的積累降雨量往往與實(shí)際出流量密切相關(guān),而不僅僅是單時(shí)刻非離散降雨量的疊加集合,由此降低了降雨徑流模擬效果[4]。神經(jīng)網(wǎng)絡(luò)模型作為數(shù)據(jù)驅(qū)動(dòng)模型在水文模擬中應(yīng)用較為廣泛,然而該模型具有網(wǎng)絡(luò)集成方法與參數(shù)優(yōu)化、模型構(gòu)建方式與拓?fù)浣Y(jié)構(gòu)、輸入變量選擇等幾方面不足。
為提高降雨徑流模型的非實(shí)時(shí)校正精度,本文針對(duì)上述問(wèn)題進(jìn)行了基于數(shù)據(jù)驅(qū)動(dòng)模型的次洪降雨徑流模擬分析,并構(gòu)建了新型耦合數(shù)據(jù)驅(qū)動(dòng)模型PEK。研究表明,PEK模型實(shí)現(xiàn)高精度連續(xù)的降雨徑流模擬,通過(guò)多步外推預(yù)報(bào)明顯提高了模型的預(yù)見(jiàn)期;PEK模型利用初始出流量即可完成高精度的出流量連續(xù)模擬而無(wú)需進(jìn)行流域狀態(tài)變量的分析,并表現(xiàn)出較好的適用性與簡(jiǎn)便性[5]。研究成果可作為常用水平模擬的補(bǔ)充和輔助,也可為降雨徑流模擬預(yù)測(cè)、防洪規(guī)劃決策、洪水預(yù)報(bào)以及水資源評(píng)價(jià)管理提供一定的決策依據(jù)。
輸入變量選擇法是指在候選變量中進(jìn)行輸入變量挑選的方法,其中統(tǒng)計(jì)分析法、啟發(fā)式算法、試算法以及先驗(yàn)知識(shí)等為常見(jiàn)的輸入變量選擇法[6]。對(duì)于統(tǒng)計(jì)分析法具有結(jié)果穩(wěn)定可靠、應(yīng)用性較廣且效率較高等優(yōu)點(diǎn),在數(shù)據(jù)驅(qū)動(dòng)模型中比較適合應(yīng)用。所以,本文對(duì)于模型的輸入變量選擇采用偏互信息處理的方法,該方法屬于目前在選擇方法中應(yīng)用最好且較為廣泛的統(tǒng)計(jì)分析法[7]。
為避免降雨有效信息的丟失,本文在考慮實(shí)測(cè)前期流量、降雨量與出流量之間關(guān)聯(lián)性作用的基礎(chǔ)上,經(jīng)過(guò)不同的輸入變量選擇過(guò)程對(duì)降雨量與實(shí)測(cè)前期流量進(jìn)行選入,即利用分離式選擇策略對(duì)候選輸入流量進(jìn)行選取,其表達(dá)式如下:
(1)
(2)
(3)
(4)
由于公式(3)是利用不連續(xù)的、離散的單時(shí)刻降雨量作為降雨量輸出變量,而在實(shí)際應(yīng)用中一定歷時(shí)和延時(shí)的積累降雨量與出流量具有密切的關(guān)聯(lián)性,因此本文針對(duì)降雨量候選輸入向量選取滑窗積累雨量進(jìn)行輸入并可利用下式進(jìn)行求解:
(5)
本研究提出了一種個(gè)體網(wǎng)絡(luò)采用三次反向傳播的新型集成神經(jīng)網(wǎng)絡(luò)模型,并對(duì)輸入數(shù)據(jù)和各自的輸出可采用個(gè)體網(wǎng)絡(luò)進(jìn)行求解,對(duì)集成輸出網(wǎng)絡(luò)的輸出采用加權(quán)平均法進(jìn)行求解,其中AIC信息準(zhǔn)則的加權(quán)平均法是個(gè)體集成網(wǎng)絡(luò)輸出計(jì)算的基本理論和基礎(chǔ)[8]。
個(gè)體網(wǎng)絡(luò)權(quán)重生成和新型個(gè)體網(wǎng)絡(luò)生成方法為EBPNN模型的兩大主要特征,對(duì)于個(gè)體網(wǎng)絡(luò)一般由早停止LM算法與NSGA-Ⅱ算法的個(gè)體網(wǎng)絡(luò)進(jìn)行生成,此方法可對(duì)網(wǎng)絡(luò)參數(shù)、最優(yōu)拓?fù)浣Y(jié)構(gòu)以及個(gè)體網(wǎng)絡(luò)的個(gè)數(shù)進(jìn)行一次性的自動(dòng)確定,在確保模擬精度的前提下所生成的個(gè)體網(wǎng)絡(luò)具有良好的多樣性,可顯著提高神經(jīng)網(wǎng)絡(luò)的泛化能力。
新型集成神經(jīng)網(wǎng)絡(luò)模型是以有限個(gè)體網(wǎng)絡(luò)組合而集成的基于個(gè)體網(wǎng)絡(luò)的優(yōu)化和編碼等過(guò)程,該模型可對(duì)決策變量的上限進(jìn)行確定,并以此減少搜索空間提高優(yōu)化網(wǎng)絡(luò)效率。NSGA-Ⅱ算法在優(yōu)化過(guò)程中有兩個(gè)目標(biāo)函數(shù)即保證拓?fù)浣Y(jié)構(gòu)復(fù)雜度最小和訓(xùn)練誤差最小化。本研究中訓(xùn)練集采用3/4率定期樣本,而早停止算法的測(cè)試集選取其他率定期樣本。在生成個(gè)體網(wǎng)絡(luò)后,利用加權(quán)平均法對(duì)每個(gè)個(gè)體網(wǎng)絡(luò)權(quán)重進(jìn)行集成總輸出分析,本文結(jié)合相關(guān)文獻(xiàn)利用AIC信息準(zhǔn)則法進(jìn)行個(gè)體網(wǎng)絡(luò)權(quán)重的生成。
PEK模型是對(duì)出流量誤差利用K最近鄰算法進(jìn)行求解、對(duì)出流量利用新型集成網(wǎng)絡(luò)計(jì)算、對(duì)輸入變量采用偏互信息進(jìn)行選擇的一種降雨徑流模擬預(yù)測(cè)方法。通過(guò)利用模擬前期流量替代實(shí)測(cè)前期流量,PEK模型實(shí)現(xiàn)了高精度連續(xù)非實(shí)時(shí)校正模式下的降雨徑流模擬[9]。PEK模型通過(guò)利用EBPNN,可采用輸入向量進(jìn)行求解預(yù)報(bào)輸出,對(duì)預(yù)報(bào)預(yù)測(cè)利用K最近鄰算法進(jìn)行求解,并通過(guò)對(duì)預(yù)報(bào)誤差與輸出疊加得到網(wǎng)絡(luò)模擬輸出,其建模方式分別為:
(6)
(7)
(8)
(9)
(10)
(11)
(12)
PEK模型主要是對(duì)4個(gè)映射關(guān)系進(jìn)行確定和率定,即利用偏互信息對(duì)前期流量候選輸入向量IVSQ_SIM進(jìn)行選擇;采用偏互信息對(duì)滑窗積累雨量候選輸入向量IVSSWCR進(jìn)行輸入變量的選擇;對(duì)出流量利用EPBNN進(jìn)行預(yù)測(cè);對(duì)出流量誤差利用KNN進(jìn)行預(yù)測(cè)。PEK模型各參數(shù)的率定方法及詳細(xì)過(guò)程參照相關(guān)文獻(xiàn)。
CLS模型是由Todini與Natale所提出的基于總徑流響應(yīng)TLR模型的約束線性系統(tǒng),該模型是在TLR模型的基礎(chǔ)上添加了兩個(gè)約束條件即水量平衡與非負(fù)響應(yīng)。并且,CLS模型將降雨量按照不同的閥值進(jìn)行劃分并以此作為雨強(qiáng)對(duì)產(chǎn)匯流過(guò)程的影響的判別依據(jù),其產(chǎn)匯流計(jì)算分別利用不同的響應(yīng)函數(shù)進(jìn)行求解,結(jié)合研究區(qū)域?qū)嶋H狀況,本研究中共有兩個(gè)CLS模型閥值[10]。
渾河流域面積約為11481km2,全長(zhǎng)415km,河寬約2~5km,年平均降水量約718.3mm,年蒸發(fā)量約1805.4mm,年平均徑流量為30.52億m3。流域東面屬于富水區(qū),西面處于少水區(qū),徑流洪水受降雨影響顯著,降雨集中,短期暴雨是造成該流域洪水的主要原因,汛期主要集中在7—8月。研究區(qū)域?qū)儆跍貛Т箨懶约撅L(fēng)氣候,冬季干燥寒冷,夏季炎熱多雨,溫差變化較大,降水時(shí)空分布不均勻,東部降水較多,西部較少,自東至西逐級(jí)遞減。該流域東至清原,流經(jīng)撫順、沈陽(yáng)等市縣,為不對(duì)稱(chēng)水系,主要有大伙房水庫(kù)站、沈陽(yáng)水文站、邢家窩棚水文站等8個(gè)水文站,區(qū)域內(nèi)支流主要細(xì)河、萬(wàn)泉河、蒲河等10個(gè)子流域。本研究的次洪模型計(jì)算選取了2000—2009年間的20場(chǎng)次洪資料,其中模型率定和驗(yàn)證場(chǎng)次分別為14和6場(chǎng)次,其中降雨蒸發(fā)站選取邢家窩棚水文站[11]。
次洪歷時(shí)最小值在邢家窩棚流域?yàn)?0h,所以本研究首選設(shè)定邢家窩棚流域的階數(shù)nP=nQ=24進(jìn)行驗(yàn)證,并以此確保輸入變量能更好地包含較多輸入信息,對(duì)輸入變量利用偏互信息進(jìn)行輸入變量的選擇。結(jié)果發(fā)現(xiàn),生成最優(yōu)滑窗積累雨量以及模擬前期流量和最優(yōu)預(yù)報(bào)前期流量分別介于Pt~Pt-23、t-1~t-24范圍。選擇結(jié)果顯示出選擇nP=nQ=24可以滿足邢家窩棚流域降雨徑流相關(guān)研究,此選擇結(jié)果表現(xiàn)出良好的適用性與合理性。
通過(guò)合理設(shè)定NSGA-Ⅱ相關(guān)參數(shù)可有效提高模型的效率和優(yōu)化效果,本研究種群數(shù)與總進(jìn)化代數(shù)分別為100個(gè)和1000次,交叉與變異概率分別為0.9和0.1;LM算法的參數(shù)設(shè)定為:模型最小梯度為1~10,初始值與減少因子分別為0.001和0.1,增加因子和最大值分別為10和1E- 10。訓(xùn)練集選取3/4的率定樣本作為早停止策略,測(cè)試集為其他各率定樣本,其中失敗次數(shù)為5次。權(quán)重系數(shù)和最優(yōu)拓?fù)浣Y(jié)構(gòu)見(jiàn)表1。
表1 PEK模型個(gè)體網(wǎng)絡(luò)權(quán)重與最優(yōu)拓?fù)浣Y(jié)構(gòu)
表1中權(quán)重最大的拓?fù)浣Y(jié)構(gòu)為8- 4- 1,由此可在一定程度上表明最優(yōu)的拓?fù)浣Y(jié)構(gòu)包含于帕累托最優(yōu)集。隱含層神經(jīng)元個(gè)數(shù)往往不超過(guò)輸入層神經(jīng)元個(gè)數(shù)且大部分處于較小水平。研究表明,在滿足模擬精度的條件下優(yōu)化出的個(gè)體網(wǎng)絡(luò)規(guī)模往往較低且具有較好的泛化能力。
結(jié)合文中有關(guān)雨量閥值的設(shè)定,CLS模型共有兩個(gè)閥值和三個(gè)子響應(yīng)函數(shù),并且利用試算法對(duì)各子響應(yīng)函數(shù)的寬度進(jìn)行優(yōu)化。其寬度值結(jié)合研究流域洪水歷時(shí)的最小值可預(yù)先設(shè)定區(qū)間為[1,24]。本研究針對(duì)預(yù)先設(shè)定區(qū)間的合理性利用優(yōu)化結(jié)果進(jìn)行對(duì)比分析,對(duì)CLS模型利用二次規(guī)劃算法和后選值進(jìn)行率定并對(duì)模擬誤差進(jìn)行記錄。當(dāng)各寬度的候選值試算結(jié)束后選取誤差最小的寬度作為最優(yōu)解。研究表明對(duì)于邢家窩棚流域的各子響應(yīng)函數(shù)寬度整體上小于區(qū)間的上限值24,表明所設(shè)定的函數(shù)寬度24是合理可行的。
本研究分別采用MAE(平均絕對(duì)值誤差)、RMSE(均方根誤差)以及CE(納須效率系數(shù))3個(gè)準(zhǔn)則對(duì)次洪模擬結(jié)果進(jìn)行評(píng)價(jià)和分析。
結(jié)合文中公式和相關(guān)理論對(duì)降雨徑流分別利用CLS與PEK模型進(jìn)行模擬分析,其誤差結(jié)果見(jiàn)表2。結(jié)果表明,利用PEM模型在模擬驗(yàn)證期與率定期的邢家窩棚小流域降雨徑流均顯著優(yōu)于CLS模型。針對(duì)傳統(tǒng)數(shù)據(jù)驅(qū)動(dòng)模型的不足,對(duì)PEK模型進(jìn)行了多項(xiàng)改進(jìn)和分析,主要是對(duì)輸入變量進(jìn)行了選擇優(yōu)化、訓(xùn)練并涉及了集成神經(jīng)網(wǎng)絡(luò)、添加了出流量誤差預(yù)測(cè)與模擬前期流量的新建模式,通過(guò)優(yōu)化改進(jìn)PEK模型取得了滿意的模擬結(jié)果。而CLS模型由于其具有的線性模擬特征,針對(duì)非線性問(wèn)題未能取得理想的模擬結(jié)果,因此該模型不適于對(duì)非線性問(wèn)題的模擬分析。
表2 各模擬方法的誤差統(tǒng)計(jì)結(jié)果表
(1)在本研究中訓(xùn)練集采用3/4率定期樣本,而早停止算法的測(cè)試集選取其他率定期樣本。在生成個(gè)體網(wǎng)絡(luò)后,利用加權(quán)平均法對(duì)每個(gè)個(gè)體網(wǎng)絡(luò)的權(quán)重進(jìn)行集成總輸出分析,本文利用AIC信息準(zhǔn)則法進(jìn)行個(gè)體網(wǎng)絡(luò)權(quán)重的生成。
(2)在滿足模擬精度的條件下優(yōu)化出的個(gè)體網(wǎng)絡(luò),其網(wǎng)絡(luò)規(guī)模往往較低且具有較好的泛化能力。