戴領(lǐng) 駱光磊 周建中
摘要:
現(xiàn)有水庫(kù)調(diào)度模擬模型在長(zhǎng)時(shí)段模擬時(shí)存在嚴(yán)重的誤差累積,極大影響模型模擬精度。針對(duì)上述問(wèn)題,首先建立了基于隨機(jī)森林和貝葉斯優(yōu)化理論的水庫(kù)調(diào)度規(guī)則提取模型,進(jìn)一步引入概率性預(yù)測(cè)方法,提出了一種基于分位數(shù)回歸森林的水庫(kù)調(diào)度滾動(dòng)模擬方法,以預(yù)測(cè)區(qū)間分位數(shù)為媒介將概率預(yù)測(cè)信息傳遞至下一時(shí)刻,最后以二灘水庫(kù)和觀音巖水庫(kù)為研究實(shí)例,對(duì)比分析了點(diǎn)預(yù)測(cè)模型滾動(dòng)模擬結(jié)果以及多步模擬模型結(jié)果。研究表明:所提出的基于分位數(shù)回歸森林的水庫(kù)調(diào)度滾動(dòng)模擬方法能夠有效降低模擬累積誤差,提高長(zhǎng)時(shí)段模擬精度,相對(duì)于直接采用確定性的調(diào)度規(guī)則進(jìn)行滾動(dòng)模擬,該方法在同等指標(biāo)要求下模擬時(shí)段延長(zhǎng)3~5 d,在相同模擬天數(shù)情況下,各項(xiàng)指標(biāo)均提升5%~10%。
關(guān) 鍵 詞:
水庫(kù)調(diào)度; 滾動(dòng)模擬; 隨機(jī)森林; 分位數(shù)回歸森林; 貝葉斯優(yōu)化
中圖法分類號(hào): TV391
文獻(xiàn)標(biāo)志碼: A
DOI:10.16232/j.cnki.1001-4179.2023.07.031
0 引 言
隨著國(guó)民經(jīng)濟(jì)發(fā)展對(duì)電力需求的快速增長(zhǎng),水能資源開(kāi)發(fā)與利用逐漸加快[1]。流域內(nèi)水庫(kù)逐漸增多,梯級(jí)上下游水力聯(lián)系逐漸緊密,上游水庫(kù)出庫(kù)流量在下游水庫(kù)入庫(kù)流量中的占比增大,導(dǎo)致下游水庫(kù)調(diào)度運(yùn)行難度增加,嚴(yán)重影響了下游水庫(kù)綜合效益發(fā)揮。為此,在目前流域大規(guī)模水庫(kù)群逐步投產(chǎn)運(yùn)營(yíng)的背景下,開(kāi)展水庫(kù)調(diào)度運(yùn)行模擬模型研究,在短期尺度上,下游水庫(kù)可以提前預(yù)知上游水庫(kù)出庫(kù)過(guò)程,獲得更加精確的預(yù)報(bào)入庫(kù)流量,從而提前制定更加合理的水庫(kù)蓄泄過(guò)程,提高水庫(kù)綜合效益;在中長(zhǎng)期尺度上,可以獲知上游水庫(kù)在任意來(lái)水條件下的調(diào)蓄過(guò)程,明晰上游水庫(kù)調(diào)度運(yùn)行對(duì)下游水庫(kù)入庫(kù)流量、年發(fā)電量等因素的影響。同時(shí),對(duì)流域整體而言,有利于探索流域大規(guī)模水庫(kù)群聯(lián)合調(diào)度理論,為流域梯級(jí)水庫(kù)群聯(lián)合運(yùn)行、水資源優(yōu)化配置提供科學(xué)指導(dǎo)[2]。
目前,水庫(kù)模擬調(diào)度模型常采用調(diào)度圖方式。范繼輝[3]結(jié)合馬斯京根演進(jìn)方法和水庫(kù)調(diào)度圖建立了長(zhǎng)江上游水庫(kù)群模擬調(diào)度模型,通過(guò)設(shè)置不同的運(yùn)行情景,分析了上游水庫(kù)群不同蓄水時(shí)機(jī)下三峽水庫(kù)來(lái)水發(fā)電響應(yīng)過(guò)程。戴明龍[4]基于長(zhǎng)江上游水庫(kù)群調(diào)度圖建立了上游水庫(kù)群協(xié)同“還原-模擬-演算”模型,模擬上游各梯級(jí)水庫(kù)的蓄水運(yùn)行,得到不同水平年經(jīng)上游水庫(kù)調(diào)節(jié)后的下游控制站徑流,進(jìn)而分析了上游水庫(kù)運(yùn)行對(duì)下游水文變異的影響。然而,在實(shí)際調(diào)度中,調(diào)度圖僅作為參考,調(diào)度人員會(huì)根據(jù)當(dāng)前水位、來(lái)水等信息修正決策,真實(shí)調(diào)度過(guò)程往往與調(diào)度圖相差甚遠(yuǎn)。已建水庫(kù)通過(guò)多年運(yùn)行,積累了大量水文數(shù)據(jù)以及水庫(kù)歷史運(yùn)行數(shù)據(jù),這些數(shù)據(jù)中蘊(yùn)藏著大量的規(guī)律性信息,反映了水庫(kù)調(diào)度人員多年人工經(jīng)驗(yàn)和決策智慧。而機(jī)器學(xué)習(xí)算法擅長(zhǎng)從大量數(shù)據(jù)中挖掘隱含規(guī)律,具有極強(qiáng)的非線性擬合能力。因此,隨著數(shù)據(jù)挖掘理論不斷發(fā)展,基于機(jī)器學(xué)習(xí)算法的水庫(kù)調(diào)度模擬模型逐漸嶄露頭角并得到推廣。駱光磊[5]基于改進(jìn)深度神經(jīng)網(wǎng)絡(luò),考慮水庫(kù)運(yùn)行約束,構(gòu)建了金沙江中游觀音巖水庫(kù)、雅礱江錦屏一級(jí)、二灘水庫(kù)群模擬調(diào)度模型,實(shí)現(xiàn)了庫(kù)群旬尺度年運(yùn)行過(guò)程模擬。湯正陽(yáng)等[6]收集了溪洛渡水電站的調(diào)度運(yùn)行數(shù)據(jù),基于RNN,LSTM,GRU3種循環(huán)神經(jīng)網(wǎng)絡(luò),學(xué)習(xí)電站現(xiàn)有調(diào)度規(guī)則,構(gòu)建了溪洛渡水庫(kù)的出流量預(yù)測(cè)模型,并探究不同參數(shù)設(shè)定對(duì)模型精度和計(jì)算速度的影響,對(duì)比了3種模型的模擬性能,分析了影響水庫(kù)調(diào)度的主要因素。Chaves等[7]采用人工神經(jīng)網(wǎng)絡(luò)模擬水庫(kù)調(diào)度系統(tǒng)。Zhu等[8]提出了一種基于人工智能算法和系統(tǒng)動(dòng)力學(xué)模型的梯級(jí)水庫(kù)自適應(yīng)仿真模型,所提模型可以有效地反映系統(tǒng)運(yùn)行的動(dòng)態(tài)變化,實(shí)現(xiàn)各種條件下系統(tǒng)運(yùn)行和自適應(yīng)調(diào)度決策的精細(xì)模擬。然而,現(xiàn)有研究中大多數(shù)水庫(kù)調(diào)度模擬模型均為單步模擬模型,即模型只能獲得下一個(gè)時(shí)刻模擬值,而如果要獲得長(zhǎng)序列模擬值,即t+1,t+2,…t+n時(shí)刻模擬值,則需要進(jìn)行多步模擬。目前多步模擬主要有兩種方法:① 直接利用t時(shí)刻及之前的狀態(tài),構(gòu)建n個(gè)模型,分別預(yù)測(cè)t+1,t+2,…,t+n時(shí)刻輸出值,集成n個(gè)模型實(shí)現(xiàn)多步模擬。該方法主要缺點(diǎn)是需要構(gòu)建多個(gè)模型,且時(shí)段越長(zhǎng),輸入輸出因子間相關(guān)性會(huì)降低,模型精度無(wú)法保證;② 將t+1時(shí)刻模型預(yù)測(cè)值當(dāng)做已知量代入到原模型中,預(yù)測(cè)t+2時(shí)刻輸出值,以此類推獲得t+n時(shí)刻輸出值。該方法可以實(shí)現(xiàn)無(wú)限制時(shí)長(zhǎng)的預(yù)測(cè),但是t+1時(shí)刻模型輸出誤差會(huì)代入到模型中加大t+2時(shí)刻模型預(yù)測(cè)誤差,多次滾動(dòng)會(huì)使誤差累積,從而降低模型精度。
為此,本文針對(duì)第2種多步模擬方法,為降低模擬模型累積誤差,提出一種基于分位數(shù)回歸森林和貝葉斯優(yōu)化理論的水庫(kù)調(diào)度滾動(dòng)模擬方法,首先建立基于隨機(jī)森林和貝葉斯優(yōu)化理論的調(diào)度規(guī)則提取模型作為對(duì)比模型,在此基礎(chǔ)上,綜合考慮上述兩種多步模擬方法,分別構(gòu)建水庫(kù)調(diào)度多步模擬和基于分位數(shù)回歸森林的滾動(dòng)模擬模型,最后以二灘水庫(kù)和觀音巖水庫(kù)作為研究對(duì)象進(jìn)行驗(yàn)證。
1 基于隨機(jī)森林和貝葉斯優(yōu)化理論的水庫(kù)調(diào)度規(guī)則提取模型
1.1 隨機(jī)森林
隨機(jī)森林(Random Forests,RF)算法最早由Brieman等學(xué)者于2001年提出[9],是一種基于決策樹(shù)和自舉匯聚法(Bagging)的集成模型,適用于解決小樣本、高維度特征數(shù)據(jù)分類和回歸問(wèn)題,對(duì)于存在噪聲和缺失值的觀測(cè)數(shù)據(jù)具有很好的魯棒性[10]。其主要原理是:首先通過(guò)樣本的有放回抽樣產(chǎn)生多組訓(xùn)練集,然后根據(jù)訓(xùn)練集數(shù)據(jù)隨機(jī)選擇特征生成決策樹(shù),最后將多棵決策樹(shù)的結(jié)果進(jìn)行投票選擇或取均值獲得最終結(jié)果。
1.2 貝葉斯優(yōu)化
超參數(shù)優(yōu)化是機(jī)器學(xué)習(xí)領(lǐng)域一大重難點(diǎn),旨在尋找使算法在驗(yàn)證集上表現(xiàn)性能最佳的超參數(shù)組合。超參數(shù)與一般模型參數(shù)不同,需在訓(xùn)練前設(shè)置,決定模型架構(gòu),如支持向量機(jī)中的懲罰系數(shù),神經(jīng)網(wǎng)絡(luò)層數(shù)、節(jié)點(diǎn)數(shù)等[11]。隨著機(jī)器學(xué)習(xí)算法模型愈加復(fù)雜、訓(xùn)練樣本逐漸增加,單次模型訓(xùn)練時(shí)間成本越來(lái)越高。因此,為提高搜索效率,貝葉斯優(yōu)化算法應(yīng)運(yùn)而生。它首先基于目標(biāo)函數(shù)過(guò)去評(píng)估結(jié)果建立代理模型,進(jìn)而通過(guò)采集函數(shù)尋找代理模型期望收益最大的超參數(shù),然后將超參數(shù)與評(píng)估結(jié)果作為輸入更新代理模型,以此往復(fù)交替進(jìn)行,最終獲得目標(biāo)值最優(yōu)的超參數(shù)。相對(duì)于隨機(jī)或網(wǎng)格搜索,貝葉斯優(yōu)化算法使用不斷更新的代理模型,并通過(guò)推斷已有結(jié)果來(lái)“集中”更有希望的超參數(shù),從而大大減少了調(diào)參時(shí)間[12]。
1.3 調(diào)度規(guī)則提取模型
水庫(kù)調(diào)度決策與水位、入庫(kù)流量、出庫(kù)流量、出力、負(fù)荷、預(yù)報(bào)流量等因素密切相關(guān),考慮到水庫(kù)出力、負(fù)荷、預(yù)報(bào)流量數(shù)據(jù)難以獲取,本文選擇時(shí)段數(shù)、水庫(kù)前期水位、入庫(kù)流量、出庫(kù)流量以及當(dāng)前時(shí)段入庫(kù)流量作為影響因子構(gòu)成輸入因子集,考慮到時(shí)段數(shù)和水庫(kù)前一時(shí)刻狀態(tài)以及當(dāng)前時(shí)段入庫(kù)流量與當(dāng)前時(shí)段決策關(guān)系最為密切,因此將其作為模型輸入必選因子,對(duì)剩余因子采用互信息方法定量評(píng)估其與輸出因子間的相關(guān)性并將其作為備選因子,然后采用隨機(jī)森林算法構(gòu)建調(diào)度規(guī)則提取模型,最后采用貝葉斯超參數(shù)優(yōu)化算法中的樹(shù)形Parzen評(píng)估器同時(shí)優(yōu)化輸入因子選擇個(gè)數(shù)與隨機(jī)森林算法超參數(shù),尋找模型效果最優(yōu)的超參數(shù)組合。模型具體步驟及流程(圖1)如下:
步驟1:從水庫(kù)調(diào)度運(yùn)行數(shù)據(jù)中挑選時(shí)段數(shù)T、前期水位H、入庫(kù)流量Q、出庫(kù)流量q等特征組建模型輸入因子集,選擇當(dāng)前時(shí)段末水位作為模型輸出,選擇時(shí)段數(shù)、前1時(shí)段入庫(kù)、出庫(kù)、末水位及當(dāng)前時(shí)段入庫(kù)作為必選輸入因子,選擇前2~10時(shí)段入庫(kù)流量Qt-2~10、出庫(kù)流量qt-2~10、末水位Ht-2~10構(gòu)成備選輸入因子集,計(jì)算備選輸入因子集中各因子與輸出變量間的互信息并排序。
步驟2:將備選輸入因子個(gè)數(shù)M與隨機(jī)森林算法超參數(shù)最大深度、最小樣本數(shù)、決策樹(shù)個(gè)數(shù)組合成超參數(shù)集。備選輸入因子個(gè)數(shù)M表示在備選因子集中選擇互信息值排序靠前的M個(gè)因子與必選輸入因子構(gòu)成模型輸入。
步驟3:根據(jù)模型輸入輸出構(gòu)造數(shù)據(jù)樣本并劃分訓(xùn)練集和測(cè)試集,以訓(xùn)練集上交叉驗(yàn)證的均方根誤差均值最小為目標(biāo)函數(shù),采用樹(shù)形Parzen估計(jì)器優(yōu)化模型超參數(shù)。
步驟4:選用步驟3中最優(yōu)超參數(shù)重新對(duì)模型進(jìn)行訓(xùn)練,計(jì)算模型在測(cè)試集上的各項(xiàng)指標(biāo),評(píng)估模型效果。
2 基于分位數(shù)回歸森林的水庫(kù)調(diào)度滾動(dòng)模擬方法
2.1 分位數(shù)回歸森林
分位數(shù)回歸森林(Quantile Regression Forests,QRF)是在隨機(jī)森林算法基礎(chǔ)上結(jié)合分位數(shù)回歸(Quantile Regression,QR)的改進(jìn)模型[13],其不僅能夠獲得預(yù)測(cè)結(jié)果的條件均值,還能得到預(yù)測(cè)結(jié)果的條件概率分布,被廣泛應(yīng)用于負(fù)荷預(yù)測(cè)、風(fēng)速區(qū)間預(yù)測(cè)領(lǐng)域[14-16]。算法實(shí)現(xiàn)的主要步驟如下:
步驟1:根據(jù)隨機(jī)森林算法,生成N棵決策樹(shù),記錄每棵決策樹(shù)每個(gè)葉子節(jié)點(diǎn)上所有訓(xùn)練樣本;
步驟2:對(duì)于給定的新樣本X*,獲取其在隨機(jī)森林每棵樹(shù)的葉子點(diǎn)ln,如圖2所示,計(jì)算每棵決策樹(shù)上所有樣本的權(quán)重wi,n,公式如下:
wi,n=1/k,Xi∈R(ln)0,XiR(ln)(1)
式中:k為ln葉子節(jié)點(diǎn)上的訓(xùn)練樣本子集R(ln)數(shù)據(jù)量,Xi為訓(xùn)練樣本。
3 實(shí)例研究
本文分別以二灘水庫(kù)和觀音巖水庫(kù)為研究對(duì)象。二灘水庫(kù)位于雅礱江下游,壩址以上流域面積11.64萬(wàn)km2,約占雅礱江整個(gè)流域面積的90%,壩址處多年平均流量1 670 m3/s,年徑流量52.7 km3;觀音巖水庫(kù)位于金沙江中游,位于云南省華坪縣與四川省攀枝花市的交界處,上游接魯?shù)乩娬?,下游距攀枝花?7 km,各水庫(kù)基本信息見(jiàn)表1。研究分別采用2014~2019年數(shù)據(jù)為訓(xùn)練數(shù)據(jù),2020年數(shù)據(jù)作為測(cè)試數(shù)據(jù),時(shí)間尺度為日尺度。根據(jù)第1節(jié)所提方法建立水庫(kù)調(diào)度規(guī)則提取模型(記為RF模型),圖4~5與表2分別為二灘和觀音巖水庫(kù)在測(cè)試集上各評(píng)價(jià)指標(biāo)結(jié)果,由圖表可知,各水庫(kù)單步模擬精度均較高。
圖6~7分別為二灘和觀音巖水庫(kù)QRF模型在70%,80%,90%置信區(qū)間(Probability Intervals,PIs)下單步模擬結(jié)果。由圖可知,某些時(shí)段分位數(shù)預(yù)測(cè)值相同,且模擬值的區(qū)間寬度越小,分位數(shù)模擬值相同時(shí)段長(zhǎng)度也越短。其主要原因是:這些時(shí)段水位變化幅度不大,入庫(kù)流量等其他特征區(qū)分程度不明顯,從而導(dǎo)致隨機(jī)森林模型將其劃分至同一葉子節(jié)點(diǎn),而分位數(shù)回歸森林采用葉子節(jié)點(diǎn)上樣本權(quán)重作為頻率估計(jì)分位數(shù)模擬值,故其分位數(shù)相同,同時(shí),模擬區(qū)間寬度越小,證明該時(shí)段樣本越集中,相鄰時(shí)段樣本區(qū)別越大,所在的葉子節(jié)點(diǎn)數(shù)不同從而其分位數(shù)預(yù)測(cè)值不同。此外,二灘水庫(kù)預(yù)測(cè)區(qū)間寬度非汛期時(shí)段較汛期小,其主要原因是水庫(kù)在高水位運(yùn)行期水位基本保持不變,而汛期由于防洪調(diào)度需求,相同時(shí)段水位變化較大,需要較寬區(qū)間才能覆蓋所有樣本。相反,觀音巖水庫(kù)為周調(diào)節(jié)水庫(kù),水庫(kù)全年無(wú)明顯的蓄水與消落時(shí)期,日間波動(dòng)幅度較大,相同時(shí)段的樣本較為分散,其區(qū)間寬度較二灘水庫(kù)要大。表3為不同置信度下區(qū)間預(yù)測(cè)指標(biāo)值,由表3可知,給定置信度下的PICP指標(biāo)基本大于該置信度,預(yù)測(cè)結(jié)果可靠。區(qū)間覆蓋率PICP指標(biāo)隨給定置信度的增大而增大,但同時(shí)區(qū)間平均寬度PINAW指標(biāo)也隨之增大,95%置信度下,預(yù)測(cè)區(qū)間基本覆蓋所有實(shí)測(cè)值??傮w而言,各水庫(kù)QRF模型輸出的不同置信區(qū)間很好地覆蓋了實(shí)測(cè)水位曲線,區(qū)間模擬效果較好。
進(jìn)一步依托上述2個(gè)模型,設(shè)置3套模擬方案:方案一,采用二灘水庫(kù)單步模擬模型滾動(dòng)模擬n個(gè)時(shí)段。方案二,分別用以后n個(gè)時(shí)段末水位為輸出,重新率定模型,直接模擬后n個(gè)時(shí)段的調(diào)度過(guò)程,并通過(guò)水庫(kù)調(diào)度計(jì)算判斷是否滿足調(diào)度基本約束(水位上下限,出庫(kù)上下限),進(jìn)行水位修正。方案三,采用所提方法進(jìn)行滾動(dòng)模擬n個(gè)時(shí)段。上述方案中n取50,方案一和方案三分別以2020年1月1日至11月19日為起始時(shí)刻進(jìn)行滾動(dòng)模擬,從而獲得不同模擬時(shí)長(zhǎng)下水位模擬值,方案二以2020年以前數(shù)據(jù)為訓(xùn)練集,2020年數(shù)據(jù)為測(cè)試集,模型訓(xùn)練過(guò)程與第2節(jié)相同,方案三中模擬方法預(yù)測(cè)水位分位數(shù)步長(zhǎng)Δ=1,PINAW指標(biāo)權(quán)重η=50。
圖8~9為不同方案在不同模擬時(shí)長(zhǎng)下各水庫(kù)各指標(biāo)變化圖。由圖可知:兩水庫(kù)各方案指標(biāo)變化趨勢(shì)保持一致。方案一和方案三以原始單步模擬模型輸出作為下一時(shí)段單步模擬模型輸入進(jìn)行滾動(dòng)模擬,隨著模擬時(shí)段增加,累積誤差逐漸增大,模擬過(guò)程逐步偏離實(shí)際過(guò)程,滾動(dòng)模擬效果逐漸變差;方案二各評(píng)估指標(biāo)變化趨勢(shì)一致,均表現(xiàn)為模型效果首先急速下降,最后趨于穩(wěn)定,但二灘水庫(kù)確定性系數(shù)隨模擬時(shí)長(zhǎng)增加維持在0.85以上,而觀音巖水庫(kù)較差,隨著模擬時(shí)長(zhǎng)增加,各項(xiàng)評(píng)價(jià)指標(biāo)急劇下降,模型基本失效。對(duì)比3種模擬方案,在模擬時(shí)長(zhǎng)較短時(shí)方案三模擬效果優(yōu)于方案一和二,其主要原因是:水庫(kù)QRF模型在區(qū)間覆蓋率滿足要求的基礎(chǔ)上區(qū)間寬度較小。區(qū)間寬度越小,說(shuō)明該葉子節(jié)點(diǎn)樣本越集中,其不同預(yù)測(cè)分位數(shù)間的差距較小,預(yù)測(cè)結(jié)果越接近真實(shí)值,同時(shí)式(8)中各輸入?yún)^(qū)別越小,則模型大部分輸出落在隨機(jī)森林相同葉子節(jié)點(diǎn)上,從而減少了參與分位數(shù)計(jì)算的訓(xùn)練樣本數(shù)量,進(jìn)一步降低了下一時(shí)刻的模擬區(qū)間寬度;在模擬時(shí)長(zhǎng)較長(zhǎng)時(shí),方案二的模擬精度遠(yuǎn)遠(yuǎn)高于方案一和三,其主要原因是:當(dāng)模擬時(shí)段較長(zhǎng)時(shí),時(shí)段誤差逐步累積,水位偏差逐步變大,而前期水位對(duì)RF和QRF模型輸出值影響較大,即使方案一和方案三在模擬過(guò)程中添加了后期實(shí)際入庫(kù)流量信息,也無(wú)法較大改善模擬效果。總體而言,方案二完全通過(guò)數(shù)據(jù)挖掘的方式,相對(duì)方案一和方案二,缺少了后面時(shí)段的真實(shí)入庫(kù)信息的加入,其在滾動(dòng)模擬時(shí)段較短時(shí)模擬效果沒(méi)有方案一和方案二好,但隨著模擬時(shí)長(zhǎng)增加,方案一和三時(shí)段累積誤差逐步占主導(dǎo)作用,此時(shí)方案二的模擬效果較好。但由于方案二模擬時(shí)采用的是純數(shù)據(jù)挖掘方式,模擬效果受數(shù)據(jù)系列影響較強(qiáng),不確定性程度較大,缺少物理意義支撐,且其無(wú)法使用預(yù)報(bào)信息,使用靈活性不如方案一和三。此外,方案三模擬效果持續(xù)優(yōu)于方案一,在同等指標(biāo)要求下,方案三滾動(dòng)模擬時(shí)段延長(zhǎng)3~5 d,在相同模擬天數(shù)情況下,各項(xiàng)評(píng)價(jià)指標(biāo)均提升5%~10%,表明所提方法能夠有效降低滾動(dòng)模擬累積誤差,提高水庫(kù)調(diào)度長(zhǎng)時(shí)段模擬精度。
4 結(jié) 論
本文分別以二灘水庫(kù)和觀音巖水庫(kù)為研究對(duì)象,首先建立了基于隨機(jī)森林和貝葉斯超參數(shù)優(yōu)化的水庫(kù)調(diào)度規(guī)則提取模型,依據(jù)兩種不同的多步模擬策略,建立了水庫(kù)調(diào)度滾動(dòng)模擬模型。在此基礎(chǔ)上,考慮到概率預(yù)測(cè)方法能夠獲取模型預(yù)測(cè)值更多信息,提出了一種基于分位數(shù)回歸森林的水庫(kù)調(diào)度滾動(dòng)模擬方法,最后,對(duì)比分析了所提方法與兩類多步模擬模型的模擬效果。研究結(jié)果表明:基于隨機(jī)森林和貝葉斯超參數(shù)優(yōu)化的水庫(kù)調(diào)度規(guī)則提取模型效果較好,精度較高;通過(guò)構(gòu)建多個(gè)模型實(shí)現(xiàn)多步模擬方法在模擬時(shí)段較短時(shí)模擬效果較差,較長(zhǎng)時(shí)段模擬效果較好,但該方法模擬效果受數(shù)據(jù)系列影響較強(qiáng),不確定性程度較大,且使用靈活性差;本文所提基于分位數(shù)回歸森林的水庫(kù)調(diào)度滾動(dòng)模擬方法能夠有效降低模擬累積誤差,提高長(zhǎng)時(shí)段模擬精度。
本文所提方法的核心在于在水庫(kù)調(diào)度模擬中引入概率性預(yù)測(cè)方法,利用預(yù)測(cè)區(qū)間內(nèi)的所有分位數(shù)作為下一時(shí)刻的輸入,從而在一定程度上減弱滾動(dòng)模擬累積誤差,因此本文所提方法中的概率預(yù)測(cè)方法不局限于隨機(jī)森林算法,任意類型的概率性預(yù)測(cè)方法均可使用。此外,受研究者工程經(jīng)驗(yàn)、理論水平和研究時(shí)間的限制,尚存在一些研究難點(diǎn)需要在今后的研究工作中進(jìn)一步突破,特別是需針對(duì)不同時(shí)期分別建立相應(yīng)模擬模型,以進(jìn)一步提高模型模擬精度,提升方法的適用性。
參考文獻(xiàn):
[1] 彭才德.“十三五”水電發(fā)展及展望[J].中國(guó)電力企業(yè)管理,2019,(4):34-36.
[2] 戴領(lǐng).梯級(jí)水庫(kù)群調(diào)度運(yùn)行對(duì)下游水庫(kù)防洪發(fā)電影響分析[D].武漢:華中科技大學(xué),2021.
[3] 范繼輝.梯級(jí)水庫(kù)群調(diào)度模擬及其對(duì)河流生態(tài)環(huán)境的影響:以長(zhǎng)江上游為例[D].成都:中國(guó)科學(xué)院·水利部成都山地災(zāi)害與環(huán)境研究所,2007.
[4] 戴明龍.長(zhǎng)江上游巨型水庫(kù)群運(yùn)行對(duì)流域水文情勢(shì)影響研究[D].武漢:華中科技大學(xué),2017.
[5] 駱光磊.基于深度學(xué)習(xí)的流域水庫(kù)群調(diào)度模擬方法研究與系統(tǒng)實(shí)現(xiàn)[D].武漢:華中科技大學(xué),2020.
[6] 湯正陽(yáng),張迪,林俊強(qiáng),等.基于循環(huán)神經(jīng)網(wǎng)絡(luò)算法的水庫(kù)調(diào)度模擬[J].水電能源科學(xué),2021,39(5):83-86,70.
[7] CHAVES P,CHANG F J.Intelligent reservoiroperation system based on evolving artificial neural networks[J].Advances in Water Resources,2008,31(6):926-936.
[8] ZHU B,LIU J,LIN L,et al.Cascade reservoirs adaptive refined simulation model based on the mechanism-AI coupling modeling paradigm[J].Journal of Hydrology,2022,612(B):128229.
[9] BREIMAN L.Random forests[J].Machine learning,2001,1(45):5-32.
[10] LIAW A,MATTHEW W.Classification and regression by randomforest[J].Forest,2002(2/3):18-22.
[11] 浮盼盼,司琪,王鑫賽.機(jī)器學(xué)習(xí)算法的超參數(shù)優(yōu)化:理論與實(shí)踐[J].電腦編程技巧與維護(hù),2020(12):116-117.
[12] BERGSTRA J,BARDENET R,KGL B,et al.Algorithms for Hyper-Parameter Optimization[C]∥25th Annual Conference on Neural information Processing Systems.NIPS Fund.Granada:NIPS Fund,2011.
[13] ROGER K,HALLOCK K F.Quantile Regression[J].Journal of Economic Perspectives,2001,15(4):143-156.
[14] 孫國(guó)強(qiáng),梁智,俞娜燕,等.基于EWT和分位數(shù)回歸森林的短期風(fēng)電功率概率密度預(yù)測(cè)[J].電力自動(dòng)化設(shè)備,2018,38(8):158-165.
[15] HE F F,ZHOU J Z,MO L,et al.Day-ahead short-term load probability density forecasting method with a decomposition-based quantile regression forest[J].Applied Energy,2020:262114396.
[16] HE Y Y,QIN Y,WANG S,et al.Electricity consumption probability density forecasting method based on LASSO-Quantile Regression Neural Network[J].Applied Energy,2019:233-234565-575.
[17] ABBAS K,NAHAVANDI S,CREIGHTON D,et al.Lower upper bound estimation method for construction of neural network-based prediction intervals[J].IEEE transactions on neural networks,2011,22(3),337-346.
(編輯:江 文)
Rolling simulation method of reservoir operation based on Quantile Regression Forest
DAI Ling1,LUO Guanglei2,ZHOU Jianzhong3
(1.CISPDR Corporation,Wuhan 430010,China;2.CCCC Second Harbor Consultants Co.,Ltd.,Wuhan 430061,China; 3.School of Civil and Hydraulic Engineering,Huazhong University of Science and Technology,Wuhan 430010,China)
Abstract:
It is difficult for existing reservoir operation simulation models to avoid error accumulation in multi-step simulation,which seriously affects the long-term simulation accuracy of the models.In view of the above problems,firstly,a reservoir operation rule extraction model based on random forest and Bayesian optimization theory was established.Then the probabilistic prediction method was further introduced and a rolling simulation method of reservoir operation based on Quantile Regression Forest was proposed,which used the quantile of the prediction interval as the medium to transmit the probabilistic prediction information to the next time.Finally,Ertan and Guanyinyan Reservoirs were computed by this model,and the results of the rolling simulation of the point prediction model and multi-step simulation model were compared and analyzed.The case study showed that the proposed rolling simulation method of reservoir operation based on Quantile Regression Forest could effectively reduce the cumulative error of simulation and improve the accuracy of the long-term simulation.Compared with the rolling simulation using deterministic scheduling rules directly,the proposed method could extend the simulation period by 3~5 days under the same index requirements,and all indicators could increase by 5%~10% under the same simulation days.
Key words:
reservoir operation;rolling simulation;random forest;Quantile Regression Forest;Bayesian optimization