苑希民,李 達(dá),田福昌,何立新,王秀杰,郭立兵
(1.天津大學(xué) 水利工程仿真與安全國(guó)家重點(diǎn)實(shí)驗(yàn)室,天津 300350;2.天津大學(xué) 建筑工程學(xué)院,天津 300350;3.河北工程大學(xué) 水利水電學(xué)院,河北 邯鄲 075000;4.寧夏回族自治區(qū)水旱災(zāi)害防御中心,寧夏 銀川 750002)
在氣候變化背景下,過(guò)去幾十年來(lái)全球極端降水強(qiáng)度和頻率顯著上升,引發(fā)的洪澇災(zāi)害造成每年300億美元以上的經(jīng)濟(jì)損失,給人類社會(huì)帶來(lái)了嚴(yán)重危害[1-2]。洪水預(yù)報(bào)作為應(yīng)對(duì)洪澇災(zāi)害的重要非工程措施之一,對(duì)水庫(kù)調(diào)度、防洪預(yù)警、城市規(guī)劃等具有重要指導(dǎo)作用。當(dāng)前應(yīng)用廣泛的洪水預(yù)報(bào)模型主要包括概念性水文模型和數(shù)據(jù)驅(qū)動(dòng)模型。概念性水文模型使用物理和經(jīng)驗(yàn)參數(shù)來(lái)概括徑流的形成過(guò)程,常用的概念性水文模型包括集總式的Tank模型、新安江模型和分布式的TOPKAPI模型、SWAT模型等[3-6]。概念性水文模型應(yīng)用廣泛,在很多流域取得了較好的模擬效果,但其內(nèi)部不同意義的水文參數(shù)相互作用復(fù)雜,導(dǎo)致其有很強(qiáng)的不確定性,往往需要大量流域自然地理數(shù)據(jù),或借助敏感性分析和優(yōu)化算法輔助確定參數(shù)[7-8]。
數(shù)據(jù)驅(qū)動(dòng)的洪水預(yù)報(bào)模型通過(guò)挖掘歷史數(shù)據(jù)中驅(qū)動(dòng)因子與目標(biāo)值之間的關(guān)系來(lái)預(yù)測(cè)徑流[9],其內(nèi)部的大量參數(shù)通過(guò)誤差反向傳播的方式自動(dòng)更新,極大減小了率定難度,近年來(lái)取得了長(zhǎng)足發(fā)展。熊怡等[10]提出一種基于自適應(yīng)變分模態(tài)分解和長(zhǎng)短期記憶網(wǎng)絡(luò)的分解-預(yù)測(cè)-集成月徑流預(yù)測(cè)混合模型,提升了金沙江上游石鼓水文站月徑流預(yù)報(bào)精度。劉媛媛等[11]將數(shù)值模型與BP神經(jīng)網(wǎng)絡(luò)相結(jié)合,提出了一種快速預(yù)測(cè)城市內(nèi)澇風(fēng)險(xiǎn)的新方法。Yuan等[12]將ANN模型與Muskingum-Cunge方法相結(jié)合,提出一種應(yīng)用于數(shù)據(jù)稀缺干旱山區(qū)的洪水預(yù)報(bào)智能模型。Chen等[13]應(yīng)用CNN神經(jīng)網(wǎng)絡(luò),結(jié)合DEM地理特征和歷史徑流過(guò)程對(duì)洪水過(guò)程進(jìn)行預(yù)測(cè),在洪峰和到達(dá)時(shí)間方面表現(xiàn)出了更好的準(zhǔn)確性。數(shù)據(jù)驅(qū)動(dòng)模型的效果主要受訓(xùn)練數(shù)據(jù)和模型結(jié)構(gòu)影響,當(dāng)輸入數(shù)據(jù)與目標(biāo)數(shù)據(jù)相關(guān)性不顯著時(shí)可能會(huì)出現(xiàn)模型難以收斂的情況,而模型復(fù)雜度較高時(shí)則可能出現(xiàn)梯度消失的問(wèn)題。
當(dāng)研究區(qū)域的產(chǎn)匯流特性較為復(fù)雜時(shí),洪水預(yù)報(bào)模型使用一套參數(shù)往往難以實(shí)現(xiàn)對(duì)洪水過(guò)程的準(zhǔn)確模擬,此時(shí)可對(duì)降雨徑流數(shù)據(jù)進(jìn)行分級(jí)處理,數(shù)據(jù)特征相近的洪水共用一套模型參數(shù)以提高洪水預(yù)報(bào)的準(zhǔn)確性[14-16]。李志超等[17]利用徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)和降雨方差對(duì)洪水進(jìn)行分級(jí)預(yù)報(bào),提高了模型在四川省壽溪流域和陜西省青陽(yáng)岔流域洪水預(yù)報(bào)的準(zhǔn)確性。Xu等[18]根據(jù)降水的時(shí)空分布、降水強(qiáng)度的時(shí)間方差和其他水文因子,對(duì)歷史洪水進(jìn)行K均值聚類,并采用粗糙集提取實(shí)時(shí)洪水預(yù)報(bào)的識(shí)別規(guī)則,提高了洪水預(yù)報(bào)準(zhǔn)確性。鄭彥辰等[19]將降雨時(shí)空分布特征作為洪水分類依據(jù),聚類得到的不同洪水類型特征顯著。以上研究使用不同聚類算法進(jìn)行了洪水分級(jí),但面對(duì)復(fù)雜的降雨流量序列,原始數(shù)據(jù)包含大量冗余信息,直接進(jìn)行聚類計(jì)算量過(guò)大,通常是選取特定的數(shù)據(jù)特征進(jìn)行聚類。其中數(shù)據(jù)特征的選擇往往依賴于研究人員的自身經(jīng)驗(yàn),選定數(shù)據(jù)特征對(duì)原始數(shù)據(jù)的描述效果亦難以評(píng)定,可能丟失大量有效信息。
因此,本文提出一種結(jié)合自編碼器(Autoencoder,AE)與殘差卷積神經(jīng)網(wǎng)絡(luò)(RCNN)的洪水分級(jí)智能預(yù)報(bào)方法,使用自編碼器實(shí)現(xiàn)原始降雨徑流數(shù)據(jù)的自動(dòng)降維,再將降維后的數(shù)據(jù)通過(guò)K均值聚類算法進(jìn)行洪水分級(jí),最后利用殘差卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行洪水預(yù)報(bào)。將AE-RCNN模型應(yīng)用于小清河流域上游黃臺(tái)橋水文站的洪水預(yù)報(bào),并與使用未分級(jí)數(shù)據(jù)訓(xùn)練的CNN、RCNN模型,以及應(yīng)用降雨數(shù)據(jù)進(jìn)行分級(jí)訓(xùn)練的RCNN模型進(jìn)行對(duì)比,驗(yàn)證了AE-RCNN模型的聚類和預(yù)報(bào)效果。
黃臺(tái)橋水文站位于濟(jì)南市歷城區(qū)華山鎮(zhèn)前進(jìn)橋,控制流域面積321 km2,是泰沂山北漏水區(qū)區(qū)域代表站,還是濟(jì)南市重要防洪除澇河道小清河干流上的省級(jí)重點(diǎn)水文站(如圖1),屬于華北暖溫帶半濕潤(rùn)季風(fēng)型大陸性氣候,年內(nèi)四季分明,溫差變化大;夏季炎熱,氣溫較高,暖空氣活動(dòng)較頻繁,雨量較多。2007年7月18日,濟(jì)南市發(fā)生強(qiáng)降雨,降雨集中、匯流迅速,最大點(diǎn)雨量高達(dá)182.7 mm,平均降雨82.3 mm,導(dǎo)致徑流峰高量大,黃臺(tái)橋水文站超警戒水位1.04 m,最終濟(jì)南市直接經(jīng)濟(jì)損失達(dá)12.3億元。針對(duì)黃臺(tái)橋水文站展開(kāi)洪水預(yù)報(bào)研究對(duì)于小清河干流與濟(jì)南市城區(qū)防洪排澇具有重要意義。
圖1 研究區(qū)域示意圖
本次研究收集了流域內(nèi)1987—2019年間部分年份的降雨數(shù)據(jù)與黃臺(tái)橋水文站流量數(shù)據(jù)。通過(guò)對(duì)降雨數(shù)據(jù)進(jìn)行反距離權(quán)重插值得到黃臺(tái)橋匯水區(qū)形心降雨量,與黃臺(tái)橋水文站流量數(shù)據(jù)結(jié)合得到27場(chǎng)洪水的逐時(shí)降雨徑流數(shù)據(jù)。
3.1 數(shù)據(jù)降維模型自編碼器(AE)是一種自監(jiān)督學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)架構(gòu)(如圖2),通過(guò)將原始數(shù)據(jù)輸入一個(gè)編碼器網(wǎng)絡(luò)編碼成一個(gè)固定維度的隱藏變量,然后使用一個(gè)解碼器網(wǎng)絡(luò)對(duì)這個(gè)隱藏變量進(jìn)行解碼,從而得到輸出數(shù)據(jù)。自編碼器的目標(biāo)是使得輸出數(shù)據(jù)與原始數(shù)據(jù)之間的誤差最小化,可以用于多種任務(wù),例如數(shù)據(jù)去噪、降維、生成式模型等[20]。編碼器網(wǎng)絡(luò)在將原始數(shù)據(jù)映射到低維隱藏向量后,可以通過(guò)解碼器網(wǎng)絡(luò)得到與原始數(shù)據(jù)相似的輸出,這表示隱藏向量中保留了原始數(shù)據(jù)的基本特征,因此將降維后的隱藏向量應(yīng)用于聚類算法能夠在大幅降低計(jì)算復(fù)雜度的同時(shí)實(shí)現(xiàn)對(duì)原始數(shù)據(jù)的聚類,這也避免了傳統(tǒng)聚類算法人為選擇數(shù)據(jù)特征帶來(lái)的不確定性。
圖2 自編碼器結(jié)構(gòu)示意圖
3.2 洪水分級(jí)模型K均值聚類算法是一種廣泛應(yīng)用的無(wú)監(jiān)督學(xué)習(xí)算法,可以將集中的數(shù)據(jù)分成K個(gè)不同的簇(類別),具有簡(jiǎn)單易懂、計(jì)算效率高的特點(diǎn)[21]。該算法的核心思想是通過(guò)計(jì)算數(shù)據(jù)點(diǎn)之間的距離來(lái)將它們劃分為K個(gè)簇,使得同一簇內(nèi)的數(shù)據(jù)點(diǎn)彼此相似度較高,而不同簇之間的數(shù)據(jù)點(diǎn)差異較大。具體來(lái)說(shuō),K均值聚類算法首先隨機(jī)初始化K個(gè)聚類中心,然后將每個(gè)數(shù)據(jù)點(diǎn)分配到與其最近的聚類中心所在的簇,接著更新每個(gè)簇的聚類中心,直到達(dá)到收斂條件為止。
3.3 洪水預(yù)報(bào)模型卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)是一種廣泛應(yīng)用于圖像識(shí)別和語(yǔ)言處理的前饋神經(jīng)網(wǎng)絡(luò),其內(nèi)部的卷積運(yùn)算可以提取輸入數(shù)據(jù)的局部特征,根據(jù)輸入數(shù)據(jù)的維度不同可分為Conv1d、Conv2d、Conv3d等。水文預(yù)報(bào)的時(shí)序數(shù)據(jù)可近似理解為自然語(yǔ)言處理中的一個(gè)句子,僅包含沿時(shí)間的一個(gè)維度,因此采用Conv1d進(jìn)行預(yù)報(bào)。一維卷積的計(jì)算過(guò)程如圖3所示,通過(guò)卷積核在輸入數(shù)據(jù)上的移動(dòng)提取局部信息,padding用于填補(bǔ)數(shù)據(jù)兩側(cè)的空缺,stride為卷積核移動(dòng)的步長(zhǎng),具體計(jì)算公式如下[22]:
(1)
在卷積神經(jīng)網(wǎng)絡(luò)中,隨著模型隱藏層和通道數(shù)量增加,可產(chǎn)生大量模型參數(shù)學(xué)習(xí)到更多信息特征,但這樣也容易造成梯度消失等問(wèn)題。殘差網(wǎng)絡(luò)(Residual Network)是一種針對(duì)梯度消失問(wèn)題的特殊網(wǎng)絡(luò)結(jié)構(gòu),能夠極大提高模型的有效訓(xùn)練深度。傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的信息通過(guò)層層遞進(jìn)的方式向前傳播,而殘差網(wǎng)絡(luò)通過(guò)跳層連接實(shí)現(xiàn)了信息從低層到高層的直接傳播,以此達(dá)到緩解梯度消失的目的[23]。如圖4所示,殘差網(wǎng)絡(luò)將上層輸入的x跳層與卷積運(yùn)算后得到的F(x)進(jìn)行相加作為輸出H(x),當(dāng)F(x)=0時(shí),H(x)=x,形成恒定映射,以保留上層輸入特征,避免梯度消失問(wèn)題。
圖4 傳統(tǒng)網(wǎng)絡(luò)與殘差網(wǎng)絡(luò)對(duì)比圖
3.4 AE-RCNN洪水分級(jí)智能預(yù)報(bào)方法綜合上述理論方法,本文提出的AE-RCNN洪水分級(jí)智能預(yù)報(bào)方法訓(xùn)練流程如圖5所示,其主要訓(xùn)練步驟包括:①將原始的降雨流量數(shù)據(jù)分別歸一化至[0,1]區(qū)間內(nèi),輸入到AE數(shù)據(jù)降維模型中進(jìn)行數(shù)據(jù)重構(gòu),以重構(gòu)數(shù)據(jù)的誤差作為損失函數(shù)進(jìn)行網(wǎng)絡(luò)訓(xùn)練,待訓(xùn)練完成得到原始數(shù)據(jù)在AE數(shù)據(jù)降維模型中的隱藏向量;②對(duì)步驟1中得到的隱藏向量進(jìn)行K均值聚類,根據(jù)聚類結(jié)果對(duì)原始數(shù)據(jù)進(jìn)行分類,并將隱藏向量的聚類中心輸入AE數(shù)據(jù)降維模型的解碼器得到原始數(shù)據(jù)的聚類中心,作為后續(xù)實(shí)際應(yīng)用時(shí)進(jìn)行洪水分級(jí)的依據(jù);③按照步驟2中的洪水分級(jí)結(jié)果分別進(jìn)行RCNN洪水預(yù)報(bào)模型的訓(xùn)練,保存生成的K類模型參數(shù)。
圖5 AE-RCNN模型訓(xùn)練預(yù)報(bào)流程圖
在應(yīng)用訓(xùn)練好的模型進(jìn)行洪水預(yù)報(bào)時(shí),需要將數(shù)據(jù)分別輸入K類RCNN洪水預(yù)報(bào)模型中得到K類預(yù)報(bào)結(jié)果,再將預(yù)報(bào)結(jié)果和各自聚類中心按洪峰時(shí)刻對(duì)齊,計(jì)算二者交集的歐氏距離作為參考,以參考距離最近的預(yù)報(bào)結(jié)果作為最優(yōu)預(yù)報(bào)結(jié)果,參考距離的具體計(jì)算公式如下:
(2)
3.5 模型評(píng)價(jià)指標(biāo)選取誤差平方和(SSE)與輪廓系數(shù)(Silhouette Coefficient,SC)作為聚類效果的評(píng)價(jià)指標(biāo)[24],主要用于確定K均值聚類算法的聚類中心數(shù)量和評(píng)估聚類效果,具體計(jì)算公式如下。
(3)
式中:Sj為第j個(gè)聚類;cj為第j個(gè)聚類中心;x為屬于第j個(gè)聚類的數(shù)據(jù)點(diǎn);K為聚類中心數(shù)量。
(4)
(5)
式中:ai為數(shù)據(jù)點(diǎn)xi與所屬簇內(nèi)其它樣本的平均距離,若簇內(nèi)僅一個(gè)樣本,則令SCi=0;bi為數(shù)據(jù)點(diǎn)xi與其它簇的樣本平均距離的最小值;N為全部數(shù)據(jù)點(diǎn)的數(shù)量。
選取平均絕對(duì)誤差(MAE)、均方根誤差(RMSE)和納什效率系數(shù)(NSE)作為洪水預(yù)報(bào)效果評(píng)價(jià)指標(biāo),具體計(jì)算公式如下。
(6)
(7)
(8)
4.1 模型構(gòu)建通過(guò)調(diào)整模型不同隱藏層卷積核的數(shù)量、大小、步長(zhǎng)和填充參數(shù),減小數(shù)據(jù)的時(shí)間分辨率(序列長(zhǎng)度)并增加數(shù)據(jù)的通道深度,以提高模型對(duì)數(shù)據(jù)全局特征的學(xué)習(xí)能力。同時(shí)選用LeakyReLU作為激活函數(shù),LeakyReLU解決了Sigmoid容易梯度消失和ReLU神經(jīng)元死亡的問(wèn)題,且相比ELU在訓(xùn)練中速度更快[25]。選用SmoothL1Loss作為損失函數(shù),SmoothL1Loss與平均絕對(duì)誤差L1Loss相比平滑了趨近于0時(shí)的誤差,與均方誤差MSE相比對(duì)離群點(diǎn)更不敏感,增加了訓(xùn)練過(guò)程的穩(wěn)定性[26]。
結(jié)合黃臺(tái)橋水文站匯水區(qū)域特點(diǎn)與歷史洪水資料,選取洪峰前后各24 h的降雨數(shù)據(jù)48維、流量數(shù)據(jù)48維共計(jì)96維向量作為AE數(shù)據(jù)降維模型的編碼器輸入,輸出5維隱藏向量到解碼器中進(jìn)行數(shù)據(jù)重構(gòu)。選取預(yù)報(bào)時(shí)刻前12 h的降雨流量數(shù)據(jù)和預(yù)見(jiàn)期(24 h)內(nèi)的降雨數(shù)據(jù)作為洪水預(yù)報(bào)模型輸入,通過(guò)兩個(gè)RCNN網(wǎng)絡(luò)提取前期降雨流量特征和預(yù)見(jiàn)期內(nèi)降雨特征,將兩類特征拼接后通過(guò)反卷積層實(shí)現(xiàn)對(duì)預(yù)見(jiàn)期內(nèi)流量過(guò)程的預(yù)報(bào)。具體模型結(jié)構(gòu)參數(shù)如表1、表2所示。
表1 AE數(shù)據(jù)降維模型結(jié)構(gòu)參數(shù)
表2 RCNN洪水預(yù)報(bào)模型結(jié)構(gòu)參數(shù)
4.2 數(shù)據(jù)降維結(jié)果分析在對(duì)構(gòu)建的AE數(shù)據(jù)降維模型進(jìn)行500次訓(xùn)練后,通過(guò)5維隱藏向量解碼得到的重構(gòu)流量數(shù)據(jù)誤差為8%,重構(gòu)降雨數(shù)據(jù)誤差為11%,部分重構(gòu)降雨流量數(shù)據(jù)與原始數(shù)據(jù)對(duì)比如圖6所示,其中重構(gòu)流量數(shù)據(jù)能夠反映原始數(shù)據(jù)的整體趨勢(shì),且在散點(diǎn)圖中不同量級(jí)流量條件下表現(xiàn)出較為一致的重構(gòu)效果。而重構(gòu)降雨數(shù)據(jù)能夠基本還原主要降雨過(guò)程,但降雨量較小時(shí)的重構(gòu)效果略顯不佳,其散點(diǎn)圖也表現(xiàn)出相同的特點(diǎn),部分較小的降雨存在重構(gòu)值等于0的情況,但仍能保留原始數(shù)據(jù)大部分的降雨特征。由此可見(jiàn),AE數(shù)據(jù)降維模型能夠利用編碼器得到的隱藏向量實(shí)現(xiàn)對(duì)原始降雨流量數(shù)據(jù)的基本還原,可以使用隱藏向量作為降維后的原始數(shù)據(jù)進(jìn)行聚類分析。
圖6 AE數(shù)據(jù)降維模型重構(gòu)數(shù)據(jù)效果
4.3 洪水聚類結(jié)果分析對(duì)AE數(shù)據(jù)降維模型中編碼器得到的隱藏向量進(jìn)行不同數(shù)量聚類中心的K均值聚類,計(jì)算其SSE和SC,并將SC同直接應(yīng)用原始降雨數(shù)據(jù)的聚類結(jié)果進(jìn)行對(duì)比,如圖7所示。其中SSE下降速度突然變緩的拐點(diǎn)處對(duì)應(yīng)的聚類中心數(shù)量被認(rèn)為具有更好的聚類效果(肘部法則),SC則用于描述聚類后的輪廓清晰度,SC>0即代表聚類結(jié)果是相對(duì)緊湊的,SC越大則輪廓越清晰。在不同聚類中心數(shù)下,SC1均大于SC2,表明應(yīng)用AE降維數(shù)據(jù)的聚類效果優(yōu)于直接應(yīng)用原始降雨數(shù)據(jù)。且當(dāng)聚類中心為3時(shí),SSE下降速度突然變緩且SC1最大,因此確定聚類中心K為3。
(圖中SSE、SC1為應(yīng)用AE降維數(shù)據(jù)的聚類結(jié)果,SC2為應(yīng)用原始降雨數(shù)據(jù)的聚類結(jié)果)圖7 SSE、SC隨聚類中心數(shù)變化圖
最終隱藏向量被分為3類,各類分別包含6、7、13場(chǎng)洪水,將各隱藏向量聚類中心輸入到AE數(shù)據(jù)降維模型的解碼器中得到原始數(shù)據(jù)聚類中心如圖8所示,類別1的洪峰流量為134.81 m3/s,最大24 h洪量為867.95萬(wàn)m3,最大3 h降雨量為29.67 mm,最大24 h降雨量為104.95 mm;類別2的洪峰流量為138.29 m3/s,最大24 h洪量為718.13萬(wàn)m3,最大3 h降雨量為45.99 mm,最大24 h降雨量為69.23 mm;類別3的洪峰流量為112.32 m3/s,最大24 h洪量為506.28萬(wàn)m3,最大3 h降雨量為32.10 mm,最大24 h降雨量為50.62 mm。其中類別1的降雨持續(xù)時(shí)間較長(zhǎng),最大24 h降雨量最高,且最大24 h洪量也更多。類別2與類別3的最大3 h降雨量更高,但類別2的降雨量級(jí)比類別3大,對(duì)應(yīng)的洪峰流量也更高。三種類別洪水的聚類中心存在明顯差異,聚類結(jié)果可信度高。
4.4 洪水預(yù)報(bào)結(jié)果分析將洪水?dāng)?shù)據(jù)按AE降維數(shù)據(jù)的聚類結(jié)果進(jìn)行分級(jí)RCNN洪水預(yù)報(bào)模型訓(xùn)練,選取15%的洪水?dāng)?shù)據(jù)作為測(cè)試集,以CNN、RCNN模型和降雨聚類RCNN模型作為對(duì)比,最終預(yù)報(bào)效果評(píng)價(jià)指標(biāo)如表3、表4所示。RCNN模型在訓(xùn)練集和測(cè)試集中的模擬效果均優(yōu)于CNN模型,表明RCNN模型中的殘差網(wǎng)絡(luò)結(jié)構(gòu)能夠提升CNN的預(yù)報(bào)精度,更好地挖掘數(shù)據(jù)特征。AE-RCNN模型預(yù)報(bào)結(jié)果的評(píng)價(jià)指標(biāo)優(yōu)于作為對(duì)比的其他三種模型。在測(cè)試集的洪水模擬中,AE-RCNN模型的平均MAE、RMSE和NSE指標(biāo)分別為5.04、7.91和0.92,較CNN模型分別提高了48.23%、43.94%和22.32%;較RCNN模型分別提高了35.06%、34.70%和11.72%;較降雨聚類RCNN模型分別提高了26.45%、30.58%和11.29%。同時(shí)在將測(cè)試集輸入到K類AE-RCNN模型后的預(yù)報(bào)結(jié)果中,參考距離最小的預(yù)報(bào)結(jié)果模擬效果也最好,因此本文所提出通過(guò)參考距離判斷未來(lái)洪水類別的方法是合理可行的。
表3 CNN、RCNN、AE-RCNN模型洪水預(yù)報(bào)效果評(píng)價(jià)指標(biāo)對(duì)比
表4 降雨聚類RCNN模型洪水預(yù)報(bào)效果評(píng)價(jià)指標(biāo)
不同模型對(duì)測(cè)試集洪水的模擬效果如圖9所示,其中AE-RCNN模型的模擬結(jié)果與實(shí)測(cè)洪水過(guò)程最為接近,散點(diǎn)圖也距離標(biāo)準(zhǔn)線更為緊密。綜上可得,AE數(shù)據(jù)降維模型能夠通過(guò)對(duì)不同產(chǎn)匯流特性洪水的特征提取與快速聚類,使輸入RCNN的數(shù)據(jù)特征更為清晰,進(jìn)而達(dá)到更好的模擬效果。
圖9 部分場(chǎng)次模擬洪水過(guò)程與整體測(cè)試集模擬結(jié)果散點(diǎn)圖對(duì)比
本文提出一種基于AE-RCNN的洪水分級(jí)智能預(yù)報(bào)方法,通過(guò)自編碼器(AE)重構(gòu)降雨徑流數(shù)據(jù)實(shí)現(xiàn)對(duì)其自動(dòng)降維,再結(jié)合K均值聚類算法進(jìn)行洪水分級(jí),對(duì)分級(jí)后的洪水使用殘差卷積神經(jīng)網(wǎng)絡(luò)(RCNN)進(jìn)行洪水預(yù)報(bào)。將該方法應(yīng)用于小清河上游黃臺(tái)橋水文站的洪水預(yù)報(bào)中,分析其聚類效果和洪水預(yù)報(bào)能力。主要結(jié)論如下:
(1)AE數(shù)據(jù)降維模型的編碼器可將降雨、流量數(shù)據(jù)共96維輸入向量提取為5維向量,經(jīng)解碼器還原后與原始數(shù)據(jù)的降雨徑流過(guò)程基本一致,實(shí)現(xiàn)對(duì)洪水?dāng)?shù)據(jù)的自動(dòng)降維,避免人工挑選數(shù)據(jù)特征對(duì)工作人員經(jīng)驗(yàn)的依賴性。應(yīng)用AE降維數(shù)據(jù)的聚類效果優(yōu)于直接應(yīng)用原始降雨數(shù)據(jù),可將洪水分為特征明顯的三類。
(2)對(duì)比應(yīng)用降維數(shù)據(jù)進(jìn)行洪水分級(jí)的AE-RCNN模型和CNN模型、RCNN模型、降雨聚類RCNN模型,AE-RCNN模型在訓(xùn)練集和測(cè)試集中的各項(xiàng)評(píng)價(jià)指標(biāo)均為最優(yōu)。其測(cè)試集洪水模擬的平均MAE指標(biāo)、RMSE指標(biāo)、NSE指標(biāo)分別為5.04、7.91、0.92,較CNN模型分別提高了48.23%、43.94%和22.32%,較RCNN模型分別提高了35.06%、34.70%和11.72%,較降雨聚類RCNN模型分別提高了26.45%、30.58%和11.29%。
(3)本文提出的AE-RCNN洪水分級(jí)智能預(yù)報(bào)方法主要應(yīng)用了自編碼器的降維功能,后續(xù)可考慮自編碼器的變種VAE、VAE-GAN等數(shù)據(jù)生成模型,使模型在重構(gòu)提取數(shù)據(jù)特征的同時(shí),能夠生成具備原始數(shù)據(jù)基本特征但又有一定差異的新數(shù)據(jù),對(duì)訓(xùn)練集進(jìn)行擴(kuò)充以進(jìn)一步提高模擬效果。