陳偉,金柱成,2,俞真元,2,王曉麗*,彭士濤,,魏燕杰
1.天津理工大學(xué)環(huán)境科學(xué)與安全工程學(xué)院
2.朝鮮理科大學(xué)數(shù)學(xué)系
3.交通運(yùn)輸部天津水運(yùn)工程科學(xué)研究院
近年來(lái),經(jīng)濟(jì)社會(huì)發(fā)展和人類(lèi)活動(dòng)加劇了水資源的消耗,工業(yè)廢水、生活污水的排放及面源污染等直接對(duì)水體水質(zhì)造成影響。水體污染和富營(yíng)養(yǎng)化已成為湖泊水體生態(tài)環(huán)境主要問(wèn)題之一。富營(yíng)養(yǎng)化帶來(lái)浮游植物大量增殖、水體溶解氧濃度降低、水體生境受損等一系列問(wèn)題[1]。鄱陽(yáng)湖是中國(guó)第一大淡水湖,其生態(tài)系統(tǒng)的變化受到研究人員的關(guān)注[2-3]。目前關(guān)于鄱陽(yáng)湖水質(zhì)水量、富營(yíng)養(yǎng)化和植被分布的研究已經(jīng)很多[4-7],但鮮見(jiàn)鄱陽(yáng)湖水域針對(duì)CODMn的研究。CODMn作為反映湖泊富營(yíng)養(yǎng)化和有機(jī)質(zhì)濃度的重要指標(biāo),與其他環(huán)境因子關(guān)系密切,其變化動(dòng)態(tài)對(duì)預(yù)防藻類(lèi)水華發(fā)生具有重要意義,因此,開(kāi)展鄱陽(yáng)湖CODMn的預(yù)測(cè)與評(píng)價(jià)十分必要。
目前對(duì)于CODMn的治理主要依賴(lài)于實(shí)時(shí)監(jiān)測(cè)技術(shù),但僅依靠實(shí)時(shí)監(jiān)測(cè)技術(shù)只能進(jìn)行污染后的修復(fù)工作,而不能規(guī)避未來(lái)可能發(fā)生的水體污染風(fēng)險(xiǎn)。如果能將實(shí)時(shí)監(jiān)測(cè)的COD數(shù)據(jù)與數(shù)學(xué)模型相結(jié)合實(shí)現(xiàn)水質(zhì)的準(zhǔn)確預(yù)測(cè),就可以讓相關(guān)部門(mén)及管理人員預(yù)判到可能存在的污染風(fēng)險(xiǎn),并向上下流域發(fā)出預(yù)警,從而為水資源的管理提供科學(xué)可靠的依據(jù)[8-9]。機(jī)器學(xué)習(xí)模型作為一種數(shù)據(jù)驅(qū)動(dòng)的方法,具有非線性映射、魯棒性和自適應(yīng)性的優(yōu)點(diǎn),被認(rèn)為是水質(zhì)預(yù)測(cè)的有效方法。近年來(lái),機(jī)器學(xué)習(xí)在理論研究和實(shí)際應(yīng)用中都取得了重大突破。在水質(zhì)預(yù)測(cè)方面,Ruben等[10]通過(guò)多層傳感器實(shí)現(xiàn)了對(duì)無(wú)錫市河流CODMn的預(yù)測(cè);Miao等[11]通過(guò)構(gòu)建長(zhǎng)短期記憶(LSTM)神經(jīng)網(wǎng)絡(luò),實(shí)現(xiàn)了對(duì)有毒污水出水COD的精準(zhǔn)預(yù)測(cè),為實(shí)現(xiàn)系統(tǒng)故障預(yù)警提供了科學(xué)依據(jù);Khullar等[12]通過(guò)構(gòu)建雙向長(zhǎng)短期記憶(BLSTM)神經(jīng)網(wǎng)絡(luò),對(duì)印度德里地區(qū)的CODCr和BOD5進(jìn)行了預(yù)測(cè),其表現(xiàn)出色。雖然機(jī)器學(xué)習(xí)在水質(zhì)預(yù)測(cè)方面的研究有很多,但由于CODMn這個(gè)指標(biāo)具有高度不確定性且變化因素也比較復(fù)雜,單一的機(jī)器學(xué)習(xí)模型往往不能滿(mǎn)足預(yù)測(cè)精度的要求[13-14]。為了克服這些局限性,專(zhuān)家學(xué)者將數(shù)據(jù)分解技術(shù)與機(jī)器學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)相結(jié)合,以此提高機(jī)器學(xué)習(xí)模型的預(yù)測(cè)精度。該混合模型的基本思想是通過(guò)數(shù)據(jù)分解將原始的高噪聲數(shù)據(jù)分解成幾個(gè)低噪聲數(shù)據(jù),再對(duì)分解的低噪聲數(shù)據(jù)應(yīng)用機(jī)器學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)進(jìn)行預(yù)測(cè)。由于分解后的數(shù)據(jù)相較于原始數(shù)據(jù)更加穩(wěn)定和便于處理,因此該類(lèi)方法的預(yù)測(cè)精度往往高于單一機(jī)器學(xué)習(xí)模型[15]。而數(shù)據(jù)分解技術(shù)中,小波分解(WD)、經(jīng)驗(yàn)?zāi)J椒纸?EMD)[16]是近年來(lái)最常用的數(shù)據(jù)分解技術(shù),并已經(jīng)在水質(zhì)預(yù)測(cè)模型方面得到了廣泛應(yīng)用[13,17-19]。但這2種數(shù)據(jù)分解方法存在明顯的缺點(diǎn):WD的分解性能很大程度上取決于母小波函數(shù)和分解水平的設(shè)置,所以需要進(jìn)行大量數(shù)值試驗(yàn)來(lái)確定這些超參數(shù);而EMD缺少?lài)?yán)謹(jǐn)?shù)臄?shù)學(xué)基礎(chǔ)且存在模態(tài)混疊、重構(gòu)誤差大等問(wèn)題,導(dǎo)致模型的預(yù)測(cè)性能十分有限。經(jīng)驗(yàn)小波變換(EWT)通過(guò)構(gòu)建自適應(yīng)小波函數(shù),能夠提取不同頻率成分,具有WD的嚴(yán)謹(jǐn)性和EMD的自適應(yīng)性[20],可以解決上述WD和EMD的缺點(diǎn)[21]。但現(xiàn)有的研究鮮見(jiàn)將EWT應(yīng)用于CODMn預(yù)測(cè)??紤]到CODMn在水質(zhì)方面的重要性,并且該指標(biāo)比溶解氧、pH等其他水質(zhì)指標(biāo)變化更復(fù)雜[22],因此有必要驗(yàn)證EWT在CODMn預(yù)測(cè)方面的有效性。
筆者將EWT與BLSTM神經(jīng)網(wǎng)絡(luò)相結(jié)合,開(kāi)發(fā)出一種混合模型對(duì)CODMn進(jìn)行預(yù)測(cè),并以鄱陽(yáng)湖入水口CODMn時(shí)間序列作為研究對(duì)象進(jìn)行模型驗(yàn)證。本研究的特色:1)將EWT用于水體CODMn預(yù)測(cè);2)開(kāi)發(fā)EWT與深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)相結(jié)合組成的預(yù)測(cè)模型進(jìn)行水質(zhì)預(yù)測(cè)。雖然Liu等[21]使用過(guò)EWT方法,但其研究中利用的是傳統(tǒng)的機(jī)器學(xué)習(xí)算法(“淺層學(xué)習(xí)”),而不是深度學(xué)習(xí)算法。與傳統(tǒng)的機(jī)器學(xué)習(xí)相比,深度學(xué)習(xí)通過(guò)深層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)來(lái)實(shí)現(xiàn)底層數(shù)據(jù)源的更高級(jí)別表示,而且能夠在沒(méi)有明確指示的情況下提取大量特征,受原始數(shù)據(jù)和噪聲數(shù)據(jù)的影響較少[23-24]。EWT與深度學(xué)習(xí)算法相結(jié)合建立的模型可能達(dá)到更高的預(yù)測(cè)精度。
鄱陽(yáng)湖位于江西省北部,平水位時(shí)湖泊面積為3 150 km2。鄱陽(yáng)湖由贛江、新江、府河、饒河、修河5條河流匯入,通過(guò)一條狹長(zhǎng)的北方河道與長(zhǎng)江交匯,是長(zhǎng)江中下游主要支流之一。該地區(qū)受季風(fēng)控制,年平均氣溫為18 ℃,降水量為1 500 mm。不同季節(jié)湖泊水位差較大,低水位時(shí)僅12 m,高水位時(shí)能達(dá)到22 m以上[4]。
從生態(tài)環(huán)境部網(wǎng)站(https://www.mee.gov.cn)收集鄱陽(yáng)湖入水口的水質(zhì)監(jiān)測(cè)站點(diǎn)——江西省南昌市滁槎監(jiān)測(cè)站2017年8月1日——2020年4月30日(共33個(gè)月)的CODMn監(jiān)測(cè)數(shù)據(jù)(每4 h一次)。對(duì)得到的數(shù)據(jù)進(jìn)行異常值處理,即根據(jù)GB 3838——2002《地表水環(huán)境質(zhì)量標(biāo)準(zhǔn)》將高于15 mg/L的值全部去除,再進(jìn)行每日平均(單日監(jiān)測(cè)值4個(gè)以上的才算有效,否則視為缺失值),得到每日平均CODMn數(shù)據(jù)(共計(jì)988個(gè))。其中,2017年8月1日——2019年10月31日的數(shù)據(jù)用于模型訓(xùn)練,2019年11月1日——2020年1月31日的數(shù)據(jù)用于模型驗(yàn)證,2020年2月1日——4月30日的數(shù)據(jù)用于模型測(cè)試。
圖1顯示了該監(jiān)測(cè)站點(diǎn)2017年8月1日——2020年4月30日的CODMn監(jiān)測(cè)數(shù)據(jù)。由圖1可知,鄱陽(yáng)湖CODMn具有明顯的季節(jié)性變化,整體數(shù)值范圍為 1.13~6.00 mg/L,平均值為(2.50±0.73)mg/L,標(biāo)準(zhǔn)偏差較大,表明數(shù)據(jù)不穩(wěn)定性較高,導(dǎo)致現(xiàn)有的很多模型無(wú)法達(dá)到較高的預(yù)測(cè)精度。
圖1 2017年8月1日——2020年4月30日鄱陽(yáng)湖CODMn數(shù)據(jù)分布Fig.1 CODMn data distribution of Poyang Lake from August 1,2017 to April 30, 2020
EWT是Gilles[20]提出的一種自適應(yīng)信號(hào)處理技術(shù)。 本研究采用EWT將CODMn時(shí)間序列分解成若干個(gè)相對(duì)平穩(wěn)的事件序列。首先對(duì)水質(zhì)CODMn的監(jiān)測(cè)數(shù)據(jù)X(t)進(jìn)行Fourier變換得到Fourier頻譜,將該頻譜劃分成I個(gè)連續(xù)段。定義經(jīng)驗(yàn)小波函數(shù)(ω)(k=1,2,···,I)以及經(jīng)驗(yàn)尺度函數(shù)(ω)(k=1,2,···,I):
式中: ωk是第k個(gè)頻譜段的上限; τk是以 ωk為中心的過(guò)渡相寬度的1/2; θ (z)是函數(shù),θ(z)=z4(35-84z+75z2-20z3)。
將 τk選擇為 τk= βωk(0 < β <1),則 ??k(ω)和ψ?k(ω)表示為:
經(jīng) 驗(yàn) 模 式 M ODEk(t)(k=1,2,···,I,I+1)表 示如下:
式中: φk(ω)和 ψ1(ω)分別為小波函數(shù)和尺度函數(shù);〈·,·〉為內(nèi)積;*為卷積。結(jié)果原始CODMn時(shí)間序列X(t)被EWT分解成K(K=I+1)個(gè)模式(分解成分)。
機(jī)器學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)很多,但與支持向量回歸(SVR)、極限學(xué)習(xí)機(jī)(ELM)、Elman神經(jīng)網(wǎng)絡(luò)(ENN)等其他傳統(tǒng)機(jī)器學(xué)習(xí)模型相比,LSTM神經(jīng)網(wǎng)絡(luò)能夠體現(xiàn)長(zhǎng)期相關(guān)性,因此,LSTM神經(jīng)網(wǎng)絡(luò)更適合于水質(zhì)預(yù)測(cè)[25-26]。但LSTM神經(jīng)網(wǎng)絡(luò)只能體現(xiàn)從過(guò)去到未來(lái)單方向的特征,而不能體現(xiàn)反方向的特征。因此,LSTM神經(jīng)網(wǎng)絡(luò)無(wú)法充分表達(dá)具有相互性的時(shí)間相關(guān)性,因而在預(yù)測(cè)精度方面還有待提高。解決這一問(wèn)題的方法就是BLSTM神經(jīng)網(wǎng)絡(luò),如圖2所示,BLSTM神經(jīng)網(wǎng)絡(luò)的基本思想是利用2層獨(dú)立的隱藏層在正向和反向2個(gè)方向描述時(shí)間序列。每個(gè)隱藏層都由LSTM單位組成,那么由2個(gè)LSTM單位結(jié)合組成的BLSTM單位即可同時(shí)表達(dá)2個(gè)方向的信息。BLSTM單元在表達(dá)長(zhǎng)期依賴(lài)方面非常有效,而且不會(huì)產(chǎn)生冗余信息。因此,BLSTM神經(jīng)網(wǎng)絡(luò)在許多領(lǐng)域廣泛應(yīng)用,并證明了其有效性[14]。本研究采用BLSTM神經(jīng)網(wǎng)絡(luò)對(duì)每個(gè)分解成分進(jìn)行預(yù)測(cè)。
圖2 LSTM神經(jīng)網(wǎng)絡(luò)和BLSTM神經(jīng)網(wǎng)絡(luò)的對(duì)比Fig.2 Comparison between LSTM and BLSTM neural networks
將EWT與BLSTM神經(jīng)網(wǎng)絡(luò)相結(jié)合,構(gòu)建混合模型EWT-BLSTM對(duì)鄱陽(yáng)湖水體CODMn進(jìn)行預(yù)測(cè),具體流程如下:1)使用EWT將CODMn的原始時(shí)間序列分解成若干個(gè)模態(tài)分量MODEk(k=1,2,···,K);2)對(duì)獲得的每個(gè)分解成分,使用偏自相關(guān)函數(shù)(PACF)[15]來(lái)提取用于開(kāi)發(fā)每個(gè)子模型(對(duì)應(yīng)每個(gè)分解成分的BLSTM)的輸入變量;3)將上述選定的輸入變量輸入到BLSTM神經(jīng)網(wǎng)絡(luò),得出每個(gè)分解成分的預(yù)測(cè)值;4)通過(guò)把所有分解成分的預(yù)測(cè)結(jié)果進(jìn)行重建,得到最終水質(zhì)參數(shù)CODMn的預(yù)測(cè)值。
圖3顯示EWT-BLSTM模型的預(yù)測(cè)過(guò)程,圖中BLSTMk(k=1,2,···,K)表示第k個(gè)分解成分對(duì)應(yīng)的BLSTM神經(jīng)網(wǎng)絡(luò)(預(yù)測(cè)模塊),MODEk′(k=1,2,···,K)是 M ODEk的預(yù)測(cè)結(jié)果。
圖3 地表水體CODMn預(yù)測(cè)流程Fig.3 Flow chart of CODMn prediction of surface water
模型的建立和測(cè)試通過(guò)MATLAB 2020b軟件實(shí)現(xiàn)。
2.4.1 評(píng)價(jià)指標(biāo)
通過(guò)1和7 d后的CODMn預(yù)測(cè)來(lái)驗(yàn)證所提出方法的有效性,采用均絕對(duì)誤差(MAE)、均方根誤差(RMSE)和平均絕對(duì)百分比誤差(MAPE)3個(gè)統(tǒng)計(jì)指標(biāo)進(jìn)行模型性能評(píng)估,其計(jì)算公式如下:
式中:Ol為實(shí)測(cè)值;Pl為預(yù)測(cè)值;L為數(shù)據(jù)長(zhǎng)度。
2.4.2 比較對(duì)象
為了更清楚地展示EWT-BLSTM模型的高效性,表1展示了參與比較的模型的結(jié)構(gòu)對(duì)比 。
表1 參與比較的模型的結(jié)構(gòu)Table 1 Structure of the competitor models
模型的預(yù)測(cè)性能很大程度上受到模型超參數(shù)設(shè)置的影響,為此使用訓(xùn)練集和驗(yàn)證集來(lái)確定模型的結(jié)構(gòu)并優(yōu)化必要的超參數(shù)。
3.1.1 EWT數(shù)據(jù)分解
首先通過(guò)EWT將鄱陽(yáng)湖數(shù)據(jù)中訓(xùn)練集和驗(yàn)證集的CODMn時(shí)間序列分解為8個(gè)模式(MODE1~MODE8)(圖4)。其中,MODE8是通過(guò)識(shí)別多錐功率譜估計(jì)中的峰值自動(dòng)確定的。從圖4可以看出,相較于原始數(shù)據(jù),大部分分解成分展現(xiàn)出更加清晰的變化趨勢(shì)。通過(guò)表2所示的樣本熵值,同樣也可以看出分解成分的熵值明顯小于原始CODMn時(shí)間序列的熵值(圖1)。因此,根據(jù)這些分解成分建立模型,可以獲得比使用原始數(shù)據(jù)建立的模型更高的預(yù)測(cè)精度。
表2 ICEEMDAN分解成分的樣本熵Table 2 Sample entropy calculation of ICEEMDAN modes
圖4 EWT對(duì)鄱陽(yáng)湖CODMn時(shí)間序列的數(shù)據(jù)分解Fig.4 Data decomposition of CODMn time series by EWT in Poyang Lake
3.1.2 PACF分析
在建立模型之前,根據(jù)時(shí)間序列數(shù)據(jù)的特征,需要確定輸入因子??紤]到歷史數(shù)據(jù)和預(yù)測(cè)值之間的相關(guān)性,使用PACF分析來(lái)確定模型的輸入因子。具體計(jì)算過(guò)程:首先計(jì)算出每個(gè)分解成分時(shí)間序列的PACF,然后找出95%置信區(qū)間的最大時(shí)間滯后值(表3)。以未來(lái)1 d預(yù)測(cè)的第一個(gè)分解成分MODE1為例,確定的時(shí)間滯后值是47,因此,在任何時(shí)間點(diǎn)t,{MODE1(t-46), MODE1(t-45),···, MODE1(t)}作為輸入,預(yù)測(cè)MODE1(t+1)。同樣,得到所有分解成分的預(yù)測(cè)值 MODEk(t+1)(k=2,3,···,8)后,將這些值相加,就得到(t+1)時(shí)刻的CODMn預(yù)測(cè)值。
表3 CODMn時(shí)間序列以分解成分的預(yù)測(cè)模型的時(shí)間滯后值Table 3 Time lags of the prediction model of the decomposition components of CODMn time series
3.1.3 BLSTM神經(jīng)網(wǎng)絡(luò)的優(yōu)化
采用網(wǎng)格搜索優(yōu)化方法來(lái)確定BLSTM神經(jīng)網(wǎng)絡(luò)的最佳結(jié)構(gòu)和超參數(shù)。表4列出了獲得的超參數(shù)。具體步驟:1)對(duì)每個(gè)超參數(shù)選擇其合適范圍,如BLSTM層數(shù)為1~3;每層神經(jīng)元數(shù)為{[N/2]、N、[3N/2]、[2N]、[5N/2]、3N}(N為輸入的大小,[ ]為取整函數(shù));最小批量大小為{8,16,32,64};學(xué)習(xí)率為{0.1,0.01,0.001}。考慮到訓(xùn)練中迭代次數(shù)超過(guò)50~80以后訓(xùn)練誤差基本不變,最大迭代次數(shù)設(shè)置為100。2)對(duì)每組超參數(shù),計(jì)算驗(yàn)證集預(yù)測(cè)結(jié)果并比較,最終將預(yù)測(cè)誤差最低的超參數(shù)組選為模型的超參數(shù)。
表4 BLSTM神經(jīng)網(wǎng)絡(luò)的超參數(shù)Table 4 Hyperparameters of BLSTM neural network
在3.1節(jié)優(yōu)化模型結(jié)構(gòu)及其超參數(shù)后,使用測(cè)試集來(lái)測(cè)試構(gòu)建模型的預(yù)測(cè)精度(測(cè)試階段)。表5顯示了EWT-BLSTM模型的預(yù)測(cè)性能。從表5可以看出,EWT-BLSTM模型在1和7 d以后預(yù)測(cè)中的MAPE分別為2.25%和8.36%,預(yù)測(cè)精度較高。
表5 測(cè)試階段EWT-BLSTM模型的預(yù)測(cè)性能Table 5 Forecast performance of EWT-BLSTM model in the testing stage
3.3.1 整體性能比較
參與比較的模型(2.4.2節(jié))的預(yù)測(cè)評(píng)價(jià)結(jié)果如表6所示。由表6可知,與單一的BLSTM模型相比,結(jié)合數(shù)據(jù)分解技術(shù)的混合模型的預(yù)測(cè)精度更高。在預(yù)測(cè)未來(lái)1 d以后的CODMn時(shí),WD-BLSTM、EMD-BLSTM、EWT-BLSTM模型的MAPE比單一BLSTM模型分別降低了6.01%、3.45%、10.53%;在預(yù)測(cè)未來(lái) 7 d以后的CODMn時(shí),WD-BLSTM、EMD-BLSTM、EWT-BLSTM模型的MAPE比單一BLSTM模型分別降低了12.80%、9.82%、16.16%,表明數(shù)據(jù)分解技術(shù)可以提高模型的預(yù)測(cè)精度。在基于各種數(shù)據(jù)分解的混合型模型中,本研究提出的EWT-BLSTM模型的預(yù)測(cè)精度最高,與WD-BLSTM、EMD-BLSTM模型相比,1 d預(yù)測(cè)的MAPE降低了4.52%、7.08%,7 d預(yù)測(cè)的MAPE降低了3.36%、6.34%,表明EWT技術(shù)比其他分解技術(shù)更有效。而表6中數(shù)據(jù)顯示,EWT-BLSTM模型的預(yù)測(cè)精度高于EWT-SVR、EWT-ELM、EWT-LSTM模型。預(yù)測(cè)1 d以后CODMn時(shí),與EWT-SVR、EWT-ELM、EWTLSTM模型相比,EWT-BLSTM模型的MAPE分別降低了10.24%、7.54%、0.09%;預(yù)測(cè)7 d以后CODMn時(shí),與EWT-SVR、EWT-ELM、EWT-LSTM模型相比,EWT-BLSTM模型的MAPE分別降低了15.39%、3.33%、3.06%,說(shuō)明BLSTM神經(jīng)網(wǎng)絡(luò)在構(gòu)建混合模型時(shí)具有非常可靠的預(yù)測(cè)能力。
表6 各模型的預(yù)測(cè)性能比較Table 6 Comparison of the prediction performance of different models
3.3.2 預(yù)測(cè)值和實(shí)測(cè)值之間的一致性程度
為了更直觀地展示EWT-BLSTM模型的優(yōu)勢(shì),將4個(gè)模型(BLSTM、WD-BLSTM、EMD-BLSTM、EWT-BLSTM)在測(cè)試階段的預(yù)測(cè)值和實(shí)測(cè)值使用散點(diǎn)圖(圖5)和折線圖(圖6)表示。從圖5可以看出,EWT-BLSTM模型的點(diǎn)在回歸線附近最集中,決定系數(shù)(R2)最高,說(shuō)明所提出模型的預(yù)測(cè)值與實(shí)測(cè)值之間一致性最好。從圖6可以看出,EWT-BLSTM模型在水質(zhì)參數(shù)的極值處,預(yù)測(cè)精度高于其他3個(gè)模型。這說(shuō)明在數(shù)據(jù)相對(duì)復(fù)雜、極端的情況下,本研究所提出的混合模型也是有效的。
圖5 鄱陽(yáng)湖測(cè)試階段CODMn預(yù)測(cè)值和實(shí)測(cè)值之間的相關(guān)性 (P<0.01)Fig.5 Correlation between predicted and measured CODMn values of Poyang Lake in test stage (P < 0.01)
圖6 鄱陽(yáng)湖測(cè)試階段CODMn預(yù)測(cè)值和實(shí)測(cè)值對(duì)比Fig.6 Comparision of predicted and measured CODMn values of Poyang Lake in test stage
(1)鄱陽(yáng)湖CODMn數(shù)據(jù)波動(dòng)幅度較大,存在很強(qiáng)的不穩(wěn)定性,但EWT-BLSTM混合模型在預(yù)測(cè)中依然表現(xiàn)出非常高的準(zhǔn)確性:在預(yù)測(cè)未來(lái)1 d以后的CODMn時(shí),相對(duì)于單一BLSTM模型,MAPE降低了10.53%,而與WD-BLSTM、EMD-BLSTM模型相比,MAPE降低了4.52%、7.08%;在預(yù)測(cè)未來(lái)7 d以后的CODMn時(shí),相對(duì)于單一BLSTM模型,MAPE降低了16.16%,而與WD-BLSTM、EMD-BLSTM模型相比,MAPE降低了3.36%、6.34%。
(2)EWT-BLSTM混合模型解決了現(xiàn)有基于WD和EMD的模型運(yùn)算量大、模態(tài)混疊、重構(gòu)誤差大等問(wèn)題,大大提高了水質(zhì)預(yù)測(cè)精度,從而提供了一種數(shù)據(jù)驅(qū)動(dòng)水質(zhì)預(yù)測(cè)方法。
(3)EWT-BLSTM混合模型僅使用水質(zhì)參數(shù)本身的歷史數(shù)據(jù)作為輸入,具有建模所需數(shù)據(jù)相對(duì)簡(jiǎn)單的優(yōu)點(diǎn)。然而,在現(xiàn)實(shí)中,水質(zhì)參數(shù)受天氣條件等因素的影響很大,因此,該方法仍有進(jìn)一步改進(jìn)的空間。