施 珮,匡 亮,王 泉,錢(qián)承山,袁永明
(1.無(wú)錫學(xué)院物聯(lián)網(wǎng)工程學(xué)院,江蘇 無(wú)錫 214105;2.江蘇省物聯(lián)網(wǎng)設(shè)備超融合與安全工程研究中心,江蘇無(wú)錫 214105;3.江蘇信息職業(yè)技術(shù)學(xué)院物聯(lián)網(wǎng)工程學(xué)院,江蘇 無(wú)錫 214153;4.中國(guó)水產(chǎn)科學(xué)研究院淡水漁業(yè)研究中心,江蘇 無(wú)錫 214081)
在水產(chǎn)養(yǎng)殖中,水體溶解氧(Dissolved Oxygen,DO)作為魚(yú)類生長(zhǎng)中的關(guān)鍵因子,其濃度的高低直接影響魚(yú)類的生存[1]。實(shí)際的集約化養(yǎng)殖生產(chǎn)中,由于養(yǎng)殖投放密度高、規(guī)模大,溶解氧濃度變化快,溶解氧時(shí)間序列總是受到復(fù)雜環(huán)境和干擾因素影響,呈現(xiàn)較明顯的非線性和非平穩(wěn)特征。如何利用其多元關(guān)聯(lián)因素對(duì)這種非線性時(shí)間序列進(jìn)行準(zhǔn)確預(yù)測(cè),實(shí)現(xiàn)集約化養(yǎng)殖生產(chǎn)的溶解氧精準(zhǔn)控制,對(duì)提高生產(chǎn)效率、降低養(yǎng)殖風(fēng)險(xiǎn)具有重要意義。
近年來(lái),越來(lái)越多的專家學(xué)者開(kāi)展了養(yǎng)殖水體溶解氧數(shù)據(jù)流的預(yù)測(cè)研究[2-8]。崔雪梅[2]提出并建立了基于遺傳算法的阻尼最小二乘法改進(jìn)BP(Back Propagation,BP)神經(jīng)網(wǎng)絡(luò)算法,對(duì)水體溶解氧進(jìn)行預(yù)測(cè)。雖然該方法相較于傳統(tǒng)BP 算法有一定提高,但未考慮影響溶解氧的眾多因素,且BP 神經(jīng)網(wǎng)絡(luò)算法易陷入局部最小化,訓(xùn)練速度較慢。劉雙印等[3]采用蟻群算法對(duì)最小二乘支持向量回歸機(jī)的模型參數(shù)進(jìn)行優(yōu)化,實(shí)現(xiàn)養(yǎng)殖池塘溶解氧濃度的預(yù)測(cè)。但是,該類算法未考慮溶解氧時(shí)間序列的多尺度特征,預(yù)測(cè)精度有限。宦娟和劉星橋[4]提出了一種基于k-Means 聚類和極限學(xué)習(xí)機(jī)(Extreme Learning Machine,ELM)的溶解氧預(yù)測(cè)模型,對(duì)常州市水產(chǎn)養(yǎng)殖基地的試驗(yàn)池塘溶解氧濃度進(jìn)行有效預(yù)測(cè)。該方法使用的ELM 方法收斂速度快,但當(dāng)預(yù)測(cè)模型輸入量冗余時(shí)易產(chǎn)生強(qiáng)共線性問(wèn)題。謝雨茜等[5]針對(duì)溶解氧的非線性特征提出基于經(jīng)驗(yàn)?zāi)B(tài)分解(Empirical Mode Decomposition,EMD) 與k-Means 聚類的改進(jìn)長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)(Improved Long Short-Time Memory,ILSTM)模型。然而EMD方法在分解過(guò)程中易出現(xiàn)模態(tài)混疊問(wèn)題,從而影響預(yù)測(cè)模型的預(yù)測(cè)精度。
為此,本文提出一種自適應(yīng)完備集合經(jīng)驗(yàn)?zāi)B(tài)分解-聚類重構(gòu)結(jié)構(gòu)的偏最小二乘優(yōu)化ELM 算法(Complete Ensemble Empirical Mode Decomposition with Adaptive Noise-Clustering reconstitution and Partial Least Squares optimized ELM,CEEMDANCPELM),實(shí)現(xiàn)養(yǎng)殖試驗(yàn)池塘的溶解氧預(yù)測(cè)。該模型通過(guò)CEEMDAN 對(duì)水體溶解氧濃度進(jìn)行分解,使得溶解氧時(shí)間序列的多尺度特征被捕捉,同時(shí)基于模糊熵的聚類重構(gòu)可以降低多尺度分解的復(fù)雜度。偏最小二乘法改進(jìn)的極限學(xué)習(xí)機(jī)模型可以在訓(xùn)練過(guò)程中避免冗余信息輸入引起的強(qiáng)共線問(wèn)題,且模型學(xué)習(xí)速度快,可在溶解氧與各相關(guān)因子間建立穩(wěn)定的映射關(guān)系,從而高效、準(zhǔn)確地預(yù)測(cè)水體溶解氧濃度。
本文的試驗(yàn)基地位于江蘇省常熟市(121.9°E、31.6°N),該試驗(yàn)基地?fù)碛叙B(yǎng)殖總面積約3×105m2。養(yǎng)殖基地部署有物聯(lián)網(wǎng)感知監(jiān)測(cè)系統(tǒng),本試驗(yàn)以物聯(lián)網(wǎng)監(jiān)測(cè)范圍內(nèi)的一口養(yǎng)殖池塘為試驗(yàn)對(duì)象,該池塘長(zhǎng)約 110 m,寬 60 m,深 1.5 m,面積約6.7×103m2。養(yǎng)殖品種為南美白對(duì)蝦,投放密度約75 尾/m2。本文選擇2019 年7 月11 日至8 月16 日期間共36 d 監(jiān)測(cè)信息的約5 293 組數(shù)據(jù)集作為試驗(yàn)數(shù)據(jù)集,并選前4 830(約33 d)組數(shù)據(jù)作為訓(xùn)練樣本集,剩余463 組(約3 d)數(shù)據(jù)作為測(cè)試樣本集。
養(yǎng)殖池塘部署的物聯(lián)網(wǎng)感知監(jiān)測(cè)系統(tǒng)包括水下智能感知系統(tǒng)和自動(dòng)氣象站兩部分。水下智能感知系統(tǒng)能夠通過(guò)部署的傳感器設(shè)備實(shí)時(shí)采集水體溶解氧、pH 和水溫等參數(shù)信息,各傳感器一般部署在水下0.5 m 處,數(shù)據(jù)采集頻率為10 min/次。自動(dòng)氣象站部署在距離池塘邊1 m 處,多個(gè)試驗(yàn)池塘共用一套自動(dòng)氣象站,可采集氣溫、風(fēng)速、風(fēng)向、大氣壓強(qiáng)、濕度、二氧化碳、輻射率、日照強(qiáng)度、光合有效輻射等九項(xiàng)數(shù)據(jù)。所有感知設(shè)備采集的數(shù)據(jù)以Zigbee 無(wú)線通信的方式通過(guò)Sink 節(jié)點(diǎn)傳輸至服務(wù)器。圖1為該系統(tǒng)的架構(gòu)圖。
圖1 物聯(lián)網(wǎng)感知監(jiān)測(cè)系統(tǒng)架構(gòu)圖
1.2.1 完備集合經(jīng)驗(yàn)?zāi)B(tài)分解
經(jīng)驗(yàn)?zāi)B(tài)分解是一種能夠自適應(yīng)地將非線性信號(hào)分解為相互獨(dú)立的本征模態(tài)函數(shù)的一種方法[9]。然而EMD 在實(shí)際使用過(guò)程中,存在“模態(tài)混疊”現(xiàn)象。當(dāng)時(shí)間序列的分解出現(xiàn)此問(wèn)題時(shí),分解后的本征模態(tài)函數(shù)則不再具有意義。自適應(yīng)完備集合經(jīng)驗(yàn)?zāi)B(tài)分解利用白噪聲均勻分布的特點(diǎn)[10],對(duì)原始時(shí)間序列疊加帶有控制參數(shù)的成對(duì)自適應(yīng)白噪聲,并計(jì)算提取集合平均后的模態(tài)分量IMFk,克服EMD的模態(tài)混疊問(wèn)題。假定Ej(g)為EMD 分解得到的第j個(gè)模態(tài)分量,w(t)為高斯白噪聲,且滿足N(0,1)分布,則待處理的溶解氧時(shí)間序列為x(t),其詳細(xì)步驟如下:
①對(duì)初始時(shí)間序列x(t)疊加不同的白噪聲wi(t),使得初始序列變?yōu)楹铣尚盘?hào)xi(t)。利用EMD 對(duì)各合成信號(hào)xi(t)進(jìn)行I次分解,從而得到一階本征模態(tài)分量IMF1(t),同時(shí)對(duì)原始時(shí)間序列中IMF1模態(tài)分量進(jìn)行去除操作,獲得第一個(gè)殘差r1(t)。
②在r1(t)中加入成對(duì)高斯白噪聲得到r1(t)+ε1E1(wi(t)),并進(jìn)行EMD 分解,獲得二階本征模態(tài)分量IMF2(t),并計(jì)算去除IMF2模態(tài)分量后的殘差r2(t):
③重復(fù)上述步驟,直至殘差信號(hào)為單調(diào)信號(hào),不可再分解,則算法結(jié)束。由此分解獲得Z階IMFz本征模態(tài)分量、殘差rz(t)和殘差信號(hào)R(t):
由此,可以得到初始信號(hào)x(t)則表示為:
1.2.2 模糊熵
模糊熵(Fuzzy Entropy,F(xiàn)uzzyEn)能夠?qū)崿F(xiàn)時(shí)間序列復(fù)雜程度的定量化度量。它能夠隨參數(shù)變化而變化熵值,在新模式中重新評(píng)估產(chǎn)生的概率[11]。且模糊熵值越大,產(chǎn)生概率越大,時(shí)間序列的復(fù)雜程度越大。假定N維時(shí)間序列U=[u(1),u(2),…,u(N)],其模糊熵計(jì)算的詳細(xì)步驟如下:
①按照序號(hào)順序進(jìn)行相空間重構(gòu),如式(9)所示:
式中:相空間維度為m(m≤N-2),u0(i)為均值,可表示為:
②定義兩個(gè)窗口向量X(i)和X(j)之間的最大絕對(duì)距離為,如式(11):
采用模糊隸屬度函數(shù)μ(,m,r)計(jì)算向量X(i)和X(j)間的相似度:
式中:i=1,2,…N-m+1,r為相似容限度。
③對(duì)于每個(gè)i,計(jì)算各i對(duì)應(yīng)的評(píng)價(jià)值
④重復(fù)步驟①~③,并定義函數(shù)φm(r)和時(shí)間序列u(N)為有限集的模糊熵如式(14)、式(15)所示
1.2.3K-medoids 聚類
K-medoids 是一種經(jīng)典的聚類算法,但不同于k-Means 方法,它通過(guò)計(jì)算簇中點(diǎn)到其他點(diǎn)間距離和的最小值,并作為簇的中心點(diǎn),最終將相同類別和具有相同屬性的點(diǎn)聚集在同一個(gè)簇中[12]。在Kmedoids 算法中,假定一個(gè)n大小的樣本集合G,任選k個(gè)點(diǎn)作為各簇的初始中心Ci,并依據(jù)其他點(diǎn)到簇心的距離進(jìn)行歸類,獲得初始劃分的簇,再不斷使用非簇心點(diǎn)替代簇心并進(jìn)行評(píng)估,最終確定簇類數(shù)及中心。其具體聚類步驟如下:
①?gòu)臉颖炯蟈={x1,x2,…,xn}中隨機(jī)確定k個(gè)點(diǎn)作為初始簇心。
②計(jì)算集合X中心點(diǎn)之外的樣本點(diǎn)到簇心的距離Cd,依據(jù)距離最小原則完成樣本點(diǎn)歸屬簇的劃分過(guò)程。
③計(jì)算各簇中任意一點(diǎn)與簇中非簇心的累積距離和Ct,若Ct<Cd,更換初始簇心Ci,反之不進(jìn)行替換。
④重復(fù)步驟②~③,若聚類結(jié)果不變或達(dá)到迭代次數(shù),聚類結(jié)束。
1.2.4 偏最小二乘優(yōu)化極限學(xué)習(xí)機(jī)
極限學(xué)習(xí)機(jī)(ELM)作為一種簡(jiǎn)單、高效的單隱層前饋神經(jīng)網(wǎng)絡(luò)算法,在使用時(shí)僅需設(shè)置網(wǎng)絡(luò)隱含層節(jié)點(diǎn)數(shù),無(wú)需調(diào)整輸入權(quán)值和偏置即可獲得最優(yōu)解,因此學(xué)習(xí)速度非??靃13]。然而,若輸入節(jié)點(diǎn)信息冗余或隱含層單元數(shù)較樣本數(shù)更多時(shí),則會(huì)發(fā)生輸出層的強(qiáng)共線性問(wèn)題[14]。偏最小二乘算法能夠在嚴(yán)重多重相關(guān)性條件下進(jìn)行有效的回歸分析,構(gòu)建輸入與輸出間的映射模式[15]。偏最小二乘優(yōu)化極限學(xué)習(xí)機(jī)(Partial Least Squares optimized ELM,PLS-ELM)中,正是利用PLS 對(duì)ELM 隱含層中的正交變量進(jìn)行提取,有效解決強(qiáng)共線性問(wèn)題。
在傳統(tǒng)ELM 算法中,對(duì)于大小為n的樣本集(xi,ti),xi=[xi1,xi2,…,xin]和ti=[ti1,ti2,…,tin]分別為ELM 的第i個(gè)輸入和網(wǎng)絡(luò)期望輸出,含有l(wèi)個(gè)隱含層的ELM 網(wǎng)絡(luò)模型可以用式(16)表示:
式中:bj、wj=[wj1,wj2,…,wjn]T、βj=[βj1,βj2,…,βjn]、yi=[yi1,yi2,…,yin]T分別表示隱含層單元的偏置、ELM 網(wǎng)絡(luò)中輸入單元與第j個(gè)隱含層單元間輸入權(quán)值、第j個(gè)隱含層單元與輸出層間輸出權(quán)值以及輸出量,g(x)即ELM 的激活函數(shù)。
當(dāng)使用PLS 進(jìn)行權(quán)值β的計(jì)算,則可以構(gòu)建輸出Y與H的線性關(guān)系,關(guān)系表達(dá)式為:
式中:e和βPLS分別代表PLS 優(yōu)化后ELM 網(wǎng)絡(luò)的噪聲量和隱含層與輸出層間輸出權(quán)重。再對(duì)隱含層節(jié)點(diǎn)輸出矩陣H和輸出矩陣Y間進(jìn)行雙線性分解,可得如下表達(dá)式:
式中:S=[s1,…,sh]∈RN×h、P=[p1,…,ph]∈RL×h和EN×L分別為隱含層得分矩陣、載荷矩陣和殘差矩陣;U=[u1,…,uh]∈RN×h、Q=[q1,…,qh]∈Rm×h和FN×m則分別代表輸出層的得分矩陣、載荷矩陣和殘差矩陣;且輸出層潛在變量uk和隱含層潛在變量sk之間存在uk=sk×bk的關(guān)系;bk為uk和sk間的最小二乘系數(shù);最后以矩陣形式對(duì)該關(guān)系進(jìn)行表達(dá),則:
采用非線性迭代偏最小二乘法(Nonlinear Iterative Partial Least Squares,NIPALS)求解輸出權(quán)值,則該P(yáng)LS-ELM 的求解式可表達(dá)為:
基于CEEMDAN-CPELM 水體溶解氧預(yù)測(cè)模型,在獲取物聯(lián)網(wǎng)監(jiān)測(cè)系統(tǒng)感知信息后,首先進(jìn)行溶解氧關(guān)聯(lián)因子的影響性分析,捕捉水體溶解氧變化規(guī)律,利用CEEMDAN 分解溶解氧時(shí)間序列,再對(duì)各模態(tài)分量進(jìn)行模糊熵值聚類重構(gòu),并基于數(shù)據(jù)重構(gòu)結(jié)果構(gòu)建PLS-ELM 溶解氧預(yù)測(cè)模型,其整體溶解氧預(yù)測(cè)詳細(xì)流程如圖3 所示。
圖3 CEEMDAN-CPELM 溶解氧預(yù)測(cè)流程圖
①特征提取?;谖锫?lián)網(wǎng)水質(zhì)監(jiān)測(cè)系統(tǒng)實(shí)時(shí)采集水體參數(shù)和天氣信息,采用線性插值法對(duì)丟失的數(shù)據(jù)進(jìn)行插補(bǔ),獲得處理后的試驗(yàn)數(shù)據(jù)集;利用皮爾森相關(guān)系數(shù)計(jì)算各影響因子與溶解氧濃度的關(guān)聯(lián)程度值,從而提取影溶解氧變化的關(guān)鍵因子,減少后續(xù)預(yù)測(cè)模型中的輸入量,降低輸入維度。
②CEEMDAN 模態(tài)分量模糊熵重構(gòu)。針對(duì)溶解氧時(shí)間序列添加高斯白噪聲,利用CEEMDAN 完成多尺度模態(tài)分解,再將得到的IMFs 模態(tài)分量進(jìn)行模糊熵計(jì)算,度量各分量的熵值,并依據(jù)熵值完成IMF分量自適應(yīng)重構(gòu)。通過(guò)這一過(guò)程,有效地將目標(biāo)時(shí)間序列自適應(yīng)地重構(gòu)為特定模式,獲得特征統(tǒng)一的分量集合,為后續(xù)預(yù)測(cè)子模型構(gòu)建提供有效依據(jù)。
③預(yù)測(cè)子模型構(gòu)建。對(duì)CEEMDAN 模態(tài)分量模糊熵重構(gòu)的結(jié)果進(jìn)行分析,并基于重構(gòu)的分量集合構(gòu)建多個(gè)PLS-ELM 預(yù)測(cè)子模型。在試驗(yàn)數(shù)據(jù)集的訓(xùn)練集中進(jìn)行模型訓(xùn)練,經(jīng)過(guò)迭代試驗(yàn)確定預(yù)測(cè)模型的最優(yōu)參數(shù)。
④性能對(duì)比。選擇不同的預(yù)測(cè)評(píng)估指標(biāo),并在相同數(shù)據(jù)集中使用不同的預(yù)測(cè)方法進(jìn)行測(cè)試試驗(yàn),對(duì)比不同方法的預(yù)測(cè)性能差異,驗(yàn)證CEEMDANCPELM 水體溶解氧預(yù)測(cè)模型測(cè)試結(jié)果,分析其性能優(yōu)越性。
水產(chǎn)養(yǎng)殖物聯(lián)網(wǎng)監(jiān)測(cè)系統(tǒng)水下傳感器采集的水體參數(shù)包括DO 濃度、水溫(Water temperature,Wt)、pH 值等,自動(dòng)氣象站采集的天氣參數(shù)包括氣溫(Air temperature,At)、風(fēng) 速(Wind speed,Ws)、風(fēng) 向(Wind direction,Wd)、大氣壓強(qiáng)(Atmospheric pressure,Ap)、濕度(Humidity,Hu)、二氧化碳(Carbon Dioxide,Cd)、輻射率(Radiance,Ra)、日照強(qiáng)度(Illuminance,Il)、光合有效輻射(Photosynthetically active radiation,Pr)等九項(xiàng)。這些數(shù)據(jù)在傳輸過(guò)程中不可避免地會(huì)發(fā)生數(shù)據(jù)延遲和丟失,本文針對(duì)延遲數(shù)據(jù)進(jìn)行統(tǒng)一時(shí)間標(biāo)準(zhǔn)處理,并采用線性插值法對(duì)丟失數(shù)據(jù)進(jìn)行插補(bǔ)。
同時(shí),對(duì)上述水體參數(shù)與天氣參數(shù)進(jìn)行分析,利用皮爾森相關(guān)系數(shù)法計(jì)算各影響因子與溶解氧因子間的關(guān)聯(lián)度值,其關(guān)聯(lián)系數(shù)值如表1 所示。
表1 關(guān)聯(lián)因子相關(guān)性系數(shù)
式中:x和y代表量關(guān)聯(lián)變量,n代表變量長(zhǎng)度,xi為x的第i個(gè)元素,yi為y的第i個(gè)元素,和分別為x、y中所有元素的均值。
由表1 可以發(fā)現(xiàn),本試驗(yàn)中的監(jiān)測(cè)信息與溶解氧之間均存在一定的關(guān)聯(lián),但風(fēng)速、風(fēng)向和二氧化碳濃度因子關(guān)聯(lián)系數(shù)較低。故本次試驗(yàn)選擇pH、水溫、氣溫、大氣壓強(qiáng)、濕度、輻射率、日照強(qiáng)度、光合有效輻射等關(guān)聯(lián)系數(shù)較高的因素作為強(qiáng)關(guān)聯(lián)關(guān)鍵因子用于后續(xù)預(yù)測(cè)分析。
對(duì)于非平穩(wěn)的溶解氧時(shí)間序列,使用CEEMDAN可以將原始時(shí)間序列的模型分解成頻率由高到低的系列IMF 模態(tài)分量,避免模態(tài)混疊問(wèn)題。然而經(jīng)模態(tài)分解后獲得的本征模態(tài)分量數(shù)量較多,且相鄰模態(tài)分量之間復(fù)雜度、蘊(yùn)含的物理意義均相近,故對(duì)所有IMF 分量均構(gòu)建預(yù)測(cè)模型會(huì)消耗過(guò)多的模型訓(xùn)練和測(cè)試時(shí)間,預(yù)測(cè)復(fù)雜度明顯上升。同時(shí),為了提取有效信息,簡(jiǎn)化CEEMDAN 分解量的重構(gòu)過(guò)程,本文采用模糊熵理論對(duì)CEEMDAN 分解的IMFs 分量進(jìn)行復(fù)雜度度量,結(jié)合K-medoids 聚類方法,并對(duì)IMFs 模糊熵值進(jìn)行聚類,自適應(yīng)地實(shí)現(xiàn)初始溶解氧時(shí)間序列的分解-重構(gòu)過(guò)程。其具體步驟如下:
①CEEMDAN 分解:設(shè)置初始分解參數(shù),對(duì)初始溶解氧時(shí)間序列x(t)進(jìn)行CEEMDAN 分解,獲得z個(gè)本征模態(tài)分量IMF。
②IMFs 分量復(fù)雜度計(jì)算:對(duì)分解得到的IMFs分量分別計(jì)算其模糊熵值,并記作FuzzyEn1、Fuzzy-En2,…,F(xiàn)uzzyEnz。
③K-medoids 模糊熵聚類:首先設(shè)置聚類初始簇?cái)?shù),初始化簇心;再不斷計(jì)算各簇中任意一點(diǎn)與簇中非簇心的累積距離和Ct,直至簇心不再發(fā)生變化,從而確定最佳簇心位置;最后,分別對(duì)各簇中IMF本征模態(tài)分量就進(jìn)行合并重構(gòu),將初始溶解氧時(shí)間序列重構(gòu)為新的模態(tài)分量集合的形式。
在數(shù)據(jù)的特征提取完成后,本文確定PLS-ELM溶解氧預(yù)測(cè)子模型的輸入維度為9,輸出為待測(cè)時(shí)刻的溶解氧濃度。經(jīng)各模態(tài)分量IMFs 的模糊熵復(fù)雜度度量后,使用K-medoids 方法完成IMFs 分量的模糊熵值聚類,獲得z個(gè)新的模態(tài)分量。并以新的重構(gòu)模態(tài)分量構(gòu)建K=3 個(gè)PLS-ELM 預(yù)測(cè)子模型,分別對(duì)其中的參數(shù)進(jìn)行設(shè)置。
本文使用交叉驗(yàn)證法,經(jīng)多次運(yùn)行且均方根誤差(Root Mean Square Error,RMSE)[16]結(jié)果相近的條件下,設(shè)置偏最小二乘的潛在變量數(shù)h為5。另外采用試錯(cuò)法來(lái)確定各預(yù)測(cè)子模型的隱含層節(jié)點(diǎn)數(shù),分別為39、31、37。
本文選擇平均絕對(duì)誤差(Mean Absolute Error,MAE)[17]和RMSE 作為預(yù)測(cè)精度的評(píng)價(jià)指標(biāo),采用納什效率系數(shù)(Nash-Sutcliffe Efficiency Coefficient,NSE)[18]作為預(yù)測(cè)模型預(yù)測(cè)結(jié)果好壞的評(píng)價(jià)指標(biāo)。MAE 和RMSE 值越小,表明預(yù)測(cè)精度越高;反之預(yù)測(cè)精度越低。當(dāng)ENAS值越接近1 時(shí),表明該模型具有較高的可信度;當(dāng)ENAS值越接近0 時(shí),表明該預(yù)測(cè)結(jié)果可信,但存在一定的預(yù)測(cè)誤差;當(dāng)ENAS值遠(yuǎn)小于0 時(shí),表明該預(yù)測(cè)模型不可信。其計(jì)算表達(dá)式如下所示:
式中:N為樣本點(diǎn)量,yi為真實(shí)值,為模型預(yù)測(cè)值,代表觀測(cè)平均值。
如圖4 所示為養(yǎng)殖水體溶解氧濃度的測(cè)量數(shù)據(jù),對(duì)圖中的溶解氧樣本進(jìn)行分析不難發(fā)現(xiàn)養(yǎng)殖水體的溶解氧濃度呈現(xiàn)較明顯的周期性和非線性。
圖4 水體溶解氧濃度測(cè)量數(shù)據(jù)
本試驗(yàn)設(shè)置CEEMDAN 分解的參數(shù)最大迭代次數(shù)為5 000 次,集合數(shù)為500,添加的白噪聲數(shù)據(jù)的標(biāo)準(zhǔn)偏差為0.2,獲得圖5 所示分解結(jié)果。
圖5 CEEMDAN 模態(tài)分解結(jié)果
由圖5 可知,溶解氧原始時(shí)間序列被分解為13個(gè)模態(tài)分量。各IMF 模態(tài)分量的波動(dòng)頻率各不相同,且頻率由IMF1至IMF13逐漸降低,IMF13因滿足分解的終止條件,被判定為最終雨量信號(hào)r(t),無(wú)需后續(xù)分解。同時(shí),這一分解結(jié)果充分顯示了原始時(shí)間序列的變化趨勢(shì)。
在上述13 個(gè)IMFs 分量中,利用模糊熵理論進(jìn)行復(fù)雜度計(jì)算,組成新的特征向量。本試驗(yàn)中設(shè)置模糊熵的嵌入維度數(shù)為2,延遲因子系數(shù)值為0.2,相似度容差r=0.2×std,std 為模態(tài)分離時(shí)間序列的標(biāo)準(zhǔn)差。由此獲得CEEMDAN 模態(tài)分量模糊熵估算結(jié)果,如圖6 所示。
圖6 CEEMDAN 模態(tài)分量模糊熵值結(jié)果圖
由圖6 可知,IMF1~I(xiàn)MF13分量的模糊熵值除個(gè)別點(diǎn)外,總體處于下降趨勢(shì)。同時(shí),說(shuō)明CEEMDAN分解的不斷進(jìn)行,使得IMF 模態(tài)分量的變化趨于平穩(wěn)狀態(tài)。因此,模糊熵可以用于度量時(shí)間序列的分量復(fù)雜度。再對(duì)模糊熵值進(jìn)行K-medoids 聚類,獲得聚類結(jié)果如表2 所示。
表2 模糊熵重構(gòu)結(jié)果
表2 中,由于IMF2~I(xiàn)MF5的波動(dòng)頻率較高,相互之間復(fù)雜度更接近,故將IMF2~I(xiàn)MF5合并重構(gòu)為分量集合S1;IMF1、IMF6~I(xiàn)MF7三個(gè)模態(tài)分量的復(fù)雜度不高,模糊熵值最接近,故可以將該三個(gè)分量合并為分量集合S2;IMF8~I(xiàn)MF13的復(fù)雜程度較低,分量變化趨勢(shì)明顯,故可合并重構(gòu)為分量集合S3。
為了驗(yàn)證提出的CEEMDAN-CPELM 改進(jìn)算法的性能,本文將構(gòu)建CEEMDAN-ELM(基于CEEMDAN分解的ELM)、PLS-ELM(PLS 優(yōu)化ELM)以及ELM作為對(duì)比模型,分析各方法的預(yù)測(cè)性能優(yōu)劣。本試驗(yàn)中,各預(yù)測(cè)模型的試驗(yàn)數(shù)據(jù)相同,各優(yōu)化模型的相關(guān)參數(shù)設(shè)置相同,預(yù)測(cè)模型的輸入輸出量相同,由此獲得圖7 所示預(yù)測(cè)效果圖。
圖7 不同改進(jìn)模型的預(yù)測(cè)結(jié)果對(duì)比圖
圖7 清晰地顯示各ELM 改進(jìn)模型均能實(shí)現(xiàn)水體溶解氧濃度的預(yù)測(cè),但各預(yù)測(cè)模型的預(yù)測(cè)效果存在一定差異。在大多數(shù)樣本點(diǎn)中CEEMDAN-CPELM 模型的預(yù)測(cè)結(jié)果與真實(shí)值最接近,CEEMDAN-ELM 與PLS-ELM 模型的預(yù)測(cè)曲線較CEEMDAN-CPELM 預(yù)測(cè)結(jié)果雖有一定程度波動(dòng),但總體預(yù)測(cè)趨勢(shì)較一致。然而,在局部樣本點(diǎn)中,各預(yù)測(cè)模型的預(yù)測(cè)結(jié)果均與真實(shí)值存在一定偏差,且偏差程度不明確。為了清晰全面地對(duì)比各預(yù)測(cè)模型的預(yù)測(cè)效果,表3 詳細(xì)羅列了各改進(jìn)模型的預(yù)測(cè)性能值。
表3 多個(gè)改進(jìn)ELM 模型的溶解氧預(yù)測(cè)性能結(jié)果
對(duì)表3 的多個(gè)改進(jìn)ELM 模型的預(yù)測(cè)性能結(jié)果值進(jìn)行分析可以發(fā)現(xiàn),所提出的CEEMDAN-CPELM預(yù)測(cè)模型的DO 預(yù)測(cè)RMSE 值為0.959、MAE 值為0.748 9,相較CEEMDAN-ELM 模型分別降低了1.37%、3.24%。同時(shí),CEEMDAN-CPELM 模型的溶解氧預(yù)測(cè)RMSE 和MAE 值相較于PLS-ELM 模型分別降低了2.36%和1.80%。由此表明本文提出的預(yù)測(cè)模型使用的CEEMDAN 分解和模糊熵聚類重構(gòu)操作有效地捕捉了溶解氧的數(shù)據(jù)特征,提高了預(yù)測(cè)精度,偏最小二乘預(yù)測(cè)算法能避免本文中數(shù)據(jù)的強(qiáng)共線性問(wèn)題,提高預(yù)測(cè)精度。CEEMDAN-CPELM 模型的預(yù)測(cè)RMSE 和MAE 值相較于ELM 分別降低了27.35%和29.59%,充分體現(xiàn)了兩項(xiàng)優(yōu)化操作結(jié)合的優(yōu)越性,能有效提高算法的性能。CEEMDANCPELM 模型的ENAS系數(shù)值為0.0348,明顯高于其他三個(gè)模型的ENAS值,也驗(yàn)證了模型性能的優(yōu)越性。
為了驗(yàn)證提出的CEEMDAN-CPELM 模型的適用性,本文選擇GA-SELM[19]、LSSVM 和傳統(tǒng)BP 神經(jīng)網(wǎng)絡(luò)模型作為對(duì)比模型。各模型的試驗(yàn)數(shù)據(jù)集相同,水體溶解氧預(yù)測(cè)結(jié)果如圖8 所示。
圖8 不同類型預(yù)測(cè)模型的溶解氧預(yù)測(cè)結(jié)果圖
由圖8 可以發(fā)現(xiàn),上述四種不同類型的預(yù)測(cè)模型雖然均實(shí)現(xiàn)了溶解氧濃度的預(yù)測(cè),但預(yù)測(cè)效果差別較大。CEEMDAN-CPELM 模型的預(yù)測(cè)結(jié)果曲線最接近溶解氧濃度的真實(shí)測(cè)量值變化曲線。GASELM 模型的預(yù)測(cè)結(jié)果曲線與CEEMDAN-CPELM的預(yù)測(cè)效果相近,也能較好地將溶解氧真實(shí)變化趨勢(shì)預(yù)測(cè)出來(lái)。LSSVM 和BP 網(wǎng)絡(luò)模型的預(yù)測(cè)效果明顯比CEEMDAN-CPELM 和GA-SELM 模型差,在很多樣本點(diǎn)上偏離真實(shí)值較遠(yuǎn)。為了說(shuō)明CEEMDAN-CPELM 模型的性能優(yōu)勢(shì),表4 詳細(xì)列出了不同類型模型的預(yù)測(cè)性能結(jié)果。
表4 不同類型預(yù)測(cè)模型的預(yù)測(cè)性能結(jié)果表
從表4 中可以清楚地看出,CEEMDAN-CPELM模型的RMSE 較GA-SELM、LSSVM 和BP 模型分別降低了13.36%、32.21%和44.81%。CEEMDANCPELM 模型的MAE 較GA-SELM、LSSVM 和BP 模型分別降低了17.57%、26.41%和48.68%。同時(shí),CEEMDAN-CPELM 模型的ENAS系數(shù)值遠(yuǎn)高于其他模型的ENAS系數(shù)值。故,CEEMDAN-CPELM 模型的預(yù)測(cè)性能較其他模型的預(yù)測(cè)性能有明顯的提高。
結(jié)果表明,基于CEEMDAN 分解、模糊熵值聚類重構(gòu)、改進(jìn)ELM 等優(yōu)化操作構(gòu)建的CEEMDANCPELM 模型可以實(shí)現(xiàn)水體溶解氧濃度的有效預(yù)測(cè)。該模型具有較高的預(yù)測(cè)性能,在不同類型的預(yù)測(cè)模型中也具有明顯的預(yù)測(cè)性能優(yōu)勢(shì)。
本文提出的基于CEEMDAN-CPELM 的水體溶解氧濃度預(yù)測(cè)模型,能夠針對(duì)真實(shí)養(yǎng)殖環(huán)境中非線性變化的溶解氧濃度進(jìn)行預(yù)測(cè)。該模型基于多元時(shí)間序列的強(qiáng)關(guān)聯(lián)性和非平穩(wěn)性,構(gòu)建能應(yīng)用于實(shí)際養(yǎng)殖環(huán)境的預(yù)測(cè)模型。其主要結(jié)論如下:
①通過(guò)CEEMDAN 將溶解氧非線性數(shù)據(jù)分解為多尺度IMF 模態(tài)分量及余量,再通過(guò)“分解-重構(gòu)-預(yù)測(cè)”的結(jié)構(gòu)提高溶解氧預(yù)測(cè)的精度。
②采用PLS 方法對(duì)ELM 進(jìn)行改進(jìn),避免多元預(yù)測(cè)模型中輸入信息冗余帶來(lái)的強(qiáng)共線性問(wèn)題,從而提高預(yù)測(cè)模型的性能。
③以實(shí)際養(yǎng)殖生產(chǎn)環(huán)境數(shù)據(jù)為試驗(yàn)對(duì)象,將CEEMDAN-CPELM 模型的溶解氧預(yù)測(cè)性能值與多種改進(jìn)ELM 模型以及不同類型預(yù)測(cè)模型進(jìn)行對(duì)比分析,本文提出的預(yù)測(cè)模型獲得了較明顯的優(yōu)勢(shì)。驗(yàn)證了CEEMDAN-CPELM 模型對(duì)養(yǎng)殖水體溶解氧預(yù)測(cè)的有效性和可行性。