任妮 鮑彤 劉楊 荀廣連 蔣永年
摘要:?為準(zhǔn)確預(yù)測蟹塘溶解氧質(zhì)量濃度,及時(shí)掌握溶解氧質(zhì)量濃度的變化趨勢,提前采取防控措施從而降低河蟹養(yǎng)殖風(fēng)險(xiǎn),提出了一種基于粒子群優(yōu)化算法(PSO)和長短時(shí)記憶神經(jīng)網(wǎng)絡(luò)(LSTM)的蟹塘溶解氧質(zhì)量濃度預(yù)測模型,采用PSO算法優(yōu)化LSTM模型參數(shù)后對蟹塘溶解氧質(zhì)量濃度進(jìn)行預(yù)測。結(jié)果表明,PSO-LSTM模型不僅整體優(yōu)于ARIMA模型,相較于其他LSTM模型也有更高的預(yù)測精度,在連續(xù)10個(gè)時(shí)間點(diǎn)的預(yù)測中相比于LDO-LSTM、LSTM和ARIMA模型平均百分誤差分別降低了2.55%、1.891%和4.055%。說明PSO-LSTM模型在蟹塘溶解氧質(zhì)量濃度預(yù)測中具有良好的準(zhǔn)確性和穩(wěn)定性,可以為河蟹養(yǎng)殖中水質(zhì)精準(zhǔn)預(yù)測與調(diào)控提供參考。
關(guān)鍵詞:?溶解氧預(yù)測;河蟹養(yǎng)殖;粒子群優(yōu)化算法;長短時(shí)記憶神經(jīng)網(wǎng)絡(luò)
中圖分類號:?S126??文獻(xiàn)標(biāo)識碼:?A??文章編號:?1000-4440(2021)02-0426-09
Abstract:?To predict the mass concentration of dissolved oxygen in Chinese mitten crab ponds accurately, grasp the changing trend of the mass concentration of dissolved oxygen timely and take preventive and control measures in advance to reduce the risk in Chinese mitten crab culturing, a model for predicting the mass concentration of dissolved oxygen in Chinese mitten crab ponds based on particle swarm optimization (PSO) and long short-term memory (LSTM) neural networks was proposed. The mass concentration of dissolved oxygen in Chinese mitten crab ponds was predicted after optimizing LSTM model parameters by PSO algorithm. The results showed that the PSO-LSTM model was not only superior to the ARIMA model, but also had higher prediction accuracy compared with other LSTM models. In the predictions at 10 consecutive time points, the average percentage error of the PSO-LSTM model reduced by 2.55%, 1.891% and 4.055% respectively, compared with the LDO-LSTM, LSTM and ARIMA models. It can be seen that the PSO-LSTM model has good accuracy and stability in the prediction of the mass concentration of dissolved oxygen in Chinese mitten crab ponds, and can provide a reference for accurate prediction and regulation of water quality in Chinese mitten crab culturing.
Key words:?prediction of dissolved oxygen;culturing of Chinese mitten crab;particle swarm optimization algorithm;long short-term memory neural networks
河蟹,學(xué)名中華絨螯蟹,俗稱大閘蟹。河蟹養(yǎng)殖是中國很多地區(qū)實(shí)施精準(zhǔn)扶貧、拉動(dòng)經(jīng)濟(jì)增長、促進(jìn)農(nóng)民增收的重要突破口。溶解氧(Dissolved oxygen,DO)即溶解于水中的分子態(tài)氧,是集約化河蟹養(yǎng)殖成功與否的關(guān)鍵因素之一,其含量多少關(guān)乎河蟹的生長速度、發(fā)病率、死亡率,以及蟹塘中飼料的利用率和有害物質(zhì)的產(chǎn)生量等。準(zhǔn)確預(yù)測蟹塘中溶解氧的含量,有利于及時(shí)掌握溶解氧的變化趨勢,提前采取防控措施,從而降低河蟹養(yǎng)殖風(fēng)險(xiǎn),增加養(yǎng)殖經(jīng)濟(jì)效益,同時(shí)還對水質(zhì)監(jiān)測和疾病防控等生態(tài)問題具有預(yù)警意義。
近年來,隨著機(jī)器學(xué)習(xí)和深度學(xué)習(xí)等技術(shù)的發(fā)展,越來越多的研究者將此類方法應(yīng)用于水體溶解氧的預(yù)測研究中。劉雙印等[1]采用支持向量機(jī)方法構(gòu)建了基于蟻群優(yōu)化的LSSVR溶解氧預(yù)測模型?;戮甑萚2]提出基于K-means聚類和極限學(xué)習(xí)機(jī)(Extreme learning machine,ELM)結(jié)合的溶解氧預(yù)測模型,降低了不同趨勢樣本間的干擾,提升了預(yù)測準(zhǔn)確度。Khan等[3]提出了模糊線性回歸的溶解氧預(yù)測方法,與貝葉斯方法相比均方誤差更低。吳慧英等[4]提出了主成分分析法(Principal component analysis, PCA)和SVR的池塘溶解氧預(yù)測模型,提取影響?zhàn)B殖水體溶解氧濃度的關(guān)鍵指標(biāo),降低模型輸入變量的維度,提高了模型的訓(xùn)練速度。以上諸如支持向量機(jī)、K-means聚類等淺層的機(jī)器學(xué)習(xí)方法在有限樣本和計(jì)算單元的情況下對復(fù)雜函數(shù)的表征學(xué)習(xí)能力有限,普遍缺乏長效性。
深度學(xué)習(xí)方法通過深層的非線性網(wǎng)絡(luò)結(jié)構(gòu)可以實(shí)現(xiàn)利用少量參數(shù)表示復(fù)雜函數(shù),更有助于挖掘數(shù)據(jù)的內(nèi)在信息,具有強(qiáng)大的數(shù)據(jù)學(xué)習(xí)能力和泛化能力。循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent neural network, RNN)作為深度學(xué)習(xí)處理時(shí)間序列任務(wù)的經(jīng)典網(wǎng)絡(luò)結(jié)構(gòu),在時(shí)序數(shù)據(jù)預(yù)測中表現(xiàn)突出,但是隨著序列長度的增加存在梯度爆炸或梯度消失風(fēng)險(xiǎn),性能受到制約[5-6]。而基于RNN改進(jìn)的長短時(shí)記憶網(wǎng)絡(luò)(Long short-term memory, LSTM)[7]加入了細(xì)胞狀態(tài)單元,較好地解決了長時(shí)間序列的依賴問題。有大量學(xué)者利用LSTM模型對時(shí)間序列進(jìn)行預(yù)測的研究。溫惠英等[8]利用遺傳算法(GA)對LSTM的神經(jīng)網(wǎng)絡(luò)隱藏層數(shù)、訓(xùn)練次數(shù)、dropout等參數(shù)進(jìn)行優(yōu)化并利用高速公路交通流的數(shù)據(jù)進(jìn)行驗(yàn)證,闡述了不同參數(shù)對LSTM模型調(diào)優(yōu)過程中的影響。白盛楠等[9]在使用灰色關(guān)聯(lián)度分析后搭建了基于LSTM的PM2.5預(yù)測模型,為空氣污染的預(yù)警和治理提供了新的思路。魏昱洲等[10]利用雙層LSTM網(wǎng)絡(luò)結(jié)構(gòu),對風(fēng)速數(shù)據(jù)進(jìn)行了預(yù)測,證明超前10 min內(nèi)各時(shí)間段的預(yù)測準(zhǔn)確率達(dá)到了98.8%以上,具有很好的預(yù)測精度。也有少數(shù)學(xué)者利用LSTM模型對水體溶解氧進(jìn)行了預(yù)測[11-13],取得了一定成果。其中朱南陽等[14]在LSTM的基礎(chǔ)上通過對低溶解氧權(quán)重的調(diào)節(jié)進(jìn)行預(yù)測,在確保溶解氧趨勢擬合的前提下提高了低濃度溶解氧的預(yù)測精度。陳英義等[15]提出主成分分析和LSTM相結(jié)合的溶解氧預(yù)測方法,試驗(yàn)證明LSTM模型的各項(xiàng)誤差指標(biāo)都優(yōu)于其他淺層模型。
選擇不同模型參數(shù)對LSTM模型預(yù)測性能的提升影響巨大。目前模型參數(shù)的選擇往往過多依賴于研究者的經(jīng)驗(yàn)和反復(fù)調(diào)試,需要大量的人力和計(jì)算資源。而粒子群優(yōu)化算法(Particle swarm optimization,PSO)可以在保證模型評價(jià)指標(biāo)最優(yōu)的前提下,通過不斷迭代尋優(yōu)過程找到模型的最優(yōu)參數(shù),從而避免了依據(jù)經(jīng)驗(yàn)選取參數(shù)而導(dǎo)致的預(yù)測精度低、調(diào)參時(shí)間長的問題。近兩年,有少量學(xué)者開始嘗試用PSO與LSTM相結(jié)合的方式對時(shí)間序列進(jìn)行預(yù)測研究。楊孟達(dá)[16]提出改進(jìn)PSO-LSTM模型對未來一天日均溫度進(jìn)行預(yù)測,試驗(yàn)結(jié)果表明PSO-LSTM模型有更好的準(zhǔn)確性。劉可真等[17]利用PSO-LSTM模型對變壓器中溶解氣體濃度進(jìn)行了預(yù)測,證明相較于傳統(tǒng)預(yù)測方法,PSO-LSTM模型可以更好地追蹤油中溶解氣體濃度的變化規(guī)律。李萬等[18]采用改進(jìn)粒子群算法優(yōu)化LSTM模型并對鐵路客運(yùn)量進(jìn)行了預(yù)測。宋剛等[19]基于粒子群優(yōu)化LSTM模型對各類股票的變化曲線進(jìn)行了預(yù)測,證明了該模型具有普遍適用性。
本研究提出一種基于PSO-LSTM模型的蟹塘溶解氧預(yù)測方法,首先將LSTM模型中樣本批次、隱藏層單元數(shù)、學(xué)習(xí)率、迭代次數(shù)等參數(shù)設(shè)為優(yōu)化對象并給予取值范圍,利用PSO算法根據(jù)參數(shù)范圍初始化各粒子的位置信息并建立初始模型,將模型在驗(yàn)證集的預(yù)測誤差作為粒子的適應(yīng)度值不斷更新,當(dāng)滿足最大迭代次數(shù)時(shí)停止更新優(yōu)化,利用優(yōu)化后的各類參數(shù)搭建LSTM預(yù)測模型對溶解氧進(jìn)行預(yù)測。
1?材料與方法
1.1?數(shù)據(jù)采集
試驗(yàn)數(shù)據(jù)源自江蘇省宜興市高塍鎮(zhèn)河蟹養(yǎng)殖基地,該基地內(nèi)各池塘面積約為37 000 m2,水深約為1.2 m。每個(gè)池塘選取2~3個(gè)位置,每個(gè)位置分別選取距離水底30 cm、60 cm、90 cm處作為數(shù)據(jù)采集點(diǎn)布設(shè)傳感器(圖1)。
每個(gè)數(shù)據(jù)采集點(diǎn)設(shè)有溶解氧質(zhì)量濃度、溫度、濁度、pH、銨態(tài)氮質(zhì)量濃度、電導(dǎo)率等傳感器,傳感器型號如表1所示。
試驗(yàn)所選取的數(shù)據(jù)為位置1-2(圖1)的中層傳感器采集的數(shù)據(jù),采集時(shí)間為2020年4月11日至2020年5月24日,數(shù)據(jù)采集間隔時(shí)間為10 min,共采集到溶解氧質(zhì)量濃度、溫度、濁度、pH、銨態(tài)氮質(zhì)量濃度、電導(dǎo)率等有效數(shù)據(jù)6 226條。其中5月8日采集的部分?jǐn)?shù)據(jù)如表2所示。
分析長期監(jiān)測數(shù)據(jù)后發(fā)現(xiàn),蟹塘養(yǎng)殖水相關(guān)參數(shù)每小時(shí)內(nèi)波動(dòng)范圍較小,其中溶解氧質(zhì)量濃度和溫度隨著時(shí)間呈周期變化。水體溶解氧質(zhì)量濃度在清晨和傍晚較高,而中午隨著水溫升高,盡管水草等植物光合作用增強(qiáng),但是水中好氧因子也多,因此水中溶解氧質(zhì)量濃度降低。除此之外,溶解氧質(zhì)量濃度隨著季節(jié)的不同也呈現(xiàn)明顯的周期變化,而pH、銨態(tài)氮質(zhì)量濃度、濁度、電導(dǎo)率等參數(shù)隨溶解氧質(zhì)量濃度的變化呈振蕩變化特點(diǎn),無明顯的線性關(guān)系。
1.2?數(shù)據(jù)預(yù)處理與相關(guān)性分析
由于水下環(huán)境、設(shè)備腐蝕和人為干預(yù)等因素的影響,傳感器的原始數(shù)據(jù)存在缺失值或異常值,在預(yù)處理階段對獲取到的6 226條原始數(shù)據(jù)采用均值法(公式1)對缺失值進(jìn)行補(bǔ)充和異常值替換。
為了降低數(shù)據(jù)維度,篩選出與溶解氧質(zhì)量濃度相關(guān)性較高的影響因子,采用SPSS工具的皮爾遜相關(guān)系數(shù)法(Pearson correlation coefficient)進(jìn)行相關(guān)性分析。結(jié)果表明,溶解氧質(zhì)量濃度與溫度(相關(guān)系數(shù)-0.150**)、濁度(0.338**)、pH值(0.811**)、銨態(tài)氮質(zhì)量濃度(-0.118**)具有顯著相關(guān)性(P<0.01), 而與電導(dǎo)率(-0.040)的相關(guān)性較低,因此選擇溫度、濁度、pH、銨態(tài)氮質(zhì)量濃度等主要影響因子作為模型輸入?yún)?shù)。
1.3?數(shù)據(jù)歸一化
為了消除奇異樣本數(shù)據(jù),減少模型訓(xùn)練時(shí)間,通過公式(2)對數(shù)據(jù)進(jìn)行歸一化,將原數(shù)據(jù)映射到[0,1]之間。并將歸一化后的數(shù)據(jù)按照8∶1∶1劃分訓(xùn)練集、驗(yàn)證集和測試集。
1.4?模型構(gòu)建
1.4.1?長短時(shí)記憶網(wǎng)絡(luò)(LSTM)?LSTM是一種特殊的RNN結(jié)構(gòu)。為了解決傳統(tǒng)RNN在長序列訓(xùn)練過程中的梯度彌散問題,LSTM引入了特殊的“門”結(jié)構(gòu)。LSTM網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示,由輸入門、遺忘門、輸出門和細(xì)胞單元組成[7]。
圖2中ft是遺忘門,決定上一時(shí)刻的細(xì)胞中有多少信息需要傳遞到當(dāng)前時(shí)刻;it是輸入門,用來控制當(dāng)前單元嵌入細(xì)胞狀態(tài)的程度;ot是輸出門,輸出門結(jié)合了細(xì)胞狀態(tài)用來輸出;Ct是記憶單元,用來記錄不同門結(jié)構(gòu)情況下細(xì)胞的狀態(tài);ht是輸出。各個(gè)門之間的計(jì)算過程如下:
其中Wf,Wi,Wc,Wo是各個(gè)門的權(quán)重,bf,bi,bc,bo是各個(gè)門的偏置項(xiàng)。通過上述計(jì)算,LSTM可以利用門控單元進(jìn)行長序列的信息傳遞,從而避免長期依賴問題。
1.4.2?粒子群優(yōu)化算法(PSO)?粒子群優(yōu)化算法的思想源于對鳥類覓食行為的研究,鳥群通過搜尋目前離食物最近的鳥的周圍區(qū)域,利用個(gè)體的飛行經(jīng)驗(yàn)判斷食物所在并不斷向集體共享信息,從而使得整個(gè)群體快速獲得覓食路線的最優(yōu)解[20]。PSO將群體中的個(gè)體看作在空間中進(jìn)行搜索的粒子,每個(gè)粒子隨機(jī)得到一組隨機(jī)解,每個(gè)解都有特定的位置、速度和適應(yīng)度,粒子在空間的搜尋過程中不斷跟蹤空間內(nèi)最優(yōu)解調(diào)整自身的參數(shù),從而完成從局部最優(yōu)到全局最優(yōu)的搜索過程。
式中,ω為慣性權(quán)重,控制粒子在局部最優(yōu)和全局最優(yōu)中的權(quán)重分配;c1和c2為加速因子,用以調(diào)整飛行的步長,一般非負(fù);r1和r2為值在[0,1]之間的隨機(jī)數(shù);Xkid,Vkid,Pkgd,Pkid分別對應(yīng)該時(shí)刻下粒子的位置、速度、局部最優(yōu)解和全局最優(yōu)解。
1.4.3?粒子群優(yōu)化算法優(yōu)化LSTM模型參數(shù)流程?LSTM盡管在一定程度上解決了傳統(tǒng)RNN的梯度彌散問題,但是由于門結(jié)構(gòu)的加入增加了參數(shù)量,需要不斷調(diào)整參數(shù)才能達(dá)到最優(yōu)的效果。本研究利用粒子群優(yōu)化算法對LSTM模型中樣本批次、隱藏層單元數(shù)、學(xué)習(xí)率、迭代次數(shù)等參數(shù)進(jìn)行尋優(yōu),確定溶解氧質(zhì)量濃度預(yù)測模型的最佳參數(shù)。PSO-LSTM模型結(jié)構(gòu)如圖3所示:
算法流程:步驟1,將LSTM的樣本批次、隱藏層單元數(shù)、學(xué)習(xí)率、迭代次數(shù)作為優(yōu)化對象,根據(jù)預(yù)先設(shè)定的范圍初始化粒子的位置信息。步驟2,初始化粒子群,劃分訓(xùn)練集和測試集,并將步驟1中初始化參數(shù)輸入LSTM網(wǎng)絡(luò)進(jìn)行訓(xùn)練,將模型預(yù)測誤差作為粒子的適應(yīng)度值。步驟3,比較每個(gè)粒子的適應(yīng)度值及其經(jīng)歷過的最好位置,確定粒子的最優(yōu)位置,并根據(jù)公式9和公式10更新粒子的速度和位置,計(jì)算新一輪粒子適應(yīng)度值。步驟4,當(dāng)搜尋過程達(dá)到預(yù)先設(shè)定的最大迭代次數(shù),或粒子的適應(yīng)度值不再隨迭代次數(shù)明顯變化時(shí)停止更新,并獲得此時(shí)LSTM模型的樣本批次、隱藏層單元數(shù)、學(xué)習(xí)率、迭代次數(shù)值。步驟5,將步驟4獲得的各項(xiàng)數(shù)值輸入LSTM模型進(jìn)行訓(xùn)練和預(yù)測。
1.4.4?模型評價(jià)指標(biāo)?為了驗(yàn)證PSO-LSTM模型對溶解氧質(zhì)量濃度的預(yù)測性能,選取平均絕對百分比誤差(MAPE)、均方根誤差(RMSE)、均方誤差(MSE)作為模型評價(jià)指標(biāo)。各評價(jià)指標(biāo)計(jì)算公式如下:
式中,N為預(yù)測的總次數(shù),yi代表真實(shí)值,y^i代表預(yù)測值,MAPE表示預(yù)測值與真實(shí)值的百分誤差,MSE反映了預(yù)測值與真實(shí)值之間偏差的期望值,RMSE是均方誤差的算術(shù)平方根。
1.4.5?PSO-LSTM模型驗(yàn)證對比模型的選擇?為了驗(yàn)證PSO-LSTM模型的有效性,選擇單一LSTM模型、自回歸移動(dòng)平均模型(ARIMA)和低溶解氧預(yù)測模型(LDO-LSTM)作為對比模型。ARIMA模型是研究時(shí)間序列的重要模型,由自回歸模型(AR)與滑動(dòng)平均模型(MA)結(jié)合而成,僅需要對數(shù)據(jù)進(jìn)行平穩(wěn)性檢驗(yàn)和差分即可搭建模型,具有適用范圍廣、預(yù)測誤差小的特點(diǎn)。由于蟹塘溶解氧質(zhì)量濃度偏低時(shí)危害更大,有學(xué)者通過更改損失函數(shù)的權(quán)重建立了LDO-LSTM模型提升低溶解氧時(shí)預(yù)測精度[10],該模型根據(jù)溶解氧真實(shí)值在反向傳播時(shí)給損失函數(shù)分配不同的權(quán)重,使網(wǎng)絡(luò)更關(guān)注低溶解氧質(zhì)量濃度時(shí)刻的特征,取得了良好的預(yù)測精度。
1.4.6?PSO-LSTM模型參數(shù)設(shè)置?本試驗(yàn)環(huán)境為Anaconda,編程語言為Python3.6,模型訓(xùn)練框架為基于Keras的Tensorflow1.4。LSTM模型的輸入層神經(jīng)元數(shù)量為4,隱藏層數(shù)量為1,輸出層神經(jīng)元數(shù)量為1,預(yù)測所需步長為40。訓(xùn)練過程中用Adam算法優(yōu)化參數(shù),將樣本批次、隱藏層單元數(shù)、學(xué)習(xí)率、迭代次數(shù)設(shè)置為待優(yōu)化參數(shù),具體取值范圍設(shè)置如下:樣本批次取值范圍為[4,128],隱藏層單元數(shù)為[2,20],學(xué)習(xí)率為[0.000 1,0.010 0],迭代次數(shù)為[30,300]。粒子群優(yōu)化算法參數(shù)設(shè)置為:粒子群數(shù)量為20,加速因子c1=c2=2,慣性權(quán)重ω設(shè)置為0.8,最大迭代次數(shù)為300。ARIMA中階層(p)、階數(shù)(q)和差分(d)分別設(shè)置為1、1、2。LSTM模型學(xué)習(xí)率設(shè)置為0.001,樣本批次為32,迭代次數(shù)為100,隱藏層數(shù)量為1,每層神經(jīng)元數(shù)量為10。LDO-LSTM模型的學(xué)習(xí)率為0.001,時(shí)間步長為10,輸入層節(jié)點(diǎn)數(shù)為4,隱藏層節(jié)點(diǎn)數(shù)為20。
2?結(jié)果
選取不同模型對蟹塘溶解氧質(zhì)量濃度進(jìn)行預(yù)測,各模型在測試集上的部分預(yù)測曲線和百分誤差分別如圖4、圖5所示。
從圖4可以看出,ARIMA模型在平滑區(qū)間的預(yù)測值與真實(shí)值曲線趨勢基本擬合,但整體在時(shí)間上具有一定的滯后性,且部分點(diǎn)的預(yù)測值和真實(shí)值存在較大誤差;LSTM模型相較于ARIMA模型減少了平均誤差,具有更好的擬合曲線,但是在低質(zhì)量濃度溶解氧的預(yù)測上普遍存在偏大的現(xiàn)象;而LDO-LSTM模型由于調(diào)整了在低溶解氧質(zhì)量濃度時(shí)的權(quán)重分配,因此在繼續(xù)保持了LSTM模型優(yōu)點(diǎn)的基礎(chǔ)上,還在低溶解氧質(zhì)量濃度的預(yù)測上有較好的表現(xiàn),但仍有部分時(shí)間段在時(shí)間上存在滯后性;PSO-LSTM模型相比較于其他模型在整體上曲線擬合和縮短時(shí)間滯后性上都得到了提升,預(yù)測值更貼近于真實(shí)值,說明PSO-LSTM模型比其他模型有更好的預(yù)測精度。
從圖5可以看出,ARIMA、LSTM和LDO-LSTM模型部分相鄰點(diǎn)的預(yù)測誤差會出現(xiàn)“跳崖”現(xiàn)象,波動(dòng)較大。而PSO-LSTM模型的預(yù)測誤差曲線更加平滑,誤差波動(dòng)較小,具有很好的穩(wěn)定性。
為了更加直觀地反映各模型的預(yù)測效果,選擇MSE、RMSE和MAPE 3個(gè)評價(jià)指標(biāo)對4種模型進(jìn)行評價(jià)(表3)。4種模型用于蟹塘溶解氧質(zhì)量濃度預(yù)測的精度從高到低依次為PSO-LSTM模型、LDO-LSTM模型、LSTM模型和ARIMA模型。其中,PSO-LSTM模型的MSE、RMSE、MAPE值分別是0.013、0.114、0.354,與ARIMA模型相比MSE、RMSE、MAPE值分別降低了0.035、0.106、0.308,與單一的LSTM模型相比MSE、RMSE、MAPE值分別降低了0.016、0.058、0.18,與LDO-LSTM模型相比MSE、RMSE、MAPE值分別降低了0.009、0.035、0.116??梢?,利用PSO進(jìn)行參數(shù)優(yōu)化后的LSTM模型在溶解氧質(zhì)量濃度預(yù)測上整體表現(xiàn)突出,預(yù)測值和真實(shí)值之間的偏差小,準(zhǔn)確性和穩(wěn)定性提升明顯。
為了進(jìn)一步比較不同模型在連續(xù)性預(yù)測中的表現(xiàn),選取測試集中未來連續(xù)10個(gè)時(shí)間點(diǎn)的預(yù)測值和真實(shí)值進(jìn)行比較分析,結(jié)果如表4所示??梢钥闯?,PSO-LSTM模型在測試集連續(xù)10個(gè)時(shí)間點(diǎn)中單值最大誤差為1.496%,而LDO-LSTM、LSTM和ARIMA模型的最大誤差分別為4.959%、3.140%,和7.245%。另外PSO-LSTM模型在10個(gè)采集點(diǎn)的平均絕對誤差為0.658%,相較于LDO-LSTM、LSTM和ARIMA等模型的誤差分別降低了2.550個(gè)百分點(diǎn)、1.891個(gè)百分點(diǎn)、4.055個(gè)百分點(diǎn),證明PSO-LSTM模型在連續(xù)性、長期性的蟹塘溶解氧質(zhì)量濃度預(yù)測方面具有很高的準(zhǔn)確性,對于溶解氧質(zhì)量濃度變化情況的提前預(yù)警和調(diào)控具有重要意義。
3?討論
本研究針對采集到的蟹塘水質(zhì)數(shù)據(jù)先進(jìn)行變量間皮爾遜相關(guān)性分析,確定影響溶解氧質(zhì)量濃度的主要變量,再結(jié)合目前主流的時(shí)間序列模型LSTM,利用粒子群優(yōu)化算法優(yōu)化LSTM模型的超參數(shù),根據(jù)優(yōu)化結(jié)果搭建PSO-LSTM模型研究蟹塘溶解氧質(zhì)量濃度變化規(guī)律。通過試驗(yàn)對比發(fā)現(xiàn):(1)對數(shù)據(jù)進(jìn)行相關(guān)性分析可以有效降低訓(xùn)練數(shù)據(jù)的維度,減少訓(xùn)練時(shí)間,提升預(yù)測精度。(2)LSTM網(wǎng)絡(luò)模型能較好地解決ARIMA模型在溶解氧質(zhì)量濃度預(yù)測中的滯后性問題,并且提高準(zhǔn)確性。(3)PSO-LSTM模型的精度較單一的LSTM有明顯提升,說明參數(shù)的優(yōu)化對模型預(yù)測精度具有較大影響。(4)相比于ARIMA、LSTM、LDO-LSTM模型,PSO-LSTM模型的預(yù)測值和真實(shí)值之間的偏差小,準(zhǔn)確性和穩(wěn)定性提升明顯,尤其是PSO-LSTM模型在未來一個(gè)時(shí)間點(diǎn)和多個(gè)時(shí)間點(diǎn)的預(yù)測精度優(yōu)于其他模型,能夠較好地應(yīng)用于蟹塘溶解氧質(zhì)量濃度的預(yù)警預(yù)報(bào)。
綜上所述,基于PSO-LSTM模型預(yù)測蟹塘溶解氧質(zhì)量濃度具有較好的預(yù)測精度,可以在蟹塘水質(zhì)預(yù)警、水質(zhì)環(huán)境監(jiān)測、溶解氧質(zhì)量濃度自動(dòng)精準(zhǔn)調(diào)控等方面發(fā)揮作用。但是在試驗(yàn)過程中僅考慮了水體內(nèi)部不同因子對溶解氧質(zhì)量濃度的影響,并沒有考慮氣壓、風(fēng)速等外在環(huán)境因素,在未來的實(shí)際應(yīng)用中需要對數(shù)據(jù)進(jìn)行更全面的整合與分析,進(jìn)一步提升預(yù)測的準(zhǔn)確性和穩(wěn)定性。
參考文獻(xiàn):
[1]?劉雙印,徐龍琴,李道亮,等. 基于蟻群優(yōu)化最小二乘支持向量回歸機(jī)的河蟹養(yǎng)殖溶解氧預(yù)測模型[J].農(nóng)業(yè)工程學(xué)報(bào),2012,28(23):167-175.
[2]?宦?娟,劉星橋. 基于K-means聚類和ELM神經(jīng)網(wǎng)絡(luò)的養(yǎng)殖水質(zhì)溶解氧預(yù)測[J].農(nóng)業(yè)工程學(xué)報(bào),2016,32(17):174-181.
[3]?KHAN V C. Comparing A Bayesian and fuzzy number approach to uncertainty quantification in short-term dissolved oxygen prediction[J]. Journal of Environmental Informatics, 2017, 30(1):1-16.
[4]?吳慧英,楊日劍,張?穎,等. 基于PCA-SVR的池塘DO預(yù)測模型[J].安徽大學(xué)學(xué)報(bào)(自然科學(xué)版),2016,40(6):103-108.
[5]?BENGIO Y, SIMARD P, FRASCONI P. Learning long-term dependencies with gradient descent is difficult[J]. IEEE Transactions on Neural Networks, 1994, 5(2): 157-166.
[6]?楊?麗,吳雨茜,王俊麗,等. 循環(huán)神經(jīng)網(wǎng)絡(luò)研究綜述[J].計(jì)算機(jī)應(yīng)用,2018,38(S2):1-6,26.
[7]?HOCHREITER S, SCHMIDHUBER J. Long short-term memory[J]. Neural Computation, 1997, 9(8): 1735-1780.
[8]?溫惠英,張東冉,陸思園. GA-LSTM模型在高速公路交通流預(yù)測中的應(yīng)用[J].哈爾濱工業(yè)大學(xué)學(xué)報(bào),2019,51(9):81-87,95.
[9]?白盛楠,申曉留. 基于LSTM循環(huán)神經(jīng)網(wǎng)絡(luò)的PM_(2.5)預(yù)測[J].計(jì)算機(jī)應(yīng)用與軟件,2019,36(1):67-70,104.
[10]魏昱洲,許西寧. 基于LSTM長短期記憶網(wǎng)絡(luò)的超短期風(fēng)速預(yù)測[J].電子測量與儀器學(xué)報(bào),2019,33(2):64-71.
[11]LIU S Y, XU L Q, LI D L. Prediction of dissolved oxygen content in river crab culture based on least squares support vector regression optimized by improved particle swarm optimization[J]. Computers and Electronics in Agriculture, 2013, 95:82-91.
[12]TA X X, WEI Y G. Research on a dissolved oxygen prediction method for recirculating aquaculture systems based on a convolution neural network[J]. Computers and Electronics in Agriculture, 2018, 145: 302-310.
[13]LIU Y Q,ZHANG Q,SONG L H. Attention-based recurrent neural networks for accurate short-term and long-term dissolved oxygen prediction[J]. Computers and Electronics in Agriculture,2019,165:1-11.
[14]朱南陽,吳?昊,尹達(dá)恒,等. 基于長短時(shí)記憶網(wǎng)絡(luò)(LSTM)的蟹塘溶解氧估算優(yōu)化方法[J].智慧農(nóng)業(yè),2019,1(3):67-76.
[15]陳英義,程倩倩,方曉敏,等. 主成分分析和長短時(shí)記憶神經(jīng)網(wǎng)絡(luò)預(yù)測水產(chǎn)養(yǎng)殖水體溶解氧[J].農(nóng)業(yè)工程學(xué)報(bào),2018,34(17):183-191.
[16]楊孟達(dá). 基于改進(jìn)PSO-LSTM神經(jīng)網(wǎng)絡(luò)的氣溫預(yù)測[J].現(xiàn)代信息科技,2020,4(4):110-112.
[17]劉可真,茍家萁,駱?釗,等. 基于PSO-LSTM模型的變壓器油中溶解氣體濃度預(yù)測方法[J]. 電網(wǎng)技術(shù),2020,44(7):2778-2785.
[18]李?萬,馮芬玲,蔣琦瑋. 改進(jìn)粒子群算法優(yōu)化LSTM神經(jīng)網(wǎng)絡(luò)的鐵路客運(yùn)量預(yù)測[J].鐵道科學(xué)與工程學(xué)報(bào),2018,15(12):3274-3280.
[19]宋?剛,張?jiān)品澹紕?,? 基于粒子群優(yōu)化LSTM的股票預(yù)測模型[J].北京航空航天大學(xué)學(xué)報(bào),2019,45(12):2533-2542.
[20]李愛國,覃?征,鮑復(fù)民,等. 粒子群優(yōu)化算法[J].計(jì)算機(jī)工程與應(yīng)用,2002(21):1-3,17.
(責(zé)任編輯:張震林)