汪靖陽(yáng),郄志紅,吳天齊,劉家樹(shù),王 晨,王曉麗,張?jiān)鲁?/p>
(1.河北農(nóng)業(yè)大學(xué) 城鄉(xiāng)建設(shè)學(xué)院,河北 保定 071001;2.國(guó)網(wǎng)北京市電力公司豐臺(tái)供電公司,北京100000;3.河北省水利水電第二勘測(cè)設(shè)計(jì)研究院,河北 石家莊 050000;4.河北省節(jié)水灌溉裝備產(chǎn)業(yè)技術(shù)研究院,河北 石家莊 050000;5.河北農(nóng)業(yè)大學(xué) 農(nóng)學(xué)院,河北 保定 071001)
適宜的土壤溫度是作物生長(zhǎng)發(fā)育的重要環(huán)境因素,在作物全生育期都起著關(guān)鍵作用。為此,土壤溫度在現(xiàn)代土壤系統(tǒng)分類(lèi)中往往作為土壤診斷的重要特性之一[1]。在農(nóng)田灌溉工作中,土壤溫度影響著作物的生長(zhǎng)發(fā)育。比如作物在其生長(zhǎng)關(guān)鍵期短期強(qiáng)低溫會(huì)導(dǎo)致其生長(zhǎng)受到抑制[2-4]。因此,研究土壤溫度的預(yù)測(cè)模型對(duì)農(nóng)業(yè)生產(chǎn)具有重要意義。
土壤溫度的預(yù)測(cè)模型基本上可分為機(jī)理模型和經(jīng)驗(yàn)?zāi)P?。機(jī)理模型,也稱(chēng)“確定性模型”,主要是1種基于土壤溫度變化的平衡方程而建立的數(shù)學(xué)模型,但由于其數(shù)學(xué)表達(dá)式的建立較為困難,所需的參數(shù)較多而且確定困難,在實(shí)際應(yīng)用中難以推廣。經(jīng)驗(yàn)?zāi)P停卜Q(chēng)“不確定性模型”,包括線(xiàn)性回歸模型、神經(jīng)網(wǎng)絡(luò)模型等。相較于機(jī)理模型,經(jīng)驗(yàn)?zāi)P徒⒑?jiǎn)單,且參數(shù)少,因此近十幾年來(lái),在國(guó)內(nèi)外已得到了廣泛應(yīng)用。鄒平和楊勁松等[5]利用BP神經(jīng)網(wǎng)絡(luò)模型對(duì)長(zhǎng)期定位監(jiān)測(cè)點(diǎn)表層土壤溫度時(shí)間序列數(shù)據(jù)進(jìn)行了分析和預(yù)測(cè)取得了良好的效果;Saeed Samadianfard[6]等將小波神經(jīng)網(wǎng)絡(luò)模型、基因表達(dá)式編程和人工神經(jīng)網(wǎng)絡(luò)模型3種模型進(jìn)行對(duì)比,分別對(duì)土壤溫度進(jìn)行了預(yù)測(cè)。劉家樹(shù)[7]采用LSTM神經(jīng)網(wǎng)絡(luò)模型對(duì)土壤溫度時(shí)間序列分析,取得了良好的效果
RNN由BP神經(jīng)網(wǎng)絡(luò)改進(jìn)而來(lái),在BP神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上,將隱藏層內(nèi)的神經(jīng)元之間進(jìn)行了連接,使RNN網(wǎng)絡(luò)會(huì)記憶以往輸入的信息并應(yīng)用于當(dāng)前輸出的計(jì)算中,增強(qiáng)了神經(jīng)網(wǎng)絡(luò)對(duì)時(shí)間序列數(shù)據(jù)的訓(xùn)練效果。RNN網(wǎng)絡(luò)近年來(lái)在處理時(shí)間序列數(shù)據(jù)的應(yīng)用中取得了一定成果,但其在應(yīng)用時(shí)仍存在梯度消失和梯度爆炸問(wèn)題[8-10]。1997年,Hochreiter等[10]首次提出了LSTM神經(jīng)網(wǎng)絡(luò),并在長(zhǎng)期的應(yīng)用實(shí)踐中發(fā)現(xiàn)LSTM神經(jīng)網(wǎng)絡(luò)比RNN泛化能力更強(qiáng)[11-14]。
為了便于分析土壤溫度數(shù)據(jù)和指導(dǎo)農(nóng)田灌溉,常選擇土壤的時(shí)均和日均溫度數(shù)據(jù)來(lái)表示數(shù)據(jù)特征:土壤時(shí)均溫度數(shù)據(jù)能夠獲得日內(nèi)土壤溫度變化情況和日最低溫度,用于描述作物寒害強(qiáng)度,對(duì)防控作物寒害具有指導(dǎo)作用[15];土壤日均溫度數(shù)據(jù)能夠反應(yīng)作物在生育期內(nèi)受到的低溫冷害情況,對(duì)指導(dǎo)灌水施肥具有重要意義[16]。
本研究的試驗(yàn)地點(diǎn)位于河北省石家莊市藁城區(qū),地處太行山東麓河北平原中南部,坐標(biāo)北緯37°51′~ 38°18′、東經(jīng) 114°39′~ 114°59′[17]。藁城區(qū)氣候?yàn)榕瘻貛О霛駶?rùn)大陸性季風(fēng)氣候。全年的年平均氣溫為12.8 ℃,其中1月和7月分別為全年最冷和最熱的時(shí)間,其當(dāng)月平均氣溫為-3.5 ℃和26.4℃。藁城區(qū)全年平均降水量為494 mm[16]。
在不同深度下的土壤內(nèi)布置土壤溫度傳感器,并與數(shù)據(jù)采集器相連。數(shù)據(jù)采集器每1 h采集1次溫度數(shù)據(jù)并保存。本研究選擇藁城區(qū)2017年到2020年間10~30 cm深度處的數(shù)據(jù)作為本試驗(yàn)的原始數(shù)據(jù),共計(jì)34 430條。首先對(duì)原始數(shù)據(jù)進(jìn)行降采樣操作,將原數(shù)據(jù)聚合為不同深度的每日平均土壤溫度數(shù)據(jù),共計(jì)991條,并建立日均土壤溫度預(yù)測(cè)模型;然后直接選取2019年5月初至6月底各土層的溫度數(shù)據(jù)建立基于LSTM神經(jīng)網(wǎng)絡(luò)的時(shí)均土壤溫度模型。本研究選擇上述時(shí)間段的數(shù)據(jù)建立時(shí)均土壤溫度模型是由于該時(shí)段內(nèi)試驗(yàn)區(qū)域的溫度較接近,更容易建立模型。
LSTM神經(jīng)網(wǎng)絡(luò)是RNN的擴(kuò)展,相較于RNN可以使自循環(huán)的權(quán)重視上下文而定,通過(guò)細(xì)胞狀態(tài)將信息向后傳播,這個(gè)傳播的過(guò)程也稱(chēng)記憶。如圖1所示,LSTM神經(jīng)網(wǎng)絡(luò)具有不同的結(jié)構(gòu),有4個(gè)以特殊方式相互影響的神經(jīng)網(wǎng)絡(luò)層。通過(guò)門(mén)結(jié)構(gòu)對(duì)網(wǎng)絡(luò)增刪信息,通常由1個(gè)Sigmoid神經(jīng)網(wǎng)絡(luò)層和逐點(diǎn)乘積操作組成[18-20]。
圖1 LSTM神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)Fig.1 The LSTM neural network structure
(1)遺忘門(mén)f(t)
遺忘門(mén)決定在細(xì)胞傳遞信息的過(guò)程中對(duì)信息的取舍,由下式表示:
(2)輸入門(mén)g(t)
輸入門(mén)決定向細(xì)胞狀態(tài)中添加新的信息,由下式表示:
(3)輸出門(mén)q(t)
輸出門(mén)決定了當(dāng)前時(shí)刻的最終輸出,由下式表示:
其中b,U和W分別是LSTM細(xì)胞中的偏置、輸入權(quán)重和遺忘門(mén)的循環(huán)權(quán)重,σ表示Sigmod激活函數(shù),hj(t-1)和xj(t)分別表示由上一時(shí)間序列輸出的土壤溫度和當(dāng)前時(shí)間序列輸入的土壤溫度。
從圖2可以看出,10、20 cm和30 cm的土壤溫度的變化規(guī)律相似,即在每年的2月至7月總體呈上升趨勢(shì),8月至次年2月總體呈下降趨勢(shì)。當(dāng)圖2中的土壤溫度呈上升趨勢(shì)時(shí),深層土壤溫度通常低于淺層土壤溫度;反之,當(dāng)土壤溫度呈下降趨勢(shì)時(shí),深層土壤溫度通常高于淺層土壤溫度。這可能是由于與深層土壤相比,淺層土壤溫度受到大氣溫度等外界因素的影響更直接造成的。
圖2 距地表10~30 cm處時(shí)均土壤溫度時(shí)間序列Fig. 2 Time series of average edaphic temperature at 10 ~ 30 cm from the surface
由圖3可知,距地表10 cm和20 cm的土壤日內(nèi)溫度變化劇烈,距地表30 cm表層土壤日內(nèi)溫度変化相對(duì)平穩(wěn),淺層土壤溫度主要受太陽(yáng)輻射強(qiáng)度、日照時(shí)長(zhǎng)、風(fēng)速、和大氣溫度等影響。
圖3 距地表10~30 cm處日均土壤溫度時(shí)間序列Fig. 3 Time series of average daily edaphic temperature at 10 ~ 30 cm from the surface
將本研究獲取的土壤溫度時(shí)間序列數(shù)據(jù)降采樣,總計(jì)991個(gè),為了檢驗(yàn)日均土壤溫度預(yù)測(cè)模型的效果,將原始數(shù)據(jù)劃分為訓(xùn)練集和測(cè)試集兩部分:即2017年至2019年的土壤溫度數(shù)據(jù)作為訓(xùn)練集,共計(jì)725個(gè),而2019年7月至2020年2月的土壤溫度數(shù)據(jù)為檢驗(yàn)?zāi)P托Ч臏y(cè)試集,共計(jì)266個(gè)。
將原始數(shù)據(jù)集的2019年5、6月份的數(shù)據(jù)集,以同樣的方式劃分為訓(xùn)練集和測(cè)試集:即2019年5月至6月中旬?dāng)?shù)據(jù)作為訓(xùn)練集,共1 110個(gè),剩余342個(gè)數(shù)據(jù)為檢驗(yàn)?zāi)P托Ч臏y(cè)試集。在建立土壤溫度預(yù)測(cè)模型前先對(duì)土壤溫度原始數(shù)據(jù)進(jìn)行歸一化[22]。
神經(jīng)網(wǎng)絡(luò)輸入層和輸出層神經(jīng)元個(gè)數(shù)由輸入樣本和目標(biāo)樣本維數(shù)確定,而隱含層神經(jīng)元個(gè)數(shù)的確定沒(méi)有固定的規(guī)范,相關(guān)研究常常采用試湊法確定,因此,本研究分別選擇60和80作為2個(gè)隱藏層的神經(jīng)元數(shù)目。
延遲坐標(biāo)維數(shù)是確定時(shí)間序列模型輸入樣本和輸出樣本個(gè)數(shù)的重要參數(shù),其大小主要由時(shí)間序列數(shù)據(jù)的特征和模型決定[5]。本研究采取試湊法來(lái)確定模型的延遲坐標(biāo)維數(shù):假定延遲坐標(biāo)維數(shù)的步長(zhǎng)和取值范圍,先選擇取值范圍的最小值再依次遞增,得到不同延遲坐標(biāo)維數(shù)的樣本預(yù)測(cè)值與真實(shí)值的均方根誤差(RMSE),最后取均方根誤差(RMSE)最小時(shí)的作為模型最優(yōu)的延遲坐標(biāo)維數(shù)。
根據(jù)圖2可知,10~30 cm的土壤溫度時(shí)間序列數(shù)據(jù)變化趨勢(shì)相似,可以采用相同的LSTM神經(jīng)網(wǎng)絡(luò)模型。運(yùn)用試湊法確定模型參數(shù),以距地表20 cm的土壤溫度數(shù)據(jù)為例:設(shè)置延遲坐標(biāo)維數(shù)的最小值為3,最大值取21,步長(zhǎng)為1,逐步遞增,經(jīng)LSTM神經(jīng)網(wǎng)絡(luò)對(duì)20 cm的土壤溫度數(shù)據(jù)訓(xùn)練后,得到模擬值與實(shí)測(cè)值均方根誤差。由圖4可知,隨著增加,先增大后逐漸趨于平穩(wěn),當(dāng)時(shí)其對(duì)應(yīng)的最小,因此確定,輸入層神經(jīng)元的數(shù)目設(shè)為2。因此本研究LSTM神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)為2-60-80-1,如圖5所示。
圖4 不同延遲坐標(biāo)條件下日均土壤溫度預(yù)測(cè)模型的均方根誤差Fig. 4 Root mean square error (RMSE) of daily mean edaphic temperature prediction model under different delay coordinate conditions
圖5 基于LSTM神經(jīng)網(wǎng)絡(luò)的日均土壤溫度預(yù)測(cè)模型結(jié)構(gòu)Fig. 5 Structure of daily mean edaphic temperature prediction model based on LSTM neural network
該建立過(guò)程與日均土壤溫度預(yù)測(cè)模型相似:如圖6所示,通過(guò)試湊法得到最優(yōu)的延遲坐標(biāo)維數(shù)為3,建立基于LSTM神經(jīng)網(wǎng)絡(luò)的時(shí)均溫度預(yù)測(cè)模型,結(jié)構(gòu)為2-60-80-1,結(jié)構(gòu)同圖5所示。
圖6 不同延遲坐標(biāo)條件下時(shí)均土壤溫度預(yù)測(cè)模型的均方根誤差Fig. 6 Root mean square error (RMSE) of time-mean edaphic temperature prediction model under different delay coordinates conditions
使用10、20和30 cm的各土層溫度數(shù)據(jù)對(duì)上述基于LSTM神經(jīng)網(wǎng)絡(luò)的日均土壤溫度預(yù)測(cè)模型進(jìn)行訓(xùn)練,并設(shè)定網(wǎng)絡(luò)性能函數(shù)為均方誤差。以2019年6月至次年2月的259個(gè)10、20和30 cm的各土層溫度數(shù)據(jù)作為測(cè)試樣本,經(jīng)模型預(yù)測(cè)之后,獲得如圖7所示各土層溫度預(yù)測(cè)值與實(shí)測(cè)值的對(duì)比圖示以及表1中LSTM模型評(píng)價(jià)指標(biāo)。
圖7 10~30 cm處日均土壤溫度的預(yù)測(cè)值與實(shí)測(cè)值Fig. 7 Predicted and measured daily mean edaphic temperature at 10 ~ 30 cm
表1 不同深度條件下LSTM神經(jīng)網(wǎng)絡(luò)的時(shí)均土壤溫度預(yù)測(cè)模型的評(píng)價(jià)指標(biāo)Table 1 Evaluation index of hour-average edaphic temperature prediction model based on LSTM neural network under different depth conditions
如圖7所示,經(jīng)訓(xùn)練后模型的預(yù)測(cè)值與實(shí)測(cè)值在趨勢(shì)上吻合程度較高,且由表1可知,在處理日均土壤溫度時(shí)間序列數(shù)據(jù)時(shí),該模型擬合效果較好,特別是預(yù)測(cè)30 cm處土壤溫度時(shí)間序列時(shí),其決定系數(shù)達(dá)到0.997,均方根誤差達(dá)到0.600,均方誤差達(dá)到0.360,由此證明與10 cm和20 cm處日均土壤溫度時(shí)間序列數(shù)據(jù)相比,30 cm處日均土壤溫度時(shí)間序列數(shù)據(jù)更適合該模型應(yīng)用。這說(shuō)明將LSTM神經(jīng)網(wǎng)絡(luò)應(yīng)用到日均土壤溫度時(shí)間序列預(yù)測(cè)中具有一定可行性。
使用10、20和30 cm的各土層溫度數(shù)據(jù)對(duì)上述基于LSTM神經(jīng)網(wǎng)絡(luò)的時(shí)均土壤溫度預(yù)測(cè)模型進(jìn)行訓(xùn)練,并設(shè)定網(wǎng)絡(luò)性能函數(shù)為MSE。以2019年6月份數(shù)據(jù)作為檢驗(yàn)LSTM神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)能力的測(cè)試樣本,得到如圖8所示各土層溫度預(yù)測(cè)值與實(shí)測(cè)值的對(duì)比圖示。
可以看出經(jīng)訓(xùn)練后模型的預(yù)測(cè)值與實(shí)測(cè)值在趨勢(shì)上吻合程度較高,且由表2可知,該模型的決定系數(shù)較高,對(duì)10~30 cm的時(shí)均土壤溫度時(shí)間序列數(shù)據(jù)擬合效果較好,說(shuō)明該模型用于土壤的時(shí)均溫度預(yù)測(cè)具有一定的實(shí)用性。但在個(gè)別時(shí)間模型模擬結(jié)果有所偏差,如在當(dāng)天13至14時(shí),該模型的預(yù)測(cè)值常常會(huì)低于實(shí)測(cè)值0.2~0.3 ℃。
圖8 10~30 cm處時(shí)均土壤溫度的預(yù)測(cè)值與實(shí)測(cè)值Fig.8 Predicted and measured values of edaphic temperature at 10 ~ 30 cm
表2 不同深度條件下LSTM神經(jīng)網(wǎng)絡(luò)的時(shí)均土壤溫度預(yù)測(cè)模型的評(píng)價(jià)指標(biāo)Table 2 The estimate indicator of hour-average edaphic temperature predictied model based on LSTM neural network under different depth conditions
相關(guān)研究表明,BP神經(jīng)網(wǎng)絡(luò)模型——誤差反向傳播多層前向反饋神經(jīng)網(wǎng)絡(luò)在土壤溫度時(shí)間序列預(yù)測(cè)方面已經(jīng)表現(xiàn)出較好的效果[5]。為進(jìn)一步驗(yàn)證LSTM神經(jīng)網(wǎng)絡(luò)模型在土壤溫度時(shí)間序列預(yù)測(cè)方面的優(yōu)勢(shì),本研究應(yīng)用BP神經(jīng)網(wǎng)絡(luò)模型再對(duì)原始數(shù)據(jù)進(jìn)行擬合,并將求解結(jié)果與LSTM神經(jīng)網(wǎng)絡(luò)模型的求解結(jié)果進(jìn)行對(duì)比分析。本研究采用的BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)參考文獻(xiàn)[5],采用3-3-1結(jié)構(gòu)。
通過(guò)求解結(jié)果的均方誤差(MSE)、均方根誤差(RMSE)和決定系數(shù)(R2)等模型評(píng)價(jià)指標(biāo),對(duì)2種土壤溫度時(shí)間序列預(yù)測(cè)模型的優(yōu)劣進(jìn)行討論,鑒于數(shù)據(jù)種類(lèi)較多,不失代表性地,使用對(duì)10、20和30 cm的3個(gè)土層數(shù)據(jù)模型計(jì)算結(jié)果的均方根誤差(RMSE)的平均值作為判定2種模型優(yōu)劣判定的標(biāo)準(zhǔn),模型分析結(jié)果如圖9所示。
圖9 LSTM神經(jīng)網(wǎng)絡(luò)與BP神經(jīng)網(wǎng)絡(luò)對(duì)10~30 cm處土壤溫度時(shí)間序列的平均均方根誤差Fig. 9 Average root mean square error of LSTM neural network and BP neural network for soil temperature time series at 10 ~ 30 cm
在擬合日均土壤溫度數(shù)據(jù)時(shí),LSTM神經(jīng)網(wǎng)絡(luò)模型較之BP神經(jīng)網(wǎng)絡(luò)模型,均方根誤差(RMSE)平均降低0.038;在預(yù)測(cè)時(shí)均土壤溫度數(shù)據(jù)時(shí),LSTM神經(jīng)網(wǎng)絡(luò)模型較之BP神經(jīng)網(wǎng)絡(luò)模型,均方根誤差(RMSE)平均降低0.068。結(jié)果表明,相較于BP神經(jīng)網(wǎng)絡(luò)模型LSTM神經(jīng)網(wǎng)絡(luò)模型用于本試驗(yàn)區(qū)域的土壤溫度時(shí)間序列預(yù)測(cè)具有更高的評(píng)價(jià)精確度。
試驗(yàn)結(jié)果表明,由LSTM神經(jīng)網(wǎng)絡(luò)建立的土壤溫度預(yù)測(cè)模型其模擬效果能夠達(dá)到土壤溫度日常預(yù)報(bào)的基本標(biāo)準(zhǔn),對(duì)日均土壤溫度預(yù)測(cè)和時(shí)均土壤溫度預(yù)測(cè)均能達(dá)到較高的準(zhǔn)確度,且相較于BP神經(jīng)網(wǎng)絡(luò)模型在土壤溫度時(shí)間序列預(yù)測(cè)上亦具備一定優(yōu)勢(shì)。此外,該模型對(duì)不同深度的土壤溫度數(shù)據(jù)的預(yù)測(cè)效果也不盡相同:相較于距地表10 cm和20 cm的土壤溫度數(shù)據(jù),基于LSTM神經(jīng)網(wǎng)絡(luò)的日均土壤溫度預(yù)測(cè)模型對(duì)距地表30 cm的土壤溫度時(shí)間序列數(shù)據(jù)的預(yù)測(cè)效果更好,并且模型的RMSE、MSE和R2均優(yōu)于使用其他深度的土壤溫度數(shù)據(jù)訓(xùn)練的LSTM神經(jīng)網(wǎng)絡(luò)模型。LSTM神經(jīng)網(wǎng)絡(luò)模型對(duì)土壤溫度時(shí)間序列預(yù)測(cè)時(shí),不需要建立復(fù)雜的數(shù)學(xué)模型,應(yīng)用簡(jiǎn)單,參數(shù)少,方法簡(jiǎn)單、快捷、實(shí)用。