李偉,匡昌武,胡欣欣
(1.海南省氣象探測(cè)中心,???570203;2.海南省南海氣象防災(zāi)減災(zāi)重點(diǎn)實(shí)驗(yàn)室,???570203)
水是一切生命賴以生存的重要自然資源之一,對(duì)土壤-植物-大氣連續(xù)系統(tǒng)起到紐帶作用。土壤水分是地球表層不同圈層互相影響的關(guān)鍵因素,為地表物質(zhì)循環(huán)和能量轉(zhuǎn)換提供載體和驅(qū)動(dòng)力。土壤水分含量會(huì)影響到植物或土壤中微生物的生長(zhǎng),是陸地生態(tài)系統(tǒng)的重要控制因子,還與生活環(huán)境和經(jīng)濟(jì)發(fā)展相關(guān)[1-3]。土壤水分含量和變化受土壤特性、地形、氣象因子等環(huán)境因素的影響[4]。目前,監(jiān)測(cè)土壤水分?jǐn)?shù)據(jù)主要依靠地面專用儀器和衛(wèi)星遙感反演2 種方法。地面專用儀器監(jiān)測(cè)法主要采用時(shí)域反射型儀器(TDR)、電阻儀器、中子水分儀等儀器設(shè)備來(lái)檢測(cè)土壤中水分含量。該方法具有精度高、性能穩(wěn)定、環(huán)境影響較小的優(yōu)點(diǎn),但是費(fèi)用較高,難以滿足觀測(cè)數(shù)據(jù)高時(shí)空分辨率的要求。衛(wèi)星遙感反演法有基于土壤熱慣量、基于溫度和植被、基于微波遙感等檢測(cè)方法,具有監(jiān)測(cè)范圍廣、強(qiáng)動(dòng)態(tài)、高時(shí)效等優(yōu)點(diǎn),但該方法僅能監(jiān)測(cè)到地表范圍內(nèi),同時(shí),遙感反演方法前期需要大量準(zhǔn)確、可靠的地面觀測(cè)數(shù)據(jù)建立模型。然而,國(guó)內(nèi)現(xiàn)有土壤水分實(shí)測(cè)數(shù)據(jù)的時(shí)間序列較短,大多以農(nóng)業(yè)旬報(bào)為主,存在一定的數(shù)據(jù)缺測(cè)率[5,6]。因此,提升土壤水分?jǐn)?shù)據(jù)的完整性和延長(zhǎng)時(shí)序是當(dāng)前重點(diǎn)研究工作。土壤水分預(yù)測(cè)方法主要分為數(shù)值模型預(yù)測(cè)和機(jī)器學(xué)習(xí)法兩類。數(shù)值模型預(yù)測(cè)可分為基于物理機(jī)制的模型和基于土壤水分平衡方程的模型等2 類方法,該方法輸入量多、模型結(jié)構(gòu)復(fù)雜、計(jì)算量冗余,預(yù)測(cè)的結(jié)果差異性大[7]。以氣象、土壤要素為輸入量的機(jī)器學(xué)習(xí)方法具有操作簡(jiǎn)單、自適應(yīng)性學(xué)習(xí)和擬合能力強(qiáng)的特點(diǎn),目前廣泛應(yīng)用于土壤水分?jǐn)?shù)據(jù)監(jiān)測(cè)和預(yù)報(bào)研究中。由于受到多種自然環(huán)境因素的影響,土壤水分?jǐn)?shù)據(jù)變化規(guī)律復(fù)雜,受到干旱、暴雨、寒冷等天氣過(guò)程的影響呈季節(jié)性變化趨勢(shì),也會(huì)受到土壤微生物等環(huán)境影響呈隨機(jī)變化趨勢(shì)?;谏窠?jīng)網(wǎng)絡(luò)的土壤水分預(yù)測(cè)方法,具有較高的準(zhǔn)確率,能實(shí)現(xiàn)精準(zhǔn)把握土壤墑情,科學(xué)灌溉農(nóng)作物,對(duì)最終實(shí)現(xiàn)農(nóng)業(yè)高產(chǎn)具有重要意義[8,9]。
1.1.1 RF 特征選擇 隨機(jī)森林(Random forest)是利用多棵樹對(duì)樣本進(jìn)行訓(xùn)練并預(yù)測(cè)的一種分類器[10]。隨機(jī)森林是一種靈活且易于使用的機(jī)器學(xué)習(xí)算法,即使沒有超參數(shù)調(diào)優(yōu),也可以在大多數(shù)情況下得到很好的結(jié)果,既可用于分類,也能用于回歸任務(wù)。本研究在隨機(jī)森林算法的基礎(chǔ)上,利用RF 特征選擇中的平均不純度減少方法(Mean decrease impurity)對(duì)影響土壤水分的各種因素進(jìn)行關(guān)聯(lián)性分析[11]。
RF 算法生成決策樹步驟如下[12]:
1)對(duì)所有影響因素進(jìn)行遍歷并計(jì)算均方誤差,統(tǒng)計(jì)可能出現(xiàn)的分類情況。選擇均方誤差最小的分割點(diǎn)s和最優(yōu)切分變量j。均方差和目標(biāo)函數(shù)可以表示為:
式中,c1、c2表示2 樣本集合R1、R2的平均輸出值,yi為第i個(gè)樣本的輸出值。
2)用選定的(j,s)劃分樣本集合,并求得相應(yīng)的輸出值。根據(jù)分割點(diǎn)s分割形成的樣本集合R1和R2為:
樣本集合Rm的輸出值cm的計(jì)算公式為:
式中,Nm為樣本集合Rm的總樣本數(shù)。
3)重復(fù)步驟1 和步驟2,將輸入空間劃分為m個(gè)區(qū)域,R1,R2,…,Rm,直至樣本集合滿足終止條件。
4)生成決策樹:
式中,I(x)為指示函數(shù)。
1.1.2 長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò) 循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent neutral network,RNN)能挖掘并分析數(shù)據(jù)中的時(shí)序信息[13]。RNN 的神經(jīng)單元僅由權(quán)重矩陣w、偏置b和激活函數(shù)組成,且每個(gè)時(shí)間片都共享相同的參數(shù),圖1 為循環(huán)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。隨著循環(huán)神經(jīng)網(wǎng)絡(luò)訓(xùn)練時(shí)長(zhǎng)和網(wǎng)絡(luò)層數(shù)的增多,很容易出現(xiàn)長(zhǎng)期依賴、梯度消失和梯度爆炸等問(wèn)題,從而無(wú)法有效地處理較長(zhǎng)序列數(shù)據(jù)信息。
圖1 循環(huán)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)(Long short-term memory network,LSTM)是具有長(zhǎng)期記憶能力的一種時(shí)間遞歸神經(jīng)網(wǎng)絡(luò),引入門機(jī)制用于控制信息的流通與丟失,有效解決長(zhǎng)期依賴、梯度消失和爆炸問(wèn)題[14]。LSTM 廣泛應(yīng)用在機(jī)器翻譯、語(yǔ)音識(shí)別等領(lǐng)域[15]。LSTM 核心思想是記憶塊,主要包含1 個(gè)記憶單元和3 個(gè)門(遺忘門、輸入門、輸出門),圖2 為L(zhǎng)STM 模型結(jié)構(gòu)。
1.1.3 雙向LSTM 神經(jīng)網(wǎng)絡(luò) 雙向長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)(Bidirectional long short-term memory network,BiLSTM)是傳統(tǒng)LSTM 的擴(kuò)展,其思想是將同一個(gè)輸入序列分別接入向前和先后的2 個(gè)LSTM中,然后將2 個(gè)網(wǎng)絡(luò)的隱含層連在一起,共同接入到輸出層進(jìn)行預(yù)測(cè),BiLSTM 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)見圖3[16]。在訓(xùn)練過(guò)程中,通過(guò)對(duì)輸出神經(jīng)元的正向和反向傳播來(lái)更新LSTM 網(wǎng)絡(luò)的權(quán)值。前一時(shí)刻狀態(tài)的輸入和隱含層輸出分別用xt-1和ht-1表示,當(dāng)前狀態(tài)的輸入和隱含層的輸出分別用xt和ht表示,后一時(shí)刻狀態(tài)的輸入和隱含層的輸出分別用xt-1和ht-1表示(圖3)。
圖3 BiLSTM 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
1.2.1 隨機(jī)森林選擇特征 為避免輸入過(guò)多變量導(dǎo)致數(shù)據(jù)冗余,本研究通過(guò)隨機(jī)森林方法對(duì)樣本數(shù)據(jù)進(jìn)行特征的重要性度量,挑選出在土壤水分預(yù)測(cè)過(guò)程中關(guān)聯(lián)性較強(qiáng)的影響因素,具體步驟如下[17]:
1)隨機(jī)森林算法在每次建立決策樹時(shí),對(duì)訓(xùn)練集采取隨機(jī)且有放回地抽取操作,這類數(shù)據(jù)稱為袋外數(shù)據(jù)(OOB),利用袋外數(shù)據(jù)計(jì)算模型的預(yù)測(cè)錯(cuò)誤率,稱為袋外數(shù)據(jù)誤差,記為errOOB1;
2)隨機(jī)對(duì)袋外數(shù)據(jù)所有樣本特征X加入噪聲干擾,再次計(jì)算袋外數(shù)據(jù)誤差,記為errOOB2;
3)假設(shè)隨機(jī)森林中有N棵樹,則計(jì)算影響因素X的重要性度量公式為:
4)計(jì)算每個(gè)影響因素X的重要性W,按照降序進(jìn)行排序,確定前m個(gè)影響因素為神經(jīng)網(wǎng)絡(luò)輸入數(shù)據(jù)集的特征。
圖4 表示使用隨機(jī)森林在土壤水分預(yù)測(cè)過(guò)程中進(jìn)行特征變量重要性度量的結(jié)果。由圖4 可知,在土壤水分預(yù)測(cè)度量特征重要性的過(guò)程中,氣溫、地面溫度、10 cm 地溫、相對(duì)濕度、降水量、日照時(shí)數(shù)、蒸發(fā)量7 種氣象因子與土壤水分的關(guān)聯(lián)性在所有特征中相對(duì)更重要,所以輸入變量由上述7 種氣象因子組成,輸入樣本數(shù)據(jù)集由輸入變量的特征集組成。
圖4 隨機(jī)森林選擇特征結(jié)果
1.2.2 模型構(gòu)建流程 基于隨機(jī)森林的雙向長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)(RF-BiLSTM)土壤水分預(yù)測(cè)模型結(jié)構(gòu)如圖5 所示[18-20]。首先,對(duì)樣本數(shù)據(jù)進(jìn)行歸一化和補(bǔ)充缺失數(shù)據(jù)等預(yù)處理工作;其次,使用RF 算法對(duì)土壤水分和土壤水分氣象影響因素進(jìn)行關(guān)聯(lián)度分析,選出與土壤水分關(guān)聯(lián)度較高的特征,從而提升模型的訓(xùn)練速度和準(zhǔn)確性;再次,搭建雙向LSTM 神經(jīng)網(wǎng)絡(luò),在特征數(shù)據(jù)集上訓(xùn)練預(yù)測(cè)模型;最后,再根據(jù)設(shè)置的評(píng)估指標(biāo)選取最佳預(yù)測(cè)模型,得到更精確的土壤水分預(yù)測(cè)值。
圖5 RF-BiLSTM 土壤水分預(yù)測(cè)模型結(jié)構(gòu)
本研究選取三亞國(guó)家氣候觀象臺(tái)近6 年(2016—2021 年)小時(shí)觀測(cè)數(shù)據(jù)作為樣本數(shù)據(jù)集,氣象站觀測(cè)變量包括氣溫、地面溫度、5 cm 地溫、10 cm 地溫、15 cm 地溫、20 cm 地溫、蒸發(fā)量、降水量、日照時(shí)數(shù)、相對(duì)濕度等15 種指標(biāo),土壤水分站觀測(cè)變量為10 cm 深度的土壤體積含水量數(shù)據(jù)。數(shù)據(jù)來(lái)源于全國(guó)綜合氣象信息共享平臺(tái)(CIMISS),部分觀測(cè)數(shù)據(jù)如表1 所示。
表1 部分觀測(cè)數(shù)據(jù)
數(shù)據(jù)集中存在369 條缺測(cè)數(shù)據(jù),占比0.70%,通過(guò)計(jì)算前后均值對(duì)缺測(cè)數(shù)據(jù)進(jìn)行填充處理。每種氣象數(shù)據(jù)都有著對(duì)映的數(shù)量級(jí)和數(shù)量級(jí)單位,采用大量的無(wú)序化數(shù)量規(guī)則數(shù)據(jù)進(jìn)行模型訓(xùn)練有可能會(huì)出現(xiàn)梯度爆炸,預(yù)測(cè)結(jié)果也會(huì)有很大的偏差,為解決上述問(wèn)題,訓(xùn)練模型前首先對(duì)樣本數(shù)據(jù)進(jìn)行歸一化處理[21,22]:
式中,Xmax表示對(duì)映影響因素?cái)?shù)據(jù)的最大值,Xmin為對(duì)映影響因素?cái)?shù)據(jù)的最小值。
采用均方根誤差RMSE、平均絕對(duì)誤差MAE、決定系數(shù)(R2)作為評(píng)價(jià)指標(biāo)[23,24]。
1)均方根誤差(RMSE):
2)平均絕對(duì)誤差(MAE):
3)決定系數(shù)(R2)
式中,yi為土壤體積含水量觀測(cè)值(%)為模型預(yù)測(cè)值(%)為平均值(%),n為觀測(cè)次數(shù)。均方根誤差(RMSE)能衡量觀測(cè)值與預(yù)測(cè)值間的偏差,其值越小,表明模型的準(zhǔn)確度更高;平均絕對(duì)誤差(MAE)反映誤差的真實(shí)情況;決定系數(shù)(R2)衡量數(shù)值間的離散程度[25,26]。
為驗(yàn)證基于RF-BiLSTM 神經(jīng)網(wǎng)絡(luò)的土壤水分預(yù)測(cè)模型的優(yōu)越性,本研究采用三亞國(guó)家氣候觀象臺(tái)2016—2020 年的氣象和土壤水分觀測(cè)數(shù)據(jù)作為訓(xùn)練集,為防止連續(xù)時(shí)間序列對(duì)訓(xùn)練模型造成影響,每一輪訓(xùn)練,從訓(xùn)練集中隨機(jī)抽取600組,每組128個(gè)數(shù)據(jù)集[27],每個(gè)數(shù)據(jù)集包括前120 h 的氣象觀測(cè)數(shù)據(jù)和土壤體積含水量數(shù)據(jù),預(yù)測(cè)對(duì)象則為后6、12、24、48 h 的土壤體積含水量數(shù)據(jù)。測(cè)試集為2021 年整年的氣象和土壤水分觀測(cè)數(shù)據(jù),并分別在RF-BiLSTM 模型、LSTM 模型、BP 模型對(duì)比試驗(yàn)。
圖6 顯示在訓(xùn)練和測(cè)試過(guò)程中,RF-BiLSTM 模型經(jīng)過(guò)50 次迭代的損失函數(shù)變化曲線圖[28,29]。由圖6 可知,在訓(xùn)練集和測(cè)試集上,當(dāng)?shù)螖?shù)達(dá)到25次時(shí),損失函數(shù)基本收斂;迭代次數(shù)達(dá)到40 次后,損失值已降至0.01 以下,并基本無(wú)變化,說(shuō)明RFBiLSTM 模型在訓(xùn)練集和測(cè)試集上均具有較好的效果和超強(qiáng)的泛化能力。
圖6 RF-BiLSTM 模型損失函數(shù)曲線
為驗(yàn)證RF-BiLSTM 模型的預(yù)測(cè)精度,分別使用RF-BiLSTM 模型、LSTM 模型、BP 模型在測(cè)試集上預(yù)測(cè)每個(gè)時(shí)次6、12、24、48 h 后的土壤體積含水量值,利用MAE、RMSE、R23 種評(píng)估參數(shù)對(duì)比3 種模型的預(yù)測(cè)效果,評(píng)估結(jié)果如表2 所示。隨著預(yù)測(cè)步長(zhǎng)的增加,3 種模型的預(yù)測(cè)性能均不同程度下降。在4 個(gè)預(yù)測(cè)步長(zhǎng)下,RF-BiLSTM 模型的R2值均比LSTM 模型、BP 模型的R2大,RF-BiLSTM 模型的預(yù)測(cè)精度更高,4 種步長(zhǎng)的預(yù)測(cè)值與觀測(cè)值之間具有最小的誤差。
表2 Bi-LSTM、LSTM、BP 模型預(yù)測(cè)效果
在4 種步長(zhǎng)下,3 種模型的預(yù)測(cè)值均能夠反映該地土壤水分的變化趨勢(shì),RF-BiLSTM 模型的預(yù)測(cè)曲線最貼近真實(shí)值(圖7)。圖8、圖9 和圖10 分別為6、12、24、48 h 下RF-BiLSTM 模型、LSTM 模型、BP 模型預(yù)測(cè)值與觀測(cè)值的比較結(jié)果,在較短的預(yù)測(cè)步長(zhǎng)下,RF-BiLSTM 模型預(yù)測(cè)值與真實(shí)值誤差極小;隨著預(yù)測(cè)步長(zhǎng)的增加,3 種模型的預(yù)測(cè)值均不同程度地偏離真實(shí)值,表明預(yù)測(cè)誤差逐漸變大,但是RF-BiLSTM 模型的R2值仍保持在0.9 以上,表現(xiàn)出較高的相關(guān)性,預(yù)測(cè)效果最好。
圖8 RF-BiLSTM 模型預(yù)測(cè)值與觀測(cè)值對(duì)比
圖9 LSTM 模型預(yù)測(cè)值與觀測(cè)值對(duì)比
圖10 BP 模型預(yù)測(cè)值與觀測(cè)值對(duì)比
范嘉智等[30]利用長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)同樣對(duì)6、12、24、48 h 后的土壤體積含水量進(jìn)行預(yù)測(cè),RMSE分別為1.171%、1.430%、1.930%、2.371%,其準(zhǔn)確率遠(yuǎn)低于本研究結(jié)果。韋琦等[31]基于非線性回歸與BP 神經(jīng)網(wǎng)絡(luò)模型對(duì)土壤水分蒸發(fā)量進(jìn)行預(yù)測(cè),平均絕對(duì)誤差可達(dá)到1.453%,遠(yuǎn)高于本研究的0.462%。侍永樂等[32]基于優(yōu)化的自適應(yīng)遺傳神經(jīng)網(wǎng)絡(luò)算法對(duì)24 h 后的土壤濕度進(jìn)行預(yù)測(cè),一步預(yù)測(cè)RMSE為3.679%,高于本研究的1.430%。
在土壤水分多時(shí)次動(dòng)態(tài)預(yù)測(cè)的應(yīng)用中,RFBiLSTM 模型處理長(zhǎng)時(shí)間序列數(shù)據(jù)具有強(qiáng)大的擬合能力,比常用的BP 模型和LSTM 模型預(yù)測(cè)準(zhǔn)確度更高,性能更加優(yōu)越。
神經(jīng)網(wǎng)絡(luò)模型可以通過(guò)反復(fù)學(xué)習(xí),實(shí)現(xiàn)輸入和輸出之間的映射。因此,輸入變量必須精簡(jiǎn),訓(xùn)練數(shù)據(jù)要充足,否則預(yù)測(cè)效果不佳。本研究通過(guò)RF特征選擇中的平均不純度減少方法[33]對(duì)土壤水分的所有影響因素進(jìn)行關(guān)聯(lián)性分析,選擇高度相關(guān)的8種氣象因子作為輸入變量,從而大大提高模型訓(xùn)練的速度,降低模型的冗余程度;采用2016—2021 年的氣象和土壤水分觀測(cè)數(shù)據(jù),保證訓(xùn)練模型的數(shù)據(jù)充足,再通過(guò)BiLSTM 神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)過(guò)程對(duì)各項(xiàng)輸入進(jìn)行權(quán)重設(shè)置,最終形成高效的RF-BiLSTM模型。
本研究提出的RF-BiLSTM 模型為土壤墑情預(yù)報(bào)預(yù)測(cè)提供了技術(shù)指導(dǎo),為實(shí)現(xiàn)農(nóng)業(yè)灌溉智慧化提供數(shù)據(jù)支撐,為多變量時(shí)間序列的預(yù)測(cè)和建模提供了指導(dǎo)方向。