景 輝,楊 華,趙惠瑾,孟 瑤
(山西農(nóng)業(yè)大學(xué)信息科學(xué)與工程學(xué)院,山西太谷030801)
運城市蘋果種植面積16.6萬hm2,總產(chǎn)量28億kg,產(chǎn)值達43億元,農(nóng)民依靠蘋果種植所得收入占其總收入的30%以上。蘋果產(chǎn)量在全國地級市中名列前茅,是運城市農(nóng)業(yè)增效、農(nóng)民增收的重要渠道之一[1]。蘋果產(chǎn)量與氣象因素密切相關(guān),運用氣象因子建立產(chǎn)量預(yù)測模型實現(xiàn)蘋果產(chǎn)量早期預(yù)測對運城市政府規(guī)劃經(jīng)濟發(fā)展具有決定性作用,并且能夠合理統(tǒng)籌種植策略以及減少水肥的浪費。
從20世紀(jì)80年代至今,國內(nèi)外諸多學(xué)者對農(nóng)作物產(chǎn)量預(yù)測進行了大量研究。國內(nèi)學(xué)者基于農(nóng)作物各個生長時期數(shù)據(jù)建立產(chǎn)量預(yù)測模型。申順吏[2]運用灰色關(guān)聯(lián)分析法對1981—2013年山西蘋果不同物候期(芽期、花期、初果期、果實膨大期和成熟期)主要氣候因子(降水量、平均氣溫、最高氣溫、最低氣溫、日照時數(shù)和平均相對濕度)與蘋果產(chǎn)量的關(guān)系進行研究,確定不同物候期影響蘋果產(chǎn)量的關(guān)鍵氣候因子,并使用GM(1,1)模型和多元回歸方法相結(jié)合預(yù)測年蘋果產(chǎn)量[3-7];李修華等[8]基于甘蔗整個生長期的田間環(huán)境和氣象數(shù)據(jù)對某一塊農(nóng)田建立BP模型[9-12]和GA-BP模型進行甘蔗產(chǎn)量預(yù)測;趙汝男等[13]運用灰色關(guān)聯(lián)分析法選取影響高粱產(chǎn)量的主要影響因子,將其作為輸入變量對高粱產(chǎn)量進行多元回歸預(yù)測。國外學(xué)者基于大量數(shù)據(jù)實現(xiàn)農(nóng)作物產(chǎn)量早期預(yù)測。Damerow等[14]提出了一種將圖像處理與支持向量機技術(shù)相結(jié)合的方法,以建立早期蘋果樹產(chǎn)量估算的預(yù)測模型,模型隨機選擇60棵蘋果樹自然光下捕獲的樹冠圖像,分析冠層圖像并從中提取了5個特征:果實總面積、果實總數(shù)、果實總面積與葉面面積的比例、葉片遮蓋的總果實面積占果實總面積的比例以及葉片遮蓋的總果實數(shù)占果實總面積的比例、水果總數(shù),并采用支持向量機方法建立了以這5個特征為輸入?yún)?shù),以實際產(chǎn)量為輸出的產(chǎn)量估算模型。Rozman rtomir等[15]提出基于圖像分析和神經(jīng)網(wǎng)絡(luò)的混合模型,模型通過圖像分析算法對采集的疏果期圖像進行處理,分別接收每個采樣周期的水果數(shù)量數(shù)據(jù),以此作為使用人工神經(jīng)網(wǎng)絡(luò)建模預(yù)測[16-19]蘋果產(chǎn)量的輸入信息。綜上所述,基于農(nóng)作物全生長期數(shù)據(jù)建立的產(chǎn)量預(yù)測模型可以較為準(zhǔn)確的預(yù)測農(nóng)作物產(chǎn)量,但難以實現(xiàn)早期預(yù)測。另一方面,部分學(xué)者提出了農(nóng)作物產(chǎn)量早期預(yù)測方法,但所需數(shù)據(jù)量大,采集難度較高?;诖?,本研究提出了一種僅使用幼果期氣象數(shù)據(jù)便可實現(xiàn)蘋果產(chǎn)量早期預(yù)測的方法。該方法難度較高但具有重大的實踐意義。
本研究以運城市蘋果產(chǎn)量為研究對象,旨在實現(xiàn)蘋果產(chǎn)量早期預(yù)測。試驗通過HP濾波法將蘋果產(chǎn)量分為趨勢產(chǎn)量和氣象產(chǎn)量,分別對蘋果不同物候期建立多元回歸模型從而比較不同物候期對蘋果氣象產(chǎn)量的影響強弱,最終選取影響蘋果氣象產(chǎn)量最強的幼果期進行BP神經(jīng)網(wǎng)絡(luò)建模,實現(xiàn)蘋果產(chǎn)量早期預(yù)測。
本研究以山西省運城市為研究地域。運城氣候地理獨特,屬暖溫帶大陸性半濕潤氣候,年平均氣溫13.8℃;地處35°N,屬黃土高原區(qū),土層深厚,并且種植區(qū)域水資源比較豐富[20]。
運城市2005—2018年逐日氣象數(shù)據(jù)來源于中國氣象局,蘋果年產(chǎn)量來源于《山西省統(tǒng)計年鑒》。運城蘋果的物候期大致可分為:3月發(fā)芽期、4月花期、5月幼果期、6—8月膨果期、9—10月成熟期。
本研究旨在對運城市蘋果產(chǎn)量進行預(yù)測研究,建立蘋果產(chǎn)量早期預(yù)測模型。首先,考慮到蘋果生長周期較長、對氣象條件依賴較高,氣候變化很大程度上影響了蘋果產(chǎn)量,所以采用HP濾波法將運城市蘋果年產(chǎn)量分為趨勢產(chǎn)量和氣象產(chǎn)量。在此基礎(chǔ)上基于SPSS軟件分別對蘋果物候期:發(fā)芽期、花期、幼果期、膨果期、成熟期建立多元線性回歸模型,研究每個物候期對蘋果氣象產(chǎn)量的影響程度并進行比較。最后,選取對蘋果氣象產(chǎn)量影響最強的幼果期運用MATLAB軟件建立BP神經(jīng)網(wǎng)絡(luò)產(chǎn)量早期預(yù)測模型,并對其驗證。
1.3.1 HP濾波法 HP濾波法的理論基礎(chǔ)是時間序列的譜分析方法。譜分析方法將時間序列看成是不同頻率的成分的疊加,時間序列的High-Pass濾波就是要在所有不同頻率的成分中,分離出頻率較高的成分,去除掉頻率較低的成分,即去除掉長期的趨勢項,而對短期的隨機波動進行度量[21-25]。
設(shè)有蘋果產(chǎn)量序列Y={y1,y2,...,yT},其分離出的趨勢產(chǎn)量記為G={g1,g2,...,gT},氣象產(chǎn)量記為C={c1,c2,...,cT},Y=G+C。HP濾波使得單產(chǎn)序列在長時間尺度上的趨勢產(chǎn)量與實際單產(chǎn)序列間偏差的平方和達到最小,即G為函數(shù)(1)最小化問題的解。
其中,λ為HP濾波參數(shù),當(dāng)λ=0時,函數(shù)最小化的解為Y序列等于G序列;隨著λ值增加,最小化解估計的趨勢越來越光滑。因本研究中的數(shù)據(jù)為年度數(shù)據(jù),根據(jù)相關(guān)研究經(jīng)驗,參數(shù)λ的參照值選取100。本研究采用Eviews7.2中的HP濾波法對運城市蘋果趨勢產(chǎn)量進行擬合分析。
1.3.2 多元線性回歸 在回歸分析中,如果有2個或2個以上的自變量,就稱為多元回歸。事實上,一種現(xiàn)象常常是與多個因素相聯(lián)系的,由多個自變量的最優(yōu)組合共同來預(yù)測或估計因變量比只用一個自變量進行預(yù)測或估計更有效,更符合實際。本研究采用影響運城市蘋果氣象產(chǎn)量的11個氣象因子(最高氣壓、最低氣壓、最高溫度、最低溫度、平均濕度、最小濕度、降雨量、平均風(fēng)速、最大風(fēng)速、日照時長、平均地溫)作為自變量,將蘋果氣象產(chǎn)量作為因變量分別對應(yīng)蘋果的5個物候期建立多元回歸模型。檢驗5個多元線性回歸模型的有效性,有效性最強的多元線性回歸模型所對應(yīng)的蘋果物候期對蘋果的產(chǎn)量影響最大。令C代表蘋果氣象產(chǎn)量,與其相關(guān)的11個氣象因子為自變量Xi(i=1,2,…,11),因變量C與自變量Xi建立的多元線性回歸模型如式(2)所示。
其中,αk(k=1,2,…,11)為回歸系數(shù);Xi為氣象因子;θ為隨機誤差。
1.3.3 BP神經(jīng)網(wǎng)絡(luò) 人工神經(jīng)網(wǎng)絡(luò)無需事先確定輸入輸出之間映射關(guān)系的數(shù)學(xué)方程,僅通過自身的訓(xùn)練,學(xué)習(xí)某種規(guī)則,在給定輸入值時得到最接近期望輸出值的結(jié)果。作為一種智能信息處理系統(tǒng),人工神經(jīng)網(wǎng)絡(luò)實現(xiàn)其功能的核心是算法。BP神經(jīng)網(wǎng)絡(luò)是一種按誤差反向傳播(簡稱誤差反傳)訓(xùn)練的多層前饋網(wǎng)絡(luò),其算法稱為BP算法,它的基本思想是梯度下降法,利用梯度搜索技術(shù),使網(wǎng)絡(luò)的實際輸出值和期望輸出值的誤差均方差為最小。BP算法學(xué)習(xí)過程流程如圖1所示。
圖1 BP算法學(xué)習(xí)流程圖
基于Eviews7.2使用HP濾波法將運城市2005—2018年蘋果產(chǎn)量分離成趨勢產(chǎn)量和氣象產(chǎn)量結(jié)果如表1所示。
表1 HP濾波法蘋果產(chǎn)量分離結(jié)果 t
通過建立多元線性回歸模型,并對其進行檢驗與評價,檢驗?zāi)P偷挠行?。本研究采取擬合優(yōu)度(R2)進行檢驗,檢驗回歸方程對樣本觀測值的擬合程度,即所有解釋變量與被解釋變量之間的相關(guān)程度,R2越大,回歸方程對樣本數(shù)據(jù)點擬合的程度越強,自變量與因變量的關(guān)系越密切。在限制因變量均為相同的氣象因子和自變量為蘋果氣象產(chǎn)量的條件下,比較蘋果花期、發(fā)芽期、幼果期、膨果期、成熟期所建立多元回歸線性模型的R2。5個時期建立的多元線性回歸模型R2如表2所示。
由表2可知,蘋果幼果期所建立多元回歸線性模型的R2最大,表明該物候期對蘋果的氣象產(chǎn)量影響最大,選取蘋果幼果期的氣象數(shù)據(jù)和蘋果實際年產(chǎn)量構(gòu)建BP網(wǎng)絡(luò)模型預(yù)測蘋果產(chǎn)量。
表2 多元線性回歸模型R2
由上述可知蘋果幼果期對蘋果的氣象產(chǎn)量影響最大,故選取蘋果幼果期,即每年5月份的氣象數(shù)據(jù)和蘋果年產(chǎn)量作為數(shù)據(jù)來源。本研究將最高氣壓、最低氣壓、最高溫度、最低溫度、平均濕度、最小濕度、降雨量、平均風(fēng)速、最大風(fēng)速、日照時長、平均地溫等11個氣象因子作為模型輸入變量,蘋果實際年產(chǎn)量作為輸出變量建立BP神經(jīng)網(wǎng)絡(luò)模型并采用留一驗證法進行交叉驗證,將運城市2005—2018年數(shù)據(jù)分為14個樣本,隨機使用13個樣本當(dāng)作訓(xùn)練集,而剩余的1個樣本留下來當(dāng)作測試集,這個步驟一直持續(xù)到每個樣本都僅被當(dāng)作一次測試集后結(jié)束。根據(jù)以上數(shù)據(jù),設(shè)定網(wǎng)絡(luò)輸入層節(jié)點數(shù)為11,輸出層節(jié)點數(shù)為1。隱含層節(jié)點數(shù)根據(jù)試湊法,按照預(yù)測誤差最小的原則定為300。設(shè)置網(wǎng)絡(luò)學(xué)習(xí)的收斂誤差為0.001,學(xué)習(xí)速度為0.05,最大訓(xùn)練次數(shù)為100。當(dāng)收斂誤差達到要求后,訓(xùn)練結(jié)束。蘋果產(chǎn)量預(yù)測結(jié)果如表3所示,實際產(chǎn)量和預(yù)測產(chǎn)量趨勢變化如圖2所示。
由圖2可知,實際產(chǎn)量和預(yù)測產(chǎn)量趨勢變化基本吻合。由表3可知,BP神經(jīng)網(wǎng)絡(luò)蘋果產(chǎn)量早期預(yù)測模型驗證集的平均相對誤差為7.08%。將2019年相關(guān)數(shù)據(jù)代入模型驗證后,驗證模型精度為89.6%,表明該模型能夠較為準(zhǔn)確的預(yù)測蘋果產(chǎn)量。
圖2 實際產(chǎn)量和預(yù)測產(chǎn)量趨勢變化對比
表3 BP神經(jīng)網(wǎng)絡(luò)蘋果產(chǎn)量預(yù)測結(jié)果
HP濾波法蘋果產(chǎn)量分離結(jié)果表明,氣象因素與蘋果產(chǎn)量相關(guān)性密切,基于氣象數(shù)據(jù)構(gòu)建蘋果產(chǎn)量早期預(yù)測模型是可行的。通過對蘋果5個物候期分別建立的多元線性回歸模型結(jié)果分析可知,蘋果幼果期對蘋果氣象產(chǎn)量影響最大?;谟坠诮⒌腂P神經(jīng)網(wǎng)絡(luò)蘋果產(chǎn)量早期預(yù)測模型通過了模型檢驗,并用2019年相關(guān)數(shù)據(jù)驗證后表明模型精度良好,能夠較為準(zhǔn)確的預(yù)測蘋果產(chǎn)量,為農(nóng)作物產(chǎn)量早期預(yù)測提供了理論支持。
通過本文研究可知,注重蘋果幼果期的管理可以提高蘋果產(chǎn)量。果農(nóng)要在幼果期多做增產(chǎn)措施,注意追施速效肥,以提供充足的營養(yǎng)提高座果率和充盈果實。并且,果農(nóng)要時刻警惕幼果期是病蟲害高發(fā)的時期,做到定時觀察檢測,定時噴藥預(yù)防。