摘要:為了建立較為精確的作物騰發(fā)量預(yù)測(cè)模型,降低常規(guī)利用彭曼公式計(jì)算繁瑣及參數(shù)估計(jì)的難度,應(yīng)用偏最小二乘回歸算法來(lái)建立作物騰發(fā)量預(yù)測(cè)模型,采用多維氣象數(shù)據(jù)(太陽(yáng)輻射、空氣溫度、相對(duì)濕度和平均風(fēng)速)與作物騰發(fā)量的相關(guān)性來(lái)確定模型方程。結(jié)果表明,該模型能很好地解決作物騰發(fā)量與多個(gè)影響因素之間的不確定性和非線性關(guān)系,預(yù)測(cè)精度較高,完全能夠滿足灌溉的精度要求。
關(guān)鍵詞:偏最小二乘回歸;作物騰發(fā)量;彭曼公式;預(yù)測(cè)模型
中圖分類(lèi)號(hào):S161.4 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):0439-8114(2013)22-5596-03
我國(guó)是一個(gè)水資源不豐富的國(guó)家,進(jìn)入21世紀(jì),工農(nóng)業(yè)生產(chǎn)用水矛盾更加突出,水資源緊缺的狀況日益嚴(yán)峻,在各個(gè)用水部門(mén)中,灌溉用水最多,約占全國(guó)總用水量的80%,這就迫使農(nóng)業(yè)灌溉排水領(lǐng)域要不斷更新觀念,其中研究和推廣高效的節(jié)水灌溉理論與技術(shù),是我國(guó)發(fā)展節(jié)水農(nóng)業(yè)、設(shè)施農(nóng)業(yè),實(shí)現(xiàn)高產(chǎn)、高效、優(yōu)質(zhì)農(nóng)業(yè)的重要途徑,對(duì)緩解我國(guó)日益突出的水資源供需矛盾具有十分重要的戰(zhàn)略意義[1,2]。
作物騰發(fā)量包括植株蒸騰與棵間蒸發(fā),是農(nóng)業(yè)用水的主要組成部分,是農(nóng)田水分消耗的主要途徑。作物騰發(fā)量的研究與估算,一直是灌溉排水領(lǐng)域中重要的研究課題之一[3,4]。實(shí)測(cè)方法是獲取作物騰發(fā)量最可靠的途徑,但實(shí)測(cè)資料的地區(qū)分布和時(shí)間序列十分有限。計(jì)算作物騰發(fā)量有助于作物騰發(fā)量在空間上的插補(bǔ)和時(shí)間序列上的延長(zhǎng)[5]。但是常規(guī)彭曼公式計(jì)算法需要大量的氣候、作物等數(shù)據(jù),而且要對(duì)大量數(shù)據(jù)進(jìn)行估算,計(jì)算非常繁瑣。因此隨著其他學(xué)科的發(fā)展,出現(xiàn)許多作物騰發(fā)量預(yù)測(cè)方法及預(yù)測(cè)模型,本試驗(yàn)是對(duì)特定作物和土壤條件下,通過(guò)偏最小二乘回歸算法利用天氣環(huán)境參數(shù)來(lái)預(yù)測(cè)作物騰發(fā)量(ET)[6-8]。
1 多重共線性分析
1.1 試驗(yàn)條件
本試驗(yàn)數(shù)據(jù)來(lái)自于項(xiàng)目試驗(yàn)基地,天氣環(huán)境數(shù)據(jù)通過(guò)小型自動(dòng)采集氣象站采集,作物騰發(fā)量通過(guò)高精度蒸滲儀來(lái)測(cè)量。2012年5-6月選取典型氣候測(cè)量50組試驗(yàn)數(shù)據(jù),利用得到的試驗(yàn)數(shù)據(jù)來(lái)建立作物騰發(fā)量預(yù)測(cè)模型。試驗(yàn)田長(zhǎng)18.0 m,寬6.2 m,土質(zhì)為沙質(zhì)土壤,試驗(yàn)所用的作物為玉米,這一階段玉米處于拔節(jié)、抽雄發(fā)育期。在測(cè)量過(guò)程中太陽(yáng)輻射(RS)取1 d的累計(jì)值,相對(duì)濕度(RH)、空氣溫度(TA)和平均風(fēng)速(WS)取1 d的平均值。試驗(yàn)數(shù)據(jù)如表1所示。
1.2 多重共線性診斷
在多元回歸建模中,變量多重相關(guān)的現(xiàn)象經(jīng)常出現(xiàn),而偏最小二乘回歸方法可以有效解決普通最小二乘法在多重共線性存在的多元回歸模型中估計(jì)參數(shù)失效的問(wèn)題,因此在建模前有必要診斷數(shù)據(jù)的多重相關(guān)性。自變量間的皮爾遜相關(guān)系數(shù)矩陣如表2所示。從表2可知,作物騰發(fā)量與太陽(yáng)輻射、相對(duì)濕度的相關(guān)性較大,分別為0.953和-0.705,其次線性相關(guān)性較強(qiáng)的是太陽(yáng)輻射和相對(duì)濕度,相關(guān)系數(shù)為-0.712,相對(duì)濕度與空氣溫度間的相關(guān)性略強(qiáng),為0.442,從相關(guān)系數(shù)矩陣中可以初步判斷除了因變量和自變量間有線性相關(guān)性之外,自變量間也可能存在共線性問(wèn)題。
特征根和條件指數(shù)是診斷多重共線性的方法,如果相當(dāng)多維度的特征根等于0,則可能有比較嚴(yán)重的共線性,條件指數(shù)由Stewart等提出,當(dāng)某些維度的該指標(biāo)數(shù)值大于30時(shí),則可能存在共線性。表3的自變量多重共線性診斷顯示數(shù)據(jù)間存在一定的多重共線性。
2 模型原理及其構(gòu)建
2.1 偏最小二乘回歸建模思路
首先,對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,消除量綱影響。然后,分別在自變量組與因變量組中提取出t和u,滿足條件:① t和u最大程度攜帶各自數(shù)據(jù)的變異信息;② t與u的相關(guān)度達(dá)最大。當(dāng)?shù)谝粋€(gè)成分被提取后,偏最小二乘回歸分別實(shí)施自變量對(duì)t的回歸和因變量對(duì)t的回歸。如果回歸方程已經(jīng)達(dá)到滿意的精度,則算法終止;否則,將利用自變量被t解釋后的殘余信息以及因變量被t解釋后的殘余信息進(jìn)行第二輪的成分提取。如此往復(fù),直到能達(dá)到一個(gè)較滿意的精度為止。判斷是否繼續(xù)提取成分的方法是檢驗(yàn)交叉有效性Q2h,滿足條件Q2h≤0.097 5時(shí),停止計(jì)算。
2.2 作物騰發(fā)量的偏最小二乘回歸模型
根據(jù)以上建模過(guò)程,結(jié)合作物騰發(fā)量與相關(guān)因素的關(guān)系,建立如下標(biāo)準(zhǔn)化模型:
在表4中,符號(hào)RdX表示成分th對(duì)X的解釋能力,符號(hào)RdY表示成分th對(duì)Y的解釋能力。符號(hào)Q2表示交叉有效性,臨界值0.097 5,前3個(gè)成分的交叉有效性均大于臨界值,系統(tǒng)默認(rèn)提取3個(gè)有效成分th,h=1,2,3。第一個(gè)成分對(duì)X的解釋能力為0.429 0,第二個(gè)成分對(duì)X的解釋能力為0.378 0,第三個(gè)成分對(duì)X的解釋能力為0.140 0。3個(gè)成分對(duì)X的信息利用率為0.946 0,基本提取了所有信息。第一個(gè)成分對(duì)Y的解釋能力為0.871 0,解釋能力較強(qiáng),3個(gè)有效成分能夠解釋0.939 0的因變量中的變異,而且累計(jì)交叉有效性Q2(cum)=0.923 0,也接近于1,可以說(shuō)模型非常完美。
3.2 回歸方程系數(shù)分析
圖1是變量投影重要性指標(biāo)(VIP)圖,用來(lái)描述X在解釋Y的重要程度,它的平均值為1,大于1表示變量非常重要。從圖1可以看出,反映作物騰發(fā)量最顯著的指標(biāo)是太陽(yáng)輻射和相對(duì)濕度,太陽(yáng)輻射的VIP值是均值的1.5倍,相對(duì)濕度的VIP值也超過(guò)了1,為1.16。
標(biāo)準(zhǔn)化回歸系數(shù)直方圖如圖2所示。
3.3 擬合效果分析
圖3為觀測(cè)值與預(yù)測(cè)值的對(duì)比圖,圖3顯示樣本點(diǎn)均勻分布在斜率為1的直線附近,判定系數(shù)為0.938 7,均方誤差根為0.33,相對(duì)誤差的均值為0.10,擬合效果較好。
4 模型預(yù)測(cè)
為了驗(yàn)證所建模型的有效性,選取一組非建模樣本試驗(yàn)數(shù)據(jù),用建立的模型預(yù)測(cè)作物的騰發(fā)量,通過(guò)與試驗(yàn)數(shù)據(jù)對(duì)比來(lái)進(jìn)一步分析所建模型的合理性(表5)。
5 結(jié)論
本研究采用多元回歸建模方法建立了較為精確的作物騰發(fā)量預(yù)測(cè)模型,降低了常規(guī)利用彭曼公式計(jì)算繁瑣及參數(shù)估計(jì)的難度,通過(guò)診斷數(shù)據(jù)的多重相關(guān)性來(lái)避免變量多重相關(guān)的現(xiàn)象,有效解決了普通最小二乘法在多重共線性存在的多元回歸模型中估計(jì)參數(shù)失效的問(wèn)題。用多維氣象數(shù)據(jù)(太陽(yáng)輻射、空氣溫度、相對(duì)濕度和平均風(fēng)速)與作物騰發(fā)量的相關(guān)性來(lái)確定模型方程,結(jié)果表明,該模型能很好地解決作物騰發(fā)量與多個(gè)影響因素之間的不確定性和非線性關(guān)系,預(yù)測(cè)精度較高,完全能夠滿足灌溉的精度要求。
參考文獻(xiàn):
[1] 羅金耀.節(jié)水灌溉理論與技術(shù)[M].武漢:武漢大學(xué)出版社,2003.
[2] 付 強(qiáng),王立坤,王兆菡.井灌水稻需水量預(yù)測(cè)的人工神經(jīng)網(wǎng)絡(luò)模型研究[J].灌溉排水,2002(1):29-32.
[3] 張 兵,袁壽其,成 立,等.基于L-M優(yōu)化算法的BP神經(jīng)網(wǎng)絡(luò)的作物需水量預(yù)測(cè)模型[J].農(nóng)業(yè)工程學(xué)報(bào),2004,20(6):73-76.
[4] 魏占民,陳亞新,史海濱,等.BP神經(jīng)網(wǎng)絡(luò)的春小麥作物-水模型的初步研究[J].灌溉排水,2002,21(2):12-16.
[5] 康紹忠,熊運(yùn)章,劉曉明.用彭曼-蒙特斯模式估算作物蒸騰量的研究[J].西北農(nóng)林科技大學(xué)學(xué)報(bào)(自然科學(xué)版),1991(1):13-19.
[6] 周金龍,董新光.內(nèi)陸干旱區(qū)潛在蒸發(fā)量的計(jì)算[J].灌溉排水,2002,21(2):21-24.
[7] 霍再林,史海濱,陳亞新,等.參考作物潛在蒸散量的人工神經(jīng)網(wǎng)絡(luò)模型研究[J].農(nóng)業(yè)工程學(xué)報(bào),2004,20(1):40-43.
[8] 史海濱,何京麗,郭克貞,等.參考作物蒸散量計(jì)算方法及適用性評(píng)判[J].灌溉排水,1997,16(2):50-54.
(責(zé)任編輯 昌炎新)