徐芳,黃帆
(梧州市氣象局,梧州 543002)
基于SPSS的梧州早稻產(chǎn)量預(yù)測(cè)模型構(gòu)建
徐芳,黃帆
(梧州市氣象局,梧州 543002)
應(yīng)用界面友好的SPSS統(tǒng)計(jì)軟件及MicrosoftExcel軟件作為建模工具,利用l983-2014年梧州市氣象局早稻生長(zhǎng)發(fā)育關(guān)鍵期氣象觀測(cè)資料和市統(tǒng)計(jì)局提供的早稻單產(chǎn)資料,采用直線滑動(dòng)均值和調(diào)和權(quán)重法模擬外推趨勢(shì)產(chǎn)量,再通過(guò)逐步回歸建立氣象產(chǎn)量預(yù)報(bào)方程,得到產(chǎn)量預(yù)報(bào)值,建立梧州市早稻產(chǎn)量的定量預(yù)測(cè)模型,通過(guò)了5%的信度檢驗(yàn),并且2015年的預(yù)報(bào)準(zhǔn)確率為98.6%。
SPSS;預(yù)測(cè)模型;早稻產(chǎn)量;梧州
SPSS[1](StatisticalProductandService Solutions,統(tǒng)計(jì)產(chǎn)品和服務(wù)解決方案)是當(dāng)今國(guó)際上最新、最流行、最受歡迎的統(tǒng)計(jì)軟件之一。它最突出的特點(diǎn)是圖形菜單驅(qū)動(dòng)界面極為友好,輸出結(jié)果美觀。SPSS具有完善的數(shù)據(jù)輸入、編輯、統(tǒng)計(jì)分析、報(bào)表、圖形制作等功能。該軟件自帶l2種類型177個(gè)函數(shù),基本能夠滿足氣象統(tǒng)計(jì)的需要。此外,SPSS采用類似EXCEL表格的方式輸入與管理數(shù)據(jù),數(shù)據(jù)接口較為通用,能方便地從其他數(shù)據(jù)庫(kù)中讀入數(shù)據(jù)。本文以梧州市早稻單產(chǎn)預(yù)測(cè)為例,構(gòu)建早稻產(chǎn)量預(yù)測(cè)模型,以期為提高梧州市早稻產(chǎn)量預(yù)報(bào)準(zhǔn)確率提供一種有效的方法。
1.1 資料來(lái)源
利用l983-2014年梧州市氣象局所屬的梧州、蒙山、藤縣、蒼梧、岑溪等5個(gè)地面站氣象觀測(cè)資料和市統(tǒng)計(jì)局提供的梧州市早稻單產(chǎn)資料。
1.2 處理方法
采用直線滑動(dòng)均值和調(diào)和權(quán)重法模擬趨勢(shì)產(chǎn)
量,再通過(guò)逐步回歸建立氣象產(chǎn)量預(yù)報(bào)模型,依據(jù)作物產(chǎn)量預(yù)報(bào)模型得到產(chǎn)量預(yù)報(bào)值。
建模過(guò)程的基本方法是[2]:首先將梧州市1983—2014年早稻單產(chǎn)資料進(jìn)行處理。去掉產(chǎn)量的時(shí)間趨勢(shì)項(xiàng),分離出氣象產(chǎn)量。其次將氣象產(chǎn)量作為因變量、早稻主要生育期(2月下旬—6月中旬)氣象因子作為自變量,利用逐步回歸分析方法,篩選出對(duì)早稻產(chǎn)量貢獻(xiàn)大的因子建立回歸方程。最后在上述分析基礎(chǔ)上建立早稻產(chǎn)量預(yù)測(cè)模型。
制作作物產(chǎn)量預(yù)報(bào)[3],要將早稻產(chǎn)量分解為由生產(chǎn)力水平等因素形成的趨勢(shì)產(chǎn)量和氣象因子影響對(duì)應(yīng)的氣象產(chǎn)量?jī)刹糠?。其產(chǎn)量預(yù)測(cè)模式為:Y=Yt+Ym(X1,X2,…XK)+Yε,其中Y,Yt,Ym和Yε分別表示預(yù)測(cè)單產(chǎn)、趨勢(shì)單產(chǎn)、氣象單產(chǎn)和隨機(jī)干擾項(xiàng),X1,X2,…XK表示作物生長(zhǎng)期內(nèi)氣象因子,如降水量、溫度、日照時(shí)數(shù)等。由于隨機(jī)干擾項(xiàng)yε構(gòu)成的因素具有不確定性.通常只有通過(guò)對(duì)歷史資料的分析.進(jìn)行社會(huì)調(diào)查研究之后,或?qū)Ξa(chǎn)量數(shù)據(jù)進(jìn)行訂正,或舍棄不用。
2.1 趨勢(shì)產(chǎn)量模擬
要研究作物產(chǎn)量與氣象條件之間關(guān)系[4],必須從實(shí)際產(chǎn)量中將生產(chǎn)力水平因素去掉,剩下由氣象因子影響的那部分產(chǎn)量與氣象要素進(jìn)行相關(guān)分析,才合理。對(duì)于產(chǎn)量時(shí)間趨勢(shì)項(xiàng)的模擬方法有多種[5][6],如滑動(dòng)平均法、重心描繪法、指數(shù)法、直線法、正交多項(xiàng)式法、分段直線法等,實(shí)際應(yīng)用中可根據(jù)當(dāng)?shù)鼐唧w情況選擇采用,本次建模則主要采用滑動(dòng)平均與調(diào)和權(quán)重相結(jié)合方法,先用滑動(dòng)平均分段建模,后用調(diào)和權(quán)重減少趨勢(shì)產(chǎn)量外推的風(fēng)險(xiǎn)性。
分析梧州市早稻實(shí)際單產(chǎn),由圖1可看出,梧州市水稻實(shí)際單產(chǎn)是逐年變化的,上升趨勢(shì)不明顯,因此本次建模首先采用取平滑區(qū)間k為7進(jìn)行分段建模,應(yīng)用統(tǒng)計(jì)分析軟件spss19.0,在曲線回歸模型中,主要選用如下三次曲線或二次曲線計(jì)算模擬水稻產(chǎn)量的時(shí)間趨勢(shì)項(xiàng)序列。
2.1.1 分段模擬在spss中的計(jì)算方法[7]
(1)在SPSS中建立一新數(shù)據(jù)文件,第1列為t(年代,設(shè)置1983年為1,2014年為32,首次計(jì)算為1-7),第2列為對(duì)應(yīng)的y(實(shí)際單產(chǎn)),每列為7個(gè)數(shù)據(jù),表略。
圖1 梧州市早稻單產(chǎn)歷年演變曲線
(2)選擇【Analyze】→【Regression】→【Curve Estimation】打開(kāi)Curve Estimation(曲線估計(jì))主對(duì)話框。將y(實(shí)際單產(chǎn)))添加到Dependent(因變量)列表,將t(年代)添加到Variable(變量),并在Models(模型)欄中選擇Cubic(二次曲線)、Quadratic(二次曲線)項(xiàng),并選擇Dieplay ANOVA table(顯示ANOVA表格),然后點(diǎn)擊OK按鈕。
(3)重復(fù)上述計(jì)算28次,得出各線段方程,各線段方程均通過(guò)回歸分析顯著性F值的檢驗(yàn)。
2.1.2 利用調(diào)和權(quán)重減少趨勢(shì)產(chǎn)量外推風(fēng)險(xiǎn)
調(diào)和權(quán)重法[8][9][10]就是以不同權(quán)重估計(jì)序列樣本對(duì)未來(lái)趨勢(shì)的影響,把已知時(shí)間序列yt諸點(diǎn)的折線進(jìn)行平滑并作為時(shí)間趨勢(shì)項(xiàng)的某種近似ft,主要步驟為:
即:利用調(diào)和權(quán)重系數(shù)Cmt+1和歷年趨勢(shì)產(chǎn)量增量Wt+1,求得平均增量,最后得出趨勢(shì)產(chǎn)量預(yù)報(bào)值t+1=?t+,權(quán)重序列可由(t=2,3…n-1)確定。由(6)式可以計(jì)算梧州市2015年趨勢(shì)產(chǎn)量t+1=?t+= 6121.302(-6.80755)6114.495
2.2 用逐步回歸分析方法建立氣象產(chǎn)量回歸方程
(1)根據(jù)表2模擬獲得的1983~2014年早稻趨勢(shì)產(chǎn)量,代入公式Y(jié)m=Y-Yt即求得各年相應(yīng)的氣象產(chǎn)量Ym。
(2)進(jìn)行相關(guān)分析。利用1983—2014年梧州市早稻氣象產(chǎn)量與影響早稻分孽、幼穗分化、乳熟成熟的氣象因子在SPSS中進(jìn)行相關(guān)顯著性分析[7]:選擇【Analyze】→【Correlate】→【Bivariate】,將對(duì)話框中的
氣象因子逐個(gè)調(diào)入右邊的變量Yt,單擊OK按鈕。獲取59個(gè)與氣象產(chǎn)量相關(guān)性顯著的氣象因子:梧州市所屬5個(gè)氣象站的3月中旬旬降雨量,4月上旬旬日照時(shí)數(shù),4月上旬旬平均最高氣溫、旬平均氣溫、旬平均最低氣溫,5月上旬旬平均最高氣溫,5月上中旬的旬平均氣溫、旬平均最低氣溫,6月上旬旬平均最高氣溫,2月下旬至6月中旬的平均最高氣溫。
(3)進(jìn)行逐步回歸[7][11]。在SPSS中建立新數(shù)據(jù)文件,第l列變量為ym(氣象產(chǎn)量),其余各列變量為備選氣象因子,記為Xi(i=1,2……)。選擇【Analyze】→【Regression】→【Linear】→打開(kāi)Linear Regression(線性回歸分析)主對(duì)話框。將Ym(氣象產(chǎn)量)添加到Dependent(因變量)列表,將xi(I=l,2……)(備選氣象因子)添加到Independent(自變量)列表。在Method(方法)下拉菜單中選擇Stepwise(逐步回歸法)。
(4)獲取逐步回歸方程模型參數(shù)方法。打開(kāi)Linear Re.gression:Sta.tistics(線性回歸統(tǒng)計(jì):統(tǒng)計(jì)量對(duì)話框),點(diǎn)選Estimates(估計(jì)值),這將在結(jié)果中顯示回歸系數(shù)B、回歸系數(shù)的標(biāo)準(zhǔn)誤差(SEB)、標(biāo)準(zhǔn)化回歸系數(shù)(Beta)、回歸系數(shù)B的t值及雙側(cè)顯著性水平(Sig.)。點(diǎn)選Model fit(模型擬合),這將在結(jié)果中顯示被引入模型或被剔出的變量,復(fù)相關(guān)系數(shù)R、R2、調(diào)整R2、估計(jì)值的標(biāo)準(zhǔn)誤差及方差分析表。
(5)打開(kāi)Linear Regression:Save(線性回歸分析:保存)對(duì)話框,點(diǎn)選Predicted Va1.ues(預(yù)測(cè)值)中的Unstandardized(非標(biāo)準(zhǔn)化預(yù)測(cè)值),即模型中因變量的預(yù)測(cè)值。在Confidence Interval(置信區(qū)間)處輸入95%,即置信度設(shè)為95%。
(6)單擊【Continue】【OK】,得到主要結(jié)果與逐步回歸方程:
由表1可知,方程中復(fù)相關(guān)系數(shù)為0.700,R2為0.489,調(diào)整R2為0.44,剩余標(biāo)準(zhǔn)差為166.74。F值為9.904,查F分布表,有F>FO.05,表示逐步回歸效果顯著。由表2可得到逐步回歸方程Ym=410.349-75.458×X1-42.644×X2+91.493×X3。
表1 模型匯總
表2 Anova(方差分析表)
表3 回歸系數(shù)
上式表明,影響梧州市早稻單產(chǎn)的氣象因子主要有3個(gè):5月上旬、中旬期間的平均最低氣溫、4月上旬的旬平均最高氣溫、2月下旬至6月中旬期間的平均最高氣溫。說(shuō)明5月上旬、中旬的平均最低氣溫偏高,導(dǎo)致夜間呼吸作用增強(qiáng),不利于營(yíng)養(yǎng)物質(zhì)的有效積累[1][12][13],因而對(duì)氣象產(chǎn)量的貢獻(xiàn)是消極的。
4月上旬的旬平均最高氣溫偏高,對(duì)水稻幼苗返青分蘗生長(zhǎng)不利,對(duì)氣象產(chǎn)量的貢獻(xiàn)也是消極的。2月下旬至6月中旬平均最高氣溫偏高,說(shuō)明主要生育期內(nèi)光照偏多,對(duì)早稻的生長(zhǎng)發(fā)育是極為有利的[14],對(duì)氣象產(chǎn)量的貢獻(xiàn)是積極的。
圖2 梧州市早稻產(chǎn)量歷史擬合曲線(1983-2014年)
2.3 早稻歷史產(chǎn)量模擬
將1983—2014年的氣象因子X(jué)1、X2、X3代入以上方程,可得到模擬的水稻氣象產(chǎn)量序列,這樣由時(shí)間趨勢(shì)項(xiàng)序列和模擬的水稻氣象產(chǎn)量序列,可得到水稻的模擬產(chǎn)量。計(jì)算表明,水稻產(chǎn)量歷史擬合率較高,均在91%以上,見(jiàn)圖2。
2.4 梧州市早稻產(chǎn)量預(yù)報(bào)模型與2015年產(chǎn)量模擬
由以上得到的利用直線滑動(dòng)均值和調(diào)和權(quán)重相結(jié)合的方法和逐步回歸方程,可得倒梧州市早稻產(chǎn)量預(yù)報(bào)模型Yt+1=Y(jié)t++Ym=Y(jié)t+410.349-75.458× X1-42.644×X2+91.493×X3,其中X1:蒙山5月上旬、中旬的平均最低氣溫,X2:梧州4月上旬的旬平均最高氣溫,X3:蒙山2月下旬至6月中旬的平均最高氣溫。
利用直線滑動(dòng)均值和調(diào)和權(quán)重相結(jié)合的方法對(duì)2015年趨勢(shì)產(chǎn)量進(jìn)行預(yù)報(bào),趨勢(shì)產(chǎn)量Yt+1=Y(jié)t+=6121.302+(-6.80755)=6114.495(kg·ha-1),利用逐步回歸方程對(duì)氣象產(chǎn)量進(jìn)行預(yù)報(bào),氣象產(chǎn)量Ym=410.349-75.458×21.9-42.644×26.6+91.493×24.8=108.189(kg·ha-1);因此,2015年預(yù)報(bào)產(chǎn)量:
Yi+1=Y(jié)t++Ym=6114.495+(-108.189)=6006.3(kg·ha-1),與實(shí)際產(chǎn)量6090kg·ha-1相比,預(yù)報(bào)誤差-1.37%,效果較好。
(1)采用SPSS軟件進(jìn)行作物產(chǎn)量預(yù)報(bào),是實(shí)際工作中有益的嘗試,它提供了新的技術(shù)手段和工作思路。
(2)利用直線滑動(dòng)均值和調(diào)和權(quán)重相結(jié)合的方法進(jìn)行趨勢(shì)產(chǎn)量預(yù)報(bào),用逐步回歸分析方法模擬氣象產(chǎn)量,從而得到的梧州市早稻產(chǎn)量預(yù)測(cè)模型具有較好的預(yù)報(bào)效果,預(yù)測(cè)結(jié)果接近實(shí)產(chǎn),準(zhǔn)確率高,達(dá)到了產(chǎn)量預(yù)報(bào)業(yè)務(wù)化所需的精度要求,所挑選出來(lái)的3個(gè)預(yù)報(bào)因子具有明確的生物學(xué)意義。
(3)在趨勢(shì)產(chǎn)量的外延預(yù)測(cè)中,除原有的滯后增長(zhǎng)或增量增長(zhǎng)方法外,還能以不同權(quán)重方法去求算各序列樣本趨勢(shì)產(chǎn)量的影響,大大減少了外推趨勢(shì)產(chǎn)量的風(fēng)險(xiǎn)性,且具有明確的生物學(xué)意義,與其它方法比較,它更符合農(nóng)業(yè)生產(chǎn)的實(shí)際情況。
(4)實(shí)際產(chǎn)量預(yù)報(bào)中,如何把握趨勢(shì)產(chǎn)量的分離,是分析、建立氣象產(chǎn)量模式的關(guān)鍵,也是分析、建立作物產(chǎn)量預(yù)報(bào)模式的基礎(chǔ)。
[1]袁立新,段修榮,余先超.用SPSS建立自貢水稻產(chǎn)量年景預(yù)測(cè)模型[J].高原山地氣象研究,2006,26(1):31-33.
[2]蘇永秀.廣西農(nóng)業(yè)氣象產(chǎn)量預(yù)報(bào)系統(tǒng)[J].廣西氣象,1991,(2):41-44.
[3]陳靖,蘇永秀.廣西玉米、花生、柑桔農(nóng)業(yè)氣象產(chǎn)量預(yù)報(bào)技術(shù)方法的研究[J].廣西氣象,1991,(3):37-40.
[4]周慧琴,戴小笠,唐缸艷.寧夏灌區(qū)糧食趨勢(shì)產(chǎn)量預(yù)報(bào)方法的探討[J].寧夏農(nóng)林科技,2001,(4):24-25.
[5]代立芹,吳炳方,李強(qiáng)子,等.作物單產(chǎn)預(yù)測(cè)方法研究進(jìn)展[J].農(nóng)業(yè)網(wǎng)絡(luò)信息,2006,(4):24-27,49.
[6]韓永翔,尹東.作物產(chǎn)量預(yù)報(bào)新方法研究[J].干旱地區(qū)農(nóng)業(yè)研究,2002,20(3):124-127.
[7]楊善朝,張軍艦.SPSS統(tǒng)計(jì)軟件應(yīng)用基礎(chǔ)[M].桂林廣西師范大學(xué)出版社(第2版),2010,3:70-99.
[8]劉文平.利用調(diào)和權(quán)重法處理產(chǎn)量預(yù)測(cè)我省小麥產(chǎn)量效果好[J].山西氣象,1994,29(4):30-32.
[9]曲靜.調(diào)和權(quán)重法在作物產(chǎn)量預(yù)報(bào)中的應(yīng)用[J].陜西農(nóng)業(yè)科學(xué),2011,(5):109-110.
[10]北京農(nóng)業(yè)大學(xué)氣象教研組.農(nóng)業(yè)氣象統(tǒng)汁講義[M].氣象出版社,1980:222—225.
[11]羅森波,黃賢湛.水稻氣象產(chǎn)量逐步回歸雙重分析方法[J].廣東氣象,1991,(2):8-10.
[12]廖雪萍,何燕.廣西種植巴西旱稻單季再生稻的適播期分析[J].廣西氣象,2006,27(1):39-41.
[13]蘇志,涂方旭.廣西春播期低溫陰雨的氣候變化分析[J].廣西氣象,1999,20(1):32-34.
[14]凃方旭.對(duì)廣西水稻氣候區(qū)劃的探討[J].廣西氣象,2006,27(1):34-36.
Building of early season rice yield prediction model of Wuzhou by SPSS
Xu Fang,Huang Fan
(Wuzhou Municipal Meteorological Service,Wuzhou 543002)
Based on the meteorological observation of the early rice growing stage data from l983-2014 and yield data provided by municipal of statistical bureau,the output of trend extrapolation was obtained by the linear sliding mean and mediate weight method,and meteorological yield forecast equation was established by stepwise regression to get the volume forecast value,then early rice yield quantitative prediction model in Wuzhou was established,which passed the reliability test of 5%,and get the forecast accuracy of 98.6%in 2015.
SPSS;predicting model;early season rice yield;Wuzhou
P49
A
1673-8411(2016)03-0098-04
2016-05-16
由廣西梧州市科學(xué)研究與技術(shù)開(kāi)發(fā)計(jì)劃項(xiàng)目(2014-30)資助。
徐芳(1967-),女,高級(jí)工程師,現(xiàn)從事農(nóng)業(yè)氣象服務(wù)。