李 碩,王馨彤,楊吉斌,張有江
(1.陜西師范大學(xué)數(shù)學(xué)與統(tǒng)計學(xué)院,陜西 西安 710062;2.昌吉學(xué)院數(shù)學(xué)與數(shù)據(jù)科學(xué)學(xué)院,新疆 昌吉 831100)
棉花是新疆最具經(jīng)濟規(guī)模和種植優(yōu)勢的經(jīng)濟作物,棉花產(chǎn)業(yè)是新疆的重要綜合支柱型經(jīng)濟產(chǎn)業(yè),發(fā)展棉花產(chǎn)業(yè)是保障新疆國民經(jīng)濟穩(wěn)定健康發(fā)展和推動農(nóng)牧民收入穩(wěn)定增加的一個重要途徑,在新疆整個市場經(jīng)濟和國民社會持續(xù)發(fā)展中一直占有舉足輕重的地位.受到國家經(jīng)濟結(jié)構(gòu)不斷調(diào)整的影響,我國棉花產(chǎn)量呈現(xiàn)波動收窄的趨勢,其中影響因素有種植面積、降水量、土壤、氣候、水源、化肥的搭配使用方法及用量等.這些因素引起了社會各界的高度重視[1-9].為探明昌吉州棉花產(chǎn)量影響因素的相關(guān)問題,本研究選取棉花種植面積和降雨量2個變量,建立多元線性回歸模型,對棉花產(chǎn)量影響因素進行分析,以期為昌吉州棉花生產(chǎn)提供參考.
對昌吉州1998年至2017年棉花產(chǎn)量、種植面積以及降水量進行分析,數(shù)據(jù)來源于新疆統(tǒng)計年鑒.
表1 昌吉州歷年棉花產(chǎn)量、種植面積及降水量
多元線性回歸分析主要用于分析多個解釋變量對同一個被解釋變量的影響.本研究中,筆者首先根據(jù)擬合函數(shù)對收集到的數(shù)據(jù)進行擬合并繪制散點圖,通過觀察2個變量之間的散點圖趨勢,進行相關(guān)關(guān)系的顯著性檢驗,選擇合適的模型擬合事物的變化趨勢.根據(jù)收集到的時間序列樣本數(shù)據(jù)建立回歸模型;其次,運用最小二乘法估計出模型中的各個回歸參數(shù),得到回歸擬合值,最終獲得相應(yīng)的線性回歸方程.最后,用t檢驗和F檢驗對回歸系數(shù)進行檢驗,運用F檢驗判斷自變量之間的關(guān)系以及回歸模型是否合適.
通過SPSS 20.0軟件繪制棉花產(chǎn)量與種植面積、降水量的散點圖(見圖1,2),觀察可得棉花產(chǎn)量與種植面積、降水量大致呈現(xiàn)線性回歸趨勢.
圖1 棉花產(chǎn)量與種植面積的散點圖
根據(jù)圖1和圖2可知,棉花產(chǎn)量隨種植面積的增加而增加,昌吉州降水量集中分布在200~400 mm范圍內(nèi),解釋變量種植面積、降水量與被解釋變量棉花產(chǎn)量成正相關(guān)關(guān)系,因此,用二元線性回歸模型嘗試建模:
圖2 降水量與棉花產(chǎn)量的散點圖
y=β0+β1x1+β2x2.
其中:y表示棉花產(chǎn)量;x1表示種植面積;x2表示降水量;β0表示回歸常數(shù);β1,β2表示回歸系數(shù).
通過最小二乘法解出回歸系數(shù):
運用軟件SPSS 20.0對種植面積、降水量解釋變量進行相關(guān)性分析,據(jù)表2所示,種植面積、降水量二者之間的相關(guān)系數(shù)為-0.101,可以看出種植面積和降水量之間不具有較強的相關(guān)性,另外Durbin-Watson統(tǒng)計量的值為1.492,因此無需考慮多重共線性的問題,種植面積和降水量對棉花產(chǎn)量的影響可以直接進行多元線性回歸分析.
表2 種植面積與降水量相關(guān)性分析
多元回歸分析建模結(jié)果見表3.
表3 回歸系數(shù)的確定(因變量:棉花產(chǎn)量)
模型各系數(shù)的估計值β0=-89 754,β1=1 797,β2=298,從各個系數(shù)的顯著性水平來看,對于種植面積,P=0.002<0.05,說明種植面積顯著影響棉花產(chǎn)量;對于降水量,P=0.153>0.05,說明降水量對棉花產(chǎn)量的影響不顯著,但從相關(guān)系數(shù)可以看出,二者之間仍然存在一定的線性趨勢,并且由下一節(jié)內(nèi)容可知,模型整體可通過F檢驗,于是確定線性回歸方程為:
y=-89 755+1 797x1+298x2.
從回歸方程可知,在降水量不變的情況下,種植面積增大1個單位,棉花產(chǎn)量平均增加1 883.922 t;而如果固定種植面積,降水量每增加1個單位,棉花產(chǎn)量平均增加341.296 t.
(1)原假設(shè)和備擇假設(shè).
原假設(shè):H0:β1=β2=0(F檢驗原假設(shè):模型中參數(shù)均為0).
備擇假設(shè):H1:β1,β2不全為0(F檢驗備擇假設(shè):模型中參數(shù)不全為0).
若原假設(shè)成立則自變量x對因變量y影響不顯著,反之,自變量x對因變量y影響顯著,變量之間有顯著線性的關(guān)系.
(2)檢驗結(jié)果見表4.
表4 F檢驗
根據(jù)F檢驗的結(jié)果,P=0.004<0.05,可知回歸方程整體顯著.說明棉花產(chǎn)量與種植面積及降雨量具有線性趨勢.
表5 變量的殘差分析
圖3 殘差PP圖
圖4 殘差直方圖
由圖3可以看出,殘差觀測值基本在預(yù)期值周圍波動,兩者呈現(xiàn)明顯的線性關(guān)系;由圖4可以看出,殘差的分布基本具有正態(tài)性.
通過F檢驗證實模型整體有效,因此采用公式y(tǒng)=-112 499.606+1 883.922x1+341.296x2計算棉花產(chǎn)量預(yù)測值,并由此畫出棉花產(chǎn)量預(yù)測值和真實值的擬合圖(圖5),從圖5可以看出,模型整體擬合效果較好.
圖5 回歸方程預(yù)測結(jié)果
根據(jù)棉花種植面積、降水量與棉花產(chǎn)量的散點圖以及線性回歸模型的數(shù)據(jù)分析結(jié)果可知,棉花種植面積、降水量對全年棉花順利出苗生長至關(guān)重要,其中全年棉花種植面積大小是全年棉花產(chǎn)量的重要影響因素之一,同時日照量、降雨季的天數(shù)、降水量及土壤濕度等也會影響全年棉花產(chǎn)量,日照量和土壤濕度的增加均有利于棉花出苗,昌吉州的日照一般在棉花出苗期就已經(jīng)能充分滿足全年棉苗生長所需的日照量,昌吉州的降水量處在200~400 mm之間且變化穩(wěn)定,因此降水量對全年棉花產(chǎn)量影響不顯著.故本研究認為棉花種植面積是昌吉州棉花產(chǎn)量的關(guān)鍵影響因素.