卿俸伶, 李 燕, 王 豪, 劉羽姿, 繆 林, 鄭方江
(云南大學(xué) 建筑與規(guī)劃學(xué)院, 昆明 650091)
改革開(kāi)放以來(lái),河南作為人口大省面臨著嚴(yán)峻復(fù)雜的經(jīng)濟(jì)社會(huì)發(fā)展環(huán)境和艱巨繁重的改革發(fā)展任務(wù)。作為承擔(dān)著中部崛起的領(lǐng)頭羊和排頭兵,河南省的經(jīng)濟(jì)發(fā)展起到了重要作用。2018年河南省生產(chǎn)總值(GDP)已突破48 000億元,位居全國(guó)第五,比2017年增長(zhǎng)7.6%以上,占據(jù)中部地區(qū)的25%以上,穩(wěn)居中部地區(qū)首位[1]。作為農(nóng)業(yè)大省,河南糧食產(chǎn)量已占據(jù)全國(guó)10%以上。相比之下,大多文獻(xiàn)集中于農(nóng)業(yè)因素對(duì)河南經(jīng)濟(jì)發(fā)展的研究[2-5],很多學(xué)者忽視了工業(yè)、服務(wù)業(yè)等第二、第三產(chǎn)業(yè)對(duì)河南經(jīng)濟(jì)的影響。其次,河南作為內(nèi)陸省份,很多經(jīng)濟(jì)政策的制定都是學(xué)習(xí)沿海區(qū)域,自身優(yōu)勢(shì)不明顯。本文通過(guò)分析影響河南省經(jīng)濟(jì)發(fā)展的重要因素,為河南經(jīng)濟(jì)社會(huì)保持總體平穩(wěn)、穩(wěn)中有進(jìn)發(fā)展態(tài)勢(shì)提供啟示建議。
多元線性回歸主要是研究一個(gè)因變量與多個(gè)自變量之間的相關(guān)關(guān)系,還可以通過(guò)分析找出對(duì)因變量影響顯著的自變量。多元線性回歸模型是含有多個(gè)解釋變量的線性回歸模型,其方程為
Y=β0+β1X1+β2X2+β3X3+…+βpXp+ε
(1)
式中:X1,X2,X3,…,Xp分別代表自變量;p為自變量個(gè)數(shù);ε為隨機(jī)誤差;β為未知參數(shù)。如果有n組樣本,那么這個(gè)多元線性回歸,將會(huì)組成一個(gè)矩陣。
(2)
則該多元線性回歸方程矩陣形式可寫(xiě)作Y=Xβ+ε。
主成分分析是采取一種數(shù)學(xué)降維的方法,找出幾個(gè)綜合變量來(lái)代替原來(lái)眾多的變量,使這些綜合變量能盡可能地代表原來(lái)變量的信息量,而且彼此之間互不相關(guān)。這種通過(guò)正交變換將一組可能存在相關(guān)性的變量轉(zhuǎn)換為一組線性不相關(guān)的變量,轉(zhuǎn)換后的這組變量叫主成分。用主成分分析篩選變量,可以用較少的計(jì)算量來(lái)選擇量,獲得選擇最佳變量子集合的效果[6]。
由中國(guó)國(guó)家統(tǒng)計(jì)局官網(wǎng)可查得表1中相關(guān)數(shù)據(jù)[7],其中,投資率是利用固定資產(chǎn)投資額在河南省地區(qū)生產(chǎn)總值中所占百分比來(lái)衡量固定資產(chǎn)對(duì)經(jīng)濟(jì)增長(zhǎng)的影響;城鎮(zhèn)化率用河南省城鎮(zhèn)年末常住人口占年末總常住人口的百分比來(lái)衡量[8]。根據(jù)所選定的數(shù)據(jù)指標(biāo),將河南省的人均地區(qū)生產(chǎn)總值確定為因變量Y,來(lái)代表河南省的經(jīng)濟(jì)發(fā)展?fàn)顩r;第一產(chǎn)業(yè)增加值占地區(qū)生產(chǎn)總值的比重、第二產(chǎn)業(yè)增加值占地區(qū)生產(chǎn)總值的比重、第三產(chǎn)業(yè)增加值占地區(qū)生產(chǎn)總值的比重、投資率、財(cái)政支出增加值占地區(qū)生產(chǎn)總值的比重、城鎮(zhèn)化率、居民消費(fèi)水平指數(shù)、教育經(jīng)費(fèi)增長(zhǎng)率分別確定為因變量X1、X2、X3、X4、X5、X6、X7、X8??傻肶關(guān)于X的多元線性回歸方程模型為Y=β0+β1X1+β2X2+β3X3+β4X4+β5X5+β6X6+β7X7+β8X8+ε。
表1 1999—2018年河南省經(jīng)濟(jì)發(fā)展指標(biāo)原始數(shù)據(jù)
在河南省1999—2018年統(tǒng)計(jì)年鑒中,其中關(guān)于人均地區(qū)生產(chǎn)總值、投資率、城鎮(zhèn)化率、居民消費(fèi)水平指數(shù)和教育經(jīng)費(fèi)增長(zhǎng)率存在不同程度的數(shù)據(jù)缺失。缺失值的出現(xiàn)使得數(shù)據(jù)分析中所表現(xiàn)出的不確定性更加顯著,為此使用SPSS統(tǒng)計(jì)分析軟件通過(guò)EM估算統(tǒng)計(jì)和回歸估算統(tǒng)計(jì)進(jìn)行缺失值分析,從未缺失數(shù)據(jù)的分布情況中推算出缺失數(shù)據(jù)的估計(jì)值,從而能有效地使用所有數(shù)據(jù)進(jìn)行分析,來(lái)提高統(tǒng)計(jì)結(jié)果的可信度。單變量統(tǒng)計(jì)見(jiàn)表2,估算標(biāo)準(zhǔn)差見(jiàn)表3。
表2 單變量統(tǒng)計(jì)
表3 估算標(biāo)準(zhǔn)差
由表2單變量統(tǒng)計(jì)可知,城鎮(zhèn)化率具有最多缺失值(30%);教育增長(zhǎng)經(jīng)費(fèi)次之(15%);人均地區(qū)生產(chǎn)總值、投資率、居民消費(fèi)水平指數(shù)最少(5%)。又原始數(shù)據(jù)中,1999—2004年城鎮(zhèn)化率數(shù)據(jù)均缺失,故舍棄該自變量。余下缺失值可通過(guò)替換缺失值方法進(jìn)行數(shù)據(jù)填補(bǔ)。
在SPSS統(tǒng)計(jì)分析軟件中,對(duì)人均地區(qū)生產(chǎn)總值、投資率、居民消費(fèi)水平指數(shù)和教育經(jīng)費(fèi)增長(zhǎng)率等變量進(jìn)行缺失值替換處理。由于人均地區(qū)生產(chǎn)總值、投資率和居民消費(fèi)水平指數(shù)等變量缺失值均處于變量數(shù)據(jù)首尾兩端,故采用該點(diǎn)的線性趨勢(shì)法補(bǔ)填缺失值;教育經(jīng)費(fèi)增長(zhǎng)率在中間和末端,故先采用鄰近點(diǎn)中位數(shù)進(jìn)行補(bǔ)填,后通過(guò)該點(diǎn)的線性趨勢(shì)法補(bǔ)全缺失值。補(bǔ)全數(shù)據(jù)結(jié)果見(jiàn)表4。
表4 1999—2018年替換數(shù)據(jù)
相關(guān)分析是數(shù)據(jù)統(tǒng)計(jì)分析中經(jīng)常使用的分析方法之一。通過(guò)對(duì)不同特征或數(shù)據(jù)間的關(guān)系進(jìn)行分析,發(fā)現(xiàn)影響因變量的驅(qū)動(dòng)因素。通過(guò)SPSS統(tǒng)計(jì)分析軟件中的相關(guān)分析,得出相關(guān)性及顯著性水平表(表5),并分析每個(gè)自變量之間的相關(guān)性。
表5中顯示了各變量之間的相關(guān)系數(shù),包括自變量和因變量在內(nèi)的8個(gè)變量之間的Pearson相關(guān)系數(shù)及單尾檢驗(yàn)的顯著性水平。其中第一產(chǎn)業(yè)增加值占地區(qū)生產(chǎn)總值的比值、投資率_1、財(cái)政支出增加值占地區(qū)生產(chǎn)總值的比值等3個(gè)自變量與因變量人均地區(qū)生產(chǎn)總值之間的相關(guān)系數(shù)均大于0.90,且顯著性相關(guān)的概率接近0.00,小于0.01,這表明它們與人均地區(qū)生產(chǎn)總值之間存在顯著相關(guān)性,因此變量之間具有相關(guān)性。而人均地區(qū)生產(chǎn)總值與這3個(gè)影響經(jīng)濟(jì)發(fā)展的主要因素之間是否具有定量線性關(guān)系,在此通過(guò)建立一個(gè)合適的數(shù)學(xué)運(yùn)算模型進(jìn)行進(jìn)一步驗(yàn)證,可將上述3個(gè)自變量和因變量人均地區(qū)生產(chǎn)總值_1相關(guān)數(shù)據(jù)采用逐步回歸進(jìn)行多元線性回歸分析。
3.4.1 模型檢驗(yàn)
多元線性回歸模型的擬合度檢驗(yàn)結(jié)果見(jiàn)表6,可以看出調(diào)整后模型1和模型2的R2擬合優(yōu)度,模型2的擬合優(yōu)度明顯優(yōu)于模型1(0.968>0.962)。
從表7中可以看出,模型2中的回歸平方和為4 512 584 728.325,殘差平方和為131 021 146.292,由于回歸平方和占總平方和的97.18%,因此該線性回歸模型解釋了總平方和的97.18%,解釋效果較好。
在表8中,根據(jù)3σ原理所顯示的預(yù)測(cè)值和殘值的殘差統(tǒng)計(jì)表中標(biāo)準(zhǔn)殘差的最大值為1.529<3,可見(jiàn)樣本數(shù)據(jù)中不存在奇異數(shù)據(jù)。通過(guò)繪制樣本數(shù)據(jù)觀測(cè)量累積概率P-P圖,如圖1所示,從左下到右上的樣本數(shù)據(jù)所呈現(xiàn)的散點(diǎn)基本呈直線趨勢(shì),由此可以認(rèn)定樣本分布基本上服從正態(tài)分布。又根據(jù)圖2回歸標(biāo)準(zhǔn)化殘差直方圖,可知大部分自變量的殘差都符合正態(tài)分布。
3.4.2 回歸方程模型
表9為兩個(gè)模型的回歸系數(shù),根據(jù)表中非標(biāo)準(zhǔn)化系數(shù)B值得到逐步回歸的兩個(gè)模型分別為
模型1:Y=-12 304.594+561.544X4;
模型2:Y=-23 341.875+300.643X4+1 960.194X5。
表5 相關(guān)性及顯著性水平表
表6 模型摘要c
表7 方差分析a
表8 殘差統(tǒng)計(jì)a
因變量為人均地區(qū)生產(chǎn)總值_1圖1 回歸標(biāo)準(zhǔn)化殘差的標(biāo)準(zhǔn)P-P圖
由上述分析已知,模型2的擬合度明顯優(yōu)于模型1,且模型中自變量的顯著性均小于0.05,故選取模型2作為線性回歸方程模型。
由建立的線性回歸方程模型Y=-23 341.875+300.643X4+1 960.194X5可知,投資率_1每增加1個(gè)百分點(diǎn),人均地區(qū)生產(chǎn)總值可增加300.643元;財(cái)政支出增加值占地區(qū)生產(chǎn)總值的比值每增加1個(gè)百分點(diǎn),人均地區(qū)生產(chǎn)總值可增加1 960.194元;且兩者的數(shù)值越高,河南省的人均生產(chǎn)總值越高。
因變量為人均地區(qū)生產(chǎn)總值_1圖2 回歸標(biāo)準(zhǔn)化殘差直方圖
由表9可知,投資率_1及財(cái)政支出增加值占地區(qū)生產(chǎn)總值的比值的VIF=28.858(方差膨脹因子)處于10~100,故兩者均存在較強(qiáng)多重共線性;因此,可通過(guò)主成分分析采用數(shù)學(xué)降維的方法,將變量進(jìn)行信息濃縮成為互不相關(guān)的綜合變量。表10為總方差解釋,在初始特征值中可知成分1和2的特征值大于1,則合計(jì)可解釋85.261%的方差,提取成分1和2作為主成分。
表9 回歸系數(shù)a
表10 總方差解釋
成分1和2與各影響因素間均無(wú)明顯的公因子可解釋,則采用因子旋轉(zhuǎn)得到旋轉(zhuǎn)后的成分矩陣,見(jiàn)表11。在凱撒正態(tài)化最大方差法旋轉(zhuǎn)后得到的成分矩陣中,成分1與“投資率_1、財(cái)政支出增加值占地區(qū)生產(chǎn)總值的比值”的相關(guān)性較高(>0.9),可定義為“投資影響因子”,成分2與“第二產(chǎn)業(yè)增加值占地區(qū)生產(chǎn)總值的比值、第三產(chǎn)業(yè)增加值占地區(qū)生產(chǎn)總值的比值”的相關(guān)性較高(>0.9),可定義為“非農(nóng)產(chǎn)業(yè)影響因子”。
表11 旋轉(zhuǎn)后的成分矩陣a
根據(jù)表12成分得分系數(shù)矩陣模型,可得出各成分表達(dá)式為
F1=-0.307X1-0.014X2-0.014X3+0.342X4+0.336X5+0.046X7-0.140X8;
F2=-0.017X1+0.325X2+0.325X3-0.072X4-0.055X5+0.220X7+0.302X8。
表12 成分得分系數(shù)矩陣
由于各主成分方差貢獻(xiàn)率不同,因此在進(jìn)行綜合評(píng)價(jià)時(shí)要結(jié)合主成分貢獻(xiàn)率,協(xié)調(diào)好各主成分之間的側(cè)重關(guān)系。以各主成分相對(duì)方差貢獻(xiàn)率為權(quán)重,對(duì)主成分得分和相應(yīng)權(quán)重進(jìn)行線性加權(quán)求和構(gòu)建河南省經(jīng)濟(jì)影響因素綜合評(píng)價(jià)函數(shù)模型,即Yi=(43.449F1+41.812F2)/85.261;利用該模型計(jì)算各影響因素綜合得分并對(duì)其進(jìn)行排序,結(jié)果見(jiàn)表13。
表13 各影響因素綜合得分及排序
由模型可知,“第二、三產(chǎn)業(yè)增加值占地區(qū)生產(chǎn)總值的比值”等非農(nóng)產(chǎn)業(yè)影響因子(主成分1)綜合得分最高,在各影響河南省經(jīng)濟(jì)因素中排名首位;“財(cái)政支出增加值占地區(qū)生產(chǎn)總值的比值、投資率_1”等投資影響因子(主成分2)位居第二;故兩者對(duì)于河南省經(jīng)濟(jì)發(fā)展起著積極的正向作用。
在主成分分析模型中,第二、三等產(chǎn)業(yè)在成分矩陣中均達(dá)到了0.943,且兩者同屬“非農(nóng)產(chǎn)業(yè)影響因子”在綜合得分中位居榜首。因此為實(shí)現(xiàn)河南經(jīng)濟(jì)繁榮,提高第二、三產(chǎn)業(yè)增加值對(duì)其至關(guān)重要。加快工業(yè)、服務(wù)業(yè)建設(shè)來(lái)切實(shí)提高人均生產(chǎn)總值,實(shí)現(xiàn)中原經(jīng)濟(jì)繁榮,增強(qiáng)經(jīng)濟(jì)發(fā)展后勁,促使河南經(jīng)濟(jì)躍上新的臺(tái)階。
4.2.1 增加固定資產(chǎn)投資
固定資產(chǎn)投資是衡量一個(gè)區(qū)域經(jīng)濟(jì)活力的重要指標(biāo),固定資產(chǎn)的增加說(shuō)明了投資者對(duì)經(jīng)濟(jì)前景的信心,也為經(jīng)濟(jì)的持續(xù)發(fā)展提供了動(dòng)力。宋麗智通過(guò)協(xié)整分析和仿真檢驗(yàn)顯示固定資產(chǎn)投資與經(jīng)濟(jì)增長(zhǎng)具有雙向的格蘭杰因果關(guān)系,即我國(guó)固定資產(chǎn)投資與經(jīng)濟(jì)增長(zhǎng)存在相互促進(jìn)作用[9]。在相關(guān)性分析中,投資率與人均地區(qū)生產(chǎn)總值相關(guān)性最強(qiáng)和顯著性水平較高,且兩個(gè)模型中均包含投資率系數(shù)。在主成分分析中,投資率綜合得分位居各指標(biāo)中第四位,且得分在主成分1中位居第二位。因此,擴(kuò)大固定資產(chǎn)投資來(lái)加強(qiáng)投資率是提高人均地區(qū)生產(chǎn)總值、優(yōu)化河南經(jīng)濟(jì)的重中之重。
4.2.2 提高政府財(cái)政支出
在相關(guān)性分析中,財(cái)政支出占地區(qū)生產(chǎn)總值的比重與人均地區(qū)生產(chǎn)總值相關(guān)性極強(qiáng)(0.981),在模型2中也含該變量系數(shù)。在主成分分析中,其綜合得分位居各指標(biāo)第三位,且得分在主成分1位居首位。因此,在經(jīng)濟(jì)增長(zhǎng)方面,河南省政府財(cái)政支出起到的是積極的正向作用,擴(kuò)大財(cái)政支出對(duì)河南省經(jīng)濟(jì)發(fā)展有著顯著效果。