田垠
摘要:本文采用灰色預測和神經網絡的組合預測模型預測未來兩年城鄉(xiāng)居民收入差距。利用Adaptive-Lasso估計方法,得出就業(yè)率和經濟實力是影響城鄉(xiāng)居民收入差距的關鍵因素,它們之間存在高度正相關關系。預測結果表明:我國城鄉(xiāng)居民收入差距在未來兩年會持續(xù)增長,因此現(xiàn)階段建議降低失業(yè)率,加強財政對農村社會保障和教育支出,縮小城鄉(xiāng)居民收入差距。
關鍵詞:收入差距;Adaptive-Lasso估計;灰色預測;神經網絡;預測
引言
自上世紀八十年代以來,我國經濟快速增長,人民的生活水平極速提升。但隨著經濟快速發(fā)展,社會公平問題日益突出,城鄉(xiāng)居民之間收入差距的擴大就是證明。我國現(xiàn)已從一個國民收入相對平均的經濟體變成財富分配很不均勻的經濟體。1978年,中國城鄉(xiāng)居民人均可支配收入分別為343.4元和133.6元,城鄉(xiāng)居民收入差距為209.8元。到2013年,兩者之間的差距擴大到了18059.2元。相比于1978年,翻了85倍之多[1]。城鄉(xiāng)收入差距過大不僅意味著農村居民不能和城鎮(zhèn)居民一樣享有改革開放帶來的同等成果,同時,它對中國當前社會的穩(wěn)定和構建和諧社會造成了一定威脅。因此,分析預測好未來城鄉(xiāng)居民收入差距,對于維護中國社會經濟的健康發(fā)展以及整個和諧社會的構建都具有重要的理論和現(xiàn)實意義。
而目前,針對城鄉(xiāng)居民收入差距這一問題,大多數(shù)學者采用的是ARMA模型來進行建模與預測分析,但近年來也有不少學者采用灰色模型等其他方式進行預測。我國學者張桂齡通過ARMA模型對1974-2014年城鄉(xiāng)收入差距進行擬合和預測,認為應通過調整農業(yè)結構,對農產品實行保護價格等行為減少城鄉(xiāng)收入差距[2];兩位副教授呂艷麗和陳兵建也用ARMA模型分析和預測了甘肅省的收入差距[3];涂雄苓采用ARIMA模型、灰色模型和二次多項式模型三種建模方式進行預測,通過使用具有最低平均相對誤差絕對值(MAPE)的二次多項式預測模型來執(zhí)行二期預測,給出相應建議[4];張藝則是直接采用灰色預測GM(1,1)模型對河北省收入差距進行預測并提出建議[5]。他們都是采用單個模型對城鄉(xiāng)居民收入差距進行預測并分析建議,暫時還沒有學者嘗試用組合模型對我國城鄉(xiāng)居民收入差距進行預測。筆者基于1995-2017年中國城鄉(xiāng)居民收入差距的數(shù)據,建立灰色預測模型與人工神經網絡的組合預測模型,得到我國城鄉(xiāng)居民收入差距的預測值。
1、模型設定與指標選擇
1.1模型概述
近年來,Lasso被廣泛應用于參數(shù)估計和變量選擇,使用Lasso進行變量選擇已被證明在確定的條件下是一致的。Lasso最初由Robert Tibshirani于1996年提出,它是一種正則化方法,可同時執(zhí)行參數(shù)估計與變量選擇。Lasso參數(shù)估計的定義如下:
由于Lasso方法的運用具有需要滿足一定的苛刻條件的缺點,因此Zou給不同的系數(shù)賦予不同的權重,就此提出了一種改進的Lasso方法,這種改進的方法被稱為Adaptive-Lasso方法,定義如下:
最小二乘法得出的系數(shù)。
設一組非負單調原始數(shù)據序列為X(o)={X(0)(i),i=1,2...,n},對變量X(0)建立灰色預測模型,過程如下:
首先對變量X(O)進行一次累加,得到X(O)的一次累加序列X(1)={X(1)(k)=1'2...,n}。
為X(l)建立一階線性微分方程,如下所示:
該微分方程即為GM(1,1)模型。
求解微分方程(3),可得到預測模型:
鑒于GM(1,1)模型得到的為一次累加量,將GM(1,1)模型計算所得數(shù)據X(1)(k+1)經過累減還原為X(o)@+1),即X(O)的灰色預測模型為:
后驗差檢驗模型精度表如表1所示。
在本文中,我們使用Adaptive-Lasso估計來選擇變量,使用灰色預測模型對Adaptive-Lasso估計所選定的單個影響因素進行預測,得到城鄉(xiāng)居民收入差距在2018年-2019年的預測值。為了使預測結果具有較強的適用性和容錯能力,建立了歷史數(shù)據的神經網絡訓練模型,將灰色預測得到的預測結果輸入神經網絡模型中,得到結果。
預測模型過程的步驟如下:
(1)收集到與城鄉(xiāng)居民收入差距相關數(shù)據;
(2)利用(1)形成的已完成數(shù)據預處理的建模數(shù)據,建立Adaptive-Lasso變量選擇模型;
(3)在(2)的基礎上,建立單變量的灰色預測模型和人工神經網絡預測模型;
(4)利用(3)的預測值代人人工神經網絡模型中以獲得預測值。
1.2數(shù)據來源說明
從《中國統(tǒng)計年鑒》中得到1995-2015年我國城鎮(zhèn)居民人均可支配收入和農村居民人均可支配收入,從我國財政報告中,可以找出2016-2017年我國城鎮(zhèn)居民人均可支配收入和農村居民人均可支配收入,它們之間的差值是我國城鄉(xiāng)居民收入差距數(shù)據,用y表示(表2)。
在查閱文獻以及經濟學理論對其的解釋,共選取以下因素為影響城鄉(xiāng)居民收入差距(y)的自變量。
貿易依存度(Xl):根據基于要素稟賦理論的Stolpa-Samuelson定理,對外貿易會通過改變產品價格影響要素價格,從而影響一個國家的收入分配。為當年的進出口總額與當年的GDP比值。
貿易順差(X2):出口總額與進口總額的比值。
城鎮(zhèn)化(X3):城鎮(zhèn)人口占總人口的比率。
就業(yè)率(X4):城鎮(zhèn)就業(yè)人口占總就業(yè)人口的比率
經濟實力(X5):財政總收入。
社會衛(wèi)生占比(X6):衛(wèi)生總費用占GDP的比值。
第一產業(yè)比重(X7):第一產業(yè)增量占GDP的比值。
第二產業(yè)比重(X8):第二產業(yè)增量占GDP的比值。
第三產業(yè)比重(X9):第三產業(yè)增量占GDP的比值。
根據以上描述,獲得最終變量數(shù)據,如表3所示。
1.3主要變量分析
首先,對主要變量進行描述性統(tǒng)計分析,以獲得對數(shù)據的整體理解。表4給出了主要變量的描述性統(tǒng)計結果。由表可見,城鄉(xiāng)居民收入(y)的均值和標準差分別為10660.19和6753.67。這說明我國城鄉(xiāng)居民收入差距存在較大差異。
注:Min為最小值,Max為最大值,Mean為均值,SD為標準差。
相關系數(shù)可用于來描述定量變量之間的關系,初步判定因變量和解釋變量之間是否存在線性相關。變量的Pearson相關系數(shù)矩陣如表5所示。
由表5可知,貿易依存度(xl)與城鄉(xiāng)居民收入的線性關系十分不顯著,而貿易順差(x2)與城鄉(xiāng)居民收入線性關系不顯著。其余變量中,除第一產業(yè)比重(x7)和第二產業(yè)比重(x8)與城鄉(xiāng)居民收入呈負相關之外,其余與城鄉(xiāng)居民收入高度正相關。
運用LARS算法進行公式(2)的Adaptive-Lasso估計,LARS算法中對于每一個Y,都有一個最優(yōu)的λn與其對應。本文取Y=l,計算結果如表6所示。
由表6可以看出,貿易依存度、貿易順差、城鎮(zhèn)化、社會衛(wèi)生占比、第一產業(yè)比重、第二產業(yè)比重與第三產業(yè)比重等因素的系數(shù)均為O,這說明在模型構建過程中這幾個變量被剔除了。這是因為貿易依存度和貿易順差屬于進出口方面因素,對國內城鄉(xiāng)收入的影響十分小,對收入差距的影響更是微乎其微;城鎮(zhèn)化與城鄉(xiāng)居民收入存在明顯的共線性,因此在模型構建中剔除了這個變量;在我國農村醫(yī)保的大力實行的政策下,我們可以認為社會衛(wèi)生對城鎮(zhèn)和農村的影響是一樣大的;同理我們可以推斷地一、二、三產業(yè)增量對城鄉(xiāng)收入差距的影響一致,因此被剔除。上述結論體現(xiàn)了Adaptive-Lasso方法在構建模型時,不僅能夠識別并剔除存在高度共線性關系的變量,同時還具有對同時多指標進行建模的優(yōu)勢。
綜上所述,影響城鄉(xiāng)收入差距的關鍵因素是就業(yè)率、經濟實力。
2、城鄉(xiāng)居民收入預測
通過以上分析,得出就業(yè)率和經濟實力是影響城鄉(xiāng)居民收入的關鍵因素。針對這兩個因素建立灰色預測與神經網絡的組合預測模型,參數(shù)設置如下:誤差精度△t=10-7,學習次數(shù)n=10000次,神經元個數(shù)為2。通過灰色預測模型計算得出就業(yè)率(x4)、經濟實力(x5)在2018年及2019年的預測值,如表7所示,可知灰色預測模型得到的預測值具有很好的預測精度。
代入所建立的神經網絡預測模型,得到城鄉(xiāng)收入差距真實值與預測值的對比圖,如圖1所示。由該圖可以看出,使用灰色預測和神經網絡的組合預測模型具有一致性。
3、結論
本文利用Adaptive-Lasso變量選擇方法以及灰色預測和神經網絡模型對我國城鄉(xiāng)收入差距及其影響值進行分析與預測,預測結果表明,未來兩年內,我國城鄉(xiāng)居民收入差距將持續(xù)增加,且增長幅度較高。同時我國財政收入和就業(yè)率對縮減城鄉(xiāng)收入差距有好的影響,與城鄉(xiāng)收入差距呈高度正相關。由以上結論我們可以提出下面建議。
強化政府公共服務,協(xié)調資源,努力為社會成員提供平等發(fā)展的機會,改善公民福利,促進社會公平;通過打破行業(yè)壟斷,穩(wěn)定壟斷行業(yè)與一般行業(yè)人員收入差距,減小收入差距;建議從民間角度調整居民收入分配,努力提高低收入群體的收入水平。
還要加大對農村、農民的支持力度,提高其收入水平??s小城鄉(xiāng)收入差距的重點在于提高農民收入,而農民收入差距過大的原因在于區(qū)域間經濟發(fā)展的不平衡,因此需要完善收入分配體制,給予農村更多的政策支持。
參考文獻:
[1]郭小東,付升華.社會保護底線支出、城鎮(zhèn)偏好與城鄉(xiāng)居民收入差距[J].社會保障研究,2017,02:95-105.
[2]張桂齡.基于ARMA模型對我國城鄉(xiāng)居民收入差距的分析與預測[J].經營管理者,2017,20:66-67.
[3]呂艷麗,陳兵建.基于ARMA模型的城鄉(xiāng)居民收入差距分析與預測——以甘肅為例[J].商業(yè)經濟研究,2017,2:204-206
[4]涂雄苓.我國城鄉(xiāng)居民收入差距預測模型比較研究[J].安徽農業(yè)科學,2011.39(24):57-59,62.
[5]張藝.基于灰色預測法的河北省城鄉(xiāng)居民收入的分析與預測[J].商,2015,28:197,188.
[6]霍炳男.中國城鄉(xiāng)居民收入差距影響因素的實證檢驗[J].統(tǒng)計與決策,2017,4(427):110- 112.
[7]馬斌,張富饒,城鄉(xiāng)居民收入差距影響因素實證分析[J].中國農村經濟,2008,2:53-59.
[8]魏發(fā)凡.我國城鄉(xiāng)居民收入差距的影響因素分析[J].改革與開放,2010,7(298):4-6
[9]喻勝華,張靜.基于Lasso和BP神經網絡的組合預測及其應用——以居民消費支出預測為例[J].財經理論與實,2016,39:123-128.
[10]薛嘉春,韓建雨.我國居民收入差距發(fā)展趨勢研究——基于ARIMA模型的預測分析[J].當代經濟研究,2011,12:79-84.
[11]龔承剛,王夢,謝航.基于ARIMA模型的湖北省城鄉(xiāng)居民收入差距的預測統(tǒng)計與決策[J].2014,15:94-97.
[12]張良均,云偉標,王路,劉曉勇.R語言數(shù)據分析與挖掘實戰(zhàn)[M]北京:機械工業(yè)出版社,2015