唐賢芳,崔 巖,張淑麗
(西北工業(yè)大學(xué)明德學(xué)院信息工程學(xué)院,陜西西安 710124)
一個(gè)國家或地區(qū)的人口數(shù)量直接影響該地區(qū)就業(yè)、環(huán)境、經(jīng)濟(jì)的發(fā)展,因此科學(xué)地預(yù)測人口的數(shù)量對制定經(jīng)濟(jì)政策、區(qū)域發(fā)展規(guī)劃具有非常重要的意義[1].
灰色理論是鄧聚龍教授于1982年提出的,GM(1,1)模型是其中內(nèi)容之一,它具有所需信息量少,模型建立較簡單,求解容易等特點(diǎn),在社會、經(jīng)濟(jì)、農(nóng)業(yè)、電力等領(lǐng)域得到了廣泛的應(yīng)用.但它也存在一些缺陷,比如對數(shù)據(jù)序列有比較嚴(yán)格的要求,當(dāng)發(fā)展系數(shù)的絕對值比較大時(shí),會使模型預(yù)測偏差增大,預(yù)測效果不理想.針對它的缺陷,近年來不少學(xué)者對GM(1,1)模型進(jìn)行了改進(jìn)[2].本文在數(shù)據(jù)檢驗(yàn)的基礎(chǔ)上,選擇2003~2015年數(shù)據(jù)進(jìn)行靜態(tài)灰色建模,采用等維遞補(bǔ)的方法對數(shù)據(jù)進(jìn)行動態(tài)預(yù)測.對比兩個(gè)模型,動態(tài)預(yù)測的效果明顯優(yōu)于靜態(tài)預(yù)測.最后用構(gòu)建的動態(tài)灰色預(yù)測模型對陜西省2018~2028年人口數(shù)量進(jìn)行預(yù)測.結(jié)果可為有關(guān)部門制定相關(guān)決策提供了較為科學(xué)、合理的依據(jù).
GM(1,1)灰色模型是通過對原數(shù)據(jù)進(jìn)行生成處理,使其呈現(xiàn)指數(shù)變化趨勢,依此建立微分方程,得到預(yù)測模型.該模型適用于對部分信息已知、部分信息未知的灰色系統(tǒng)進(jìn)行預(yù)測,特別適合小樣本、增長速度較快的數(shù)據(jù)建模求解[3].它的建模一般分為以下幾個(gè)步驟.
第一步:原始數(shù)據(jù)檢驗(yàn).因?yàn)镚M(1,1)本質(zhì)是指數(shù)方程,為了確保建模的可行性,要求用于預(yù)測的數(shù)據(jù)具有指數(shù)變化規(guī)律,才能建立灰色模型.數(shù)據(jù)檢驗(yàn)的標(biāo)準(zhǔn)有級比檢驗(yàn)和光滑度檢驗(yàn)兩種.
設(shè)原始數(shù)據(jù)列為
x(0)=[x(0)(1),x(0)(2),…,x(0)(n)]
(1)
級比檢驗(yàn):定義數(shù)據(jù)序列的級比為
(2)
光滑度檢驗(yàn):首先對原始數(shù)據(jù)序列做一次累加,生成累加序列為
x(1)=[x(1)(1),x(1)(2),…,x(1)(n)]
(3)
(4)
是k的遞減函數(shù),則該數(shù)據(jù)序列為光滑離散序列.只有滿足這一條件才適合用灰色預(yù)測.
第二步:灰色模型的建立.對累加序列建立一階微分方程
(5)
其中α是發(fā)展灰數(shù),μ為內(nèi)生控制灰數(shù).
第三步:灰色模型的求解.設(shè)取背景值z(1)(k)為x(1)的鄰近均值生成數(shù)序列
z(1)(k)=0.5[x(1)(k-1)+x(1)(k-1)],
k=2,3…,n
(6)
(7)
其中
Y=[x(0)(2),x(0)(3),…,x(0)(n)]T
(8)
將求解出的參數(shù)代入到微分方程(5)中,得相應(yīng)的x(1)序列預(yù)測模型為
k=1,2,…n-1
(9)
累減后得到原始數(shù)據(jù)序列的預(yù)測為
k=1,2,…n-1
(10)
第四步:模型精度檢驗(yàn).為了確保所建立的灰色模型有較高的精度能夠應(yīng)用于預(yù)測實(shí)際,按照灰色理論需要對所建立的GM(1,1)模型的精度進(jìn)行檢驗(yàn).一般的精度檢驗(yàn)包括3個(gè)方面:殘差檢驗(yàn)、關(guān)聯(lián)度檢驗(yàn)和后差檢驗(yàn)[4].
(10)
一般要求相對殘差值小于20%,最好是小于10%,符合要求.
關(guān)聯(lián)度檢驗(yàn): 關(guān)聯(lián)度是用來定量描述各變化過程之間的差別.關(guān)聯(lián)系數(shù)越大,說明預(yù)測值和實(shí)際值越接近.第t個(gè)數(shù)據(jù)的關(guān)聯(lián)系數(shù)定義為
(11)
(12)
當(dāng)關(guān)聯(lián)度的值大于0.6時(shí),認(rèn)為通過檢驗(yàn).
后驗(yàn)差檢驗(yàn): 后驗(yàn)差檢驗(yàn)有兩個(gè)指標(biāo),即后驗(yàn)差比C和小誤差概率P.
(14)
其中S1,S2分別為原始數(shù)據(jù)和殘差的均方差.模型精度等級參考表1所示.
表1 后驗(yàn)差檢驗(yàn)判別參照表
等維遞補(bǔ)模型是對傳統(tǒng)靜態(tài)GM(1,1)模型的動態(tài)應(yīng)用,它通過不斷引入已知信息來減少灰平面的灰度,這樣的模型由于及時(shí)引入了新的已知信息,就能比較準(zhǔn)確及時(shí)地反映系統(tǒng)的變化.它的原是用已知數(shù)列建立第一個(gè)灰色模型,用它來預(yù)測第一個(gè)預(yù)測值.然后將第一個(gè)已知的值去掉,將預(yù)測值加到數(shù)列后,保持?jǐn)?shù)據(jù)序列的等維,然后重新建立灰色模型,預(yù)測下一個(gè)值.如此推進(jìn)、重復(fù),逐個(gè)預(yù)測、去值、遞補(bǔ),直到完成預(yù)測任務(wù)或達(dá)到精度要求[5].
灰色預(yù)測的特長是樣本數(shù)據(jù)不必很多,即“小樣本”數(shù)據(jù),所以樣本的選取不需太多.通過查詢中國統(tǒng)計(jì)網(wǎng)的數(shù)據(jù)中心,選取2003~2017年陜西省年末人口總數(shù)為預(yù)測樣本,具體值見表2.
選取2003~2015年數(shù)據(jù)建立靜態(tài)灰色模型,
表2 2003~2017年陜西省人口數(shù)(單位:萬人)
根據(jù)公式(1)得到
x(0)=(3672,3681,3690,3699,3708,3718,3727,3735,3743,3753,3764,3775,3793)
按照建模過程,則對上式進(jìn)行一次累加生成,根據(jù)公式(3)得到新序列:
x(1)=
對數(shù)據(jù)進(jìn)行級比檢驗(yàn).根據(jù)公式(2)計(jì)算得
δ(k)=
當(dāng)n=13時(shí),
表明原始數(shù)據(jù)滿足級比檢條件.
根據(jù)公式(4),則
ρ(k)=(1.0025,0.5018,0.335,0.2515,
0.2015,0.1681,0.1442,0.1263,0.1125,0.1014,
0.0923,0.0849),
滿足數(shù)據(jù)光滑度檢驗(yàn)要求.檢驗(yàn)結(jié)果表明原始數(shù)據(jù)序列可以用于GM(1,1)灰色模型預(yù)測.
根據(jù)公式(7)計(jì)算灰色系數(shù)α,μ:
將系數(shù)代入公式(8)得到GM(1,1)一次累加數(shù)據(jù)的預(yù)測模型為
(13)
取k=1,2…,14,利用式(13)計(jì)算出2003~2017年的一次累加數(shù)據(jù),再利用公式(9)計(jì)算2003~2017年陜西省人口預(yù)測值,見表3第3列.
表3 擬合及人口預(yù)測
為了降低灰度,對預(yù)測樣本采用逐年遞補(bǔ),不斷補(bǔ)充新信息,對靜態(tài)GM(1,1)模型參數(shù)做不斷修正,通過一次遞補(bǔ)預(yù)測2017年陜西人口數(shù)量.遞補(bǔ)GM(1,1)預(yù)測模型的原始預(yù)測數(shù)據(jù)列為
累加數(shù)據(jù)預(yù)測模型
對以上兩種模型預(yù)測結(jié)果,進(jìn)行殘差檢驗(yàn)、關(guān)聯(lián)度檢驗(yàn)和后差檢驗(yàn),結(jié)果見表4.
表4 兩個(gè)模型檢驗(yàn)值
從表4可見,兩個(gè)模型的精度都滿足要求,可以進(jìn)行外推預(yù)測,但動態(tài)模型的精度更高.且從預(yù)測的2017年的數(shù)值可見,動態(tài)預(yù)測數(shù)值比靜態(tài)預(yù)測的數(shù)值更接近真值.所以,選擇動態(tài)模型進(jìn)行外推預(yù)測.
根據(jù)灰色預(yù)測維數(shù)選擇經(jīng)驗(yàn):數(shù)據(jù)年份越靠近待預(yù)測年份預(yù)測越準(zhǔn)確.我們選擇2005~2017年數(shù)據(jù)運(yùn)用等維遞補(bǔ)方法進(jìn)行外推.通過MATLAB編程計(jì)算得到陜西省2018~2028年的人口預(yù)測值,見表5.
對于以上外推模型進(jìn)行殘差檢驗(yàn)、關(guān)聯(lián)度檢驗(yàn)和后差檢驗(yàn),檢驗(yàn)結(jié)果如表6所示.
從表6可見,預(yù)測2018~2028年的模型精度均為優(yōu),從各項(xiàng)綜合指標(biāo)來分析,精度隨著外推的次數(shù)呈現(xiàn)先增后減的趨勢,第十次外推的后驗(yàn)差值比較高,所以,不再往外遞推.
表5 2018~2029年陜西省人口預(yù)測值(單位:萬人)
表6 外推模型的精度檢驗(yàn)
(1)選擇一樣的數(shù)列進(jìn)行預(yù)測,動態(tài)遞補(bǔ)模型明顯好于靜態(tài)預(yù)測,預(yù)測精度更高,可靠性更強(qiáng);
(2)采用動態(tài)遞補(bǔ)預(yù)測,隨著模型的外推,精度會呈現(xiàn)先增后減趨勢.遞推次數(shù)不能太大,一定要結(jié)合精度要求綜合考慮;
(3)根據(jù)動態(tài)預(yù)測結(jié)果,陜西省人口呈現(xiàn)遞增趨勢.但每年增加的比例在0.35%左右,與陜西省人民政府印發(fā)的人口規(guī)劃中,提到人口自然增長率穩(wěn)定在0.4%有些差距,需要相關(guān)部門采取措施提高人口自然增長率.