陳友余
(湖南財(cái)政經(jīng)濟(jì)學(xué)院,湖南 長(zhǎng)沙 410205)
農(nóng)村人均純收入是我國(guó)全面建設(shè)小康社會(huì)非常重要的衡量指標(biāo)之一。我國(guó)農(nóng)村人均純收入呈現(xiàn)持續(xù)緩慢增長(zhǎng)態(tài)勢(shì)的同時(shí),農(nóng)村居民與城鎮(zhèn)居民之間、農(nóng)村農(nóng)民內(nèi)部之間的收入差距正不斷擴(kuò)大?;诖耍鶕?jù)我國(guó)近十年來的農(nóng)村人均純收入數(shù)據(jù),運(yùn)用灰色預(yù)測(cè)法和馬爾科夫鏈數(shù)學(xué)方法建立改進(jìn)的灰色馬爾科夫鏈組合模型進(jìn)行預(yù)測(cè),對(duì)農(nóng)村人均純收入進(jìn)行系統(tǒng)分析具有非常重要的現(xiàn)實(shí)意義。
灰色預(yù)測(cè)方法由鄧聚龍教授最先提出,其應(yīng)用微積分理論進(jìn)行首次建模,用于研究一些灰色系統(tǒng)?;疑到y(tǒng)的特點(diǎn)是一部分信息是能被觀察且已知的,但還有一部分信息是未知的[1]。這種預(yù)測(cè)方法的最大優(yōu)點(diǎn)在于建模操作過程簡(jiǎn)單、模型表達(dá)式簡(jiǎn)潔且實(shí)用性強(qiáng),故而已廣泛應(yīng)用于醫(yī)藥、旅游、水利、農(nóng)業(yè)、生物等領(lǐng)域[2-6]?,F(xiàn)行灰色預(yù)測(cè)方法主要應(yīng)用于平穩(wěn)序列中,應(yīng)用范圍過于狹隘,為了突破這一瓶頸,一些學(xué)者在現(xiàn)有模型的基礎(chǔ)上進(jìn)行了方法上的改進(jìn),殘差GM(1,1)模型即是其中較為突出的改進(jìn)方法之一[7-8]。筆者先根據(jù)我國(guó)十年來的農(nóng)村人均純收入數(shù)據(jù),建立了傳統(tǒng)GM(1,1)模型,然后運(yùn)用殘差改進(jìn)法中的變起點(diǎn)方式進(jìn)行改進(jìn),建立預(yù)測(cè)模型,并從中挑選最理想的模型用于后續(xù)研究,在此基礎(chǔ)上應(yīng)用馬爾科夫鏈模型對(duì)灰色殘差進(jìn)行分類,得到由區(qū)間和概率組成的預(yù)測(cè)范圍。這種組合預(yù)測(cè)方法既提高了預(yù)測(cè)精度,又能有效增強(qiáng)實(shí)踐操作性。
灰色傳統(tǒng)GM(1,1)模型是對(duì)初始的時(shí)間序列經(jīng)過一次累加后生成具有強(qiáng)遞增性質(zhì)的時(shí)間序列,然后在此基礎(chǔ)上建立一一對(duì)應(yīng)的近似微分方程,以呈現(xiàn)時(shí)間序列內(nèi)在的發(fā)展規(guī)律。
初始的時(shí)間序列表示為:x(0)=[x(0)(1),x(0)(2),…,x(0)(n)],其中n 為初始的時(shí)間序列內(nèi)部數(shù)據(jù)個(gè)數(shù),對(duì)x(0)經(jīng)過一次累加后生成的時(shí)間序列表示為:,其中,具有強(qiáng)遞增性,i=1,2,…,n。
準(zhǔn)光滑性檢驗(yàn)主要通過準(zhǔn)光滑系數(shù)來檢驗(yàn),用p(i+1)表示,當(dāng)p(i)∈[0,0.5]時(shí)滿足準(zhǔn)光滑條件,通過檢驗(yàn);準(zhǔn)指數(shù)性檢驗(yàn)主要通過準(zhǔn)指數(shù)性指標(biāo)來檢驗(yàn),用σi+1表示當(dāng)σ(i)∈[1,1.5]時(shí)滿足準(zhǔn)指數(shù)條件,通過檢驗(yàn)。
若x(0)能通過準(zhǔn)光滑性檢驗(yàn),x(1)能通過準(zhǔn)指數(shù)性檢驗(yàn),則灰色傳統(tǒng)GM(1,1)的白化微分方程可表示為:,其中,a 為發(fā)展過程灰度,b 為灰色影響量,a 與b 均為未知參數(shù);t 表示時(shí)間;由于x(1)與不滿足平射關(guān)系,故白化微分方程無精確解,筆者采用等權(quán)數(shù)方法計(jì)算近似解,即對(duì)x(1)采用相鄰均值生成一序列,表示為w(1),w(1)= [w(1)(1),w(1)(2),…,w(1)(n)],其中w(1)(i+1)=0.5x(1)(i)+0.5x(1)(i+1)。于是由白化微分方程可變形為灰微分方程,灰微分方程為x(0)(i)+aw(1)(i)=b.
代入灰微分方程x(0)(i)+aw(1)(i)=b,可求出對(duì)應(yīng)的離散響應(yīng)函數(shù):
對(duì)累加的^x(1)(i+1),進(jìn)行累減還原,得到初始數(shù)據(jù)的預(yù)測(cè)值:
(1)逐點(diǎn)檢驗(yàn)
逐點(diǎn)檢驗(yàn)主要是檢驗(yàn)絕對(duì)誤差[不妨用ε(0)(i)表示]和相對(duì)誤差[用e(i)表示]。平均相對(duì)誤差為逐點(diǎn)檢驗(yàn)的檢驗(yàn)指標(biāo),不妨用ˉe(i)表示,0.10 為臨界點(diǎn),當(dāng)(i)≤0.10 時(shí),表明通過檢驗(yàn),ˉe(i)越小,精度越高。
(2)后驗(yàn)差比值檢驗(yàn)
(3)小誤差頻率檢驗(yàn)
表1 精度檢驗(yàn)表
實(shí)際應(yīng)用過程中,不需要應(yīng)用初始時(shí)間序列中的全部數(shù)據(jù)來建立灰色預(yù)測(cè)模型。在初始時(shí)間序列中有規(guī)律的選取部分?jǐn)?shù)據(jù)(應(yīng)大于等于4 個(gè)),就可建立一個(gè)灰色預(yù)測(cè)模型。為了改進(jìn)傳統(tǒng)GM(1,1)模型,建模所應(yīng)用的數(shù)據(jù)要滿足兩個(gè)條件:第一,時(shí)距是相等的,從而使之具備可比性;第二,必須包含x(0)(n),因?yàn)樽罱臅r(shí)間影響最大?;诖耍詳?shù)據(jù)x(0)(n)為終點(diǎn),從后往前依次不斷選取數(shù)據(jù),可以形成一組預(yù)測(cè)模型,從這組模型中挑選最佳模型應(yīng)用于后續(xù)預(yù)測(cè),其方法如下:一是初始時(shí)間序列的生成。給定初始時(shí)間序列x(0)=(x(0)(1),x(0)(2),…,x(0)(n)),其中n 為初始時(shí)間序列中數(shù)據(jù)的個(gè)數(shù)。二是模型構(gòu)建思路。若初始時(shí)間序列包含全部數(shù)據(jù),則為全數(shù)據(jù)模型;若初始時(shí)間序列包含部分?jǐn)?shù)據(jù),則為部分?jǐn)?shù)據(jù)模型。三是模型構(gòu)建。由于模型中數(shù)據(jù)至少為4 個(gè),故可建立一個(gè)4 維預(yù)測(cè)模型:[x(0)(n-3),x(0)(n-2),x(0)(n-1),x(0)(n)];由于模型中數(shù)據(jù)最多為n 個(gè),故可建立一個(gè)n 維預(yù)測(cè)模型(即全數(shù)據(jù)模型)。通過計(jì)算,總共可建立n-3 個(gè)預(yù)測(cè)模型。四是精度檢驗(yàn)與擬合度檢驗(yàn)。對(duì)這n-3 個(gè)預(yù)測(cè)模型按傳統(tǒng)灰色預(yù)測(cè)模型方法進(jìn)行預(yù)測(cè),并對(duì)各模型進(jìn)行檢驗(yàn),從中挑選出最佳的模型用于后續(xù)預(yù)測(cè)。
從變起點(diǎn)灰色預(yù)測(cè)模型中挑選出最佳模型,應(yīng)用馬爾可夫鏈方法對(duì)這一模型的殘差進(jìn)行分類,通過計(jì)算,可精確估計(jì)出各類情況出現(xiàn)的概率,從而得出由概率和區(qū)間組成的預(yù)測(cè)范圍??梢姡@種組合預(yù)測(cè)方法具有更好的精確度、可操作性和可信性。
設(shè)隨機(jī)過程{x(i),i∈I}的狀態(tài)空間為S,S 為R 的可列集,對(duì)應(yīng)I 中的任意參數(shù)i1<i2<…<in,且滿足P{x(i1)=m1,x(i2)=m2,…,x(in-1=mn-1)}>0 成立的S 中的任意狀態(tài)為m1,m2,…,mn,均有P{x(in)=mn|x(i1)=m1,x(i2)=m2,…,x(in-1)=mn-1}。此時(shí)稱{x(i1),i∈I}為馬爾可夫鏈,并有:|xm=i},i,j∈s 表示系統(tǒng)處于時(shí)刻m 和狀態(tài)i 這兩個(gè)條件下,系統(tǒng)在時(shí)刻m+k 和狀態(tài)j 時(shí)的概率,將依次排列,可得到m×n 階轉(zhuǎn)移概率矩陣,不妨用p(k)表示,即該矩陣稱為馬爾可夫鏈的K 步轉(zhuǎn)移概率矩陣,其中必大于零且
劃分狀態(tài)是指將數(shù)據(jù)序列劃分成若干個(gè)大致相等的區(qū)間范圍,其中任一狀態(tài)區(qū)間Ei=[E1i,E2i],式中E1i,E2i為狀態(tài)的臨界點(diǎn)。計(jì)算數(shù)據(jù)序列從狀態(tài)Ei轉(zhuǎn)移到狀態(tài)Ej的次數(shù),若共有mij次,狀態(tài)Ei出現(xiàn)的次數(shù)若共為mi次,則此時(shí)可計(jì)算出轉(zhuǎn)移概率對(duì)于非平穩(wěn)隨機(jī)序列,只要符合馬氏鏈特點(diǎn),狀態(tài)的劃分就可根據(jù)實(shí)際情況對(duì)數(shù)據(jù)進(jìn)行不均等的劃分,只要合理即可。
根據(jù)計(jì)算出的狀態(tài)轉(zhuǎn)移概率,可形成狀態(tài)轉(zhuǎn)移矩陣。若狀態(tài)Ei已知,利用狀態(tài)轉(zhuǎn)移概率矩陣,可估計(jì)出未來轉(zhuǎn)向狀態(tài)Ej的可能性,即若目前預(yù)測(cè)對(duì)象處于狀態(tài)Ei,就描述了目前狀態(tài)Ei轉(zhuǎn)向未來狀態(tài)Ej的可能性。按最大概率原則,其預(yù)測(cè)結(jié)果即為最大的對(duì)應(yīng)的狀態(tài),當(dāng)Max{pi1,pi2,…,pin}時(shí),可預(yù)測(cè)系統(tǒng)將轉(zhuǎn)向未來狀態(tài)Ej,或是若已知時(shí)刻t 所處的狀態(tài)向量為A(t)為[a1(t),a2(t),…,ai(t)],則有時(shí)刻A(t+m)=A(t+m-1)。這兩種方法均可為預(yù)測(cè)者提供預(yù)測(cè)方法,當(dāng)計(jì)算復(fù)雜或是對(duì)精確結(jié)果要求較高時(shí)可選用后一種預(yù)測(cè)方法進(jìn)行預(yù)測(cè)。
2000 以來,我國(guó)的年均農(nóng)村人均純收入水平呈現(xiàn)逐年增長(zhǎng)的趨勢(shì),見表2。通過改進(jìn)的灰色模型對(duì)以往年份收入水平的檢測(cè),可得出最佳模型用以預(yù)測(cè)未來年度的年均農(nóng)村人均純收入。
表2 2000-2010 我國(guó)年農(nóng)村人均純收入(單位:元)
首先,建立我國(guó)農(nóng)村人均純收入時(shí)間序列,見表3 中x(0)項(xiàng),同時(shí)建立1-AGO 累加序列,見表3 中x(1)。其次,檢驗(yàn)x(1)的準(zhǔn)光滑性和x(1)的準(zhǔn)指數(shù)性。當(dāng)i >2 時(shí),p(i)∈[0,0.5],滿足準(zhǔn)光滑性要求;當(dāng)i >2 時(shí),σ(i)∈[1,1.5],滿足準(zhǔn)指數(shù)性要求,見表3 中p(i)及σ(1)(i)項(xiàng)。再次,構(gòu)造累加權(quán)數(shù)矩陣B 和常數(shù)矩陣Y,見表3 中-w(1)(i)項(xiàng)。再次,應(yīng)用Excel 中的LINEST 可求出:= -0.1107,=1773.23。接著,將代入灰微分方程x(0)(i)+a w(1)(i)=b,可求出離散響應(yīng)函數(shù):然后,對(duì))累減還原,得到初始數(shù)據(jù)的預(yù)測(cè)值:最后,進(jìn)行檢驗(yàn)。第一步,逐點(diǎn)檢驗(yàn)。相對(duì)誤差e(i)及絕對(duì)誤差ε(0)(i)見表3,平均相對(duì)誤差可見,表明預(yù)測(cè)誤差主要集中在0.0043 左右,預(yù)測(cè)誤差的一般水平很低,精度高,能達(dá)到一級(jí)效果。第二步,后驗(yàn)差比值。經(jīng)計(jì)算,s1=1246.78,s2=可見c <0.35,表明預(yù)測(cè)誤差擺動(dòng)的幅度小,精度高,能達(dá)到一級(jí)效果。第三步,小誤差頻率。經(jīng)計(jì)算,P=1,精度高,能達(dá)到一級(jí)效果。第四步,擬合度檢驗(yàn)。求初始序列與預(yù)測(cè)序列的初值像(或均值像),筆者算出初值像(x(0)'、^x(0)')和關(guān)聯(lián)系數(shù)(ζi),見表4;最后得出擬合度為0.6366,可見能通過檢驗(yàn)。
表4 擬合度檢驗(yàn)計(jì)算過程及結(jié)果
綜上,我國(guó)2000-2010 年農(nóng)村年人均純收入時(shí)間序列完全能通過以上各項(xiàng)檢驗(yàn),且均達(dá)到了一級(jí)檢驗(yàn)標(biāo)準(zhǔn),可直接用于后續(xù)分析。
由于n=11,故共可建立8 組預(yù)測(cè)序列,分別為4 維預(yù)測(cè)序列、5 維預(yù)測(cè)序列、6 維預(yù)測(cè)序列、7 維預(yù)測(cè)序列、8 維預(yù)測(cè)序列、9 維預(yù)測(cè)序列、10 維預(yù)測(cè)序列和11 維預(yù)測(cè)序列。對(duì)各組預(yù)測(cè)序列按傳統(tǒng)灰色預(yù)測(cè)模型方法進(jìn)行預(yù)測(cè),可以得到各組模型,計(jì)算其平均相對(duì)誤差(ˉe(i))、后驗(yàn)差比值(C)、小誤差頻率(P)、灰色擬合度,結(jié)果見表5。同時(shí),對(duì)各組預(yù)測(cè)模型的精度與灰色擬合度進(jìn)行比較。平均相對(duì)誤差方面,11 維預(yù)測(cè)序列達(dá)到1 級(jí)精度,5 維預(yù)測(cè)序列達(dá)到3 級(jí)精度,其余預(yù)測(cè)序列達(dá)到2 級(jí)精度,2 級(jí)精度由高到低順序?yàn)?精度最高的是4 維預(yù)測(cè)序列,然后是6 維預(yù)測(cè)序列、8 維預(yù)測(cè)序列和9 維預(yù)測(cè)序列,再接著的是10 維預(yù)測(cè)序列,最后是7 維預(yù)測(cè)序列。后驗(yàn)差比值方面,各預(yù)測(cè)序列均達(dá)到了1 級(jí)精度,精度由高到低順序?yàn)?9 維預(yù)測(cè)序列,8 維預(yù)測(cè)序列,10 維預(yù)測(cè)序列,6 維預(yù)測(cè)序列,5 維預(yù)測(cè)序列,11維預(yù)測(cè)序列,4 維預(yù)測(cè)序列,7 維預(yù)測(cè)序列。小誤差頻率方面,各預(yù)測(cè)序列均達(dá)到了1 級(jí)精度。擬合度檢驗(yàn)方面,5 維預(yù)測(cè)序列及4 維預(yù)測(cè)序列灰色擬合度沒有達(dá)到0.60,沒有通過擬合度檢驗(yàn)。其余均能達(dá)到要求,滿足條件的預(yù)測(cè)序列灰色擬合度由高到低順序?yàn)?8 維預(yù)測(cè)序列,7 維預(yù)測(cè)序列,10 維預(yù)測(cè)序列,11 維預(yù)測(cè)序列,9 維預(yù)測(cè)序列,6 維預(yù)測(cè)序列??梢?,8 維預(yù)測(cè)序列為最優(yōu)選擇,故選擇8 維預(yù)測(cè)序列作為預(yù)測(cè)模型。
表5 變起點(diǎn)GM(1,1)模型計(jì)算結(jié)果
首先,將我國(guó)農(nóng)村年人均純收入的8 維預(yù)測(cè)序列的殘差劃分為以下5 種狀態(tài):
狀態(tài)1:呈明顯高估狀態(tài),即差額與初始值之比低于-5%;
狀態(tài)2:呈高估狀態(tài),即差額與初始值之比在-5%到-2%之間;
狀態(tài)3:較為準(zhǔn)確,即差額與初始值的之比的絕對(duì)值在2%以內(nèi);
狀態(tài)4:呈低估狀態(tài),即差額與初始值之比在2%到5%之間;
狀態(tài)5:呈明顯低估狀態(tài),即差額與初始值之比超過5%。
表6 我國(guó)農(nóng)村年人均純收入狀態(tài)表
表7 狀態(tài)轉(zhuǎn)移狀況表
表8 基于灰色預(yù)測(cè)結(jié)果的馬爾科夫鏈狀態(tài)向量表
表9 基于灰色預(yù)測(cè)結(jié)果的馬爾科夫鏈改進(jìn)預(yù)測(cè)結(jié)果
時(shí)間 灰結(jié)色預(yù)測(cè)果預(yù)測(cè)中值 馬爾科夫鏈預(yù)測(cè)區(qū)間 概率7978.7108-8230.6700 0.152 2013 8398.6429 8398.6429 8230.6700-8566.6158 0.696 8566.6158-8818.5750 0.152 8981.5892-9265.2183 0.1392 2014 9454.3044 9454.3044 9265.2183-9643.3905 0.7216 9643.3905-9927.0196 0.1392 10110.5238-10429.8035 0.1443 2015 10642.6566 10642.6566 10429.8035-10855.5097 0.7114 10855.5097-11174.7894 0.1443
農(nóng)村人均純收入是我國(guó)社會(huì)經(jīng)濟(jì)發(fā)展的重要衡量指標(biāo),對(duì)農(nóng)村農(nóng)民收入進(jìn)行系統(tǒng)量化分析尤為必要[10]。為實(shí)現(xiàn)對(duì)我國(guó)農(nóng)村年人均純收入進(jìn)行預(yù)測(cè),可以先采用傳統(tǒng)灰色預(yù)測(cè)模型對(duì)我國(guó)2000-2010 年農(nóng)村年人均純收入時(shí)間序列進(jìn)行分析,然后采用變起點(diǎn)模型對(duì)傳統(tǒng)預(yù)測(cè)模型進(jìn)行改進(jìn),建立多組預(yù)測(cè)序列模型,對(duì)各組預(yù)測(cè)序列按傳統(tǒng)灰色預(yù)測(cè)模型方法分別進(jìn)行預(yù)測(cè),并對(duì)各組預(yù)測(cè)序列的預(yù)測(cè)模型進(jìn)行精度和擬合度比較,最終選擇一項(xiàng)預(yù)測(cè)序列作為最優(yōu)預(yù)測(cè)模型。在此基礎(chǔ)上又將該項(xiàng)預(yù)測(cè)序列的殘差分為多種狀態(tài),并通過計(jì)算我國(guó)農(nóng)村農(nóng)民年人均純收入的狀態(tài)表與狀態(tài)轉(zhuǎn)移狀況表,得出轉(zhuǎn)移概率矩陣,從而求出以后各年的狀態(tài)向量,由此得出由區(qū)間和概率組成的預(yù)測(cè)范圍。這種組合預(yù)測(cè)方法可精確預(yù)測(cè)出未來各年的預(yù)測(cè)值區(qū)間及其所對(duì)應(yīng)的概率,提高了預(yù)測(cè)精度,增強(qiáng)了實(shí)踐操作性和可信度。
[1]鄧聚龍.灰色系統(tǒng)理論的GM 模型[J].模糊數(shù)學(xué),1985,(2):23-32.
[2]王宇熹,汪 泓,肖 峻.基于灰色GM(1,1)模型的上海城鎮(zhèn)養(yǎng)老保險(xiǎn)人口分布預(yù)測(cè)[J].系統(tǒng)工程理論與實(shí)踐,2010,(12):2244-2253.
[3]張勇軍,袁德富.電力系統(tǒng)可靠性原始參數(shù)的優(yōu)化GM(1,1)預(yù)測(cè)[J].華南理工大學(xué)學(xué)報(bào)(自然科學(xué)版),2009,(11):50-55.
[4]崔冬冬,陳建康,吳震宇,程黎明.大壩變形度的不等維加權(quán)動(dòng)態(tài)GM (1,1)預(yù)測(cè)模型[J].長(zhǎng)江科學(xué)院院報(bào),2011,(6):5-9.
[5]劉培路.遼寧農(nóng)村居民消費(fèi)支出的灰色預(yù)測(cè)及因素分析[J].遼寧石油化工大學(xué)學(xué)報(bào),2011,(1):79-84.
[6]楊 婷,王玉貴,鄧 瓊,楊 丹.基于G M(1,1)模型的住院人次預(yù)測(cè)[J],中國(guó)病案,2010,(11):33-34.
[7]田桂英,王花蘭.基于GM(1,1)殘差模型的鐵路客運(yùn)量預(yù)測(cè)[J].價(jià)值工程,2010,(18):252-253.
[8]李曉蕾,劉 睿,田永瑞,謝炳科.基于灰色預(yù)測(cè)的空間多點(diǎn)殘差修正模型研究[J].大地測(cè)量與地球動(dòng)力學(xué),2010,(5):125-128.
[9]鄧聚龍.灰色系統(tǒng)基本方法[M].武漢:華中科技大學(xué)出版社,2005.42-55.
[10]謝治菊,譚洪波.農(nóng)村社會(huì)資本存量:概念、測(cè)量與計(jì)算[J].貴州財(cái)經(jīng)學(xué)院學(xué)報(bào),2011,(5):81-86.