肖利哲,王學(xué)娟
(哈爾濱理工大學(xué) 管理學(xué)院,哈爾濱 150040)
基于變步長(zhǎng)梯形算法GM(1,1)模型背景值的優(yōu)化
肖利哲,王學(xué)娟
(哈爾濱理工大學(xué) 管理學(xué)院,哈爾濱 150040)
文章從GM(1,1)建模機(jī)理及背景值形成過(guò)程出發(fā),分析出對(duì)于具有明顯指數(shù)規(guī)律的一次累加生成序列,GM(1,1)有時(shí)會(huì)出現(xiàn)預(yù)測(cè)誤差較大的情況,并得出背景值的構(gòu)造方法是造成這種誤差的重要原因之一。利用拉格朗日插值函數(shù)和變步長(zhǎng)梯形算法對(duì)背景值進(jìn)行優(yōu)化,通過(guò)對(duì)變步長(zhǎng)梯形算法中步長(zhǎng)大小的變化,形成了一種新的背景值構(gòu)造方法,可使由背景值構(gòu)成的誤差降低。
GM(1,1)模型;背景值;變步長(zhǎng)梯形算法
灰色系統(tǒng)是研究少數(shù)據(jù)、貧信息等不確定性問(wèn)題的理論,灰色預(yù)測(cè)是灰色系統(tǒng)理論的主要研究?jī)?nèi)容之一,廣泛應(yīng)用于多個(gè)領(lǐng)域,而GM(1,1)模型是灰色預(yù)測(cè)的核心內(nèi)容[1],長(zhǎng)期以來(lái)受到很多學(xué)者關(guān)注,但在研究過(guò)程中發(fā)現(xiàn)該模型有時(shí)會(huì)出現(xiàn)預(yù)測(cè)精確度不高的問(wèn)題,因此對(duì)該問(wèn)題做了很多研究。譚冠軍[2]初步分析了GM(1,1)模型背景值構(gòu)造所產(chǎn)生的誤差,并給出新的構(gòu)造方法。王鐘羨,張怡等[3,4]根據(jù)GM(1,1)模型的指數(shù)特性,通過(guò)在定區(qū)間上求積分,給出了背景值的一個(gè)計(jì)算公式,在一定程度上提高了模型的預(yù)測(cè)精度。楊華龍等人[5]應(yīng)用自動(dòng)尋優(yōu)定權(quán)方法,根據(jù)原始數(shù)據(jù)的模擬值與真實(shí)值之間的最小離差平方和來(lái)確定最終權(quán)重,但計(jì)算過(guò)程較為繁瑣。李俊峰,戴文戰(zhàn)[6]利用Newton-Cotes公式計(jì)算背景值,但n較大時(shí),高次插值將出現(xiàn)Range現(xiàn)象,造成較大誤差。唐萬(wàn)梅,向長(zhǎng)合[7]則基于二次插值來(lái)構(gòu)造背景值,該方法避免了Range現(xiàn)象,但預(yù)測(cè)精度難以保證。
根據(jù)以上學(xué)者的研究,本文從一次累加生成序列的指數(shù)規(guī)律角度出發(fā),利用拉格朗日插值函數(shù)以及變步長(zhǎng)梯形算法,對(duì)背景值進(jìn)行優(yōu)化,使GM(1,1)模型不僅適用于指數(shù)規(guī)律較弱的數(shù)據(jù)序列,也適用于指數(shù)規(guī)律較強(qiáng)數(shù)據(jù)序列。
1.1 GM(1,1)建模機(jī)理
GM(1,1)建模過(guò)程是將無(wú)規(guī)律的原始數(shù)據(jù)通過(guò)累加生成得到具有灰指數(shù)規(guī)律的數(shù)據(jù)序列,利用一階線性微分方程的指數(shù)解形式來(lái)擬合x(chóng)(1)() t進(jìn)行建模,將得到的數(shù)據(jù)進(jìn)行累減還原,再進(jìn)行預(yù)測(cè)。定義1:設(shè)原始數(shù)據(jù)則一次累加生成序列為,簡(jiǎn)稱1-AGO,其中
由于分析的數(shù)據(jù)是離散的,為求解參數(shù)a、b,將該一階線性微分方程以定積分形式離散化,即:
根據(jù)其離散形式,從積分幾何角度出發(fā),求解GM(1,1)模型背景值就是求解該定積分的過(guò)程。
定理2:設(shè)x(0),x(1)如定義1所示,若令Y和B分別為下式:
則GM(1,1)模型的最小二乘估計(jì)參數(shù)列為:
以x(o)(1)為初始值計(jì)算GM(1,1)的時(shí)間響應(yīng)序列為:
其一次累減還原值為:
從以上的求解過(guò)程可以看出,參數(shù)a、b是影響GM(1, 1)模型預(yù)測(cè)精度的直接影響因素,而背景值z(mì)(1)(k)的構(gòu)成方式又決定a、b的取值。因此科學(xué)合理的構(gòu)造背景值,將有效提高模型的預(yù)測(cè)精度。
1.2 GM(1,1)模型誤差分析
2.1 背景值優(yōu)化方法構(gòu)建
根據(jù)以上誤差來(lái)源分析,針對(duì)1-AGO指數(shù)規(guī)律較強(qiáng)的數(shù)據(jù)序列,從背景值形成的積分幾何意義出發(fā),在積分區(qū)間[k -1,k]上插入適當(dāng)?shù)狞c(diǎn),此處采用拉格朗日函數(shù)進(jìn)行插值,近似得到x(1)(t)在插值點(diǎn)處函數(shù)值。并結(jié)合變步長(zhǎng)梯形算法,通過(guò)選取合適的步長(zhǎng),即在對(duì)每個(gè)積分區(qū)間進(jìn)行m等分時(shí),選取合適的m值,用m個(gè)小梯形面積之和來(lái)近似代替曲邊梯形面積。以小區(qū)間向下凹為例說(shuō)明,如圖1所示。
圖1 面積逼近示意圖
若函數(shù) y=f(x)在[a ,b]上有定義,m+1個(gè)節(jié)點(diǎn)a=x0<…<xm=b處的值已知,則Lm(xj)=yj(j=0,1,…,m)。
則稱此m+1個(gè)多項(xiàng)式l0(x),l1(x),…,lm(x)為節(jié)點(diǎn)x0<…<xm的m次插值基函數(shù)??傻胢次插值基函數(shù)為:
因此滿足式⑻的插值多項(xiàng)式Lm(x)可表示為:
式⑼稱為拉格朗日插值函數(shù),簡(jiǎn)稱Lm。
定義3:設(shè)將[ ] a,b分為m等分,共有m+1個(gè)節(jié)點(diǎn),如果將求積區(qū)間再二分一次,則分點(diǎn)增至2m+1個(gè),而每個(gè)子區(qū)間[ ] xd,xd+1經(jīng)過(guò)二分只增加一個(gè)分點(diǎn),即xd+1),其中xd=a+ih;i=0,1,…,m;使用復(fù)化梯形公式求得該子區(qū)間上的積分值為:
式(11)給出了Tm與T2m之間的遞推關(guān)系,方便計(jì)算機(jī)編程,減少了計(jì)算量,由此可見(jiàn)變步長(zhǎng)梯形算法為復(fù)化梯形公式的逐次分半算法,下面討論如何確定等分?jǐn)?shù)m。
本文通過(guò)m計(jì)算背景值 z(1)(k ),以z(1)(k)確定a、b以得到擬合函數(shù)由與x(0)(k)計(jì)算相對(duì)誤差ε(k)及平均相對(duì)誤差。m在變化過(guò)程中使z(1)(k)、ε(k)、ˉ依次變化,最終使在變化過(guò)程中達(dá)到最小,選擇此時(shí)m。
根據(jù)1-AGO波動(dòng)性,由這些點(diǎn)擬合的Lm呈現(xiàn)凹凸變化的趨勢(shì),如圖2所示。在對(duì)小區(qū)間進(jìn)行等距劃分并插值時(shí),不能使每個(gè)小區(qū)間上的m個(gè)小梯形面積之和都更接近定積分值,相應(yīng)的利用重構(gòu)的z(1)(k)建模預(yù)測(cè),不能使每個(gè)ε(k)都降低,進(jìn)而使εˉ隨ε(k)變化程度而改變。
圖2 曲線擬合圖
②若且選擇m=m1時(shí)計(jì)算背景值。
③若則繼續(xù)增大m,直至某個(gè)m值,設(shè)為m*,若繼續(xù)增大m,則ˉ增大。以m*計(jì)算背景值。
當(dāng)原始數(shù)據(jù)為非波動(dòng)性數(shù)據(jù)序列且1-AGO指數(shù)規(guī)律越明顯時(shí),則Lm整體向下凹或向上凸,可使Lm與x(1)(t)變化趨勢(shì)更接近,則εˉ可降低的空間就越大。
下面以實(shí)證部分?jǐn)?shù)據(jù)說(shuō)明z(1)(k)、ε(k)、ˉ之間變化關(guān)系。
如表1所示,隨m增大z(1)(k)均在減小,相應(yīng)的ε(2)增大,ε(3),ε(6)減小,ε(4),ε(5)先減小后增大,且ˉ逐漸減小,當(dāng)m=8時(shí)ˉ達(dá)到最小,以此m對(duì)應(yīng)的z(1)(k)計(jì)算參數(shù)a、b。
表1 背景值與相對(duì)誤差及平均相對(duì)誤差變化對(duì)照
2.2 基于優(yōu)化背景值的GM(1,1)模型的改進(jìn)
⑴計(jì)算ρ(k)與σ(k)分析指數(shù)規(guī)律,并利用軟件計(jì)算原模型平均相對(duì)誤差設(shè)定初始值m1,由Lm函數(shù)計(jì)算區(qū)間[k ,k+1]上m1等分點(diǎn)處的函數(shù)值。
⑵根據(jù)變步長(zhǎng)梯形算法,由m1值及插值點(diǎn)處的函數(shù)值計(jì)算背景值。
⑶根據(jù)定理2計(jì)算參數(shù)a、b的值,并根據(jù)式⑺求得原始數(shù)據(jù)的模擬值。
⑷計(jì)算模擬值的相對(duì)誤差ε1(k)及整體平均相對(duì)誤差
表2 原模型與優(yōu)化模型工業(yè)總產(chǎn)值模擬預(yù)測(cè)比較
本文以上海市六五至十一五期間工業(yè)總產(chǎn)值作為基本數(shù)據(jù)說(shuō)明模型改進(jìn)情況,原始數(shù)據(jù)見(jiàn)表2所示。
⑴分別計(jì)算ρ(k )與σ(1)(k)的值,得出其1-AGO具有較強(qiáng)的指數(shù)規(guī)律。并計(jì)算原模型平均相對(duì)誤差,見(jiàn)表2。
⑵令初值m=2,插入一個(gè)點(diǎn),并以區(qū)間[1 ,2]為例計(jì)算插值及背景值,其他區(qū)間類似。給出Lm函數(shù):
L6(x)=0.1406x5+4.4821x4-51.1969x3+236.5319x2-357.8253x+202.9591
⑶計(jì)算背景值
同理計(jì)算z(1)(k),k=3,4,5,6時(shí)的值,見(jiàn)表1。將得到的背景值帶入到GM(1,1)模型,得到m=2時(shí)模擬預(yù)測(cè)值,并分別取m=4、8、16,計(jì)算不同m值時(shí)的背景值,并代入GM (1,1)模型計(jì)算模擬值,與原模型進(jìn)行比較,見(jiàn)表2。
如表2所示,當(dāng)m取8時(shí)模型的平均相對(duì)誤差最小,選擇m*=8時(shí)的背景值計(jì)算a、b,并利用式⑺進(jìn)行預(yù)測(cè)。
GM(1,1)模型有三種檢驗(yàn)方法:殘差檢驗(yàn)、關(guān)聯(lián)度檢驗(yàn)以及均方差比檢驗(yàn),本文采用均方差比檢驗(yàn)方法,如下:
設(shè)原始數(shù)據(jù)序列x(0)及殘差序列的均值和方差分別為:
模型的精度由P和c共同描述,一般分為四個(gè)等級(jí),一級(jí):0.95≤p,c≤0.35;二級(jí):0.80≤p<0.95,0.3<c≤0.5;三級(jí):0.70≤p<0.80,0.5<c≤0.65;四級(jí):P<0.70,0.65<c。對(duì)模型的精度進(jìn)行檢驗(yàn),經(jīng)過(guò)計(jì)算得到 p=1,c=0.01。該模擬預(yù)測(cè)的精度屬于一級(jí),精度較高。
本文針對(duì)一次累加生成指數(shù)規(guī)律明顯的數(shù)據(jù)序列,利用拉格朗日插值函數(shù)以及變步長(zhǎng)梯形算法,提出了新的背景值構(gòu)造方法。在變步長(zhǎng)梯形算法中,隨著步長(zhǎng)的變化,也就是等分?jǐn)?shù)m取值的不同,預(yù)測(cè)結(jié)果的平均相對(duì)誤差會(huì)隨之變化。變化過(guò)程中會(huì)有一個(gè)m*使平均相對(duì)誤差達(dá)到最小或其差值小于某一特定值,以m*計(jì)算模型背景值。若m*=0則使用原模型,若m*>0表示優(yōu)化了GM(1,1)模型,提高了模型的預(yù)測(cè)精度。通常,當(dāng)1-AGO指數(shù)規(guī)律越明顯時(shí),m*應(yīng)越大,隨指數(shù)規(guī)律的減弱m*變小,當(dāng)m*=0時(shí),即使用原模型。根據(jù)重構(gòu)背景值的GM(1,1)模型,利用上海市六五至十一五期間工業(yè)生產(chǎn)總值進(jìn)行模擬預(yù)測(cè),證明該優(yōu)化模型可以提高指數(shù)規(guī)律較強(qiáng)的1-AGO的預(yù)測(cè)精度,并具有一定的理論意義與應(yīng)用價(jià)值。
[1]劉思峰,黨耀國(guó).灰色系統(tǒng)理論及其應(yīng)用[M].北京:科學(xué)出版社,2010.
[2]譚冠軍.GM(1,1)模型的背景值構(gòu)造方法和應(yīng)用(Ⅰ)[J].系統(tǒng)工程理論與實(shí)踐,2000,(4).
[3]王鐘羨,吳春篤.GM(1,1)改進(jìn)模型及其應(yīng)用[J].數(shù)學(xué)的實(shí)踐與認(rèn)識(shí),2003,33(9).
[4]張怡,魏勇,熊常偉.灰色模型GM(1,1)的一種新優(yōu)化方法[J].系統(tǒng)工程理論與實(shí)踐,2007,(4).
[5]楊華龍,劉金霞,鄭斌.灰色預(yù)測(cè)GM(1,1)模型的改進(jìn)及應(yīng)用[J].數(shù)學(xué)的實(shí)踐與認(rèn)識(shí),2011,41(23).
[6]李俊峰,戴文戰(zhàn).基于插值和Newton-Cores公式的GM(1,1)模型的背景值構(gòu)造新方法與應(yīng)用[J].系統(tǒng)工程理論與實(shí)踐,2004,(10).
[7]唐萬(wàn)梅,向長(zhǎng)合.基于二次插值的GM(1,1)模型預(yù)測(cè)方法的改進(jìn)[J].中國(guó)管理科學(xué),2006,14(6).
(責(zé)任編輯/易永生)
N941.5
A
1002-6487(2016)23-0008-04
黑龍江省高教綜合改革試點(diǎn)專項(xiàng)課題資助(JG2013010288)
肖利哲(1961—),男,黑龍江哈爾濱人,碩士,教授,研究方向:統(tǒng)計(jì)學(xué)、人力資源。
王學(xué)娟(1989—),女,河北廊坊人,碩士研究生,研究方向:人力資源管理。