杜 康, 袁宏俊
(安徽財經(jīng)大學(xué) 統(tǒng)計與應(yīng)用數(shù)學(xué)學(xué)院,安徽 蚌埠 233030)
由于預(yù)測對象的模糊性和復(fù)雜性,單項預(yù)測方法的預(yù)測結(jié)果與實際情況可能會產(chǎn)生較大的偏差。為此,Bates J M和Grange C W J[1]在1969年首次提出組合預(yù)測方法,即將幾種單項預(yù)測方法進行組合。由于組合預(yù)測方法在實際預(yù)測過程中的精度優(yōu)于單項預(yù)測方法,因此一些國內(nèi)外學(xué)者對其進行了研究,并取得了一定的研究成果[2-7]。在實際預(yù)測過程中,預(yù)測對象有時候并不能以一個確定的實數(shù)給出,因此區(qū)間型數(shù)據(jù)組合預(yù)測的研究受到學(xué)者們的重視?,F(xiàn)有文獻對于區(qū)間型組合預(yù)測模型的研究主要可以分為以下幾類:
(1) 將區(qū)間數(shù)通過連續(xù)區(qū)間的信息集成算子轉(zhuǎn)化為普通的實數(shù)。文獻[8]提出了IOWC-GOWA算子,利用該算子將區(qū)間數(shù)集結(jié)成實數(shù),并用指數(shù)支撐度作為最優(yōu)準(zhǔn)則構(gòu)建組合預(yù)測模型;文獻[9]提出了IOWC-GOWHA算子,將區(qū)間數(shù)轉(zhuǎn)化為實數(shù),利用灰色趨勢關(guān)聯(lián)度作為相關(guān)性指標(biāo)構(gòu)建了基于IOWC-GOWHA算子的組合預(yù)測模型;文獻[10]在C-OWHA算子和IGOWLA算子的基礎(chǔ)上,提出了IGOWLC-OWHA算子,將區(qū)間數(shù)集結(jié)為實數(shù),用Theil不等系數(shù)作為最優(yōu)準(zhǔn)則構(gòu)建組合預(yù)測模型;文獻[11]提出了COWG-WPA算子,將區(qū)間數(shù)轉(zhuǎn)化為實數(shù),用廣義絕對誤差λ次和作為準(zhǔn)則構(gòu)建組合預(yù)測模型。
(2) 利用區(qū)間數(shù)自身的信息,即區(qū)間數(shù)的中點和半徑或者是區(qū)間數(shù)的左、右端點等信息。文獻[12]一方面利用區(qū)間數(shù)的中點和半徑,并以區(qū)間中點和長度的最小絕對誤差準(zhǔn)則,構(gòu)建了多目標(biāo)規(guī)劃問題,引入偏好系數(shù)將其轉(zhuǎn)化為單目標(biāo)規(guī)劃問題的組合預(yù)測模型,另一方面利用區(qū)間數(shù)的左、右端點,分別以向量夾角余弦和Theil左右不等系數(shù)為準(zhǔn)則構(gòu)建多目標(biāo)規(guī)劃問題,同樣引入偏好系數(shù)將其轉(zhuǎn)化為單目標(biāo)規(guī)劃問題的組合預(yù)測模型;文獻[13]和文獻[14]分別利用區(qū)間數(shù)的中點、半徑和左、右端點,以最小誤差平方和作為準(zhǔn)則,構(gòu)建多目標(biāo)規(guī)劃問題,并引入偏好系數(shù)將其轉(zhuǎn)化為單目標(biāo)規(guī)劃問題的組合預(yù)測模型。
(3) 將區(qū)間數(shù)轉(zhuǎn)化為聯(lián)系數(shù)。文獻[15]將區(qū)間數(shù)轉(zhuǎn)化為二元聯(lián)系數(shù),并以聯(lián)系數(shù)貼進度作為最優(yōu)準(zhǔn)則構(gòu)建組合預(yù)測模型;文獻[16]也是將區(qū)間數(shù)轉(zhuǎn)化為二元聯(lián)系數(shù)的形式,以向量夾角余弦作為相關(guān)性指標(biāo)構(gòu)建組合預(yù)測模型。本文采用第一種思路,先利用IOWC-GOWA算子將區(qū)間型數(shù)據(jù)轉(zhuǎn)化為實數(shù),并對集結(jié)后的實數(shù)進行標(biāo)準(zhǔn)化處理,引入相對熵作為最優(yōu)準(zhǔn)則來構(gòu)建區(qū)間型組合預(yù)測模型,并通過實例驗證模型的合理性和有效性。
定義2[17]設(shè)[a,b]為區(qū)間數(shù),稱
FQ([a,b])=(1-μ)a+μb
定義3[18]設(shè)fw:Rn→R,λ≠0,若
定義4[19]設(shè)[a,b]為區(qū)間數(shù),λ≠0,稱
為連續(xù)區(qū)間的廣義有序加權(quán)平均(C-GOWA)算子。其中,Q(y)為BUM函數(shù)。根據(jù)定義2,同理可得:
定義6[8]設(shè)誘導(dǎo)二維區(qū)間數(shù)組V={〈v1,[a1,b1]〉,〈v2,[a2,b2]〉,…,〈vn,[an,bn]〉},fw:Ω+→R+,λ≠0,稱
fw(〈v1,[a1,b1]〉,〈v2,[a2,b2]〉,…,〈vn,[an,bn]〉)=
定義7[21]設(shè)xi,yi>0,且xi,yi∈(0,1),則稱
為序列X相對于序列Y的相對熵,其中,X=(x1,x2,…,xn),Y=(y1,y2,…,yn),i=1,2,…,n。
定理1[21]如果函數(shù)h(x,y)為序列X相對于序列Y的相對熵,則
(1)h(x,y)≥0;
(2) 當(dāng)且僅當(dāng)xi=yi,i=1,2,…,n,有h(x,y)=0。
log[yi+(1-yi)]=
log 1=0
由hi≥0,得h(x,y)≥0,原命題得證。
(Jensen不等式)
所以h(x,y)=0時當(dāng)且僅當(dāng)xi=yi,i=1,2,…,n。
由定理1可知,當(dāng)序列X=(x1,x2,…,xn)相對于序列Y=(y1,y2,…,yn)的相對熵最小且為0時,序列X和序列Y完全相同,即相對熵越小表示序列X和序列Y之間的符合程度越大。因此相對熵可以刻畫兩個標(biāo)準(zhǔn)化的序列之間的差異程度,所以可以基于相對熵達到最小的思想構(gòu)建區(qū)間型組合預(yù)測模型。
定義8
則稱vit為第i種單項預(yù)測方法在第t時刻的預(yù)測精度。其中,vit∈[0,1],i=1,2,…,m,t=1,2,…,N。
定義9 利用預(yù)測精度vit作為誘導(dǎo)值,可以構(gòu)造出第t時刻的誘導(dǎo)二維區(qū)間數(shù)組V={〈v1t,[a1t,b1t]〉,〈v2t,[a2t,b2t]〉,…,〈vmt,[amt,bmt]〉},令
Yt=GQ([at,bt])=
定義10 設(shè)Yt,Yit>0,且Yt,Yit∈(0,1),令
(1)
上述模型式(1)的權(quán)系數(shù)W=(w1,w2,…,wm)可以通過Lingo或者Matlab軟件進行求解。
定理2 設(shè)hmin=minhYit,hmax=maxhYit,i=1,2,…,m,若
為了驗證組合預(yù)測模型式(I)(即基于IOWC-GOWA算子及相對熵的區(qū)間型組合預(yù)測模型)的有效性,現(xiàn)分別用平均區(qū)間位置誤差平方和(fMSEP)、平均區(qū)間長度誤差平方和(fMSEL)、平均區(qū)間誤差平方和(fMSEI)以及平均區(qū)間相對誤差和(fMRIE)作為評價指標(biāo),其中:
fMSEI=fMSEP+fMSEL=
顯然,上述4種誤差指標(biāo)越小,表示該區(qū)間型組合預(yù)測模型的有效性相對越高,即預(yù)測精度相對越高。fMSEP和fMSEL越小,分別表示預(yù)測區(qū)間和實際區(qū)間的中點和半徑的誤差越小。而fMSEI集合了區(qū)間的中點和半徑的誤差信息,所以更能作為衡量模型有效性的指標(biāo)。對于fMRIE來說,若fMRIE>1,則說明預(yù)測區(qū)間和實際區(qū)間分離,即沒有重合部分,若0≤fMRIE≤1,則說明預(yù)測區(qū)間和實際區(qū)間部分重合,并且fMRIE越小,說明重合比例越大,即模型有效性越高。本文利用文獻[22]中的數(shù)據(jù)來進行實例分析,各數(shù)據(jù)見表1。
根據(jù)定義8可以計算出3種單項預(yù)測方法在各個時刻的預(yù)測精度,結(jié)果見表2。
表 1 實際區(qū)間數(shù)和3種單項預(yù)測區(qū)間數(shù)
表 2 3種單項預(yù)測方法在各個時刻的預(yù)測精度
根據(jù)定義9,可以計算出每個時刻基于IOWC-GOWA算子的組合預(yù)測值,以t=1和t=2為例:
表 3 實際集結(jié)數(shù)序列Yt和3種單項預(yù)測集結(jié)數(shù)序列Yit
根據(jù)標(biāo)準(zhǔn)化處理后的數(shù)據(jù),可以用Lingo軟件對組合預(yù)測模型式(1)的最優(yōu)加權(quán)向量W=(w1,w2,w3)進行求解,結(jié)果見表5。
根據(jù)表5中的各單項預(yù)測的最優(yōu)加權(quán)向量W=(w1,w2,w3)以及經(jīng)過每個時期預(yù)測精度誘導(dǎo)過后的各單項預(yù)測的區(qū)間數(shù),可以計算出不同λ取值下每個時期的組合預(yù)測區(qū)間數(shù),結(jié)果見表6。
表 4 實際集結(jié)數(shù)和3種單項預(yù)測集結(jié)數(shù)的標(biāo)準(zhǔn)化序列
表 5 不同λ取值下的最優(yōu)加權(quán)向量W=(w1,w2,w3)
表 6 實際區(qū)間數(shù)以及不同λ取值下的組合預(yù)測區(qū)間數(shù)
為了驗證組合預(yù)測模型式(1)的有效性,分別從相對熵和4種誤差指標(biāo)MSEP,MSEL,MSEI以及MRIE的角度來分析。根據(jù)表4中的數(shù)據(jù),可以計算出不同λ取值下3種單項預(yù)測方法的相對熵,運用Lingo軟件可以得到組合預(yù)測模型式(1)的最優(yōu)相對熵,結(jié)果見表7。根據(jù)4種誤差指標(biāo)的公式,可以分別計算出3種單項預(yù)測方法以及不同λ取值下的組合預(yù)測方法的MSEP,MSEL,MSEI以及MRIE,結(jié)果見表8。
表 7 不同λ取值下各種預(yù)測方法的相對熵
表 8 各種預(yù)測方法的誤差指標(biāo)
從表7和表8中可以看出:從相對熵的角度來看,λ=4時,組合預(yù)測方法的相對熵小于3種單項預(yù)測方法的相對熵;λ=5時,組合預(yù)測方法的相對熵也遠小于單項預(yù)測方法1和2的相對熵,和單項預(yù)測方法3的相對熵十分接近。從4種誤差指標(biāo)的角度來看,組合預(yù)測方法的MSEP,MSEI以及MRIE均小于3種單項預(yù)測方法,雖然組合預(yù)測方法的MSEL大于單項預(yù)測方法2,但小于單項預(yù)測方法1和3,至少說明組合預(yù)測模型式(1)是非劣的。由以上結(jié)果可以看出,組合預(yù)測模型式(1)可以有效提高區(qū)間型數(shù)據(jù)的預(yù)測精度。
本文從信息論的角度出發(fā),提出構(gòu)建區(qū)間型組合預(yù)測方法的新思路。先利用IOWC-GOWA算子將區(qū)間數(shù)進行集結(jié),轉(zhuǎn)化為普通實數(shù),并對其進行標(biāo)準(zhǔn)化處理。引入相對熵作為最優(yōu)準(zhǔn)則,構(gòu)建了基于IOWC-GOWA算子及相對熵的區(qū)間型組合預(yù)測模型,并用文獻[18]中數(shù)據(jù)以及4種誤差指標(biāo)對其有效性進行了驗證,結(jié)果顯示,該組合預(yù)測模型能有效提高預(yù)測精度。但是,由于本文采用的是IOWC-GOWA算子,所以參數(shù)λ以及BUM函數(shù)的選取都會對模型的有效性產(chǎn)生影響。另外,對于集結(jié)數(shù)序列的標(biāo)準(zhǔn)化處理方式也可能會對模型的結(jié)果產(chǎn)生一定的影響,今后將對這些因素作進一步研究,以完善本文方法。