陶志富,趙 勤,朱家明,劉金培
1.安徽大學(xué) 經(jīng)濟(jì)學(xué)院,合肥230601
2.安徽大學(xué) 數(shù)學(xué)科學(xué)學(xué)院,合肥230601
3.安徽大學(xué) 商學(xué)院,合肥230601
1969年,Bates和Granger提出組合預(yù)測的概念[1],通過統(tǒng)計(jì)的方法對單項(xiàng)預(yù)測的結(jié)果進(jìn)行賦權(quán)并集成從而提高預(yù)測精度。自這一概念被提出以來,在理論上和應(yīng)用上均成為近年來的研究熱點(diǎn)[2-10]。
一般地,隨著組合預(yù)測技術(shù)的廣泛和深入開展,按照研究的內(nèi)容不同,組合預(yù)測可以劃分為信息的組合、方法的組合和結(jié)果的組合三種類型。其中,信息的組合以最有效和最直接的方式對預(yù)測的信息進(jìn)行整合,例如某些行業(yè)數(shù)據(jù)綜合指數(shù)的編制等;方法的組合則是將某些專業(yè)信息挖掘技術(shù)與預(yù)測技術(shù)相結(jié)合,以提高預(yù)測精度,例如智能算法與經(jīng)典預(yù)測方法的結(jié)合等[7];而結(jié)果的組合則是對若干單項(xiàng)預(yù)測的結(jié)果進(jìn)行加權(quán)集成作為最終的預(yù)測結(jié)果[1,3-4]。本文遵循Bates 和Granger[1]給出的結(jié)果的預(yù)測這一組合預(yù)測概念,重點(diǎn)關(guān)注組合預(yù)測過程中單項(xiàng)預(yù)測結(jié)果權(quán)系數(shù)的確定。
傳統(tǒng)的最優(yōu)化組合預(yù)測模型以預(yù)測誤差平方和達(dá)到最小、誤差全距達(dá)到最小或誤差絕對值達(dá)到最小為準(zhǔn)則的目標(biāo)函數(shù),進(jìn)一步確定各單項(xiàng)預(yù)測結(jié)果的權(quán)重系數(shù)。上述方法存在一定的缺陷,其原因在于,預(yù)測誤差平方和、誤差全距和誤差絕對值易受極端值的影響,這導(dǎo)致在極端值點(diǎn)出現(xiàn)誤差放大效應(yīng)[11-14],影響組合預(yù)測的預(yù)測精度。此外,在組合預(yù)測中,就同一種單項(xiàng)預(yù)測方法而言,在不同時(shí)點(diǎn)的預(yù)測精度可能不相同,即在某個(gè)時(shí)點(diǎn)預(yù)測精度較高,在另一時(shí)點(diǎn)預(yù)測精度較低[15];而從多個(gè)單項(xiàng)預(yù)測結(jié)果看,在同一時(shí)點(diǎn),不同單項(xiàng)預(yù)測方法給出的預(yù)測結(jié)果其精度也往往是參差不齊的。然而,在已有的組合預(yù)測理論探究中,鮮有文獻(xiàn)對上述差異進(jìn)行考量。
注意到在鑄件加工過程中,為了保證加工質(zhì)量,均規(guī)定了允許的誤差范圍,一方面其可以作為日常的生產(chǎn)標(biāo)準(zhǔn),另一方面也可以作為鑄件生產(chǎn)質(zhì)量的保證。除此之外,在審計(jì)中提出了抽樣結(jié)果可以達(dá)到審計(jì)目標(biāo)所愿意接受總體最大誤差的可容忍誤差的概念[16]。可見,當(dāng)給定一個(gè)可容忍的誤差范圍時(shí),在實(shí)際的生產(chǎn)和管理實(shí)踐中,均可以有效地控制考察對象的質(zhì)量,提高實(shí)際運(yùn)營過程的效果。
基于此,為了更進(jìn)一步提高組合預(yù)測的預(yù)測精度,在上述概念和原理的基礎(chǔ)上,本文提出一類預(yù)測可容忍誤差的概念,并結(jié)合預(yù)測精度的相關(guān)概念,給出新的預(yù)測精度定義,并構(gòu)建一個(gè)新的最優(yōu)化組合預(yù)測賦權(quán)模型。另外,為從更多角度反映預(yù)測效果的好壞,本文除了運(yùn)用普通的預(yù)測評價(jià)指標(biāo)[15,17-20]對預(yù)測效果進(jìn)行測度之外,還嘗試運(yùn)用統(tǒng)計(jì)學(xué)中均值、方差、峰度和偏度的概念[21-22]反映預(yù)測的效果。最后,以實(shí)例說明本文所構(gòu)建的最優(yōu)化組合預(yù)測模型的可行性與有效性。
預(yù)測誤差反映了預(yù)測結(jié)果與實(shí)際觀測序列值之間的離差,其數(shù)值的大小反映了預(yù)測結(jié)果的精確程度,兩者之間呈反比關(guān)系,也即預(yù)測誤差越小,表明預(yù)測效果越好,因而預(yù)測精度也就越高??紤]到同一時(shí)點(diǎn)不同單項(xiàng)預(yù)測結(jié)果精度上的差異,變權(quán)組合預(yù)測方法得以被提出并廣泛應(yīng)用到實(shí)踐中[23-25]。為計(jì)算和控制抽樣誤差,抽樣調(diào)查中考慮容許誤差的范圍及其確定[26]。審計(jì)問題中也有類似的可容忍誤差的概念[15]。因而,對于預(yù)測方法,考慮引入可容忍誤差的概念,從而能夠反映預(yù)測結(jié)果在不同方法和不同時(shí)點(diǎn)上存在的差異及其效果。
設(shè)某社會經(jīng)濟(jì)現(xiàn)象的指標(biāo)觀察值序列為{yt,t=1,2,…,T},{t=1,2,…,T} 為某預(yù)測方法給出的預(yù)測值(或稱擬合值)序列。
定義1 令:
為了應(yīng)用上的方便,給出如下可容忍相對誤差的概念。
定義2 令:
式(2)實(shí)質(zhì)上也確定了預(yù)測值可容忍的區(qū)間范圍,其依據(jù)實(shí)際觀測值和δ 聯(lián)合給出,也即
由定義1 和定義2 可知,可容忍誤差只能觀察某一時(shí)點(diǎn)的預(yù)測效果,為從整體上對預(yù)測結(jié)果的效果進(jìn)行測度,在可容忍誤差定義的基礎(chǔ)上,給出如下精度的定義:
定義3 令,則對預(yù)測值序列,定義其可容忍精度為:
依據(jù)定義3,可容忍精度反映了預(yù)測值中位于可容忍誤差內(nèi)的預(yù)測值所占的比例。容易知道,其數(shù)值越大,表明預(yù)測的效果越好。
應(yīng)用式(3),一個(gè)直接的反映預(yù)測可容忍絕對誤差的測度可以計(jì)算如下:
針對實(shí)際觀測值序列{ yt,t=1,2,…,N },設(shè)現(xiàn)有m種單項(xiàng)預(yù)測方法,其預(yù)測值序列分別記為,…,}2,…,N ??紤]到各單項(xiàng)預(yù)測結(jié)果之間存在的差異性,為充分利用這種差異性,設(shè)各單項(xiàng)預(yù)測方法的權(quán)重向量為ω=( ω1,ω2,…,ωm)T,組合預(yù)測結(jié)果可以表示為這里ωi≥0,i=1,2,…,m 且傳統(tǒng)的組合預(yù)測考慮以組合預(yù)測誤差平方和達(dá)到最小為準(zhǔn)則,也即在上述權(quán)重應(yīng)滿足:
其中,eit=yt-yit,i=1,2,…,m;t=1,2,…,T 表示第i 種單項(xiàng)預(yù)測方法在第t 時(shí)刻的預(yù)測誤差。
為消除可能存在的極端值的影響,在上述可容忍誤差概念的基礎(chǔ)上,考慮新的組合預(yù)測賦權(quán)模型。
注意到,可容忍絕對誤差ε 值的水平越大,預(yù)測的可容忍精度也越大,但是預(yù)測值可能偏離實(shí)際值的程度也越大。換言之,可容忍預(yù)測精度與ε 值正相關(guān)但是實(shí)質(zhì)上總是希望ε 的值盡可能小而可容忍精度的值盡可能大,這是兩個(gè)矛盾的目標(biāo)。
為此,構(gòu)造如下的多目標(biāo)規(guī)劃問題:
其中,πi,i=1,2,…,m 為第i 種單項(xiàng)預(yù)測方法的可容忍預(yù)測精度,y^it為第i 種單項(xiàng)預(yù)測方法在第t 時(shí)刻的預(yù)測值。
模型(5)的第一個(gè)約束表明在考慮可容忍誤差的條件下,組合預(yù)測的可容忍精度應(yīng)大于單項(xiàng)預(yù)測中的最大者,其可以通過MATLAB或者Lingo軟件進(jìn)行求解。
綜上,基于可容忍絕對誤差的組合預(yù)測賦權(quán)模型是普通最優(yōu)化模型的推廣,其組合預(yù)測步驟如下:
步驟1 由式(5)計(jì)算各單項(xiàng)預(yù)測方法的權(quán)重向量
步驟2 依據(jù)公式對各單項(xiàng)預(yù)測結(jié)果進(jìn)行集成,得到組合預(yù)測預(yù)測值序列t=1,2,…,T 。
步驟3 對組合預(yù)測的結(jié)果進(jìn)行效果評價(jià)和對比分析。
步驟4 就樣本外時(shí)點(diǎn)進(jìn)行預(yù)測。
這里,在對預(yù)測結(jié)果的效果評價(jià)時(shí),除了常規(guī)的幾個(gè)誤差指標(biāo)外,本文還考慮對不同預(yù)測結(jié)果的殘差從均值、方差、偏度和峰度等基本的描述性統(tǒng)計(jì)指標(biāo)進(jìn)行對比和分析。應(yīng)用這些指標(biāo)對不同預(yù)測結(jié)果的殘差進(jìn)行效果分析的優(yōu)點(diǎn)在于可以從宏觀上對預(yù)測結(jié)果的狀態(tài)進(jìn)行掌握,進(jìn)而提高分析的全面性。
為了驗(yàn)證本文所構(gòu)建的最優(yōu)化模型的有效性,本文運(yùn)用2016 年1 月4 日至2018 年6 月12 日的日元兌美元日匯率收盤價(jià)的數(shù)據(jù)進(jìn)行了實(shí)證研究,并將樣本分為兩個(gè)部分,其中將2016 年1 月4 日至2018 年5 月31 日的625 個(gè)數(shù)據(jù)作為訓(xùn)練樣本,用于建模;2018 年5 月31 日至2018 年6 月12 日的10 個(gè)數(shù)據(jù)作為檢驗(yàn)樣本,并用于驗(yàn)證模型的有效性。
針對625個(gè)樣本,構(gòu)建如下的單項(xiàng)預(yù)測方法:
(1)BP神經(jīng)網(wǎng)絡(luò)(BPNN)預(yù)測
BP神經(jīng)網(wǎng)絡(luò)模型的一類典型互聯(lián)模式為一個(gè)多層感知器結(jié)構(gòu),即包含輸入層、輸出層和若干隱含層(有時(shí)可加該層)并組成前向連接模型,其中同一層級神經(jīng)元互不連接而相鄰層級之間的神經(jīng)元通過權(quán)值連接。圖1給出一類典型的三層BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)模型。
圖1 典型的三層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)模型
通過模擬生物神經(jīng)元的非線性特性,BP 神經(jīng)網(wǎng)絡(luò)選用如下的S型輸出函數(shù):
這里,vki為輸出層神經(jīng)元k 與隱含層神經(jīng)元i 的連接權(quán)值。
神經(jīng)網(wǎng)絡(luò)模型的基本原理是將觀測值序列作為輸入,而將預(yù)測值作為輸出,利用自購的樣本訓(xùn)練這個(gè)網(wǎng)路,使得不同的輸入向量得到不同的輸出值。這樣,神經(jīng)網(wǎng)絡(luò)所具有的連接權(quán)值便是經(jīng)自適應(yīng)學(xué)習(xí)所得到的內(nèi)部表示,因而訓(xùn)練好的網(wǎng)絡(luò)便可作為定性和定量相結(jié)合的有效工具對不同的預(yù)測對象進(jìn)行預(yù)測[27]。
本文選取前70%的數(shù)據(jù)作為訓(xùn)練樣本,中間15%數(shù)據(jù)作為測試數(shù)據(jù),最后15%作為驗(yàn)證數(shù)據(jù)。
運(yùn)用MATLAB運(yùn)行結(jié)果如圖2所示。
(2)非線性自回歸神經(jīng)網(wǎng)絡(luò)(NARnet)
圖2 BP神經(jīng)網(wǎng)絡(luò)預(yù)測效果圖
非線性自回歸神經(jīng)網(wǎng)絡(luò)[28]是一類記憶功能的網(wǎng)絡(luò),其結(jié)構(gòu)包含輸入層、隱含層和輸出層以及輸入和輸出的延時(shí),網(wǎng)絡(luò)的輸出取決于當(dāng)前的輸出和過去的輸出,其方程為:
其中,y(t)表示輸出,d 為延時(shí)階數(shù),f 表示應(yīng)用神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)的非線性函數(shù)。
本文選取80%為訓(xùn)練樣本,10%為檢驗(yàn)樣本和10%測試樣本。運(yùn)用MATLAB 分析,應(yīng)用MATLAB 得到的擬合結(jié)果如圖3所示。
圖3 NARnet預(yù)測效果圖
(3)自適應(yīng)神經(jīng)模糊推理預(yù)測方法
自適應(yīng)神經(jīng)模糊推理(Adaptive Neuro-Fuzzy Inference System,ANFIS)能夠直接通過模糊推理實(shí)現(xiàn)輸入層與輸出層之間的非線性映射,與神經(jīng)網(wǎng)絡(luò)的信息存儲能力和學(xué)習(xí)相近[29]。
典型的ANFIS模型結(jié)構(gòu)具有5層,即計(jì)算輸入的模糊隸屬度、每條規(guī)則的適用度、適用度的歸一化、每條規(guī)則的輸出和模糊系統(tǒng)的輸出。
圖4給出具有兩個(gè)輸入單個(gè)輸出的ANFIS結(jié)構(gòu)[30-31]。
圖4 具有兩輸入一輸出一階ANFIS結(jié)構(gòu)
模糊推理的輸出采用如下形式的加權(quán)平均法:
這里,wi為變量xi的權(quán)重。
類似地,選取前70%觀測值為訓(xùn)練數(shù)據(jù),中間15%為測試數(shù)據(jù),最后15%為驗(yàn)證數(shù)據(jù)。通過MATLAB 分析可以得到如圖5。
圖5 ANFIS預(yù)測效果圖
通過訓(xùn)練樣本的625個(gè)數(shù)據(jù)建立模型,預(yù)測樣本外的10個(gè)數(shù)據(jù),最終的單項(xiàng)預(yù)測結(jié)果如表1所示。
首先,通過本文所構(gòu)造的多目標(biāo)最優(yōu)化模型(5),利用Lingo軟件運(yùn)行得到一組權(quán)重(全局最優(yōu)解)如下:
結(jié)果表明,由于各單項(xiàng)預(yù)測結(jié)果精度均相對較高,因而在進(jìn)行組合時(shí)經(jīng)過對誤差的可容忍限制,最優(yōu)化模型給出了較為一致的權(quán)重分配。這也從另一個(gè)側(cè)面反映出普通等權(quán)重賦權(quán)結(jié)構(gòu)在實(shí)際應(yīng)用中的合理性[32]。通過對各單項(xiàng)預(yù)測結(jié)果集成,計(jì)算出組合預(yù)測值,如表1所示。
作為對比,考慮傳統(tǒng)的以組合預(yù)測誤差平方和達(dá)到最小為準(zhǔn)則構(gòu)造權(quán)重的方法,利用Lingo軟件運(yùn)行得到如下的一組權(quán)重:ω1=0,ω2=0.053,ω3=0.947。
表1 實(shí)際值及預(yù)測值
為了驗(yàn)證基于可容忍誤差的最優(yōu)組合預(yù)測方法權(quán)重構(gòu)造的有效性,本文從如下兩個(gè)方面對所提出的模型的有效性進(jìn)行驗(yàn)證:
(1)對本文的單項(xiàng)預(yù)測結(jié)果及組合預(yù)測結(jié)果的殘差進(jìn)行描述性統(tǒng)計(jì)分析,分析結(jié)果如表2所示。
表2 模型的偏度及峰度
均值是反映數(shù)據(jù)的平均水平,表2的數(shù)據(jù)反映的是殘差的均值,殘差的均值的絕對值越接近于0,表明預(yù)測結(jié)果越好,僅僅從均值的角度可以得出,NARnet模型的預(yù)測效果比較好。
從方差的角度分析,方差是反映數(shù)據(jù)的離散程度,方差越接近0,表明數(shù)據(jù)的離散程度越小,從表2中可以看到,本文所提出的組合預(yù)測模型的預(yù)測效果比較好。綜合殘差的均值和方差兩方面看,組合預(yù)測的預(yù)測效果要優(yōu)于各單項(xiàng)預(yù)測方法;本文所提出的組合預(yù)測方法優(yōu)于普通的組合預(yù)測方法。
偏度是反映數(shù)據(jù)分布對稱性的測度,偏態(tài)系數(shù)為0,則說明該組數(shù)據(jù)的分布是對稱的。本文考慮的是殘差的偏度,從表2中可以看到,NARnet模型的偏度更接近于0,表明此模型的殘差序列分布近似于對稱分布,預(yù)測效果更好。
從峰度的角度考慮,不論是組合預(yù)測模型還是單項(xiàng)預(yù)測模型,其峰度都是大于0 的,表明各個(gè)模型的殘差分布是比較集中的,其中本文所提出的組合預(yù)測方法的峰度更接近于3,更趨向于正態(tài)分布,其殘差分布更集中;其次是普通的組合預(yù)測方法的峰度更接近于3。因此,可以得出,組合預(yù)測方法優(yōu)于各單項(xiàng)預(yù)測方法,本文所提出的基于可容忍度的組合預(yù)測模型優(yōu)于普通的組合預(yù)測模型。
此外,可以繪制各單項(xiàng)預(yù)測方法及組合預(yù)測方法的殘差絕對值圖,如圖6所示。
圖6 預(yù)測結(jié)果和效果對比
由圖6(a)可見,單項(xiàng)預(yù)測結(jié)果的預(yù)測效果較差,兩種組合預(yù)測的結(jié)果都優(yōu)于單項(xiàng)預(yù)測方法,并且隨著時(shí)點(diǎn)的推移,本文所提出的組合預(yù)測方法與實(shí)際值越接近。
由圖6(b)可見,單項(xiàng)預(yù)測方法在各時(shí)點(diǎn)的殘差波動比較大,基于可容忍誤差的最優(yōu)化組合預(yù)測模型的殘差波動相對較穩(wěn)定;另外,本文所提出的組合預(yù)測模型的殘差略小于傳統(tǒng)的組合預(yù)測模型。
為了更好地對預(yù)測結(jié)果進(jìn)行分析,不能僅僅局限于對預(yù)測結(jié)果的殘差序列進(jìn)行描述性統(tǒng)計(jì)分析,于是,本文從如下幾個(gè)普通的評價(jià)指標(biāo)考慮,對其預(yù)測結(jié)果的好壞進(jìn)行分析。
(2)運(yùn)用常用的幾種誤差評價(jià)指標(biāo)對單項(xiàng)預(yù)測結(jié)果及組合預(yù)測結(jié)果進(jìn)行分析,結(jié)果如表3所示。
由表3,本文可以得出以下結(jié)論:
(1)相對于三種單項(xiàng)預(yù)測方法而言,從四種評價(jià)指標(biāo)來看,不論是相對指標(biāo)還是絕對指標(biāo),組合預(yù)測模型的預(yù)測結(jié)果均優(yōu)于單項(xiàng)預(yù)測方法。
表3 模型擬合效果比較
(2)相對于以預(yù)測誤差平方和達(dá)到最小為準(zhǔn)則的普通加權(quán)組合預(yù)測方法,本文所提出的方法由于考慮到了可容忍誤差,提高了組合預(yù)測的精度。
(3)由于單項(xiàng)預(yù)測方法均采用了精度較高的智能預(yù)測方法,在組合結(jié)果改善了預(yù)測效果的同時(shí),結(jié)果改善的幅度相對偏小。但是,仍可以觀測出通過簡單的附加可容忍誤差的條件,預(yù)測效果整體而言仍是占優(yōu)的,表明了所提概念和方法的有效性。
本文基于可容忍誤差的概念,并結(jié)合預(yù)測精度的相關(guān)概念,給出新的預(yù)測精度的定義,并構(gòu)建了一個(gè)新的最優(yōu)化組合預(yù)測賦權(quán)模型。另外,為從多角度反映預(yù)測精度的好壞,本文除了運(yùn)用普通的預(yù)測評價(jià)指標(biāo)對預(yù)測效果進(jìn)行測度之外,還嘗試運(yùn)用統(tǒng)計(jì)學(xué)中均值、方差、峰度和偏度的概念反映預(yù)測的效果。并以實(shí)例說明本文所構(gòu)建的多目標(biāo)最優(yōu)化組合預(yù)測模型的可行性和有效性。
可容忍預(yù)測誤差作為傳統(tǒng)預(yù)測誤差的推廣,本文僅將其應(yīng)用到組合預(yù)測賦權(quán)問題中。未來,這一誤差測度可以進(jìn)一步推廣到各單項(xiàng)預(yù)測方法中,例如,通過設(shè)定可容忍絕對誤差水平,考慮多元線性回歸模型中的參數(shù)確定。同時(shí),也可以將可容忍預(yù)測誤差拓展到基于誤差的預(yù)測方法構(gòu)建和評估問題中。