洪嘉灝 李雄英 王斌會
摘 要 由于金融數(shù)據(jù)具有隨機(jī)性特征,使得建模和預(yù)測變得極其困難.提出一種組合預(yù)測方法,即假定任何金融時(shí)序數(shù)據(jù)由線性和非線性兩部分組成,將其中線性部分的數(shù)據(jù)通過隨機(jī)游走(RW)模型進(jìn)行模擬,剩余的非線性殘差部分由前饋神經(jīng)網(wǎng)絡(luò)(FANN)和誒爾曼神經(jīng)網(wǎng)絡(luò)(EANN)協(xié)同處理.從實(shí)證結(jié)果可知,該組合方法相比單獨(dú)使用RW、FANN或EANN模型有更高的預(yù)測精度.
關(guān)鍵詞 誒爾曼神經(jīng)網(wǎng)絡(luò);人工神經(jīng)網(wǎng)絡(luò);隨機(jī)游走模型;組合預(yù)測;金融時(shí)間序列
中圖分類號 F224 文獻(xiàn)標(biāo)識碼 A
1 引 言
金融時(shí)間序列與經(jīng)濟(jì)環(huán)境及商業(yè)環(huán)境有關(guān),如股市,匯率,物價(jià)指數(shù),國民收入和凈出口等.選擇一個(gè)合適的金融數(shù)據(jù)模型,需要正確地識別金融市場與整體經(jīng)濟(jì)之間的內(nèi)在關(guān)系[1].在實(shí)踐中非常困難.因?yàn)橐粋€(gè)金融時(shí)序數(shù)據(jù)的動態(tài)變化受到多個(gè)經(jīng)濟(jì)變量的影響,包括經(jīng)濟(jì)增長,利率,通貨膨脹,通貨緊縮,政治決策和心理因素等多個(gè)復(fù)雜的經(jīng)濟(jì)變量[1].
這些年來,關(guān)于金融時(shí)間序列的分布特征、模型模擬及預(yù)測等已經(jīng)有了大量的研究工作[2,3].線性統(tǒng)計(jì)模型,如指數(shù)平滑法[4]和ARIMA[5]模型等,已經(jīng)大量應(yīng)用于金融數(shù)據(jù)的預(yù)測.ARIMA模型的一個(gè)分支,即隨機(jī)游走模型(Random Walk model)[1,6],已經(jīng)成為這個(gè)領(lǐng)域的主流統(tǒng)計(jì)技術(shù).在一個(gè)簡單的隨機(jī)游走模型中,每一期的預(yù)測值被認(rèn)為是最近一期的觀測值和隨機(jī)誤差項(xiàng)的總和.目前,簡單隨機(jī)游走模型是金融時(shí)間序列分析中最主要的線性模型(尤其是匯率數(shù)據(jù))[7].對隨機(jī)游走模型的改進(jìn),如帶漂移項(xiàng)的隨機(jī)游走模型和誤差修正,也有了很多相關(guān)的研究[1].盡管隨機(jī)游走模型具有簡單性和顯著的預(yù)測精度,但是其主要缺點(diǎn)是內(nèi)在的線性形式.隨機(jī)游走模型未能捕獲存在于金融時(shí)間序列中的非線性特征[2,7].非線性是金融時(shí)間序列的缺省特征,因此,通過一個(gè)隨機(jī)游走模型近似它是不充分的.在這種情況下,人工神經(jīng)網(wǎng)絡(luò)是一種不錯的選擇.由于其非線性,非參數(shù),自適應(yīng)和噪聲耐受性,人工神經(jīng)網(wǎng)絡(luò)在金融時(shí)間序列預(yù)測領(lǐng)域獲得了廣泛的關(guān)注[2,3].這些顯著的特征使得人工神經(jīng)網(wǎng)絡(luò)模型能夠有效地識別解釋變量之間導(dǎo)致金融時(shí)序圖產(chǎn)生不規(guī)則波峰和波谷的內(nèi)在機(jī)理.與其他非線性統(tǒng)計(jì)模型不同的是,人工神經(jīng)網(wǎng)絡(luò)能夠在不了解底層數(shù)據(jù)計(jì)算過程的情況下進(jìn)行非線性模擬[8].不少研究者對比了人工神經(jīng)網(wǎng)絡(luò)和隨機(jī)游走模型預(yù)測金融數(shù)據(jù)時(shí)的表現(xiàn),也研究出了許多有益的結(jié)果:如Dunis and William發(fā)現(xiàn)神經(jīng)網(wǎng)絡(luò)相對于一般的統(tǒng)計(jì)模型可以提供更高的預(yù)測精度;Sun[1]發(fā)現(xiàn)在預(yù)測匯率時(shí),人工神經(jīng)網(wǎng)絡(luò)表現(xiàn)出比隨機(jī)游走模型更差的預(yù)測精度等等.但是,對于預(yù)測金融數(shù)據(jù),一個(gè)金融時(shí)間序列一般包含了線性部分和非線性部分,單獨(dú)使用人工神經(jīng)網(wǎng)絡(luò)模型或隨機(jī)游走模型并不合適.上述研究無法確定人工神經(jīng)網(wǎng)絡(luò)模型和隨機(jī)游走模型中哪一個(gè)更適應(yīng)于預(yù)測這類金融數(shù)據(jù).從而激勵著去尋找一種組合機(jī)制去預(yù)測匯率.對于金融數(shù)據(jù)模型的預(yù)測,zhang[7]首次將隨機(jī)游走模型和神經(jīng)網(wǎng)絡(luò)模型結(jié)合起來,國內(nèi)學(xué)者熊志斌也做了ARIMA融合神經(jīng)網(wǎng)絡(luò)的人民幣匯率預(yù)測模型研究[9].
本文假設(shè)任何金融時(shí)間序列由線性部分和非線性自相關(guān)部分組成,且可以從時(shí)間序列中剝離、單獨(dú)建模.將隨機(jī)游走模型和神經(jīng)網(wǎng)絡(luò)模型結(jié)合起來對金融數(shù)據(jù)進(jìn)行預(yù)測.主要步驟如下:首先,隨機(jī)游走模型用于擬合金融時(shí)間序列的線性部分,由觀察值和隨機(jī)游走模型擬合值之間的差計(jì)算樣本內(nèi)殘差.根據(jù)假設(shè),這些殘差只包含非線性關(guān)系;第二,F(xiàn)ANN和EANN將用于分別擬合這些殘差值,并由2個(gè)模型產(chǎn)生的預(yù)測值的平均值得到想要的殘差估計(jì);第三步,由隨機(jī)游走模型預(yù)測時(shí)間序列的線性部分;最后,將線性部分和非線性部分所得到的預(yù)測值加總,獲得期望的最終預(yù)測.
2 隨機(jī)游走模型
隨機(jī)游走模型是金融時(shí)序分析最流行和有效的統(tǒng)計(jì)模型,也被廣大的研究生所研究和使用,這個(gè)模型假設(shè)最近的觀察值是對下一期預(yù)測值的最佳指南.在數(shù)學(xué)上,一個(gè)簡單的RW模型被表示如下:
其中,和yt是時(shí)間序列中的觀察值,εt是一個(gè)白噪聲并且εt~N(0,σ2).
從式(1)中可以看出,一個(gè)隨機(jī)游走模型表明所有與未來相關(guān)的信息已經(jīng)包含在可用的數(shù)據(jù)里,這個(gè)模型因?yàn)楸皇褂幂^多,所以非常容易理解和實(shí)現(xiàn).根據(jù)有效市場的假說,隨機(jī)游走模型是外匯匯率預(yù)測中最主要的線性模型,而且大量研究指出許多基于線性結(jié)構(gòu)的預(yù)測技術(shù)并沒有比簡單的隨機(jī)游走模型更有效.
一個(gè)隨機(jī)游走模型的成功很大程度上取決于隨機(jī)誤差項(xiàng),按照定義,隨機(jī)誤差項(xiàng)是獨(dú)立同分布的.在本文中將生成獨(dú)立同分布的偽隨機(jī)正態(tài)變量εt~N(0,σ2),其中σ2是樣本內(nèi)數(shù)據(jù)集的方差.
3 人工神經(jīng)網(wǎng)絡(luò)(ANN)模型
3.1 前饋神經(jīng)網(wǎng)絡(luò) (FANN)
在所有可用的仿生預(yù)測方法中,人工神經(jīng)網(wǎng)絡(luò)無疑是最流行且最成功的.人工神經(jīng)網(wǎng)絡(luò)最初起源于對人腦結(jié)構(gòu)的模仿,漸漸地,神經(jīng)網(wǎng)絡(luò)技術(shù)在眾多領(lǐng)域起到了極為重要的作用,如分類、識別和預(yù)測.人工神經(jīng)網(wǎng)絡(luò)通過若干互相連接的分布在不同層的神經(jīng)元來學(xué)習(xí)數(shù)據(jù)的內(nèi)在關(guān)系.多層感知器(MLP)是最被認(rèn)可的人工神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu),用于時(shí)間序列預(yù)測問題.一個(gè)MLP基本上是一個(gè)輸入層,一個(gè)或多個(gè)隱藏層和一個(gè)輸出層的前饋結(jié)構(gòu).在每層中有許多個(gè)處理結(jié)點(diǎn),其通過不可逆的鏈接連接到下一層.單層次的隱藏節(jié)點(diǎn)已經(jīng)足以解決許多最實(shí)際的問題.圖1描述了一個(gè)典型的MLP結(jié)構(gòu)(p個(gè)輸入結(jié)點(diǎn),h個(gè)隱藏結(jié)點(diǎn)和一個(gè)輸出結(jié)點(diǎn)).
在沒有任何限制條件的情況下,簡單的多層感應(yīng)器模型或前饋神經(jīng)網(wǎng)絡(luò)模型能以任何給定的精度去近似逼近任何非線性函數(shù).考慮到計(jì)算的要求,簡單的神經(jīng)網(wǎng)絡(luò)往往是更合適的.選擇合適的網(wǎng)絡(luò)結(jié)構(gòu)很重要,但并不是一個(gè)簡單的工作.網(wǎng)絡(luò)結(jié)構(gòu)的選擇主要包括確定輸入節(jié)點(diǎn)、隱藏節(jié)點(diǎn)和輸出節(jié)點(diǎn)的個(gè)數(shù),以及隱藏層的層數(shù).在不同文獻(xiàn)中有著不同的參數(shù)優(yōu)化選擇方法,但這些方法并不簡單,而且都是針對著具體的問題.endprint
廣泛應(yīng)用的神經(jīng)網(wǎng)絡(luò)選擇方法包括了赤池信息準(zhǔn)則(AIC),貝葉斯信息準(zhǔn)則(BIC),施瓦茨的貝葉斯準(zhǔn)則(SBC)和偏差校正的赤池信息準(zhǔn)則(AICC-).這4種準(zhǔn)則基于對增加神經(jīng)網(wǎng)絡(luò)中參數(shù)個(gè)數(shù)的懲罰.在本文中,使用BIC準(zhǔn)則作為神經(jīng)網(wǎng)絡(luò)的選擇標(biāo)準(zhǔn),因?yàn)樗绕渌?種準(zhǔn)則更嚴(yán)重地懲罰了額外的參數(shù).對于一個(gè)的FANN模型,BIC的數(shù)學(xué)表達(dá)式由式(5)給出:
3.2 誒爾曼人工神經(jīng)網(wǎng)絡(luò)(EANN)
類似于常見的前饋型神經(jīng)網(wǎng)絡(luò)(FANNs),時(shí)間遞歸神經(jīng)網(wǎng)絡(luò)在金融時(shí)間序列預(yù)測領(lǐng)域也相當(dāng)流行.誒爾曼人工神經(jīng)網(wǎng)絡(luò)是一種簡單的時(shí)間遞歸神經(jīng)網(wǎng)絡(luò),除了3種常見的層次,還有額外的上下文層和反饋連接.在每一個(gè)計(jì)算步驟中,隱藏層的輸出被再次反饋到上下文層,如圖2所示.這種遞歸使得神經(jīng)網(wǎng)絡(luò)動態(tài)化,從而能夠?qū)崿F(xiàn)對處理結(jié)點(diǎn)非線性時(shí)間依賴的映射.EANN模型通常比相同結(jié)構(gòu)的FANN提供了更好的預(yù)測性能.然而,EANNs比FANNs需要更多數(shù)量的網(wǎng)絡(luò)連接和記憶單元.
使用相同的網(wǎng)絡(luò)結(jié)構(gòu)的FANN和EANN模型,不同之處在于EANN模型隱藏層的神經(jīng)元是對應(yīng)FANN模型中神經(jīng)元的5倍.
4 組合方法的建模
在本文中,決定同時(shí)利用隨機(jī)網(wǎng)絡(luò)模型和神經(jīng)網(wǎng)路模型來預(yù)測金融數(shù)據(jù).雖然這些模型有著廣泛的應(yīng)用,但是他們之中沒有一個(gè)模型能夠在所有預(yù)測情況之下都最好.例如,RW模型不適合于識別非線性模式,類似地,使用人工神經(jīng)網(wǎng)絡(luò)處理線性問題時(shí)產(chǎn)生的結(jié)果也好壞參半.因此,更科學(xué)的做法是找一種組合方法去結(jié)合這兩種模型的長處,而不是單獨(dú)地去應(yīng)用它們.假設(shè),一個(gè)金融時(shí)間序列由從線性和非線性兩部分構(gòu)成,能從時(shí)間序列中分離出來并單獨(dú)地建模.從數(shù)學(xué)上講:
這種組合方法的顯著特點(diǎn)如下:①任何金融時(shí)間序列都由線性部分和非線性部分組成,通過隨機(jī)游走模型擬合線性部分,神經(jīng)網(wǎng)絡(luò)模型擬合非線性殘差部分,提高了總體的預(yù)測精度;②類似的組合方法最早由Zhang推出,在他們的方法中,時(shí)間序列的線性部分由ARIMA模型來擬合而剩余的非線性殘差部分由FANN來擬合.然而,該組合方法同時(shí)結(jié)合了FANN模型和EANN模型兩種模型的優(yōu)勢,能更好地識別非線性自回歸結(jié)構(gòu);③這種組合機(jī)制是基于一種簡單而有效的想法,相當(dāng)容易實(shí)施和解釋.④值得注意的是,如果金融時(shí)間序列中的線性和非線性部分存在著適當(dāng)比例的自相關(guān)結(jié)構(gòu),那所提出的組合方法將能顯著改善預(yù)測精度.如果這2個(gè)部分自相關(guān)程度較弱,那該方法可能并不合適.
5 實(shí)驗(yàn)結(jié)果與討論
為了驗(yàn)證所提出的組合方法的有效性,本文用到了三組數(shù)據(jù):①港幣兌換美元匯率,包括了從1994年8月到2015年6月港幣兌換人民幣的每月匯率;②美元兌換人民幣匯率,包含從2005年5月到2015年6月美元兌換人民幣的每月匯率;③人民幣兌換港幣匯率,包括了從1995年1月到2015年6月人民幣兌換港幣的每月匯率.(數(shù)據(jù)來源:匯率數(shù)據(jù)取自國泰安數(shù)據(jù)庫)(見表1)
從圖3中可以清楚地看到3個(gè)時(shí)間序列中不規(guī)則非平穩(wěn)的變化.
圖4和5中,畫出了3種時(shí)間序列的實(shí)際曲線和通過組合模型所描繪的預(yù)測值曲線.在每個(gè)圖中,實(shí)線和虛線分別表示實(shí)際和預(yù)測序列.港幣美元匯率與人民幣港幣匯率數(shù)據(jù)的預(yù)測誤差較小,預(yù)測值與原始值的走勢趨于一致.預(yù)測人民幣港幣匯率的預(yù)測效果沒有港幣美元匯率與人民幣港幣匯率好,預(yù)測值的總體走勢與原始值一致.三組匯率數(shù)據(jù)的原始值和他們的預(yù)測值之間的接近程度是顯而易見的.
6 總 結(jié)
眾所周知,設(shè)計(jì)一個(gè)合適的模型來預(yù)測金融數(shù)據(jù)是時(shí)間序列研究領(lǐng)域的一個(gè)重大挑戰(zhàn),也是極其不易之事.這主要是因?yàn)榻鹑跁r(shí)間序列中的不規(guī)則運(yùn)動及突然的轉(zhuǎn)折點(diǎn)使得實(shí)際中很難去理解和預(yù)測.基于金融數(shù)據(jù)獨(dú)特的隨機(jī)性特征,本文構(gòu)建了人工神經(jīng)網(wǎng)絡(luò)和隨機(jī)游走模型對中國的匯率數(shù)據(jù)進(jìn)行預(yù)測.
本文構(gòu)建的新模型結(jié)合了隨機(jī)游走模型,F(xiàn)ANN模型和EANN模型3種模型的優(yōu)勢去預(yù)測金融數(shù)據(jù).并且從實(shí)證結(jié)果表明,預(yù)測值與原始值的走勢趨于一致,港幣與人民幣之間的預(yù)測誤差不大,但是對于相對于人民幣匯率的預(yù)測,美元匯率的預(yù)測效果更好.從預(yù)測誤差看,均比每個(gè)單獨(dú)的模型效果要好.從三組真實(shí)的金融時(shí)間序列的實(shí)證結(jié)果清楚地表明,本文新構(gòu)建的組合方法極大地提高了整體的預(yù)測精度.因此,我們的新模型在匯率預(yù)測方面上有更高的準(zhǔn)確性和適用性.
參考文獻(xiàn)
[1] Y SUN. Exchange rate forecasting with an artificial neural network model: can we beat a random walk model? [D] New Zealand:Christchurch,Lincoln University, 2005.
[2] A HUSSAIN, A KNOWLES, P LISBOA,et al. Financial time series prediction using polynomial pipelined neural networks[J]. Expert Systems with Applications, 2008, 35(3): 1186-1199.
[3] M SEWELL. The application of intelligent systems to financial time series analysis[D].London:Department of Computer Science, UCL,2010.
[4] C LEMKE,B GABRYS. Metalearning for time series forecasting and forecast combination[J]. Neurocomputing, 2010, 73(10): 2006-2016.
[5] G BOX, G JENKINS, G REINSEL. Time series analysis: forecasting and control[M].London John Wiley & Sons, 2011. 734
[6] E TYREE, J LONG. Forecasting currency exchange rates: neural networks and the random walk model[J]. Citeseer, 1995(1):981-996.
[7] G ZHANG. Time series forecasting using a hybrid ARIMA and neural network model[J]. Neurocomputing, 2003, 50: 159-175.
[8] G ZHANG. A neural network ensemble method with jittered training data for time series forecasting[J]. Information Sciences, 2007, 177(23): 5329-5346.
[9] 熊志斌.ARIMA融合神經(jīng)網(wǎng)絡(luò)的人民幣匯率預(yù)測模型研究[J].數(shù)量經(jīng)濟(jì)技術(shù)經(jīng)濟(jì)研究: 2011(6):64-76.endprint