史文靜 高巖
摘要 中國近4年才成立的股指期貨市場價格呈現(xiàn)出非平穩(wěn)、非線性的信號特征, 傳統(tǒng)的預測方法無法對長相關(guān)序列進行精確預測. 將EMD與RBF相結(jié)合, 建立了一種新的預測方法對我國股指期貨日結(jié)算價格進行預測. 結(jié)果顯示本模型將原本具有長相關(guān)性質(zhì)的原始序列分解為若干個短相關(guān)性質(zhì)的不同頻帶, 解決了原始序列隨機性強, 以及因相鄰頻帶的干擾而造成的系統(tǒng)動力信息反映不足的缺陷; 并與其他預測模型進行比較, 顯示出較高的預測精度.
關(guān)鍵詞 EMD; RBF神經(jīng)網(wǎng)絡; 股指期貨
中圖分類號 F830 文獻標識碼 A
AbstractOnly in the past four years did China set up the stock index futures market displaying the nonstable and nonlinear signal features. The traditional estimation methods cannot make accurate estimation of longrelevant sequence. Combining EMD with RBF, we have created a new method of estimation to predict the daily settlement price for stock index futures. The result shows that this model has separated the original sequence with longrelevance features into several shortrelevance frequency bands, making up for the shortage of system power information caused by the serious randomness of the original sequence and the interruptions from nearby frequency bands. It is also compared with other estimation models to display a relatively high degree of accuracy.
Key wordsEmpirical Mode Decomposition; RBF; stock index futures
1引言
通過價格信號對資源進行合理配置是市場經(jīng)濟條件下經(jīng)濟發(fā)展的主要手段. 因此期貨市場應運而生, 為國民經(jīng)濟的發(fā)展創(chuàng)造了多種風險管理工具, 保證國民經(jīng)濟的運行. FLOROS通過對歐美金融市場的研究, 表明股指期貨保證了股市正常健全的發(fā)展[1]. 由此可見, 不僅應從資本市場發(fā)展和體制轉(zhuǎn)換的大系統(tǒng)來考慮股指期貨的必要性, 更應該從目前股指期貨市場隱含的需求和深層的矛盾來研究股指期貨市場.
中國滬深300股指期貨是2010年, 由中國金融期貨交易發(fā)行, 將滬深300指數(shù)作為標的物, 為長期投資者提供風險管理服務的一種新生金融商品. 我國股指期貨經(jīng)過四年的成長, 市場制度逐步完善,但對其的研究卻不夠成熟. 而股指期貨價格預測作為提高金融市場風險防范能力和增強投資組合收益的有效途徑之一, 逐漸引起學術(shù)界的重視, 探究和開發(fā)針對當前股指期貨市場價格波動特征下的價格預測方法是具有現(xiàn)實意義的研究課題.
就目前對金融市場預測方法而言, 常見的預測方法有自回歸滑動平均模型(AutoRegressive and Moving Average Model, ARMA模型)、灰色預測模型、曲線擬合、BP 神經(jīng)網(wǎng)絡模型、支持向量機(Support Vector Machine, SVM)以及小波神經(jīng)網(wǎng)絡預測模型等.
雖然在短期內(nèi)這些傳統(tǒng)的模型預測方法顯示出良好的效果, 但都不能有效解釋股指期貨波動的內(nèi)在驅(qū)動力和經(jīng)濟含義, 也不能準確地預測非平穩(wěn)時間序列. 基于模型階數(shù)的ARMA模型因其階數(shù)不容易確定造成預測精度不高[2,3]. 當數(shù)據(jù)灰度很大或者對系統(tǒng)內(nèi)在機理理解不清除的情況下, 運用灰色預測模型會造成很大的誤差[4]. BP神經(jīng)網(wǎng)絡算法一般都是根據(jù)經(jīng)驗來選擇合適的網(wǎng)絡結(jié)構(gòu),這就使得網(wǎng)絡的逼近和訓練能力具有不確定性,很難確定合適的網(wǎng)絡結(jié)構(gòu)[5,6]. 支持向量機的預測結(jié)果具有滯后性、拐點處誤差較大的缺陷, 影響預測精度[7]. 小波神經(jīng)網(wǎng)絡變換的有效性是由分解層數(shù)和小波基的選擇決定, 不能確保最佳的信號分解[8].
股指期貨價格是典型非平穩(wěn)、非線性時間序列, 具有長相關(guān)性, 而傳統(tǒng)預測方法并沒有充分考慮到序列的隨機性、周期性和趨勢性的特點, 只是針對整個時間序列進行預測, 預測精度不高. 為了提高非平穩(wěn)、非線性時間序列的預測精度, 本文采用經(jīng)驗模態(tài)分解(Empirical Mode Decomposition, EMD)在處理非線性、非平穩(wěn)信號方面的優(yōu)勢, 將股指期貨原本具有長相關(guān)性質(zhì)的原始序列分解為若干個適于預測的短相關(guān)性質(zhì)的不同頻帶, 探究其波動的結(jié)構(gòu)性特征, 為認識股指期貨的波動提供新思路, 提出了基于EMDRBF的股指期貨價格新預測模型.
2方法基礎(chǔ)
N. E. Huang等人提出的了一種適用于非線性、非平穩(wěn)信號的新型自適應信號時頻處理方法—經(jīng)驗模態(tài)分解(EMD)[9]. EMD方法根據(jù)數(shù)據(jù)自身的時間尺度特征將信號中不同時間尺度的波動逐級分解為一個代表原始信號總體趨勢的剩余分量和有限個本征模函數(shù)(Intrinsic Mode Function, IMF), 各IMF分量包含了原始信號不同時頻特征[10]. 該方法的變換并不是基于事先設定好的基函數(shù), 而是對數(shù)據(jù)本身的一種分解, 具有直接、后驗、直觀和自適應的優(yōu)點, 是對以線性和平穩(wěn)假設為基礎(chǔ)的小波基和傅立葉分解的突破.
Moody和Darken首先將RBF(RadialBasis Function, RBF)應用于神經(jīng)網(wǎng)絡設計[11]. RBF網(wǎng)絡的基本思想是將隱含層空間由徑向基函數(shù)(RBF)作為隱單元的“基”來構(gòu)成, 變換輸入矢量, 將原本低維的模式輸入數(shù)據(jù)變換到高維空間內(nèi), 輸出層再將隱單元的輸出加權(quán)求和得到結(jié)果. 其結(jié)構(gòu)圖如圖1所示.
一般采用線性激勵函數(shù)作為輸入和輸出神經(jīng)元函數(shù). 徑向基函數(shù)地快速衰減性使得RBF網(wǎng)絡具有全局逼近和超速學習的優(yōu)點, 學習方式也比BP神經(jīng)網(wǎng)絡更豐富, 且可以調(diào)節(jié)網(wǎng)絡結(jié)構(gòu)的眾多參數(shù)[12].
3一種新的預測模型設計
將EMD與RBF神經(jīng)網(wǎng)絡相結(jié)合的新模型來改善無法對長相關(guān)序列精確預測的缺陷, 提高預測模型的精度, 為預測股指期貨市場價格提供新的思路和借鑒. EMDRBF神經(jīng)網(wǎng)絡預測模型的基本思想如下:
1)數(shù)據(jù)預處理; 在運用EMDRBF新模型對原始時間序列進行初始預測會產(chǎn)生一定的偏差, 這些偏差會使最后的預測結(jié)果與實際結(jié)果的誤差增大,影響模型的預測精度. 因此采用多項式擬合算法對原數(shù)據(jù)端點做處理, 防止原序列極值端點發(fā)生發(fā)散現(xiàn)象并“污染”整個結(jié)果[13]. 處理后的數(shù)據(jù)序列為{Xt,t=1,2,…,m}.
4滬深300股指期貨價格預測
4.1數(shù)據(jù)樣本選擇
選取中國滬深300股指期貨2012~2014年兩年的日交易結(jié)算價格, 共計561個樣本數(shù)據(jù). 圖3為滬深300主連合約日交易結(jié)算價格曲線. 將區(qū)間(1,500)的數(shù)據(jù)作為建立模型的訓練數(shù)據(jù), 區(qū)間(501,561)的數(shù)據(jù)作為最后與預測數(shù)據(jù)進行比對的原數(shù)據(jù). 本文用MATLAB R2010處理數(shù)據(jù).
4.2評價準則
為了檢驗預測效果, 對測量誤差進行測量, 選用平均絕對誤差MAE(Mean Absolute Error)、均方根誤差RMSE(Rootmeansquare Error)兩個指標衡量預測誤差的大?。?方向?qū)ΨQ(Directional Symmetry ,DS)顯示正確預測目標值方向的次數(shù)與預測樣本容量的百分比, 因此可以作為各模型對股指期貨方向走勢預測性能的評價準則. 設Pi為模型預測值, Ri為實際值, 則MAE、MSE和DS的表達式分別為
4.3EMDRBF神經(jīng)網(wǎng)絡模型預測
首先用多項式擬合算法對原數(shù)據(jù)端點做處理,防止原序列極值端點發(fā)生發(fā)散現(xiàn)象并“污染”整個結(jié)果; 然后采用EMD分解方法, 把股指期貨序列分解為具有不同時頻特征的本征模函數(shù)IMF, 分解結(jié)果為圖4所示的6個IMF分量和一個剩余分量; 使用時間序列過去3天歷史結(jié)算價格預測未來一天結(jié)算價格, 對各個IMF分量及剩余分量先處理得到各自的訓練樣本和訓練目標, 其中訓練樣本為一個3行500列的矩陣, 訓練目標為一個1行500列的向量, 將這兩類訓練樣本歸一化為0~1之間來提高收斂速度; 再對各IMF分量建立相應的RBF神經(jīng)網(wǎng)絡預測模型進行預測,得到不同頻帶未來60天的預測值, 將各頻帶的預測值等權(quán)疊加, 在反歸一化得到股指期貨未來60天最終的預測值, 如圖5所示. 圖6為預測值與實際值的誤差波動.
為了檢測EMDRBF新模型的預測能力, 運用了GARCH、ARIMA和RBF神經(jīng)網(wǎng)絡模型對滬深300股指期貨的日交易結(jié)算價格進行了訓練與預測,與本模型的預測結(jié)果進行比較, 如表1所示.
5結(jié)論
如何提高非平穩(wěn)、非線性信號的預測精度一直是研究以來的重要課題. 滬深300股指期貨序列是典型的非平穩(wěn)、非線性時間序列. 而傳統(tǒng)的預測方法并沒有充分考慮到序列的隨機性、周期性和趨勢性的特點, 只是針對整個時間序列進行預測, 預測精度不高. 本文提出的模型將原長相關(guān)序列轉(zhuǎn)化為若干個便于預測的短相關(guān)時間序列進行預測, 提高了預測精度. 首先對原始價格序列進行EMD分解,再對其分量進行RBF預測, 最后將各預測結(jié)果等權(quán)求和得到最終預測結(jié)果, 對滬深300股指期貨日結(jié)算價格進行實證分析, 預測結(jié)果如下
1)對原數(shù)據(jù)端點用多項式擬合算法做了處理,防止原序列極值端點出現(xiàn)發(fā)散現(xiàn)象并“污染”整個結(jié)果.
2)將EMD方法引入到金融預測上來, 建立了EMDRBF神經(jīng)網(wǎng)絡預測模型, 使原始序列信號中的信息通過各本征模函數(shù)IMF得以充分體現(xiàn),將原本具有長相關(guān)性質(zhì)的原始序列分解為若干個短相關(guān)性質(zhì)的不同頻帶, 解決了原始序列隨機性強,以及因相鄰頻帶的干擾而造成的系統(tǒng)動力信息反映不足的缺陷, 豐富了預測數(shù)值的經(jīng)濟含義.
3)對滬深300股指期貨日交易結(jié)算價格進行實證分析, 結(jié)果表明EMDRBF神經(jīng)網(wǎng)絡新預測模型充分考慮了股指期貨價格波動的周期性、趨勢性和隨機性特征, 并與常用的金融領(lǐng)域的預測方法進行比較, 提高了金融市場預測方法的預測精度.
對于中國來講, 股指期貨市場是一個涉及社會、經(jīng)濟、科學技術(shù)、政治等眾多因素的復雜金融系統(tǒng). 近四年引入的股指期貨, 不僅為股票現(xiàn)貨市場提供了風險對沖的方法, 更能幫助機構(gòu)投資者回避股市系統(tǒng)風險. 因此, 對股指期貨價格的預測分析是一項非常重要的任務, 提高對股票市場的風險防范能力有著重要的意義. 本文研究提出的EMDRBF神經(jīng)網(wǎng)絡新預測模型針對目前股指期貨市場的屬性和特征, 可以為我國未來股指期貨市場的價格預測提供新的思路和方法.
參考文獻
[1]C FLOROS, R KIZYS, C PIERDZIOCH. Financial crises, the decouplingrecoupling hypothesis, and the risk premium on the Greek stock index futures[J]. International Review of Financial Analysis, 2013, 28(c): 166-173.
[2]王志堅, 王斌會. ARMA模型的穩(wěn)健識別及實證分析[J]. 統(tǒng)計與決策, 2014,405(9): 168-171.
[3]羅永恒. 基于ARMA 模型的中國農(nóng)產(chǎn)品價格的分析與預警[J]. 經(jīng)濟數(shù)學, 2013,30(1): 96-99.
[3]陳珂, 鄒權(quán). 融入時間關(guān)聯(lián)因子曲線擬合的交通流異常挖掘方法[J]. 計算機工程與設計, 2013, 34(7): 2561-2565.
[4]竇玉丹, 袁永博, 張明媛. 基于粗糙遺傳BP網(wǎng)絡的震害損失評估模型研究[J]. 工程管理學報. 2010, 24(01): 29-32.
[5]洪月華. 一種基于蟻群算法與粗糙集的混合BP神經(jīng)網(wǎng)絡[J]. 微電子學與計算機, 2014, 31(4): 156-159.
[6]姚瀟, 余樂安. 模糊近似支持向量機模型及其在信用風險評估中的應用[J]. 系統(tǒng)工程理論與實踐, 2012, 32(3): 549-554.
[7]贠曉哲, 趙松. 原油期貨價格預測方法的研究基于多分辨分析小波神經(jīng)網(wǎng)絡理論[J]. 價格理論與實踐, 2013,346(4): 79-80.
[8]N E HUANG, Z SHEN, S R LONG, et al. The empirical mode decomposition and the hilbert spectrum for nonlinear and nonstationary time series analysis[J]. Proceedings of the Royal Society A: Mathematical, Physical and Engineering Sciences, 1998(1971): 903-995.
[9]謝曉陽, 喬新勇, 劉健敏. 柴油機工作不均勻性的振動檢測方法[J]. 噪聲與振動控制, 2013, 33(3): 79-83.
[10]G RILLING, P FLANDRIN, P GONCALVES. On empirical mode decomposition and its algorithms[C]// IEEE-Eurasip Workshop on Nonlinear Signal and Image processing NSIp-03, Grado(I), 2003.
[11]陸寧, 周建中, 何耀耀. 粒子群優(yōu)化的神經(jīng)網(wǎng)絡模型在短期負荷預測中的應用[J].電力系統(tǒng)保護與控制, 2010, 38(12): 65-68.
[12]卓金武, 魏永生, 秦健, 李必文. MATLAB在數(shù)學建模中的應用[M]. 北京:北京航空航天大學出版社, 2011.
[13]劉慧婷, 倪志偉, 李建洋. 經(jīng)驗模態(tài)分解方法及其實現(xiàn)[J]. 計算機工程與應用,2006,42(32): 44-47.
[14]Qian GAO, Guangxia LI, Xiang TIAN, et al. A novel traffic prediction method based on IMF[J]. Advanced Materials Research, 2012,(490):1421-1425.
[15]C C CHUANG, S F SU, C C HSIAO. Robust support vector regression networks for function approximation with outliers[J]. IEEE Transactions on Neural Networks, 2002, 13(6): 1322-1330.
[16]Wei WANG, Hong ZHAO. A novel hybrid intelligent model for financial time series forecasting and its application[C]// Proceedings of the 2nd International Conference on Business Intelligence and Financial Engineering, 2009: 279-282.