耿立艷 張占福
摘?要:將自適應神經(jīng)模糊推理系統(tǒng)(ANFIS)引入到股指期貨合約收益波動率預測中,構建基于四維輸入變量的ANFIS股指期貨波動率預測模型。將前一期的收益波動率、開盤價格、最高價格、收盤價格作為輸入變量,以當期收益波動率作為輸出變量。以滬深300指數(shù)高頻期貨合約為例進行實證研究。根據(jù)RMSE、MAE、HRMSE、MPE、Theil、LLF和LELF值,四維輸入變量ANFIS的高頻收益波動率預測性能優(yōu)于RBFNN和一維輸入變量ANFIS。
關鍵詞:股指期貨;波動率;預測;自適應神經(jīng)模糊推理系統(tǒng)
中圖分類號:F830 TP183文獻標志碼:A
1引言
隨著人工智能技術的不斷發(fā)展,人工神經(jīng)網(wǎng)絡在金融波動率預測領域得到應用[1-2]。但在實際應用中,人工神經(jīng)網(wǎng)絡由于自身的一些缺陷,難以得到推廣。自適應神經(jīng)模糊推理系統(tǒng)(ANFIS)?[3]是以T-S型模糊推理系統(tǒng)[4]為基礎構建的一種自適應神經(jīng)網(wǎng)絡。ANFIS既具有神經(jīng)網(wǎng)絡的自學習、自適應能力,在功能上又與模糊推理系統(tǒng)等效,其隸屬度函數(shù)參數(shù)與結論參數(shù)均能夠通過數(shù)據(jù)樣本的訓練實現(xiàn)自主確定和更新[5]。因此,ANFIS不需要專家的經(jīng)驗與知識建模,更適應用于特性難以掌握的復雜系統(tǒng)建模。此外,ANFIS理論上能夠以任意精度逼近任意非線性連續(xù)函數(shù),充分利用這一優(yōu)勢可實現(xiàn)高精度的非線性逼近與預測[6]??紤]到金融市場波動的復雜性與非線性特點,本文將ANFIS引入到金融資產(chǎn)收益波動率研究中,構建波動率的ANFIS預測模型,并通過滬深300指數(shù)期貨的實證研究檢驗ANFIS有效性。
2金融波動率的ANFIS預測模型
構建ANFIS時,首先要選取合適的輸入變量和輸出變量。本部分要解決的是金融資產(chǎn)收益波動率的預測問題,所以將ANFIS的輸出變量設為金融資產(chǎn)收益波動率的當期值,預測值則由ANFIS訓練出的參數(shù)與規(guī)則外推下一期的收益波動率。由于收益波動率數(shù)據(jù)無法從金融市場交易數(shù)據(jù)中直接獲得,這里以股指收益平方的當期值及前四期的移動平均值之和作為收益波動率的估計值。輸入變量的選取應當包含盡可能多的相關歷史信息量,以體現(xiàn)不同影響因素對輸出變量產(chǎn)生的作用。進行金融資產(chǎn)收益波動率預測時,通常是根據(jù)金融市場的歷史數(shù)據(jù)進行建模與預測,這里將前一期的收益波動率、開盤價格、最高價格、收盤價格作為輸入變量?;谒木S輸入變量的ANFIS表達式如下:
其中,和分別為ANFIS的輸出變量和輸入變量;代表第期的收益波動率;代表第期的收益波動率;分別為第時期的開盤價格、最高價格和最低價格;表示輸入變量與輸出變量之間的非線性關系,即ANFIS通過一些模糊規(guī)則,建立它們之間的非線性映射關系。
四維輸入變量ANFIS預測波動率的步驟設計如下:
步驟1:數(shù)據(jù)預處理。以開盤價格、最高價格、收盤價格、前一期的收益波動率作為輸入變量、當期收益波動率作為輸出變量,分別對輸入變量和輸出變量的原始數(shù)據(jù)進行預處理;將預處理后的數(shù)據(jù)樣本分為兩部分:訓練樣本集和檢驗樣本集,訓練樣本集用于構建ANFIS,檢驗樣本集用于檢驗ANFIS-的預測性能。
步驟2:ANFIS隸屬度函數(shù)選擇。根據(jù)經(jīng)驗選擇隸屬度函數(shù)的類型和數(shù)目,生成初始的ANFIS,通過反復試驗選擇最優(yōu)的隸屬度函數(shù)類型和數(shù)目。
步驟3:ANFIS構建。利用訓練樣本集訓練ANFIS,確定隸屬度函數(shù)參數(shù)與結論參數(shù),根據(jù)獲得的參數(shù)構建ANFIS。
步驟4:ANFIS預測。基于檢驗樣本集,利用構建的ANFIS預測波動率,并將得到的預測值反歸一化為原始波動率的預測值。
3實證研究
3.1 數(shù)據(jù)選取與描述
以中國金融期貨交易所滬深300指數(shù)期貨合約(Hushen 300 index futures contract, HS300IFC)為研究對象,選取時間跨度為2011年1月31日到2011年3月4日的5分鐘交易數(shù)據(jù),共包括958組觀測值,每組觀測值包括開盤價格,最高價格,最低價格,收盤價格,成交量五個觀測量。根據(jù)連續(xù)復合對數(shù)收益率公式計算HS300IFC收益,得到957個數(shù)據(jù)樣本,計算公式如下:
(2)
其中,為五分鐘收益,
和
為第
個五分鐘和第
個五分鐘的收盤價格。
表1為HS300IFC收益序列描述性統(tǒng)計量。由表1可知,首先,HS300IFC收益序列的均值和中位數(shù)相對較小,僅為0.0077和0.0160,而標準誤差則相對較大,為0.1664,表明HS300IFC收益序列的數(shù)據(jù)趨于集中,偏離均值的程度較大,反映出HS300IFC收益序列具有較大的波動性特征;其次,從偏度和峰度可以看出,HS300IFC收益序列的偏度小于零、峰度大于正態(tài)分布的峰度值3,說明HS300IFC收益序列是左偏的,且凸起的程度高于標準正態(tài)分布,同時J-B統(tǒng)計量顯示,HS300IFC收益序列在1%、5%和10%水平下都顯著拒絕零假設,可以得出,HS300IFC收益序列呈現(xiàn)出“尖峰厚尾”且向左偏的非正態(tài)分布;第三,HS300IFC收益序列的LB(16)統(tǒng)計量在1%、5%和10%水平下均顯著拒絕了零假設,說明HS300IFC收益序列不存在線性自相關性,為白噪聲序列;從LB2(16)統(tǒng)計量可以看出,HS300IFC收益平方序列在1%、5%和10%水平下顯著拒絕了非自相關性假設,表明HS300IFC收益序列具有非線性自相關性;最后,HS300IFC收益序列的LM(16)統(tǒng)計量在1%、5%和10%水平下均顯著拒絕零假設,這就拒絕了不存在ARCH效應的原假設,說明HS300IFC收益序列存在“波動聚集性”特征,因此,LM檢驗結果與偏度和峰度的檢驗結果是一致的。
注:J-B表示Jarque-Bera正態(tài)性檢驗;LB(16)和LB2(16)分別表示對收益序列和收益平方序列作滯后16階的Ljung-Box序列相關性檢驗;LM(16)代表對收益平方序列作滯后20階的ARCH檢驗;*、**和***分別代表統(tǒng)計量在1%、5%和10%水平下顯著。
3.2 ANFIS學習與預測
首先,將輸入變量和輸出變量的原始數(shù)據(jù)樣本均歸一化到[0,1]區(qū)間,再分為兩個部分:前600組數(shù)據(jù)作為訓練樣本集,后358組數(shù)據(jù)作為檢驗樣本集。其次,選擇隸屬度函數(shù)。輸出變量隸屬度函數(shù)的類型只有兩種:常數(shù)和線性函數(shù),這里為輸出變量選擇線性函數(shù);輸入變量隸屬度函數(shù)類型與數(shù)目的選擇,目前尚無統(tǒng)一的方法。研究發(fā)現(xiàn),T-S型模糊推理系統(tǒng)更適合采用非線性隸屬度函數(shù)[7],因而這里為四個輸入變量選擇非線性隸屬度函數(shù)。經(jīng)過多次試驗,將輸入變量的隸屬度函數(shù)選為雙邊高斯型隸屬度函數(shù),同時,為輸入變量的模糊集設置四種模糊變量:低于、等于、中等、高于。輸入變量隸屬度函數(shù)的數(shù)目通常根據(jù)訓練數(shù)據(jù)的多少和輸入變量的維數(shù)確定,通過試驗,選取2個輸入變量隸屬度函數(shù)。第三,采用模糊聚類法劃分輸入變量空間,生成初始的參數(shù)化ANFIS結構。將訓練次數(shù)設為100次,根據(jù)訓練樣本集訓練ANFIS,采用誤差最小作為停止收斂準則,即當誤差不再變化時結束訓練。最后,利用訓練好的ANFIS向前一步預測HS300IFC收益波動率,以減少累計誤差。再將預測值反歸一化為原始波動率的預測值。
為驗證ANFIS的有效性,基于相同的訓練樣本集與檢驗樣本集,構建徑向基神經(jīng)網(wǎng)絡(RBFNN)預測HS300IFC收益波動率,并將RBFNN的預測結果與ANFIS相比較。其中,RBFNN的結構由輸入、輸出變量維數(shù)確定,即輸入層包含4個結點、輸出層有1個結點,隱含層包含2個結點;自由度設為5,期望誤差設為0.00001。
3.3 .結果分析與比較
以股指收益平方的當期值及前四期的移動平均值之和作為真實波動率的估計值,選用選用均方根誤差(RMSE)、平均絕對誤差(MAE)、異方差調(diào)整的均方根誤差(HRMSE)、平均百分比誤差(MPE)、西爾統(tǒng)計量(Theil)、對數(shù)損失函數(shù)(LLF)和線性指數(shù)損失函數(shù)(LELF)七項指標評價ANFIS和RBFNN模型的預測性能七項評價指標值越小,表明模型的預測性能越好。
表2為ANFIS和RBFNN預測性能比較結果。由表2可知,在所選擇的樣本期內(nèi),?ANFIS對HS300IFC的RMSE、MAE、HRMSE、MPE、Theil、LLF和LELF均小于RBFNN的對應值,因此,根據(jù)所考察的評價指標,ANFIS的HS300IFC收益波動率預測性能優(yōu)于RBFNN。
圖1為HS300IFC收益波動率預測值比較曲線圖。由圖1可以看出,ANFIS和RBFNN均較好地預測出HS300IFC收益波動率的變化特征,相比于RBFNN,ANFIS則更準確地捕捉到了HS300IFC收益波動率的某些峰值和谷值。
圖1 HS300IFC收益波動率預測值比較曲線圖
為進一步驗證ANFIS的有效性,基于相同的訓練樣本集與檢驗樣本集,將前一期的收益波動率作為輸入變量,構建基于一維輸入變量的ANFIS預測當期波動率。為使預測結果具有可比性,將一維輸入變量ANFIS的輸出變量隸屬度函數(shù)、輸入變量隸屬度函數(shù)與數(shù)目、模糊規(guī)則、訓練次數(shù)等參數(shù)設置為與四維變量ANFIS相同。
表3為不同維輸入變量的ANFIS預測性能比較結果。由表3可知,在所選擇的樣本期內(nèi),四維輸入變量ANFIS對HS300IFC收益波動率預測性能明顯優(yōu)于一維輸入變量ANFIS,表現(xiàn)在其RMSE、MAE、HRMSE、MPE、Theil、LLF和LELF值均明顯小于一維輸入變量ANFIS的對應值。
圖2不同輸入變量ANFIS收益波動率預測值比較曲線圖
圖2為不同維輸入變量ANFIS收益波動率預測值比較曲線圖。由圖2可以看出,基于四維輸入變量的ANFIS獲得了比一維輸入變量的ANFIS更接近于實際值的預測值,且更準確地捕捉到了HS300IFC收益波動率的峰值和谷值。因此,從提高波動率預測精度角度出發(fā),本文構建的四維輸入變量ANFIS預測模型更加合理,是一種有效的高頻股指期貨收益波動率預測方法。
四、結論
本文將ANFIS直接用于高頻股指期貨收益波動率預測。鑒于高頻股指期貨收益波動率的復雜性和非線性特點,以前一期的收益波動率、開盤價格、最高價格、收盤價格作為輸入變量,構建基于四維輸入變量的ANFIS。實證研究結果表明,四維輸入變量ANFIS的高頻股指期貨收益波動率預測性能優(yōu)于RBFNN和一維輸入變量ANFIS,獲得了比一維輸入變量的ANFIS更接近于實際值的預測值,且更準確地捕捉到了收益波動率的峰值和谷值,為高頻股指期貨波動率預測提供一種新思路。
參考文獻
基金項目:河北省2018年度引進留學人員資助項目(編號:C201820)。
作者簡介:通訊作者:耿立艷(1979-),女,天津寶坻人,博士后,教授,碩士生導師,研究方向:金融工程。