伍呈呈 夏 平 雷幫軍 胡 蓉
(1. 三峽大學(xué) 水電工程智能視覺監(jiān)測湖北省重點(diǎn)實(shí)驗(yàn)室,湖北 宜昌 443002;2. 三峽大學(xué) 計(jì)算機(jī)與信息學(xué)院,湖北 宜昌 443002)
股市、期貨市場等是一個(gè)多空雙方博弈、非線性、混沌而復(fù)雜多變的系統(tǒng),對其進(jìn)行嚴(yán)謹(jǐn)、科學(xué)的預(yù)測非常困難.近年來,人們試圖通過量化分析來探索其規(guī)律性,挖掘市場中的隱含信息,以獲得良好收益.Kim[1]利用SVM模型對韓國綜合股價(jià)指數(shù)(KOSPI)進(jìn)行了研究預(yù)測;彭麗芳等[2]提出了基于時(shí)間序列的SVM股票預(yù)測方法,并對2002年3月14日至8月9日的沙河股份進(jìn)行了研究分析;蘇冰等[3]基于PCA_SVM模型對滬深300指數(shù)進(jìn)行了量化擇時(shí)研究.上述研究是針對發(fā)達(dá)市場的股指進(jìn)行預(yù)測研究,對于國內(nèi)投資者而言缺乏實(shí)際指導(dǎo)意義.另外,對個(gè)股進(jìn)行預(yù)測研究,選擇特定時(shí)間的個(gè)股,缺乏通用性,且個(gè)股的價(jià)格易受公司單邊消息的影響.因此,上述的預(yù)測方法在普適性及預(yù)測精度上存在著改善的空間.
本文利用支持向量機(jī)(SVM)配合模糊信息?;瘜ι献C50ETF進(jìn)行量化擇時(shí)研究,在擇時(shí)研究中,沒有單純進(jìn)行股價(jià)預(yù)測,而是進(jìn)行漲跌預(yù)測,泛化了目標(biāo),以求獲得更好的預(yù)測結(jié)果.
支持向量機(jī)(SVM)理論在解決非線性、小樣本、高維模式識別等問題有著獨(dú)特的優(yōu)勢.
圖1 線性可分的SVM
如圖1所示,現(xiàn)有若干帶有標(biāo)記的訓(xùn)練樣本,假設(shè)有一個(gè)超平面H:
ωTx+b=0
(1)
將帶有標(biāo)記的樣本正確地分割;同時(shí)存在兩個(gè)超平面H1和H2使離H最近的兩類樣本分別落在H1和H2上,滿足上述條件的樣本即為支持向量.SVM目的是尋找到H,且使得H1和H2的距離最大化.對于線性不可分空間,引入核函數(shù)到SVM中,將輸入變量映射到一個(gè)高維特征空間中,然后在該特征空間中構(gòu)造最優(yōu)分類超平面.此時(shí)最優(yōu)目標(biāo)函數(shù)為:
(2)
本文選高斯核函數(shù):
(3)
信息?;痆4]是將一個(gè)整體劃分為多個(gè)部分,每一個(gè)部分為一個(gè)信息粒,而信息粒是一些元素的組合.
模糊信息粒化在信息?;幕A(chǔ)上將信息粒序列窗口中的數(shù)據(jù)模糊化.在X上建立一個(gè)模糊信息粒子P,以此能合理描述X的模糊概念G.
P?XisG
(4)
式中,G為以X為論域的模糊集合.式(4)本質(zhì)是確定函數(shù)P=A(x);A是模糊概念G的隸屬函數(shù).本文采用W.Pedrycz的?;椒╗5],選擇三角模型模糊粒子,其隸屬函數(shù):
(5)
式中,x為輸入信息序列,a、m、b為參數(shù).a(chǎn)參數(shù)描述相應(yīng)原始信息變化的最小值,m參數(shù)描述相應(yīng)原始信息變化的平均水平,b參數(shù)描述相應(yīng)原始信息變化的最大值.
根據(jù)上證50ETF的開盤價(jià)Open、最高價(jià)High、最低價(jià)Low、收盤價(jià)Close、成交量Vol、成交額Mon、成交次數(shù)Fre等7類數(shù)據(jù),選取前N天的這7類數(shù)據(jù),歸一化處理后作為SVM的輸入信息,見表1,將此后5 d的收盤價(jià)當(dāng)作一個(gè)信息粒進(jìn)行?;?/p>
(6)
粒化后的收盤價(jià)R_close的漲跌作為SVM訓(xùn)練的標(biāo)簽Label,當(dāng)這5 d總體漲標(biāo)記為Label=+1;跌標(biāo)記為Label=-1.
實(shí)驗(yàn)前隨機(jī)選取75%左右的數(shù)據(jù)為訓(xùn)練集,剩余25%左右的數(shù)據(jù)則作為測試集,以保證樣本數(shù)據(jù)的多樣性;對可能影響預(yù)測結(jié)果的SVM模型初始輸入?yún)?shù)g和懲罰系數(shù)c利用交叉驗(yàn)證的方法進(jìn)行了優(yōu)化處理,優(yōu)化后的g和c作為后續(xù)SVM的輸入?yún)?shù),利用訓(xùn)練集進(jìn)行模型訓(xùn)練,利用測試集進(jìn)行測試驗(yàn)證,循環(huán)調(diào)整N值,并重復(fù)模型訓(xùn)練及測試驗(yàn)證,選擇最優(yōu)結(jié)果作為目標(biāo)模型.
選取了201-01-04至2017-06-16的上證50ETF的日行情數(shù)據(jù),對數(shù)據(jù)預(yù)處理和標(biāo)記,選取測試集和訓(xùn)練集進(jìn)行模型訓(xùn)練及測試.實(shí)驗(yàn)時(shí)采用了3種不同方法進(jìn)行模型訓(xùn)練:1)直接使用SVM利用過去N天的數(shù)據(jù)訓(xùn)練預(yù)測接下來的一天漲跌;2)融合SVM的全局?;P?All_FIG_SVM),對輸入輸出數(shù)據(jù)進(jìn)行?;?jì)算,再使用SVM對數(shù)據(jù)訓(xùn)練預(yù)測后續(xù)信息粒的漲跌;3)融合SVM的局部?;P?Res_FIG_SVM):對輸入量不做粒化處理,對結(jié)果做粒化處理,用此模型預(yù)測后續(xù)粒化結(jié)果的漲跌.實(shí)驗(yàn)結(jié)果采用局部行情下最佳預(yù)測正確率ACC、全局行情下最佳預(yù)測正確率ACC及天數(shù)N、全局行情下預(yù)測最優(yōu)累積收益等指標(biāo)評價(jià)建模的優(yōu)劣.
為保證實(shí)驗(yàn)結(jié)果的有效性,實(shí)驗(yàn)在4種不同的情況下按照上述3種方式進(jìn)行實(shí)驗(yàn):1)選2016-03-04至2017-06-16期間的上升行情進(jìn)行測試;2)選2011-07-01至2014-07-02期間的振蕩行情中進(jìn)行測試;3)選2015-06-10至2016-03-03期間的下跌行情中進(jìn)行測試;4)選2010-01-04至2017-06-16全局行情進(jìn)行測試.
實(shí)驗(yàn)結(jié)果如表2~3、圖2~3所示.
表2 局部行情下最佳預(yù)測正確率ACC (單位:%)
表3 全局行情下最佳預(yù)測正確率ACC及對應(yīng)天數(shù)N
圖2 全局行情下3種方法的預(yù)測準(zhǔn)確率
圖3 全局行情下3種方法的預(yù)測最優(yōu)累積收益
由圖2、表3可知,當(dāng)N=45~50 d時(shí),預(yù)測結(jié)果最佳;由表2、表3、圖2、圖3可知,3種方法建模所得到的預(yù)測結(jié)果對比分析,本文提出的算法在準(zhǔn)確率和累積收益上均要優(yōu)于前兩種方法.
本文采用的模糊信息?;诤现С窒蛄繖C(jī)進(jìn)行上證50ETF的量化擇時(shí)建模,在多種不同行情下,均具有較好的預(yù)測效果.建模中利用SVM在上證50ETF量化擇時(shí)中的可行性,粒化計(jì)算配合SVM的有效性,以及不同時(shí)間窗口會(huì)影響量化擇時(shí)的準(zhǔn)確性,結(jié)果表明了使用模糊信息粒化融合支持向量機(jī)算法在上證50ETF擇時(shí)上具有較為理想的效果;本文建模對上證50ETF及上證50ETF期權(quán)投資有實(shí)際的指導(dǎo)意義及一定的應(yīng)用價(jià)值.
參考文獻(xiàn):
[1] Gui B, Wei X, Shen Q, et al. Financial Time Series Forecasting Using Support Vector Machine[C]// Computational Intelligence and Security (CIS), 2014 Tenth International Conference on. IEEE, 2014: 39-43.
[2] 彭麗芳,孟志青,姜 華,等.基于時(shí)間序列的支持向量機(jī)在股票預(yù)測中的應(yīng)用[J].計(jì)算技術(shù)與自動(dòng)化,2006,25(3):88-91.
[3] 蘇 冰.基于PCA-SVM模型的量化擇時(shí)研究[D].天津:天津財(cái)經(jīng)大學(xué),2015.
[4] Zadeh L A. Toward a Theory of Fuzzy Information Granulation and Its Centrality in Human Reasoning and Fuzzy Logic[J]. Fuzzy Sets & Systems, 1997, 90(2): 111 -127.
[5] Bargiela A, Pedrycz W. Granular Computing: An Introduction[M]. Springer Science & Business Media, 2012.