田佳敏 孫禮娜
摘要:隨著機器學習的不斷完善,機器學習對于股指、股價的預測也吸引了業(yè)界越來越多人的研究與分析。本文則是選取了機器學習中最為突出的兩個代表——神經(jīng)網(wǎng)絡與支持向量機為例研究基于其對股價的量化預測。進行回測,分別從收益、風險等角度分析該模型的回測情況從而分析機器學習股價量化預測的可行性,并對量化策略模型的優(yōu)化、改進和應用提出相關建議。
關鍵詞:神經(jīng)網(wǎng)絡;支持向量機;量化預測;PYTHON
1.引言
股市行情可能受到很多方面的影響,比如公司的財務因素、宏觀經(jīng)濟走勢等等,只有將機器學習結合合理有效的特征因子的選取,才能發(fā)揮其真正的作用。而21世紀,機器學習飛速發(fā)展,作為其核心方法的神經(jīng)網(wǎng)絡和支持向量機在在生物、金融、醫(yī)療等各個領域得到不斷的發(fā)展和廣泛的運用。
2.數(shù)據(jù)來源及處理
同花順iFind金融數(shù)據(jù)終端平臺。假設:假設數(shù)據(jù)來真實、可靠和準確,且不存在較為嚴重的異常波動,既數(shù)據(jù)為正常情況下的實際股市行情數(shù)據(jù)。
本文采用高斯預處理方法,即標準化法(去均值,方差規(guī)?;?。具體是有特征因子減去它對應的均值再除以它的標準差如下式所示
3.神經(jīng)網(wǎng)絡
3.1策略思想
選取了滬深300成份股的總市值,OBV能量潮,市盈率,布林線,KDJ隨機指標,RSI相對強弱指標作為訓練樣本的輸入層。而對于輸出層,如果未來20個工作日上漲的幅度超過10%則標記為1,否則為-1。然后采用神經(jīng)網(wǎng)絡算法數(shù)據(jù)進行訓練學習[4,5]。然后基于訓練出來的函數(shù)進行預測,如果預測結果為1且沒有持倉則買入,如果預測結果為-1且已經(jīng)持倉則賣出。
3.2回測分析
我們通過Python編程實現(xiàn)量化交易策略,并對結果進行分析。
3.2.1收益分析
回測結果顯示策略的收益大約是在17.08%,而基準收益 為-3.97%。策略的收益走勢大致與基準收益的走勢相相吻合,策略受到市場行情波動的影響較大。但策略的止損能力往往超過基準利率在基準利率跌幅較大甚至超過10%時,策略收益的跌幅仍處于一個較低的水平。
3.4.2 Alpha——投資中面臨的非系統(tǒng)性風險
Alpha代表超額收益,指投資組合獲取的超過市場平均收益的那部分收益[7]。
從圖3中我們不能看出超額收益Alpha值表現(xiàn)的較為穩(wěn)健。策略在回測過程中所面臨的非系統(tǒng)性風險較小,表現(xiàn)較好。因為超額收益率是剔除了基準收益率的,所以超額收益率也反映該策略實際的盈利水平。
3.4.3 Beta——投資中面臨的系統(tǒng)風險
Beta的計算公式為:
Beta表示股票的收益和風險收大盤的影響。
由圖4可以看出來該策略的Beta值處于0到1之間, 表示某種股票的價格波動比市場小,方向與市場相同,表明風險程度低于整個市場的風險水平。而且從圖4中我們不難看出該策略波動范圍主要是在0.7-1之間,波動范圍較小,雖然而且不難看出在之前基準收益較低的4、5、7、11等月份,β也較低,趨近于零。
4.基于SVM的量化選股策略——基于財務因子
4.1策略思想
支持向量機是一種數(shù)據(jù)挖掘的新技術,借助最優(yōu)化方法來解決機器學習問題的新工具[9]。而其基本思想就是通過找到一個超平面,使其能夠盡可能得將兩類數(shù)據(jù)點正確分來,同時使分開的兩類數(shù)據(jù)點數(shù)據(jù)分類面最遠[10]。
以季度為單位,選取一些財務因子作為訓練樣本,對于類別值,如果未來一個季度漲幅超過5%標記為1,反之為-1,然后用支持向量機算法進行訓練,預測結果為1且未持倉則買入,預測結果為-1且已持倉則賣出[11]。
4.2特征因子選取
選取2017-06-30(2015年半年報)時刻,滬深300成分股的市盈率、市凈率、總市值等共21個財務因子。
4.3回測結果分析
通過編程實現(xiàn)策略回測,接下來對回測交易結果進行收益、風險等方面的分析。
4.3.1.收益分析
回測結果顯示策略收益16.98%,而基準收益則為6.67%。策略前段和后段的表現(xiàn)較好,且收益情況均高于基準收益。
4.3.2.Alpha——投資中面臨的非系統(tǒng)性風險
該策略的超額收益率Alpha值雖然較低,但是絕大多數(shù)為正值,表現(xiàn)仍較為穩(wěn)健,說明該策略的超額收益較好且較為穩(wěn)定。由圖9可知該策略整體所面臨的非系統(tǒng)性風險較低且較為穩(wěn)定。
4.3.3. Beta——投資中面臨的系統(tǒng)風險
由圖10中我們不難看出該策略Beta值波動范圍主要是在0.4-0.6之間,波動范圍較小,風險程度低于整個市場的風險水平且處于穩(wěn)定狀態(tài)。
5.總結
經(jīng)過對回測結果的分析,我們不難看出無論是神經(jīng)網(wǎng)絡量化選股策略還是支持向量機量化選股策略均能夠獲取一定的收益,且高于基準收益,能獲得一定的超額收益,兩個模型的超過一半的月份數(shù)的sharpe率值超過了1,不過收益率有限,但是卻在風險控制上表現(xiàn)不俗,策略的收益波動率均在10%以內,后期均穩(wěn)定在5%左右。且支持向量機模型在防范非系統(tǒng)性風險的表現(xiàn)上優(yōu)與神經(jīng)網(wǎng)絡量化策略。機器學習(神經(jīng)網(wǎng)絡和支持向量機)能夠很好的進行風險防控,卻無法保證較高的高收益率。
參考文獻
[1]季峰. 智能投資引領量化策略風向[N]. 中國證券報,2017-02-13(005).
[2] 白凱敏.神經(jīng)網(wǎng)絡和深度學習在量化投資中的應用[D] .2016.
[3]陳笑,王發(fā)信,戚王月,周婷.基于遺傳算法的BP神經(jīng)網(wǎng)絡模型在地下水埋深預測中的應用——以蒙城縣為例[J].水利水電技術,2018,49(04):1-7.
[4] 胡謙.基于機器學習的量化選股研究[D] .2016.
[5] 李子睿.量化投資交易策略研究[D] .天津大學,2013.
[6] 朱晨曦.我國A股市場多因子量化選股模型實證分析[D] .2017.
[7]章宏帆. 運用量化投資策略實現(xiàn)超額收益Alpha的理論與實踐[D].浙江大學,2015.
[8]周曉志.我國內部人交易獲得超額收益分析[J].廣東農(nóng)工商職業(yè)技術學院學報,2012,28(02):41-44.
[9]于靜,韓魯青.一種改進的求解支持向量機模型的坐標梯度下降算法[J].系統(tǒng)科學與數(shù)學,2018,38(05):583-590.
[10] 魏妹金.支持向量機多因子選股模型[D] .2015.
[11] 湯凌冰.機器學習在量化投資中的應用研究[M] .電子工業(yè)出版社,2014.
[12] 張學工.關于統(tǒng)計學習理論與支持向量機[J] .自動化學報,2000(1).
[13]楊陽.銀華基金張凱:量化投資將在未來A股實戰(zhàn)中凸顯優(yōu)勢[J].股市動態(tài)分析,2016(10):56.
作者簡介:田佳敏(1996—09月)女漢族,四川成都人,安徽財經(jīng)大學金融學院,2016級本科生,研究方向:投資學。
(作者單位:1.安徽財經(jīng)大學金融學院;
2.統(tǒng)計與應用數(shù)學學)