沈宇君
量化投資 多因子模型 夏普比率 年化收益率 IC值
引言
股票市場的誕生以來,人類對于股票市場波動邏輯的認識,一直是一個令所有投資者和研究人員所為之著迷的神秘領域。在世界上,出現(xiàn)了很多有名的投資大師,例如巴菲特,索羅斯,皮特林奇,威廉江恩等。這些投資大師依靠自己獨特的對資本市場的認知以及人格魅力,取得了令世界矚目的投資收益。其中,威廉江恩還將自己對投資市場的認識整理成讓世界熟知的江恩理論,讓股票技術(shù)分析聞名,并一直流傳至今。但是,股票市場是一個極其神秘,無法很好預測出來的市場,雖然前人們總結(jié)整理了很多股票市場的經(jīng)驗以及知識,供后來人所參考。但是,在股票市場上,依然沒有一個明確和能夠獲取超額收益的長期有效的理論觀點。
量化投資的鼻祖一西蒙斯,一位世界頂級的數(shù)學家,便嘗試通過自己對數(shù)學的理解,用數(shù)學和計算機程序來進行投資,這就是量化投資。量化投資,是當今世界最吸引人目光的一個行業(yè)。當年,西蒙斯用數(shù)學模型和程序創(chuàng)造了舉世矚目的股票投資收益,由西蒙斯運作的大獎章基金在1989年2009年的這二十年期間,平均年化收益率達到了35%,如果把基金所抽取的44%的收益提成,那么,西蒙斯的基金實際年化收益率達到了60%,比同期標普500指數(shù)平均回報率高出了20%以上,而對于傳統(tǒng)的投資大師巴菲特和索羅斯,也是領先了十~LA'-百分點,一舉超越了依靠傳統(tǒng)的投資大師所創(chuàng)造的收益。在2008年這一年的爆發(fā)的由次貸危機所引起的全球經(jīng)濟危機中,西蒙斯的基金投資回報率依舊能夠穩(wěn)穩(wěn)保持在80%左右,這是何其驚人的水準。隨著西蒙斯的大獎章基金獲得成功,以及計算機和大數(shù)據(jù)的發(fā)展,再加上股票數(shù)據(jù)的不斷積累,已經(jīng)讓整個世界的目光都投向了量化投資的這個領域,特別是中國的A股市場。從09年開始,中國A股市場上開始出現(xiàn)量化投資的身影了,中國各類的量化基金像雨后春筍那樣不斷發(fā)展,因此研究可行的具有穩(wěn)定收益的量化策略是現(xiàn)在最迫切的要求。
量化投資與量化策略
(1)量化投資
從上述我們提及到,量化投資是利用數(shù)學以及計算機程序來自主完成投資行為的。量化投資可分為量化選股,量化擇時,股指期貨統(tǒng)計套利,商品期貨統(tǒng)計套利,期權(quán)套利,算法交易等等。量化投資說白了就是利用是數(shù)學或統(tǒng)計學找出投資標的相關(guān)的統(tǒng)計特點,并以此特點來進行交易,這樣,計算機就能夠按照所設定的特點自動交易。因此,量化投資具有高效組建有效的投資策略,并能夠克服人性弱點一貪婪和恐懼,嚴格按照買賣紀律來執(zhí)行,從而獲取超額收益。特別在高頻交易中,只要成功率超過50%以上,那么交易的次數(shù)多了,獲勝的概率是達到100%的。
(2)多因子選股模型
在低頻量化策略當中,量化選股是最常用的策略。而多因子選股模型則是更為常見的策略。多因子模型是量化選股中最重要的模型,它的基礎思想是找出和股票收益最相關(guān)的指標,并根據(jù)這些指標選出符合這些指標要求的股票,從而構(gòu)建出一個股票組合,期望這個股票組合能夠跑贏或者跑輸指數(shù)。如果跑贏指數(shù),則我們做多這個股票組合,做空股指期貨。反之,我們做空這個股票組合,做多股指期貨,從而獲取阿爾法收益。多因子選股模型的核心是選擇合適的因子。選取出合適的因子之后,我們將根據(jù)因子的表現(xiàn)進行綜合分析并以此作為判斷。在多因子選股模型中一般有兩種選取因子的方法一打分法和回歸法。
打分法是根據(jù)各個因子的數(shù)值對相應的股票進行打分,然后按照一定的權(quán)重加權(quán)得到該股票的總分,然后通過總分對股票進行篩選以及權(quán)重的賦值。第二個是回歸法,因為在股票市場上,我們可以知道股票的價格是對信息的反映,也就是說明,我們可以清楚知道,股票的收益是可以解釋的,因此,我們用過去的股票收益率對多因子進行回歸,得出相關(guān)的回歸方程及數(shù)值后,再將新的因子值代入回歸方程中得出預期的股票收益率,并以此收益率作為配置股票的權(quán)重,然后組合成量化策略。
在多因子選股的建立過程中,我們可以分為5個步驟,候選因子的選取,選股因子的有效性檢驗、有效但冗余因子的剔除,綜合評分的建立和模型的評價及持續(xù)改進。候選因子的選擇主要依賴于經(jīng)濟和市場邏輯,特別是在A股市場。而選股因子的有效性檢驗則是一般采用排序方法檢驗。有時候這些因子都是有效的,但是因為可能內(nèi)在驅(qū)動因素大致相等,因此,我們將這些因子剔除,只保留同類因子中收益最好最容易區(qū)分的因子。這樣能夠提高計算機運行的效率,讓更快的交易動作爭取更多的超額收益。
通常,股票市場上分為了9類因子,包括規(guī)模因子,估值因子,成長因子,盈利因子,動量反轉(zhuǎn)因子,交投因子,波動率因子,分析師預測因子等等。規(guī)模因子包括:總市值,流通市值,自由流通市值。估值類因子包括:市盈率,市凈率,市銷率,成長類因子包括,營業(yè)收入同比增長率,營業(yè)利潤同比增長率,歸屬于母公司的凈利潤同比增長率、經(jīng)營活動產(chǎn)生的現(xiàn)金流金額的同比增長率。盈利因子包括:凈資產(chǎn)收益率,總資產(chǎn)收益率動量反轉(zhuǎn)因子包括:前一個月漲跌幅,前2個月漲跌幅、前三個月漲跌幅、前6個月漲跌幅。交投因子包括:前一個月日均換手率。波動因子包括:前一個月的波動率,前一個月的振幅。股東因子包括:戶均持股比例、戶均持股比例變化、機構(gòu)持股比例變化。分析師預測因子包括:預測當年凈利潤增長率、主營業(yè)務收入增長率。
(3)Ic值與IR值
Information Coefficient,即因子Ic值,指的是該期因子對股票的下期收益的預測值和股票下期的實際回報值在橫截面上的相關(guān)系數(shù),即:
因子的IR(信息比)值為因子IC的均值和因子IC的標準差的比值,假設有M個因子,其Ic的均值向量為
協(xié)方差矩陣為:∑,如果各因子權(quán)重向量為
2.4夏普比率
夏普比率是基金績效評價的標準化指標,現(xiàn)代投資理論的研究表明,風險的大小在決定組合的表現(xiàn)上具有基礎性的作用。夏普比率就是一個可以同時對收益與風險加以綜合考慮的三大經(jīng)典指標之一。夏普比率的公式為:
其中,E(Rp)為投資組合預期報酬率,Rf為無風險利率,σp是投資組合的標準差。這公式代表著投資組合每承受一單位總風險,會產(chǎn)生多少的超額報酬。若夏普比率為正值,則代表基金報酬率高過波動風險;若為負值,代表基金操作風險打過預期報酬率。因此夏普比率越高,說明投資組合越佳。
基于IC_IR值得多因子選股模型實證研究
在一段時間內(nèi),雖然因子的有效性能夠讓策略有著較好的收益,但是考慮到因子可能具有輪動性,因此使用IC IR值來對因子打分并賦值,在特定的時期選擇分值高的因子進行選股有著較為積極的意義。
因此,根據(jù)IC_IR值的定義和公式,同時考慮到A股市場上有著大小盤的風格輪動,我進行了多因子選股策略的建立:
首先,我單獨對因子進行回測,發(fā)現(xiàn)市凈率(PB),市銷率(PS)、市現(xiàn)率(PCF)、營業(yè)收入增長率,市值,收入增長率,63日動量反轉(zhuǎn)因子,21日動量反轉(zhuǎn)因子,有著較好的表現(xiàn),因此我選擇這些因子作為有效因子。并用歷史數(shù)據(jù)進行IC值和IR值的計算,得出因子分值。然后,我選出中證500作為基準,并且,當中證500的5日移動平均線或者10日移動平均線小于-0.03時,說明大盤指數(shù)跑輸指數(shù),應當換為中小市值股票,并利用市值因子的倒數(shù)以及21日動量反轉(zhuǎn)因子來選取股票。反之,說明大盤股表現(xiàn)比小盤股好,因此則利用市現(xiàn)率的倒數(shù),市銷率的倒數(shù),市凈率的倒數(shù),營業(yè)收入增長率,收入增長率和63日動量反轉(zhuǎn)因子來選取股票。同時,我們剔除剛上市不滿一年的股票以及ST股,組成合適的量化股票策略。
基于以上步驟,我們構(gòu)建出的基于IC_IR值的量化選股模型并在優(yōu)礦平臺進行了相應的回測。策略構(gòu)建出來后,我們可以得出,年化收益為9.1%,夏普比率為0.32,最大回撤為9.4%。以下為2016年6月以來策略的每個月收益和用滬深300指數(shù)收益作為基準的每月收益對比。(數(shù)據(jù)來源:通聯(lián)數(shù)據(jù))
結(jié)合以上理論構(gòu)建出來的基于IC_IR值的量化策略模型雖然策略收益沒能夠很好跑贏大市,可能是由于因子具有衰減的性質(zhì),比如,在2015年小市值的股票大幅跑贏大市值的股票,但是在2016年6月后卻跑輸大市值因子,因此,導致這個多因子模型不能很好地跑贏大市,所以,接下來的研究是研究如加入能夠測算因子有效性的代碼,嘗試提高此模型的收益,但在已經(jīng)這段時間已經(jīng)能夠較為緊緊跟隨大市的走勢,所以基于IC_IR值構(gòu)建的多因子量化模型具有一定的可行性。