周雋 何鵬飛
摘要:選取滬深300成分股作為樣本股,截取2015-2018年財(cái)務(wù)數(shù)據(jù)和行情數(shù)據(jù),基于價(jià)值因子、盈利能力因子、運(yùn)營能力因子、成長能力因子、償債能力因子及品質(zhì)因子六個(gè)維度選取的候選因子,利用模糊C-均值聚類(FCM)算法對有效因子進(jìn)行最終篩選,構(gòu)建多因子模型。本模型在對滬深300成分股測試中取收益前100股作為一覽組股票形成投資組合,其測試結(jié)果大部分年份遠(yuǎn)超基準(zhǔn)收益,其他指標(biāo)相對穩(wěn)健,為量化投資研究提供了新的思路。
關(guān)鍵詞:模糊C-均值聚類 基本面因子 組合收益 超基準(zhǔn)收益
一、引言
20世紀(jì)50年代開始,量化投資掀起了西方傳統(tǒng)投資哲學(xué)的投資革命,量化投資是一種可以對沖市場風(fēng)險(xiǎn),用較低的風(fēng)險(xiǎn)獲得高收益的投資模式。在2008年的金融危機(jī)中,量化投資所獲得的收益遠(yuǎn)超過其他投資策略的收益。通過歷史的股票市場數(shù)據(jù),建立一定的策略模型,一尋求最優(yōu)的收益,這是量化投資策略的基本原則。我國2015年之后開啟了大牛市行情,量化投資產(chǎn)品收益率喜人,量化基金進(jìn)入快速發(fā)展階段,以量化的方法進(jìn)行從基本面到技術(shù)參數(shù)的全面分析,能夠高效率地完成對投資選股數(shù)據(jù)信息處理與價(jià)值挖掘。
當(dāng)前,量化投資的研究深受投資機(jī)構(gòu)的青睞,各種量化選股策略都在我國的A股市場得到了很好的驗(yàn)證,尤其多因子模型的發(fā)展在量化投資方面的研究已經(jīng)深入人心,多個(gè)類型的多因子模型在我國A股市場取得了很好的收益。學(xué)者范振龍[1]通過A股市場股票月收益率研究時(shí)利用Fama-Macbeth回歸模型發(fā)現(xiàn)我國股市眾多指數(shù)的差異特征。王艷萍[2]利用多因子選股模型構(gòu)造了靜態(tài)MV投融資模型,在邊界條件不允許賣空限制下的最優(yōu)解析解,一定程度上對投資權(quán)重選擇了一定思考與操作建議。丁鵬[3]在《量化投資--策略與技術(shù)》一書中首次并高屋建瓴地對量化投資進(jìn)行了系統(tǒng)化研究,為當(dāng)前學(xué)者在量化投資方面提供了豐富的參考價(jià)值。書中多因子選股模型將一攬子影響因子進(jìn)行初步有效因子篩選,到隨后的剔冗處理及選股投資組合給出了一個(gè)行之有效的范式。此外,還有學(xué)者對多因子模型與其他模型相結(jié)合的量化模型。孫守坤[4]利用多因子模型結(jié)合輪動(dòng)策略模型在滬深300股指期貨方面獲得了相對穩(wěn)定的收益率。王赟[5]利用灰色關(guān)聯(lián)分析與多因子模型相結(jié)合,其模型的實(shí)盤模擬投資效果具有一定的穩(wěn)定性。
二、量化模型基本過程
(一)數(shù)據(jù)準(zhǔn)備與預(yù)處理
本文所選用數(shù)據(jù)來自優(yōu)礦平臺(tái),利用2014-2018年滬深300成分股作為樣本股進(jìn)行因子的初步篩選。這一時(shí)期的數(shù)據(jù)圖形來看包括了上漲、下跌以及震蕩趨勢的完整形態(tài)過程。
(二)候選因子的選取
為了確定初步候選因子,本文從價(jià)值因子、盈利能力因子、運(yùn)營能力因子、成長能力因子、償債能力因子及品質(zhì)因子六個(gè)維度共19個(gè)因子作為候選因子。其中價(jià)值因子體現(xiàn)票的內(nèi)在價(jià)值,能夠形成股價(jià)高低狀態(tài)的初步判定,給投資者布局被人低估的價(jià)值股票提供
參考,以期獲得價(jià)格上升時(shí)的收益。成長因子測度公司的成長性,成長性的高低公司未來的發(fā)展前景,具有較高前景期待值的公司往往會(huì)在未來形成一段時(shí)間內(nèi)的股價(jià)上漲,吸引投資者的目光。品質(zhì)因子反映一段時(shí)間內(nèi)公司的管理與應(yīng)用狀況,通常直接表現(xiàn)為股東權(quán)益周轉(zhuǎn)率及流通市值等。運(yùn)營能力因子表現(xiàn)的是企業(yè)運(yùn)營資產(chǎn)的效率與效益,通常投資者關(guān)心的是全部資產(chǎn)、流動(dòng)資產(chǎn)營及流動(dòng)資產(chǎn)三方面的營運(yùn)能力。償債能力因子償債能力是用來衡量上市公司對負(fù)債能及時(shí)、足額償還的保證程度,較大程度上決定了投資者在投股擇時(shí)方面的基本選擇。具體候選因子入表1所示。(數(shù)據(jù)來源:優(yōu)礦平臺(tái))
(三)有效因子的選取
有效因子的選取是模型因子的初步篩選過程,也是對候選因子有效性的檢驗(yàn)過程。具體操作是針對每一個(gè)因子,選擇2014-2018年滬深300成分股在該因子排名靠前的100只,對這100只股票數(shù)據(jù)對應(yīng)的年化收益率、阿爾法系數(shù)、貝塔系數(shù)、夏普比率、收益波動(dòng)率、信息比率、最大回撤及年化換手率進(jìn)行數(shù)據(jù)結(jié)果分析?;緮?shù)據(jù)結(jié)果如下表2。
從年化收益率來看,市現(xiàn)率的組合收益為0.2%,故初步剔除該因子。同理,從阿爾法系數(shù)的大小來看,若阿爾法值為負(fù)數(shù),則表示基金沒有達(dá)到貝塔值所預(yù)期的回報(bào),因此可以剔除市現(xiàn)率、銷售凈利率、固定資產(chǎn)周轉(zhuǎn)率、固定資產(chǎn)比率、營業(yè)收入增長率這幾個(gè)因子。再者,通過觀察收益波動(dòng)率,可以剔除凈資產(chǎn)收益率因子;通過信息比率及最大回撤可以剔除總資產(chǎn)增長率這個(gè)因子;對于品質(zhì)因子中的流通市值數(shù)據(jù)導(dǎo)出缺失。剩下的因子為有效因子,包括市盈率、市凈率、對數(shù)市值、對數(shù)流通市值、市銷率、總資產(chǎn)收益率、流動(dòng)資產(chǎn)周轉(zhuǎn)率、股東權(quán)益比率、基本每股收益、股東權(quán)益周轉(zhuǎn)率一共10個(gè)因子。
(四)基于FCM算法的最終因子
1973年,Bezdek提出FCM算法,該算法是一種基于劃分的聚類算法,它的思想就是使得被劃分到同一簇的對象之間相似度最大,而不同簇之間的相似度最小。FCM把n個(gè)向量xi(i=1,2,…,n)分為c個(gè)模糊組,并求每組的聚類中心,使得非相似性指標(biāo)的價(jià)值函數(shù)達(dá)到最小。本文將11個(gè)有效因子利用FCM算法聚成3類,過程是將每個(gè)因子歸類為隸屬度最大的某類,由于時(shí)間是2014-2018年期間的滬深300樣本數(shù)據(jù),由于時(shí)間跨度較長,可考慮使用季度數(shù)據(jù),得到20個(gè)數(shù)據(jù)組數(shù)據(jù),即形成20個(gè)隸屬度矩陣,對其進(jìn)行算數(shù)平均后得到整體隸屬度矩陣。
得到的隸屬矩陣作為判別與參考依據(jù),綜合進(jìn)行有效分類。算術(shù)平均得到的綜合隸屬矩陣如表3所示。
根據(jù)上述隸屬度矩陣中各個(gè)隸屬度大小可以較好地進(jìn)行分類,市盈率屬于第1類,市凈率及對數(shù)流通市值屬于第2類,對數(shù)市值、市銷率、總資產(chǎn)收益率、流動(dòng)資產(chǎn)周轉(zhuǎn)率、股東權(quán)益比率、基本每股收益及股東權(quán)益周轉(zhuǎn)率屬于第3類。
對于每一類因子,通過比較因子的市場盈利情況(年化收益率%)的大小進(jìn)行冗余因子的剔除。參考表2的數(shù)據(jù),第1類中僅市盈率一個(gè)因子,故無需剔除;第2類中市凈率對應(yīng)的收益為29.1%,對數(shù)流通市值對應(yīng)的為30.1%,故保留對數(shù)流通市值這一因子;同樣的辦法,第3類保留的因子是對數(shù)市值這一因子。因此,相似度較低的3個(gè)最終因子分別為:市盈率、對數(shù)市值、對數(shù)流通市值。
(五)構(gòu)建投資組合與選股
針對FCM算法篩選的三個(gè)因子進(jìn)行單個(gè)測試,測試結(jié)果如下圖1-3所示:
從上述LFLO、PE、LCAP單因子的測試結(jié)果圖可以看出,這三個(gè)因子的年化收益率都比基準(zhǔn)收益率高,并且超額收益率較平穩(wěn)。
三、結(jié)果分析與評價(jià)
優(yōu)礦平臺(tái)提供2014年—2018年股票市場的數(shù)據(jù),選取滬深300成分股作為樣本股,以每個(gè)交易日進(jìn)行單位時(shí)間回測,通過計(jì)算每個(gè)因子的權(quán)重構(gòu)建投資組合,對股票池的股票進(jìn)行排序,去滬深300前100支股票作為目標(biāo)持倉,最后,回測的結(jié)果如下表4所示:
從上表也可以看出,4年時(shí)間里股票市場經(jīng)歷了熊市、盤整、牛市。最終累計(jì)超額收益達(dá)到0.71,夏普比率高達(dá)6.61。在2014年我們策略的年化收益雖然比基準(zhǔn)收益低,但是我們的最大回撤只有9.50%。從2015年開始年化收益率都超過基準(zhǔn)年化收益率,平均超額收益達(dá)到17.4%。明顯可以看出2017一年的年化收益率為70.50%,遠(yuǎn)遠(yuǎn)超過年化收益率,而且超額收益率達(dá)到46.60%,回撤率僅有8.50%,這也說明我們的策略在股票市場行情好的時(shí)候,風(fēng)險(xiǎn)較低,策略較穩(wěn)定,盈利性較強(qiáng),具體收益情況如圖4所示。
四、結(jié)論與建議
多因子選股模型是量化投資選股模型中基本面分析最常見、應(yīng)用最廣泛的模型之一。從文章的回測結(jié)果來看,模型的收益率達(dá)到37.2%,比基準(zhǔn)年化收益率高出百分之二十多,尤其是在2015年左右收益率高達(dá)80%,說明該模型的收益率還是可觀的。阿爾法為23.9%,所以該策略的實(shí)際回報(bào)率遠(yuǎn)遠(yuǎn)超過預(yù)期回報(bào)。而且貝塔值小于1,所以投資風(fēng)險(xiǎn)較小。因此,該模型能夠在較長周期的時(shí)間內(nèi)獲得較高的收益,得到較高的超額收益率。但作為投資者仍需對預(yù)測方法進(jìn)行合理選擇,有效配合使用。
參考文獻(xiàn):
[1]范龍振,余世典.中國股票市場的三因子模型[J].系統(tǒng)工程學(xué)報(bào),2002,17(6):537-546.
[2]王艷萍,陳志平,陳玉娜.多因子投資組合選擇模型研究[J].工程數(shù)學(xué)學(xué)報(bào),2012,29(6):807-814.
[3]丁鵬.量化投資——策略與技術(shù)[M].北京:電子工業(yè)出版社,2012.
[4]孫守坤.基于滬深300的量化選股模型實(shí)證分析[D].上海:復(fù)旦大學(xué),2013.
[5]王赟.基于灰色關(guān)聯(lián)分析的多因子選股模型研究[D].北京:北京交通大學(xué),2017.
[6]Schumaker,R.P.,Chen,H.A Quantitative Stock Prediction System Based on Financial News[J].Information Processing & Management,2009,45(5):571-583.
[7]Quah,T.S.DJIA Stock Selection Assisted by Neural Network[J].Expert Systems with Applications,2008,35(12):50-58.
[8]Partha,S.,Mohanram,P.S.Separating Winners From Losers Among Low Book-to-Market Stocks Using Financial Statement Analysis[J].Review of Accounting Studies,2005,10(23):133-170.
基金項(xiàng)目:廣東白云學(xué)院2016年校級科研項(xiàng)目(BYKY201613)。
(作者單位:廣東白云學(xué)院)