王春麗,劉 光,王 齊
(東北財經(jīng)大學(xué) 統(tǒng)計學(xué)院,遼寧 大連 116025)
自1952年量化投資理論興起,以量化投資作為核心概念的投資基金在海外金融市場已經(jīng)風(fēng)行六十多個年頭。截至2016年底,量化基金在全球投資總規(guī)模已經(jīng)突破3萬億美元,其在全球基金規(guī)模所占比重更是接近1/3,量化基金已經(jīng)成為全球資產(chǎn)管理公司最重要的一種投資工具。與傳統(tǒng)投資相比,量化投資更具有風(fēng)險控制相對精準且超額收益相對穩(wěn)定的特點,受到基金市場越來越多的關(guān)注。量化基金在中國基金市場的應(yīng)用,起源于2004年光大量化核心的發(fā)行,由于當時股票市場缺少量化對沖工具,致使量化基金在隨后幾年發(fā)展緩慢。2010年滬深300股指期貨的推出,使中國基金市場具備了可對沖的量化工具,各大基金研究機構(gòu)紛紛建立量化投資策略,如alpha策略、股指期貨套利策略等,中國基金市場正式進入量化投資元年。之后在2015年啟動的大牛市行情中,量化基金產(chǎn)品迎來大爆發(fā),幾乎所有的量化投資產(chǎn)品都獲得較好收益,量化基金進入快速發(fā)展階段。
國外量化投資經(jīng)過六十多年發(fā)展,從投資策略上來看,幾乎覆蓋了投資者的全部投資過程,主要包括量化選股、量化擇時、股指期貨套利、商品期貨套利、資產(chǎn)配置、風(fēng)險控制等六個方面。然而,目前國內(nèi)基金市場所使用的量化方法,大多數(shù)僅涉及到量化選股這一環(huán)節(jié)。圍繞量化選股,國內(nèi)許多學(xué)者通過借鑒國外先進的量化模型,構(gòu)建了許多不同類型的量化選股模型。駱樺和秦艷艷[1]對中國股票市場的動量效應(yīng)和反轉(zhuǎn)效應(yīng)進行研究,認為利用動量選股模型可能獲取超額收益。林德發(fā)和楊瀟宇[2]利用滬深300指數(shù)各成分股的基本面數(shù)據(jù)和行情數(shù)據(jù),構(gòu)建多因子量化選股模型,試圖構(gòu)建出跑贏市場基準的投資組合??略袜嶋p陽[3]把價值投資和行業(yè)輪動模型相結(jié)合進行量化選股,在投資的穩(wěn)健程度和收益率之間找到更加有利的均衡點。巨紅巖等[4]對股票資金流強度進行實證研究及評測,認為股票資金流強度與股價環(huán)比增長率呈線性趨勢,利用資金流選股模型可以很好地進行選股。田凱和劉永睿[5]利用logistics模型進行量化選股,認為該模型能夠有效地提高投資組合的超額收益率,并能適當?shù)匾?guī)避投資者風(fēng)險。在上述眾多不同類型的量化選股模型中,多因子選股模型無疑是其中應(yīng)用最廣泛并且最重要的量化選股模型,國內(nèi)外的許多學(xué)者為此也做了大量的研究。Fama和French[6]使用市場風(fēng)險溢酬因子、公司市值因子以及賬面市值比因子對股票收益率進行回歸,對股票收益率進行解釋。范龍振和王海濤[7]在三因素模型的基礎(chǔ)上,在模型中加入市盈率因子,使多因子量化選股模型更好地解釋了股票市場上經(jīng)常出現(xiàn)的市值效應(yīng)、賬面市值比效應(yīng)、市盈率效應(yīng)和價格效應(yīng)。陳德華等[8]將代表股票資產(chǎn)特質(zhì)的30個指標劃分為8 類風(fēng)險因子,并以股票月收益率為因變量,以各風(fēng)險因子的敏感系數(shù)為自變量,建立基于多元橫截面回歸的量化選股模型。劉洋和夏思雨[9]則是將符合GARP策略(GARP策略是將價值策略和成長策略相結(jié)合,提出價格會按合理價值成長)的公司基本面指標作為候選因子,利用多因子模型對股票的收益情況進行研究,認為市盈率(PE)、市凈率(PB)、市銷率(PS)、市現(xiàn)率(PCE)、基本每股收益同比增長率和營業(yè)利潤同比增長率等6個因子與股票的收益率相關(guān)。
在“上市公司基本面決定企業(yè)價值,企業(yè)價值決定其股票價格”的投資邏輯下,基本面分析是篩選中國股市質(zhì)地優(yōu)良上市公司的重要利器,而構(gòu)建回歸法的多因子量化選股模型是基于公司基本面的全面分析,通過模型數(shù)據(jù)信息的處理和挖掘,幫助投資者進行理性選股,從而獲得超過市場基準的穩(wěn)定收益。同時,由于中國股市常出現(xiàn)漲跌無序、隨機性較強等問題,將量化選股模型與量化擇時策略相互結(jié)合,使之從精選個股到優(yōu)化倉位控制,從判斷投資組合的風(fēng)險到執(zhí)行交易買賣,每一個環(huán)節(jié)都有效地控制人為干預(yù)的一些因素,不僅可以降低投資風(fēng)險、獲得相對穩(wěn)定的投資收益,而且能夠促進股票市場平穩(wěn)健康可持續(xù)發(fā)展。此外,從國外成熟金融市場的發(fā)展經(jīng)驗來看,利用量化方法進行投資,可以有效地提高金融市場流動性。在國外許多證券交易所,量化基金產(chǎn)品的交易量能達到整個交易所總交易量的30%—40%,通過頻繁的程序化交易,及時有效地釋放大量現(xiàn)金流,提高整個金融交易市場的資金流動性。
但值得注意的是,在量化基金取得快速發(fā)展的背后,仍然存在諸多隱患,如目前國內(nèi)量化基金所使用的量化策略多是從國外引進,是國外量化投資基金過去使用過的量化選股模型及策略,不能很好地適應(yīng)中國A股市場。為了探索適應(yīng)中國A股市場的量化模型和策略,本文建立基于回歸法的多因子量化選股模型,并設(shè)計了相應(yīng)的量化擇時策略控制投資者風(fēng)險。
針對多因子量化選股模型現(xiàn)有研究之間的差別,本文采取以下辦法進行處理。一是影響股票價格波動的因子存在差異。股票價格波動受很多因素的影響,且不同因子之間可能存在極強的相關(guān)性。因此,在多因子量化選股模型的實證研究中,由于不同學(xué)者建立模型時選取的候選因子不同,得到的最終結(jié)果可能存在一定差異。為了避免發(fā)生這種差異,本文將不同學(xué)者最終確定的候選因子盡可能地納入到多因子量化選股模型中,并通過主成分分析,將眾多的候選因子聚合形成少數(shù)幾個公共因子進行實證研究。二是收益率選取的時間跨度不同。股票收益率在不同研究中主要分為長期收益率、中期收益率和短期收益率。其中,長期收益率以5年或3年累計收益率為代表,中期收益率主要是指年度收益率和半年度收益率,而短期收益率包括季度收益率、月收益率和周收益率等。由于量化基金投資過程較長,為了盡可能地控制投資過程中產(chǎn)生的風(fēng)險,充分挖掘各上市公司公布的信息,及時有效地找出具備增長潛力的股票,本文選擇中期收益率中的年度收益率進行實證研究。三是模型的判別方法不同。多因子選股模型有打分法和回歸法兩種判別方式,與打分法相比,回歸法能夠根據(jù)股票市場上的突發(fā)情況,比較及時地調(diào)整模型對各個因子的敏感性,而且簡單、快捷,更有利于程序化交易。因此,本文決定采用回歸法對多因子模型進行判斷,并設(shè)計出相應(yīng)的量化擇時策略,即建立基于回歸法的多因子量化選股模型及擇時策略進行實證研究。
本文在研究多因子變量與股票收益率關(guān)系及量化預(yù)測股票收益率的過程中采用多元線性回歸模型。
Y=β1Xi1+β2Xi2+β3Xi3+…+βjXij+ε
(1)
其中,Xi1,Xi2,…,Xij分別表示第i只股票的j個變量X1,X2,…,Xj的取值,β1,β2,…,βj分別表示模型中j個變量的系數(shù),ε為隨機誤差項。被解釋變量為股票收益率Y,股票收益率有單利和連續(xù)復(fù)利兩種計算方式。假設(shè)某只股票在t時刻的價格為pt,則股票收益率在這兩種方式下分別表示為(Pt-Pt-1)/Pt-1與ln(Pt/Pt-1)。由于本文度量的收益率實際上為年收益率,時間區(qū)間較長、價格變動較大,若采用單利方式度量股票收益率,因其不具備可加性的特點,會導(dǎo)致兩種方式的計算結(jié)果差別很大,為保證實際收益率的科學(xué)性和合理性,本文采用連續(xù)復(fù)利收益率度量股票投資收益,即對數(shù)收益率。
本文以中國上證180指數(shù)成分股為研究對象,樣本研究區(qū)間為2007年1月4日至2016年12月30日,共計10年的樣本數(shù)據(jù)。在該樣本研究區(qū)間內(nèi),基本包含了股票市場每年可能出現(xiàn)的全部行情趨勢。根據(jù)上市公司每年公布的年度報告數(shù)據(jù)和上證180指數(shù)年度行情趨勢,對上證180指數(shù)成分股在2007—2015年分別建立基于回歸法的多因子量化選股模型,并按照價值投資的思想,通過逐年構(gòu)建的量化選股模型對投資者的證券組合不斷進行調(diào)整,以2007年年報為起點、2015年年報為終點,共歷經(jīng)9次調(diào)倉。本文數(shù)據(jù)來源于東方財富Choice數(shù)據(jù)庫,數(shù)據(jù)分析軟件和編程軟件為SPSS和Python。
在模型構(gòu)建過程中,解釋變量的選取主要包括公司基本面指標、財務(wù)指標、技術(shù)指標以及其他指標。通過借鑒國內(nèi)外學(xué)者關(guān)于多因子量化選股模型的研究,對研究對象的各指標數(shù)據(jù)進行研究歸納后,得到21個在股票市場中常用的重要指標(如表1所示),將其作為多因子量化選股模型的指標進行實證研究。
表1多因子量化選股模型中的指標
由于多因子量化選股模型選取的眾多指標之間可能存在一定的相關(guān)性,若直接對這些數(shù)據(jù)進行建模分析,可能會造成量化選股模型的多重共線性。實證研究發(fā)現(xiàn),多個變量指標之間存在較強的相關(guān)性,這與其指標的計算方式和所代表的經(jīng)濟含義有一定的關(guān)系。為了解決各指標數(shù)據(jù)的相關(guān)性問題,盡可能保留原始變量的信息,本文對選取的各指標數(shù)據(jù)進行主成分分析處理。
利用上證180指數(shù)成分股在2007—2015年各指標數(shù)據(jù),以股票收益率為因變量,以各指標數(shù)據(jù)標準化后的主成分因子得分系數(shù)為自變量,建立不同行情下基于回歸法的多因子量化選股模型,并通過模型的實際投資效果對模型進行適應(yīng)性檢驗,其具體研究過程如下:
在進行模型構(gòu)建前,利用SPSS軟件對2007—2015年上證180指數(shù)成分股標準化后的各變量數(shù)據(jù)進行KMO檢驗和Bartlett檢驗,判斷其是否適合做因子分析。以2007年數(shù)據(jù)為例KMO檢驗統(tǒng)計量為0.562,偏相關(guān)系數(shù)大于0.5,因子分析效果較好,且Bartlett檢驗對應(yīng)的P值小于0.05,拒絕原假設(shè),各解釋變量之間存在相關(guān)關(guān)系,可以進行因子分析。
對數(shù)據(jù)進行因子分析,計算2007年上證180指數(shù)成分股標準化后各變量數(shù)據(jù)的主成分貢獻率和累計貢獻率。累計貢獻率為77.414,共確定了9個主成分因子。
以股票收益率為因變量,以主成分因子F1、F2、F3、F4、F5、F6、F7、F8和F9的得分系數(shù)為自變量,建立基于回歸法的多因子量化選股模型。在95%的置信度水平下,主成分因子F5、F6、F7、F8和F9的系數(shù)不顯著,說明在2007年牛市行情中,與其他因子相比,資本結(jié)構(gòu)指標、盈利能力指標、現(xiàn)金流量指標和營運能力等指標聚合形成的主成分因子對股票投資收益的影響有限。因此,決定剔除不顯著因子,以股票收益率為因變量,對剩余的4個主成分因子重新建立多因子量化選股模型。在新模型中,主成分因子F1、F2、F3和F4的t統(tǒng)計量在95%的置信度水平下均顯著,并且模型參數(shù)沒有顯著變化,R2為0.805,AIC值和BIC值下降。因此,以4個主成分因子對2007年上證180指數(shù)各成分股的收益率進行估計,模型的估計方程為:
Y=1.020+0.045F1+0.379F2+0.086F3+0.054F4
(2)
將2007年各變量聚合形成的主成分因子得分系數(shù)代入式(2)中,計算各只股票收益率的估計值和增長潛力(股票收益率估計值與真實值的差值)。并對各只股票的增長潛力進行排序,篩選出排名靠前的前10只股票,構(gòu)建2008年股票投資的證券組合。通過檢驗該投資組合在2008年1月2日至2008年12月31日的下跌趨勢中是否相對穩(wěn)定地跑贏上證180指數(shù),以檢驗多因子量化選股模型的實際投資效果,其結(jié)果如表2所示。
表2證券組合在2008年的投資表現(xiàn) 單位:%
從表2可以看出,利用多因子量化選股模型篩選出的投資組合在2008年獲得的平均復(fù)合收益率跑贏上證180指數(shù)基準年收益率,超額收益率為17.09%。因此,2007年構(gòu)建的多因子量化選股模型通過模型適應(yīng)性檢驗。對上證180指數(shù)成分股在2007—2015年標準化后的各變量數(shù)據(jù)重復(fù)上述多因子量化選股模型的建模過程,得到其在不同年份的量化選股模型,然后根據(jù)各年的多因子量化選股模型構(gòu)建股票池,并結(jié)合2007年多因子量化選股模型的選股結(jié)果,得到股票池在2008—2016年的實際投資收益率,其結(jié)果如表3所示。
從表3可以看出,利用多因子量化選股模型進行數(shù)量化選股,篩選出具有增長潛力的股票構(gòu)建股票池,能夠使得整個投資組合在各年的平均復(fù)合收益率穩(wěn)定地跑贏當年市場基準,累計超額收益率高達211.38%,說明通過量化選股模型挖掘具備增長潛力的股票是可行的,也是非常有效的。值得注意的是,跑贏市場基準并不總是給投資者帶來正向收益,如股票池在2008年、2010年和2011年的實際投資收益率皆為負,但是投資組合在2008—2016年的實際累計收益率卻高達247.18%,說明量化投資是一個長期的投資過程,投資者要想獲得較高的超額收益,需要長期以往地投資下去,不要計較局部的得失。
表3股票池在2008—2016年實際投資收益 單位:%
在單邊做多的股票市場行情中,投資者的資產(chǎn)收益往往容易受到市場波動較大的影響。在非理性市場中,這種價格波動所帶來的風(fēng)險尤其難以規(guī)避。前文構(gòu)建的基于回歸法的多因子量化選股模型雖然采用積極型投資管理方式,能夠在股票投資中穩(wěn)定地跑贏市場基準,形成股票超額收益,但仍然無法規(guī)避股票市場波動較為頻繁、價格回撤幅度較大等問題。因此,本文進一步設(shè)計出量化擇時策略,以期控制投資者風(fēng)險,幫助投資者保持相對穩(wěn)定的投資回報。在股票市場中常用的量化擇時策略有配對交易策略、動量交易策略、均線系統(tǒng)策略、通道突破策略、隨機指標交易策略和OBV指標交易策略等。本文在均線系統(tǒng)交易策略、OBV指標交易策略和隨機指標交易策略的基礎(chǔ)上,建立多種交易策略互相配合的量化擇時策略,用來降低證券投資組合的系統(tǒng)性風(fēng)險,維持相對穩(wěn)定的投資收益。
本文結(jié)合這三種擇時策略的優(yōu)缺點,建立以均線系統(tǒng)策略為主、隨機指標交易策略為輔、OBV指標交易策略為參照的量化擇時策略。具體構(gòu)建過程如下:首先,通過均線系統(tǒng)策略,計算股票平均價格,并根據(jù)其短期移動平均線和長期移動平均線的黃金交叉點,對股票買入時機進行識別。其次,計算隨機指標策略中的KDJ指標,主要參考KDJ指標中的J值,利用J值對市場上的超買現(xiàn)象進行判斷,進而識別出股票賣出時機。最后,計算OBV指標,通過觀察成交量的變化來對股票交易時機進行進一步的判斷。
在股票交易時機識別過程中,為了減少人為因素的干擾,根據(jù)以下情況對量化擇時策略制定相應(yīng)的股票交易規(guī)則:
第一,對于均線系統(tǒng)策略判斷出的買入時機,只有當移動能量潮曲線處于上升趨勢,才能夠進行股票交易。與此同時,為了控制投資者風(fēng)險,對于股票價格處于震蕩趨勢的買入交易信號不予識別。
第二,股票買入時機和賣出時機重合,如果隨機指標交易策略僅連續(xù)兩個或三個交易日發(fā)出賣出信號,則保留倉位,對股票行情做進一步的觀察。若是隨機指標交易策略連續(xù)四個或四個以上的交易日發(fā)出賣出信號,則在第五個交易日進行清倉。
第三,買入時機和賣出時機不同,但僅相差一個或兩個交易日。若買入時機在前,且隨機指標交易策略僅連續(xù)兩個交易日發(fā)出賣出信號,則保留倉位,否則進行平倉。若賣出時機在前,并在接下來的交易日隨機指標交易策略連續(xù)發(fā)出賣出信號,則在第三個交易日進行平倉,否則保留倉位。
第四,買入時機和賣出時機不同,且差別很大,在隨機指標策略發(fā)出賣出信號的第二個交易日進行清倉。
對新設(shè)計的量化擇時策略進行回測,將其應(yīng)用到2007—2015年利用多因子量化選股模型篩選出的證券組合中,計算不同年份采用量化選股及擇時策略股票池的投資收益,并與單獨使用量化選股策略以及上證180指數(shù)基準年收益率進行對比,其結(jié)果如圖1所示。
從圖1可以看出,當股票市場行情整體表現(xiàn)較差時,使用量化選股及擇時策略,獲得的收益率能夠穩(wěn)定地跑贏上證180指數(shù)基準年收益率,并幫助投資者取得正向收益。而當股票市場行情整體表現(xiàn)較好時,使用量化選股及擇時策略獲得的收益低于單獨使用量化選股模型獲得的收益以及上證180指數(shù)基準年收益率。這一點并不難理解,當股票市場整體處于上升趨勢時,使用量化擇時策略在控制股票投資組合風(fēng)險的同時,必然會損失一部分收益,致使整個投資組合的收益降低。但使用量化選股及擇時策略可以幫助投資者在各年獲得正向收益,并且從長期來看,其獲得的累計收益率高于單獨使用量化選股模型獲得的收益率,并且遠大于市場基準(量化選股及擇時策略的累計收益率為248.63%,單獨使用量化選股策略的累計收益率為247.18%,市場累計收益率為35.81%)。因此,在中國股市熊市多、牛市少的情形下,量化選股及擇時策略在股票市場中具有非常廣闊的應(yīng)用前景。
圖1 量化選股及擇時策略的投資業(yè)績比較
通過對比逐年構(gòu)建的多因子量化選股模型以及量化擇時策略研究,本文得出以下主要結(jié)論:
第一,基于回歸法的多因子量化選股模型和量化擇時策略是可行的,也是非常有效的?;诙嘁蜃幽P瓦M行量化選股,可以充分挖掘上市公司的價值信息,篩選出具備增長潛力的股票。通過模型逐年構(gòu)建的證券組合,在不同的股票市場行情中均穩(wěn)定地跑贏市場基準,并且通過結(jié)合量化擇時策略,可以幫助投資者在獲得正向收益的同時取得較高的投資回報,投資者在2008—2016年通過量化選股及擇時策略獲得的累計收益率高達248.63%,由此可見,本文設(shè)計的多因子量化選股模型和擇時策略在中國股票交易市場是可行的,也是非常有效的。
第二,在不同的股市行情中,影響股票收益率的變量以及變量之間的相關(guān)性也隨之變化。通過對比2007—2015年逐年構(gòu)建的多因子量化選股模型,可以發(fā)現(xiàn)多因子量化選股模型在各年最終保留的公共因子存在差異,說明股票市場行情不同,一些影響股票收益率的變量聚合形成的主成分因子對投資者的收益無顯著影響。而且各年變量數(shù)據(jù)經(jīng)過因子分析聚合形成的主成分因子個數(shù)也存在一定的差異,如2007年聚合形成9個公共因子,2008年聚合形成8個公共因子,而2011年聚合形成7個公共因子,說明股市行情不同,影響股票收益率的變量之間相關(guān)性也存在一定的差異。因此,試圖通過股票多年的累計超額收益率或年化復(fù)合平均收益率,篩選出影響股票收益率的固定因子,是既不科學(xué)又不合理的,應(yīng)根據(jù)不同的股票行情分別建立量化選股模型進行研究。
第三,量化選股與量化擇時策略密不可分,投資者為了控制投資風(fēng)險,獲得相對穩(wěn)定的正向收益,應(yīng)當實施量化擇時策略。雖然在股票行情較好時,量化擇時策略在控制股票投資風(fēng)險的同時,降低了投資者收益。但這一點并不難理解,降低風(fēng)險的同時必然會損失一部分收益,致使證券組合的整體投資收益降低。如在2009年、2014年和2015年的股市行情中,投資者單獨使用量化選股策略獲得的年化復(fù)合平均收益率分別為130.47%、80.39%和65.12%,而使用量化選股及擇時策略獲得的年化復(fù)合平均收益率僅為67.66%、44.54%和46.97%。但量化擇時策略在股票市場上仍然具有非常廣闊的應(yīng)用前景,其優(yōu)越性主要體現(xiàn)在牛市很少、而熊市和震蕩行情居多的股票市場中,量化擇時策略在股票行情不好時,仍然可以保證較為穩(wěn)定的正向收益。以2008年、2010年和2011年的股市行情為例,單獨使用量化選股策略,投資組合在各年的年化復(fù)合平均收益率分別為-49.46%、-12.52%和-1.20%,而使用量化選股及擇時策略,投資組合在各年的平均復(fù)合收益率分別為8.87%、15.24%和10.87%,量化擇時策略使證券組合的整體投資收益由負變正,效果顯著。
第四,量化選股及擇時策略并不是萬能的,仍然存在投資損失的可能性,投資者若想獲得較高的超額收益,應(yīng)當進行長期投資。如單獨使用量化選股策略,投資者在2008年、2010年和2011年獲得的投資收益雖然戰(zhàn)勝市場基準,但整體投資收益皆為負,說明投資者在這三年的資產(chǎn)實際上遭受了損失。而通過結(jié)合量化擇時策略,雖然成功地使投資組合在這三年的整體平均復(fù)合收益率由負變正,但在各年的投資組合中,仍然有部分股票的收益率為負值。如2008年投資組合中的山西汾酒、上港集團和小商品城,2010年投資組合中的隧道股份,2011年投資組合中的太平洋和中國石化,說明使用量化擇時策略并不能完全規(guī)避投資者可能遭受的損失。但從長期來看,單獨使用量化選股策略或量化選股與量化擇時策略相結(jié)合,都能給投資者帶來較高的超額收益,投資者在2008—2016年使用這兩種策略獲得的累計收益率分別為247.18%和248.63%,說明投資者在實際投資過程中若想獲得較高的超額回報,不應(yīng)局限于眼前的得失,應(yīng)當按照量化選股模型及擇時策略進行長期投資。