屈沛淼
摘要:在投資中,投資者對于風險的分析和控制是獲得穩(wěn)健投資回報的關鍵因素。從上世紀50年代開始,統(tǒng)計方法開始被運用在金融市場,哈里·馬科維茨首次對投資風險進行量化。經(jīng)過多年發(fā)展,投資組合風險分析體系日趨完善,其中一個重要的風險分析工具是多因子風險模型。多因子風險模型描述的是組合內(nèi)部各資產(chǎn)之間收益和風險的相關性,Barra風險模型又是其中的佼佼者。Barra風險模型由風格因子、行業(yè)因子和國家因子組成,其考察與組合收益相關的證券屬性,例如股票市值,市凈率以及所屬行業(yè)等,對于投資實踐能起到降低投資組合的風險暴露,實現(xiàn)更精確的風險管理、提供更準確的股票組合優(yōu)化結(jié)果、對投資組合或基金產(chǎn)品進行更深入的業(yè)績歸因和風險歸因等功能,是量化投資的好幫手。因此,本文旨在對Barra風險模型各因子和構建方法進行研究概述,或有益于投資者進行風險把控。
關鍵詞:Barra風險模型;風格因子;行業(yè)因子;純因子
近年來,量化投資在國內(nèi)大力發(fā)展,Smart-Bata產(chǎn)品層出不窮,其中因子投資是該類產(chǎn)品的核心策略。因子投資由來已久,早在1987年,Russell Investments推出了最早的兩個風格指數(shù),分別對標價值股和成長股,構造方法是將B/M(賬面市值比)前一半的股票放入價值指數(shù)里,將B/M后一半的股票放入成長指數(shù)里。在這之后,S&P、MSCI以及CRSP也推出了它們的多因子風格指數(shù)。這些多因子風格指數(shù)以Capm市場因子、Fama-French系列因子、Barra系列因子等為基礎,正是有了這些因子的發(fā)現(xiàn),才使得Smart-Bata產(chǎn)品走入尋常百姓家。因此,本篇文章對金融機構廣泛使用的Barra風險模型進行初步研究概述。
在股票的多因子回歸分析中,因子暴露和因子收益率是兩個核心的概念。因子,可以描述股票某方面特征的因素,比如行業(yè)因子描述了股票是否屬于這個行業(yè)。因子暴露則是描述股票在因子所代表的特征上的取值,對于一個給定的因子,按照某種權重組合所有股票便形成了一個基于該因子構建的投資組合,該投資組合的收益率就被定義為這個因子的收益率。
價值投資思想告訴我們,股票的風險大多來源于其基本面數(shù)據(jù),因此圍繞基本面開發(fā)的因子,如P\E、P\B、PEG因子等,它們之間存在一定的線性相關。為了正確的評價一個風險因子在什么程度上有效,必須保證圍繞該因子來構建的投資組合最大程度的剝離了因子之間的相關性。因此,Barra提出了純因子模型,來對投資組合進行歷史業(yè)績歸因,幫助用戶改善組合績效。
一、Barra風險模型的構成
Barra風險模型簡略形式可以表示為:
其中,ri為股票的收益率,fk為因子收益率,包括風格因子收益率、行業(yè)因子收益率和國家因子收益率。Xik表示股票i在因子k上的暴露程度,一般取前一期的因子暴露度,ui表示股票的特質(zhì)收益率。
1.風格因子
Barra風格因子包括市值因子、非線性市值因子、價值因子、成長因子、動量因子、盈利因子、杠桿因子、流動性因子、Beta因子和波動性因子,它們分別衡量了上市公司的市值規(guī)模、上市公司市值規(guī)模的多次方、賬面價值和市值的比例、凈資產(chǎn)和盈利預期的綜合考量、3個月的短期動量、盈利和股票市值的比例、上市公司的杠桿使用情況、由交易量和頻率不同帶來的收益、上市公司與股票指數(shù)之間的協(xié)同效應、對大盤偏離的不確定性。
2.行業(yè)因子
行業(yè)因子是一個啞變量,例如新能源行業(yè)因子、銀行行業(yè)因子、食品消費行業(yè)因子、采掘行業(yè)因子、鋼鐵行業(yè)因子、航空行業(yè)因子等。當股票屬于該行業(yè)時,因子暴露為1,不屬于該行業(yè)則因子暴露為0。對于業(yè)務涉及不同行業(yè)的大公司,則該公司以不同權重暴露于多個行業(yè)。
3.國家因子
Barra國家因子旨在降低行業(yè)因子對于市場的暴露,如跟隨市場共振,出現(xiàn)同漲同跌現(xiàn)象,即回歸方程中的殘差在時序上并不獨立,引發(fā)異方差性。因此設立國家因子,把影響行業(yè)的共同因素(國家因子,相當于行業(yè)的資本加權指數(shù),有點像上證指數(shù)、深證指數(shù)等)剝離出來,從而降低相關性,增強模型外推效果。剝離國家因子之后的殘差之間的相關性大大降低,從而更大程度的滿足假設方程的穩(wěn)健性。
二、Barra風險模型的構建方法
1.數(shù)據(jù)預處理
數(shù)據(jù)處理是模型回歸分析的必要步驟,因為市場中存在停牌無法交易的股票、上市未滿一年的股票、ST股票等,這些股票由于缺乏交易信息或者存在更高可能性被操縱股價的可能,因此在做回歸前應首先剔除這些股票。其次選定樣本時間范圍和頻率,如果需要對投資組合每天進行歸因,則頻率可以選擇日頻。接下來進行缺失值補充和數(shù)據(jù)標準化。
數(shù)據(jù)缺失是回歸分析中常見的問題,對于收益率缺失,可以直接填充為0,因為股價本身波動幅度不是很大,且增量信息在可交易日迅速在股價得到反應。對于風格因子缺失,有不同的填充方法,其中行業(yè)均值/中位數(shù)填充法和回歸法填充法較為常見。行業(yè)均值/中位數(shù)填充法使用缺失股票所在行業(yè)的均值/中位數(shù),相比使用全市場股票均值/中位數(shù),這樣填充顯得更加合理?;貧w填充法則基于完整數(shù)據(jù)建立回歸方程,令完整數(shù)據(jù)集中不缺失的因子值對于有缺失的因子值回歸,這種方法在數(shù)據(jù)充足的情況下,更加準確。除上述兩種方法外,還可以用隨機森林、KNN、K-means等方法填充。值得注意的是,如果數(shù)據(jù)缺失嚴重,則首先要考慮的是該因子是否還適合使用。其次,在合并大類因子時,只選用有數(shù)據(jù)的小類因子合并,將缺失的小類因子權重等權分配在有數(shù)據(jù)的小類因子上,這樣可以避免估計缺失值導致的偏差。對于所有小類因子數(shù)據(jù)都缺失導致的合并后大類因子數(shù)據(jù)缺失的情況,用回歸法填充。
2.因子標準化
由于不同因子量綱不同,并且分布通常不服從正態(tài)分布,需要進行標準化處理再進行回歸。通用的方法是計算因子的Z-socre。在計算Z-socre之前需要去除極值,一般使用3倍標準差法,即去除超過3倍樣本標準差的值。標準化的Z-socre如下:
3.因子相關性分析
變量之間相關性過高,會給回歸帶來嚴重的估計偏差。一般可以用因子間IC值的相關性系數(shù)做出大致判斷。因子IC值指個股第t期在該因子上的暴露與t+1期收益率之間的相關系數(shù),它衡量了使用該因子進行收益率預測的有效性和穩(wěn)健性。
其中,為股票k在t期的因子暴露,r為k在t+1期上的收益率。如果出現(xiàn)相關性較強的因子,還可以采用因子斯密特正交化來增加回歸的穩(wěn)健性。
4.因子暴露和因子收益估計
對于因子暴露及因子收益通常有兩種方法:時間序列回歸和截面回歸。時間序列回歸是個股收益率對因子收益率進行回歸,估計因子暴露。截面回歸則首先進行時間序列回歸確定因子暴露,然后個股收益率對因子暴露回歸,估計因子收益率。
時間序列回歸中,因子暴露是固定的,而因子收益率是變化的。因此,這樣估計得到的因子暴露對于市場的變化反應較慢。而在橫截面回歸中,因子暴露會根據(jù)公司特征的變化及時變化,每一期的因子暴露和因子收益率都是變化的,從而能夠及時的反映市場變化情況。另外,時間序列回歸中,因子構建是以組合收益率的形式,比如Fama-French三因子模型中的HML因子,就是通過做多高賬面市值比的公司,做空低賬面市值比的公司形成的組合收益而構建的因子。截面回歸中,則可以直接使用公司的基本面數(shù)據(jù)經(jīng)過標準化后直接使用。對于Barra風險模型來說,由于其直接采用基本面數(shù)據(jù),而不是時間序列回歸中采用的組合收益率作為因子回歸,因此Barra風險模型的構建適用于截面模型。這種做法的好處之二是,Barra通過純因子對個股收益率回歸,更好的實現(xiàn)了對組合收益的歸因。
5.Barra風險模型的構建
實操中,股票收益率可以表示為市場收益率、行業(yè)收益率、風格因子收益率以及特質(zhì)收益率的線性組合:
從Barra風險模型構建原理可知,國家因子是資本市場加權指數(shù)收益率,與行業(yè)因子之和完全正相關,因此,在Barra風險模型求解時,有必要加上約束條件,限制市值加權的行業(yè)因子收益之和為0,這樣使得模型的解唯一。
此外,針對截面回歸中存在的異方差問題,可使用加權最小二乘法(WLS)解決。在Barra風險模型中易存在異方差現(xiàn)象,研究發(fā)現(xiàn)其殘差收益與股票的總市值平方根成反比,這是以總市值開根號的倒數(shù)作為WLS中的權重,即在原等式兩邊乘以總市值開根號的倒數(shù),新的殘差方差變?yōu)槌?shù),此時再進行最小二乘法回歸。
三、Barra風險模型對投資的指導意義
Barra風險模型構建的純因子,天然可以為投資組合進行歸因。對于該因子是否有益于投資(即做多該因子得分靠前的股票),需要考察兩方面:收益率和波動率。一般來說,波動低、收益率大部分時間為證的因子可以貢獻穩(wěn)定的超額收益,自身系統(tǒng)性風險低,這樣的因子有益于投資。收益率時正時負波動很大的因子,在統(tǒng)計上無法貢獻非0的超額收益,這樣的因子則可以歸為風險因子,適合對組合的歸因工作。