熊海芳,劉 躍,劉天銘
(東北財(cái)經(jīng)大學(xué) 金融學(xué)院,遼寧 大連 116025)
債券和股票均是公司融資的重要渠道,也是基金經(jīng)理投資的主要資產(chǎn),因此,應(yīng)用因子模型對(duì)公司債券信用溢價(jià)的截面差異進(jìn)行研究,有助于投資者提高對(duì)債券風(fēng)險(xiǎn)溢價(jià)因素的理解和風(fēng)險(xiǎn)管理。對(duì)于公司債券市場(chǎng),已有文獻(xiàn)多探討影響公司債券信用溢價(jià)的因素,如宏觀經(jīng)濟(jì)、市場(chǎng)利率、發(fā)行主體特征等。[1-3]但是這些研究對(duì)債券因子組合以及債券信用溢價(jià)共同因子模型的研究比較少。因此,本文將構(gòu)造多個(gè)債券共同因子,進(jìn)而考察其對(duì)公司債券信用溢價(jià)的解釋能力。
對(duì)于公司債券信用溢價(jià)在截面上存在的差異,已有研究從不同角度進(jìn)行了分析,發(fā)現(xiàn)多個(gè)具有解釋力的影響因子?,F(xiàn)有因子主要分為以下幾類:第一類,債券特征因子,比如債券流動(dòng)性、發(fā)行主體信用評(píng)級(jí)、債券信用評(píng)級(jí)、發(fā)行規(guī)模等。[4-6]由于我國(guó)社會(huì)信用體系建設(shè)并不健全,外部評(píng)級(jí)基本集中于AAA級(jí)和AA級(jí),因此,單純依賴信用評(píng)級(jí)對(duì)公司債券信用溢價(jià)進(jìn)行分析效果不佳。[7]第二類,債券市場(chǎng)因子。有學(xué)者發(fā)現(xiàn)與股票市場(chǎng)類似,債券市場(chǎng)中也存在動(dòng)量因子,[8-9]債券持有人對(duì)債券下行風(fēng)險(xiǎn)更為敏感,下行風(fēng)險(xiǎn)是一個(gè)有效影響因子。[10]流動(dòng)性和波動(dòng)率因子在公司債券定價(jià)中也有強(qiáng)解釋能力。[4,6,10]第三類,股市因子。一些研究利用股票和債券市場(chǎng)因子來探討其對(duì)同期或未來的債券收益的影響,如Fama-French三因子。[11-12]第四類,公司特征因子,這類因子主要與公司基本面有關(guān),比如其盈利和投資。[13]由于在我國(guó)發(fā)債企業(yè)中包含部分未上市企業(yè),其信息披露不完善,多數(shù)財(cái)務(wù)數(shù)據(jù)無法獲取,因此,本文在構(gòu)建我國(guó)債券市場(chǎng)共同因子的過程中并未考慮公司特征因子。部分研究發(fā)現(xiàn)市場(chǎng)利率、債券久期等因子會(huì)影響單個(gè)債券收益率,[5,14]本文在研究過程中主要通過截面視角對(duì)因子進(jìn)行研究和檢驗(yàn),需要進(jìn)行久期匹配并引入債券市場(chǎng)因子,因此不再考慮宏觀因子、市場(chǎng)利率、久期及利率期限結(jié)構(gòu)因子。根據(jù)文獻(xiàn)研究、國(guó)內(nèi)數(shù)據(jù)的可獲得性和研究需要,本文在構(gòu)建債券組合的基礎(chǔ)上,綜合規(guī)模、動(dòng)量、流動(dòng)性、波動(dòng)率和下行風(fēng)險(xiǎn)等考察我國(guó)公司債券風(fēng)險(xiǎn)溢價(jià)的共同因子。此外,2015年1月16日《公司債券發(fā)行與交易管理辦法》(下文簡(jiǎn)稱“2015‘辦法’”)的推出對(duì)債券市場(chǎng)影響巨大,公司債市場(chǎng)容量明顯增大,各子樣本內(nèi)公司債數(shù)量增加。因此,為了探討2015年1月之后市場(chǎng)擴(kuò)容的影響,本文進(jìn)一步以2015年1月為界研究公司債券信用溢價(jià)因子的解釋力度是否存在結(jié)構(gòu)性變化。
研究影響公司債券信用溢價(jià)的共同因子,需要探討如何選擇有效因子。最常見的做法是將因子加入線性模型,通過回歸對(duì)比截距項(xiàng)。這樣做盡管直觀,但只考慮了因子的線性影響。隨著機(jī)器學(xué)習(xí)的發(fā)展,有學(xué)者開始嘗試將機(jī)器學(xué)習(xí)引入因子模型,利用正則化稀疏學(xué)習(xí)等方法來進(jìn)行因子選擇。Breiman提出了適用于這類問題的集成學(xué)習(xí)算法——隨機(jī)森林。[15]Patel等發(fā)現(xiàn)隨機(jī)森林方法在股指趨勢(shì)預(yù)測(cè)中有一定優(yōu)勢(shì)。[16]鑒于此,本文將LASSO等機(jī)器學(xué)習(xí)算法應(yīng)用于債券信用溢價(jià)因子模型,比較不同模型的解釋能力并探討因子是否存在結(jié)構(gòu)變化。
與已有研究相比,本文的創(chuàng)新在于:第一,從債券市場(chǎng)、股票市場(chǎng)、債券特征等角度綜合構(gòu)造公司債券信用溢價(jià)的共同因子,這從理論上為探討我國(guó)公司債券信用溢價(jià)的決定因素提供了新的解釋;第二,除了使用傳統(tǒng)線性回歸模型外,本文綜合利用多種機(jī)器學(xué)習(xí)方法對(duì)因子回歸模型進(jìn)行變量選擇,對(duì)不同方法的精確度、穩(wěn)定性進(jìn)行比較,分析共同因子存在的結(jié)構(gòu)變動(dòng)情況,進(jìn)一步證實(shí)機(jī)器學(xué)習(xí)方法在我國(guó)公司債券市場(chǎng)的可行性與實(shí)用性。
要構(gòu)建公司債券信用溢價(jià)的單因子模型,通常根據(jù)單因子值對(duì)資產(chǎn)進(jìn)行排序,然后分組構(gòu)建組合,直接檢驗(yàn)最高和最低兩組差異的顯著性。在判斷因子有效性時(shí)還可以進(jìn)行CAPM回歸。債券組合CAPM回歸中需要構(gòu)建市場(chǎng)因子,一是像構(gòu)建股票因子一樣采用多空組合方法計(jì)算,二是參考Houweling和Van Zundert通過做多策略構(gòu)建債券市場(chǎng)因子,這是因?yàn)閭袌?chǎng)中做空難度較大,做空成本較高。[6]回歸方程如式(1)所示:
其中,Rt和DEFt分別代表因子和債券市場(chǎng)組合在t時(shí)刻的信用利差,即CAPM-alpha。
已有研究發(fā)現(xiàn),債券的發(fā)行規(guī)模、發(fā)行期限以及信用評(píng)級(jí)均會(huì)對(duì)公司債券信用溢價(jià)產(chǎn)生影響。規(guī)模因子用債券流通市值總額表示,期限因子用債券久期表示,信用評(píng)級(jí)則通過計(jì)算理論信用利差及其與債券實(shí)際信用利差的差值來衡量。經(jīng)驗(yàn)研究中通常采用公式(2)構(gòu)造公司債券價(jià)值因子組合。[17]
在式(2)中,CSi為該月公司債券信用利差;Dir是代表債券評(píng)級(jí)的虛擬變量;Mi代表債券久期。本文僅保留主要評(píng)級(jí)級(jí)別,將AAA+、AAA-統(tǒng)一視為AAA,并以此類推,因此模型中評(píng)級(jí)虛擬變量個(gè)數(shù)為8個(gè)。這樣做可以保證回歸過程盡量減少自由度的損失。此外,公司債券自身特征還有久期利差因子,本文根據(jù)久期匹配對(duì)應(yīng)國(guó)債計(jì)算債券的信用利差,這樣做可以從信用利差中剔除久期的影響。
除了債券特征因子,本文還引入了債券市場(chǎng)特征因子,如動(dòng)量、波動(dòng)率、下行風(fēng)險(xiǎn)、流動(dòng)性等。波動(dòng)率因子組合通過計(jì)算收益率的歷史波動(dòng)率來構(gòu)建,下行風(fēng)險(xiǎn)因子組合通過計(jì)算債券的歷史累積收益率來構(gòu)建。對(duì)于流動(dòng)性因子組合,由于我國(guó)公司債券交易不活躍,多數(shù)債券的交易在時(shí)間序列上并不連續(xù),故無法采用Bai等的流動(dòng)性因子構(gòu)造方法,直接采用債券日換手率進(jìn)行構(gòu)建。[10]對(duì)于動(dòng)量因子組合,先將債券根據(jù)公式(3)計(jì)算各自的歷史累積收益率并進(jìn)行排序后,再構(gòu)建組合。
其中,Pi,t和 Pi,t-1分別代表形成期期末和期初債券 i的日收盤全價(jià),couponi,t為形成期內(nèi)該公司債券的實(shí)際支付利息。
1.基于債券的多因子模型。參考Houweling和Van Zundert、Bai等的做法,本文將公司債券共同因子以及債券市場(chǎng)因子一同納入多因子模型。[6,10]在考慮了公司債券的共同因子和市場(chǎng)因子后,本文構(gòu)建包含七個(gè)單因子的多因子模型,具體形式見公式(4)。其中,Ri,t為債券或組合i在t月的年化信用利差。DEFt為市場(chǎng)組合t月的信用利差,作為市場(chǎng)因子。size、value、momentum、volatility、downrisk和liquidity分別為規(guī)模因子、價(jià)值因子、動(dòng)量因子、波動(dòng)率因子、下行風(fēng)險(xiǎn)因子和流動(dòng)性因子。
2.考慮股市的多因子模型。參考Franke等的做法,在公式(1)的基礎(chǔ)上,加入股市因子構(gòu)造多因子模型,以此檢驗(yàn)本文構(gòu)建的單因子組合收益在加入了股市多因子模型下是否仍具有無法解釋的alpha收益,回歸方程見公式(5)。[18]其中,MKTt、SMBt、HMLt為 Fama - French 三因子。
1.LASSO。LASSO通過正則化進(jìn)行壓縮估計(jì),使得LASSO兼具變量選擇和變量降維的功能。對(duì)于多因子回歸模型,LASSO主要通過對(duì)公式(6)的最小值求解。其中,第一項(xiàng)為回歸方程的殘差平方和,第二項(xiàng)為壓縮懲罰。為使公式(6)取值最小,懲罰項(xiàng)的存在會(huì)使解釋能力弱的變量參數(shù)估計(jì)值壓縮為零,從而起到變量選擇的作用。在分析公司債券信用溢價(jià)因子模型時(shí),為防止過擬合,需要對(duì)λ值進(jìn)行設(shè)定。
2.自適應(yīng)LASSO。自適應(yīng)LASSO加入最優(yōu)化過程,通過公式(7)使各個(gè)變量回歸系數(shù)具有自選擇的特點(diǎn)。其中,為因子j回歸系數(shù)的懲罰權(quán)重,γ>0,通常將其設(shè)定為[1,10]的任一整數(shù)。為因子j在OLS中的參數(shù)估計(jì)值。與LASSO算法不同的是,自適應(yīng)LASSO并不需要人為設(shè)定λ值。對(duì)于γ和λ的取值,均通過算法循環(huán)求解,以模型擬合均方誤差最小為判斷準(zhǔn)則,采用十折交叉增加樣本容量,從而得到各債券最優(yōu)組合(λ*,γ*)及最優(yōu)參數(shù)估計(jì)值。
3.彈性網(wǎng)絡(luò)。LASSO使用的懲罰項(xiàng)為L(zhǎng)1范數(shù),彈性網(wǎng)絡(luò)和LASSO類似,區(qū)別在于彈性網(wǎng)絡(luò)是L1和L2范數(shù)的組合,具體形式如公式(8)所示。彈性網(wǎng)絡(luò)仍通過對(duì)參數(shù)施加壓縮懲罰進(jìn)而實(shí)現(xiàn)變量選擇的功能。彈性網(wǎng)絡(luò)的優(yōu)勢(shì)在于:當(dāng)模型自變量存在多重共線性問題時(shí),OLS估計(jì)雖然無偏但方差膨脹,而彈性網(wǎng)絡(luò)利用L2范數(shù),泛化能力更好。
集成學(xué)習(xí)方法大致分為串行生成的序列化和可同時(shí)生成的并行化兩類。其中第一類最常見的是Boosting算法,往往用于分類問題,但也有如XGBoost算法可用于回歸。第二類算法不僅可用于分類也可用于回歸,最常見的如Bagging和隨機(jī)森林算法。[19]其中,隨機(jī)森林算法是在Bagging算法的基礎(chǔ)上加入了隨機(jī)屬性(因子)選擇,因此,隨機(jī)森林算法擁有較強(qiáng)的泛化能力和防過擬合能力。XGBoost作為一種集成學(xué)習(xí)方法,借鑒了很多隨機(jī)森林算法的思想,最后結(jié)果根據(jù)多個(gè)可疊加樹求和得到。對(duì)于一個(gè)存在m個(gè)特征的數(shù)據(jù)集,算法通過對(duì)每個(gè)“樹”函數(shù)求和來輸出預(yù)測(cè)結(jié)果,具體形式如式(9)所示:
其中,f(x)=wq(x)為回歸樹模型,其結(jié)構(gòu)與權(quán)重均通過學(xué)習(xí)確定,在整個(gè)學(xué)習(xí)過程中,需要對(duì)如下目標(biāo)函數(shù)進(jìn)行不斷優(yōu)化:
本文以我國(guó)流通的公司債券為研究對(duì)象。由于2010年前公司債發(fā)行數(shù)量極少,樣本代表性不足,故研究的時(shí)間區(qū)間從2010年開始。由于本文研究時(shí)國(guó)泰安數(shù)據(jù)庫中Fama-French三因子月度數(shù)據(jù)更新至2018年6月,因此樣本區(qū)間設(shè)為2010年1月~2018年6月。數(shù)據(jù)來源及預(yù)處理過程如下:(1)債券交易、評(píng)級(jí)數(shù)據(jù)均來自于銳思網(wǎng)站,剔除了含權(quán)債券,F(xiàn)ama-French三因子數(shù)據(jù)來源于國(guó)泰安數(shù)據(jù)庫。(2)由于我國(guó)債券市場(chǎng)流動(dòng)性較差,為了避免部分流動(dòng)性極差債券帶來的異常收益影響,剔除單只債券中月交易日不足10天的不活躍月份,保留的月份定義為有效交易月份。
2015“辦法”后,公司債規(guī)模的擴(kuò)大、發(fā)行增速的提高以及非公開債券發(fā)行的拓寬有利于提高債券流動(dòng)性,進(jìn)而降低債券流動(dòng)性風(fēng)險(xiǎn)。2015“辦法”建立了投資者適當(dāng)性制度,設(shè)立資質(zhì)條件過濾合格投資者,限制中小投資者的投資標(biāo)的,從而改變公司債投資者的組成結(jié)構(gòu)。為進(jìn)一步探究2015“辦法”對(duì)公司債券風(fēng)險(xiǎn)溢價(jià)的影響,本文以2015年為界研究公司債券信用溢價(jià)因子的解釋力度是否存在結(jié)構(gòu)性變化。
本文參考Houweling和Van Zundert的方法 計(jì)算信用利差。[6]根據(jù)債券久期匹配對(duì)應(yīng)國(guó)債,將公司債到期收益率扣除匹配久期的國(guó)債到期收益率,所得即為該公司債的信用利差。通過匹配后計(jì)算的債券信用利差可以排除久期對(duì)信用利差的影響。將組合內(nèi)債券信用利差按照等權(quán)重求平均值即可得到組合信用利差。由于我國(guó)債券市場(chǎng)上不存在衡量市場(chǎng)整體信用溢價(jià)的指標(biāo),本文以信用債市場(chǎng)上全部公司債構(gòu)建市場(chǎng)因子。公司債券各因子的定義如表1所示。
表1 公司債券因子名稱及其定義
將債券分別根據(jù)規(guī)模、價(jià)值、動(dòng)量、波動(dòng)率、下行風(fēng)險(xiǎn)、流動(dòng)性因子對(duì)各個(gè)因子構(gòu)建H-L(High minus Low)組合,通過觀察相同因子下不同組合的信用利差差值判斷因子有效性。進(jìn)一步以2015年1月為界,探討因子在2015年前后是否存在結(jié)構(gòu)性變化。不同樣本時(shí)間區(qū)間內(nèi)單因子多空收益率(H-L組利用利差差異)表現(xiàn)如表2中Panel A~Panel C所示,完整時(shí)間區(qū)間下市場(chǎng)組合以及單因子持有做多組合表現(xiàn)如Panel D所示。從實(shí)證結(jié)果來看,動(dòng)量因子對(duì)公司債券未來信用溢價(jià)解釋能力較差,其在我國(guó)公司債市場(chǎng)上因子收益并不顯著。①關(guān)于動(dòng)量因子本文分別探討了3、6、9、12個(gè)月不同動(dòng)量形成期下單因子組合信用利差,由于文章篇幅有限,本文只匯報(bào)了3個(gè)月動(dòng)量形成期的實(shí)證結(jié)果,其余形成期下H-L結(jié)果與3個(gè)月期結(jié)果類似,有興趣的讀者可向作者索取。規(guī)模、價(jià)值、波動(dòng)率、下行風(fēng)險(xiǎn)、流動(dòng)性五因子均可獲得顯著超額收益。
表2 不同時(shí)間區(qū)間下的單因子組合信用利差
2018年債券違約事件頻發(fā),2018年的違約債券數(shù)量已超過了2014~2017年的總和。除了違約風(fēng)險(xiǎn)增加,2018年還伴隨著資管新規(guī)的推出以及去杠桿進(jìn)程的推進(jìn),貨幣緊縮帶來信用緊縮導(dǎo)致債券市場(chǎng)在2018年波動(dòng)巨大。①本文實(shí)證同樣發(fā)現(xiàn)2018年債券市場(chǎng)波動(dòng)對(duì)債券收益率的影響較大,限于文章篇幅,相關(guān)實(shí)證結(jié)果并未列示,留存?zhèn)渌?。為了剔除債券異常信用利差的影響,本文將研究的樣本區(qū)間控制在2010~2017年。
基于公式(5)對(duì)公司債券信用溢價(jià)做多因子回歸分析,發(fā)現(xiàn)在控制股市三因子后,債券單因子組合alpha仍在1%水平上顯著為正②限于文章篇幅,經(jīng)過股票市場(chǎng)多因子調(diào)整后的債券因子組合alpha的實(shí)證結(jié)果并未列示,留存?zhèn)渌?。,即加入Fama-French三因子后的多因子模型不能解釋各個(gè)債券單因子組合的信用利差,這與Houweling和Van Zundert、劉桂梅和楊晨的研究結(jié)論一致。[3,6]
綜上可以發(fā)現(xiàn),在我國(guó)債券市場(chǎng)中,規(guī)模因子、下行風(fēng)險(xiǎn)因子、價(jià)值因子、波動(dòng)率因子以及流動(dòng)性因子共5個(gè)共同因子,可以獲得顯著的因子收益,而動(dòng)量因子收益不顯著。不論是單因子檢驗(yàn)還是在加入了Fama-French三因子后的多因子檢驗(yàn)下,5個(gè)共同因子組合均存在顯著alpha收益。基于以上結(jié)論,從公式(4)中剔除動(dòng)量因子構(gòu)建多因子模型。從單因子間相關(guān)系數(shù)可以看出③限于文章篇幅,因子的相關(guān)系數(shù)矩陣并未列示,留存?zhèn)渌?。,不同共同因子間相關(guān)性不高,說明因子之間的關(guān)聯(lián)性不強(qiáng)。
本文利用5個(gè)有效共同因子及市場(chǎng)因子共6個(gè)因子,對(duì)每個(gè)公司債券分別基于LASSO、自適應(yīng)LASSO做回歸,通過統(tǒng)計(jì)各因子在全部樣本公司債券回歸中最優(yōu)估計(jì)參數(shù)非零的個(gè)數(shù),來對(duì)比單因子對(duì)公司債券信用溢價(jià)解釋能力的差異。由于下行風(fēng)險(xiǎn)因子計(jì)算限制,本文使用2013年1月~2017年12月經(jīng)前文條件篩選后保留的債券數(shù)據(jù),在此基礎(chǔ)上,僅保留至少有20個(gè)有效月的公司債券作為樣本,共150只。盡管前提條件苛刻,保留的債券數(shù)據(jù)較少,但每只債券的日交易數(shù)據(jù)充足,信用利差數(shù)據(jù)更具真實(shí)性和代表性。兩種算法下最優(yōu)估計(jì)參數(shù)取值情況如表3所示。
表3 稀疏學(xué)習(xí)下各因子最優(yōu)參數(shù)取值統(tǒng)計(jì)
在表3Panel A中展示了懲罰項(xiàng)系數(shù)λ為0.01的LASSO的參數(shù)取值統(tǒng)計(jì)。除去市場(chǎng)因子外,流動(dòng)性因子參數(shù)估計(jì)值非零數(shù)量在全部樣本債券中占比最高,其余5個(gè)因子非零比例均超50%。參數(shù)估計(jì)值均為0的公司債數(shù)量為0,均非零的公司債數(shù)量為44。在Panel B中,自適應(yīng)LASSO通過對(duì)樣本內(nèi)數(shù)據(jù)交叉驗(yàn)證得到最合適的λ參數(shù)值。隨著λ值增加,六因子最優(yōu)參數(shù)估計(jì)值非零頻率均出現(xiàn)下降,但仍十分顯著。
為探索我國(guó)公司債券因子在2015年前后是否存在結(jié)構(gòu)變化,借鑒傳統(tǒng)的鄒檢驗(yàn)構(gòu)建如下模型:
其中,Rit為債券i因子組合在第t月的年化信用利差;DEFt為市場(chǎng)組合在第t月的信用利差;Dt是代表時(shí)間的虛擬變量,2015年1月之后取1,否則取0;DtDEFt為時(shí)間虛擬變量與市場(chǎng)信用利差的交乘項(xiàng)。從實(shí)證結(jié)果來看,五個(gè)債券共同因子組合在各自的回歸方程中,交乘項(xiàng)系數(shù)均顯著大于0,說明公司債券因子在2015年前后存在結(jié)構(gòu)變化。①限于文章篇幅,鄒檢驗(yàn)下公司債券單因子組合結(jié)構(gòu)變化的實(shí)證結(jié)果并未列示,留存?zhèn)渌鳌?/p>
利用自適應(yīng)LASSO方法,研究其是否可以發(fā)現(xiàn)公司債券因子中存在的結(jié)構(gòu)變化。為保證每只債券均有充足樣本數(shù)據(jù),在每個(gè)樣本區(qū)間僅保留有效交易月份不少于10個(gè)月的債券,經(jīng)篩選2015年前后兩個(gè)樣本區(qū)間分別保留145只及120只公司債券。各樣本區(qū)間最優(yōu)參數(shù)估計(jì)值取值情況見表4。從表4中可以看出,2015年以前,規(guī)模因子解釋廣度最廣,市場(chǎng)因子解釋力度最弱。2015年以后,下行風(fēng)險(xiǎn)因子解釋廣度最廣,規(guī)模因子解釋力度最弱,其次是流動(dòng)性因子,這點(diǎn)與流動(dòng)性風(fēng)險(xiǎn)分組的表現(xiàn)相對(duì)應(yīng):2015年以來最低流動(dòng)性風(fēng)險(xiǎn)分組的債券組合波動(dòng)率明顯升高,這會(huì)對(duì)參數(shù)估計(jì)產(chǎn)生影響。所有因子最優(yōu)參數(shù)估計(jì)值均非零的公司債數(shù)量占比上升至10%。此外,利用彈性網(wǎng)絡(luò)算法,即使在懲罰項(xiàng)增多的情況下,因子解釋力度強(qiáng)弱及變化與自適應(yīng)LASSO基本一致。②限于文章篇幅,彈性網(wǎng)絡(luò)算法下各因子最優(yōu)參數(shù)取值統(tǒng)計(jì)的實(shí)證結(jié)果并未列示,留存?zhèn)渌?。因此,通過基于稀疏學(xué)習(xí)方法同樣可以發(fā)現(xiàn)公司債券市場(chǎng)及其共同因子的結(jié)構(gòu)變化情況。
表4 自適應(yīng)LASSO下各因子最優(yōu)參數(shù)取值統(tǒng)計(jì)
利用集成學(xué)習(xí)中隨機(jī)森林、XGBoost以及決策樹三種方法,采用同前文相同的劃分區(qū)間方式,分析整個(gè)時(shí)間區(qū)間內(nèi)因子的重要性變化。兩個(gè)子樣本區(qū)間內(nèi)債券信用溢價(jià)六因子在三種方法上的信息增益如表5所示。2015年以前,規(guī)模因子在決策樹和隨機(jī)森林方法中的信息增益最大,市場(chǎng)因子在XGBoost方法中的信息增益最大,其次為規(guī)模因子,波動(dòng)率因子最小。2015年之后,三種模型中信息增益最大的因子分別為價(jià)值因子、下行風(fēng)險(xiǎn)因子和市場(chǎng)因子;規(guī)模因子在決策樹和隨機(jī)森林中的信息增益最小,XGBoost中流動(dòng)性因子信息增益最小。
表5 債券信用溢價(jià)因子的信息增益
總的來看,不論線性回歸、稀疏學(xué)習(xí)還是集成學(xué)習(xí)均可發(fā)現(xiàn)公司債券市場(chǎng)及其共同因子存在結(jié)構(gòu)變化。利用基于稀疏學(xué)習(xí)的自適應(yīng)LASSO、彈性網(wǎng)絡(luò),可以發(fā)現(xiàn)因子在公司層面上的結(jié)構(gòu)變化情況,利用基于集成學(xué)習(xí)的隨機(jī)森林等三種方法可以發(fā)現(xiàn)因子在樣本區(qū)間層面的結(jié)構(gòu)變化。經(jīng)對(duì)比,2015年前,市場(chǎng)因子、規(guī)模因子、下行風(fēng)險(xiǎn)因子在稀疏學(xué)習(xí)中有較高的解釋力度,前兩者在集成學(xué)習(xí)中也有較高的信息增益,波動(dòng)率因子在稀疏學(xué)習(xí)及集成學(xué)習(xí)中解釋力度均較?。?015年后,市場(chǎng)因子、下行風(fēng)險(xiǎn)因子在稀疏學(xué)習(xí)及集成學(xué)習(xí)中對(duì)應(yīng)的解釋力度均較高,流動(dòng)性因子在稀疏學(xué)習(xí)及集成學(xué)習(xí)中解釋力度均較低;2015年前后,在兩種稀疏學(xué)習(xí)方法中,流動(dòng)性因子均明顯下降,價(jià)值因子、波動(dòng)率因子變動(dòng)不明顯,規(guī)模與下行風(fēng)險(xiǎn)因子在稀疏學(xué)習(xí)和集成學(xué)習(xí)中解釋力度分別明顯下降和上升。
對(duì)比來看,機(jī)器學(xué)習(xí)方法下的實(shí)證結(jié)果與前文傳統(tǒng)線性回歸與鄒檢驗(yàn)結(jié)果基本一致。首先,在線性回歸中加入懲罰項(xiàng)的稀疏學(xué)習(xí)方法中,因子不論在全樣本還是分時(shí)期樣本下依然具有顯著解釋意義;在集成學(xué)習(xí)方法中,共同因子在降低信息熵的過程中均提供了信息增益。這些結(jié)果說明機(jī)器學(xué)習(xí)方法下共同因子在解釋公司債券信用溢價(jià)方面具有顯著的解釋能力,與基于線性回歸的單因子和多因子模型結(jié)論一致。在理論上,這與資產(chǎn)定價(jià)的多因子模型是一致的。其次,稀疏學(xué)習(xí)和集成學(xué)習(xí)均可發(fā)現(xiàn)因子存在結(jié)構(gòu)變化,這點(diǎn)與傳統(tǒng)的鄒檢驗(yàn)結(jié)論一致。綜合來看,機(jī)器學(xué)習(xí)方法下的實(shí)證結(jié)果與傳統(tǒng)的線性回歸結(jié)果基本一致,且提供了更豐富的信息,同時(shí)結(jié)構(gòu)變化分析揭示了政策調(diào)整的影響,有效說明了機(jī)器學(xué)習(xí)方法結(jié)論的準(zhǔn)確性和適用性??傮w來看,機(jī)器學(xué)習(xí)算法結(jié)果比較符合公司債券投資的理論解釋和我國(guó)的市場(chǎng)實(shí)踐。
本文采用線性回歸和多個(gè)機(jī)器學(xué)習(xí)方法對(duì)我國(guó)公司債券信用溢價(jià)的共同因子模型展開研究。結(jié)果發(fā)現(xiàn):(1)在對(duì)2010~2017年債券市場(chǎng)信用溢價(jià)的截面差異進(jìn)行解釋時(shí)發(fā)現(xiàn),規(guī)模因子、下行風(fēng)險(xiǎn)因子、價(jià)值因子、波動(dòng)率因子以及流動(dòng)性因子等5個(gè)共同因子可以獲得顯著的因子收益,而動(dòng)量因子收益不顯著,2018年債券違約和市場(chǎng)信用緊縮導(dǎo)致市場(chǎng)波動(dòng),因子模型的解釋發(fā)生較大變化。(2)在單因子檢驗(yàn)和加入了債券市場(chǎng)因子、Fama-French三因子后的多因子檢驗(yàn)下,5個(gè)共同因子的做多組合均存在顯著alpha收益,說明這5個(gè)因子是具有解釋能力的。流動(dòng)性因子組合對(duì)市場(chǎng)風(fēng)險(xiǎn)的β值較低,組合收益的波動(dòng)率最小,說明該因子的逆周期防御功能較強(qiáng)。(3)本文構(gòu)造了規(guī)模因子、價(jià)值因子、下行風(fēng)險(xiǎn)因子、波動(dòng)率因子和流動(dòng)性因子等5個(gè)共同因子模型,稀疏學(xué)習(xí)方法能夠驗(yàn)證模型中5個(gè)因子的有效性。(4)利用鄒檢驗(yàn)和機(jī)器學(xué)習(xí)方法均能發(fā)現(xiàn)我國(guó)公司債券共同因子在2015年前后存在結(jié)構(gòu)變化,機(jī)器學(xué)習(xí)方法比鄒檢驗(yàn)可以發(fā)現(xiàn)更多因子結(jié)構(gòu)變化細(xì)節(jié)。(5)自適應(yīng)LASSO對(duì)因子變動(dòng)更為敏感,識(shí)別結(jié)構(gòu)能力更強(qiáng)。基于集成學(xué)習(xí)的隨機(jī)森林和XGBoost方法要比單純的決策樹算法好,在因子區(qū)分度上表現(xiàn)更明顯。本文的結(jié)果證實(shí)截面共同因子在公司債券信用溢價(jià)中的解釋作用以及機(jī)器學(xué)習(xí)方法在我國(guó)公司債券市場(chǎng)的實(shí)用性。
本文的發(fā)現(xiàn)具有較強(qiáng)的政策啟示:機(jī)器學(xué)習(xí)算法可以在傳統(tǒng)因子模型的基礎(chǔ)上提供更多的有效信息,因此,可利用機(jī)器學(xué)習(xí)算法建立風(fēng)險(xiǎn)預(yù)警。此外,在公司債券市場(chǎng)的市場(chǎng)制度和環(huán)境改變過程中,可以利用機(jī)器學(xué)習(xí)算法識(shí)別其對(duì)市場(chǎng)的影響,防范化解潛在的系統(tǒng)性風(fēng)險(xiǎn)。