鄭紅景,蔣夢夢,周 杰
西安電子科技大學(xué) 數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,西安710126
收益率和波動率是諸多經(jīng)濟(jì)和金融研究的重要方面。收益率反映了金融市場的價(jià)格波動,波動率則體現(xiàn)了價(jià)格波動的劇烈程度。收益率及其波動情況關(guān)系到證券組合的選擇和風(fēng)險(xiǎn)管理?,F(xiàn)實(shí)中一些國內(nèi)政策及隨機(jī)性事件,如宏觀調(diào)控、市場突發(fā)事件等都會對股票市場產(chǎn)生影響。目前對這些因素的研究主要有主成分分析、線性回歸分析等,但這些方法僅能處理低維數(shù)據(jù),尤其是線性回歸分析,只能分析特定因素對結(jié)果的影響,因此本文構(gòu)建了動態(tài)因子模型(DFM)。動態(tài)因子模型可以從數(shù)據(jù)集中提取少量公共因子,來反映其對股票收益率和波動率的影響。
從現(xiàn)實(shí)情形看,科學(xué)技術(shù)不斷發(fā)展,政府統(tǒng)計(jì)的數(shù)據(jù)也在增多,由此帶來了處理高維數(shù)據(jù)的難題。動態(tài)因子模型是傳統(tǒng)因子模型在時(shí)間序列方面的推廣與發(fā)展,擅長處理觀測時(shí)間點(diǎn)個(gè)數(shù)大于觀測變量個(gè)數(shù)的數(shù)據(jù)[1-2]。若觀測變量維數(shù)較高,且因子的影響有限,觀測方程的因子載荷矩陣往往是稀疏陣。目前為止動態(tài)因子模型的估計(jì)方法有三種,一是狀態(tài)空間和極大似然估計(jì)法[3],但它只能處理低維的動態(tài)因子模型。二是提取主成分法[4],三是主成分和狀態(tài)空間的混合估計(jì)法[5],后面兩者都不能得到稀疏的因子載荷矩陣。為解決以上問題,本文引入ERM(Expectation-Regularization-Maximization)算法[6],利用ERM可得到高維動態(tài)因子模型的稀疏參數(shù)估計(jì),而稀疏性也符合金融市場的實(shí)際情況。
將提出的模型及算法,應(yīng)用到深滬交所的股票數(shù)據(jù)中,發(fā)現(xiàn)了收益率模型和波動率模型中都包含共同因子和行業(yè)因子,本文也分析了這些因子的波動趨勢及其原因。此外,還引入因子貢獻(xiàn)率來對比兩種因子對行業(yè)股票的影響程度。
動態(tài)因子模型將n維可觀測變量yt描述成由幾個(gè)不可觀測的少量的公共因子xt和均值為0的特質(zhì)因子εt組成,其基本形式是:
其中,yt,εt∈Rn×1,動態(tài)因子的個(gè)數(shù)是q,所以xt,et∈Rq×1,t=1,2,…,T,滯后算子多項(xiàng)式矩陣λ(L)∈Rn×q,Ψ(L)∈Rq×q,L是滯后階數(shù),假定Q和R均為對角陣。這里已對yt進(jìn)行了標(biāo)準(zhǔn)化,去除截距項(xiàng)。
式(1)中模型在沒有任何約束的情況下是不可識別的,為使模型可識別[7-8],加入以下約束條件:
(1)本文假定因子載荷矩陣λ(L)的滯后階數(shù)為1階,并記為C,且限定C的前q-1行,當(dāng)i=1,2,…,q-1且j>i時(shí),Cij=0。
(2)Ψ(L)為單位陣。
此時(shí),模型可以簡寫為狀態(tài)空間模型[9]的形式:
其中, x1~N(μ0,Σ0)。
通過對因子載荷矩陣C的估計(jì),可以得到y(tǒng)t與隱含的公共因子xt的相關(guān)關(guān)系。若Cij≠0,代表在其他因素保持不變的前提下,股票的公共因子xt每增加一個(gè)單位,股票i的取值改變Cij個(gè)單位,若Cij=0,則此公共因子不影響股票i。
在模型中待估計(jì)的量為θ=(C,Q,R,μ0,Σ0),核心問題是因子載荷矩陣C的估計(jì)。通常可以通過極大似然估計(jì)來計(jì)算θ,但在高維情況下,矩陣C是稀疏的,狀態(tài)空間和極大似然估計(jì)法只能處理維度較低的模型,提取主成分法和主成分與狀態(tài)空間的混合法都無法將C中極小的數(shù)值壓縮為0。因此,本文采用帶懲罰的EM算法(ERM),即在EM算法中加入正則項(xiàng),以此得到矩陣C的稀疏估計(jì)。
ERM算法分三步:E步用卡爾曼濾波和光滑[10]來計(jì)算公共因子xt其統(tǒng)計(jì)量,并求出條件期望似然函數(shù);R步利用正則化,得到因子載荷矩陣C的稀疏估計(jì);M步極大化條件期望似然函數(shù),得到其余未知參數(shù)Q,R,μ0,Σ0的估計(jì),具體算法如下。
E步,動態(tài)因子模型的聯(lián)合似然函數(shù)為:
則其對數(shù)似然函數(shù)的條件期望為:
計(jì)算θr時(shí)用到的狀態(tài)變量及它的充分統(tǒng)計(jì)量有:
式(6)統(tǒng)計(jì)量可由卡爾曼濾波和光滑過程得到。
R步,利用自適應(yīng)lasso[11]、彈性網(wǎng)[12]和自適應(yīng)彈性網(wǎng)[13]實(shí)現(xiàn)正則化。
首先利用EM算法,通過最大化對數(shù)似然函數(shù)的條件期望來得到因子載荷矩陣C的不稀疏估計(jì)。即Ψ關(guān)于C求偏導(dǎo),有:
令式(7)等于0,C的極大似然估計(jì)為:
然后通過極小化損失函數(shù)加正則項(xiàng)的方法,用LARS算法實(shí)現(xiàn)自適應(yīng)lasso、彈性網(wǎng)和自適應(yīng)彈性網(wǎng)估計(jì),來得到稀疏的C。先將式(2a)寫成偽回歸形式,令:
這里 vec是拉直算子, ?表示Kronecker積。則偽回歸為:
最大化對數(shù)似然函數(shù)等價(jià)于極小化損失函數(shù),帶懲罰的損失函數(shù)為:其中,λ是一個(gè)調(diào)優(yōu)參數(shù),L(c)是正則項(xiàng)。自適應(yīng)lasso對應(yīng)的是,其中,彈性網(wǎng)對應(yīng)的是,自適應(yīng)彈性網(wǎng)對應(yīng)的是
用LARS算法求解式(10),得到c的估計(jì),然后將維數(shù)為nq×1的向量c變形為n×q維的矩陣C。隨著λ逐漸變大,C中的部分元素會逐漸被壓縮為0,當(dāng)λ足夠大時(shí),元素可能全部被縮小為0。因此,適當(dāng)?shù)卮_定調(diào)優(yōu)參數(shù)λ是很重要的,本文采用的評估依據(jù)是擴(kuò)展的貝葉斯信息準(zhǔn)則(EBIC)[14]。
M步,用E步的充分統(tǒng)計(jì)量和R步得到的Cr-1,對條件期望似然函數(shù)關(guān)于Q,R,μ0,Σ0分別求偏導(dǎo)數(shù),令偏導(dǎo)數(shù)等于0,得到這些參數(shù)的估計(jì):
本文共設(shè)定了三個(gè)仿真實(shí)驗(yàn),且采用三種不同的正則化方法實(shí)現(xiàn)估計(jì):
實(shí)驗(yàn)1 n=40,q=4,T=300,待估計(jì)的因子載荷矩陣C中元素有160個(gè),非0元素占比p分別為10%、20%、30%。
實(shí)驗(yàn)2 n=60,q=4,T=300,待估計(jì)的因子載荷矩陣C中元素有240個(gè),非0元素占比p分別也是10%、20%、30%。
實(shí)驗(yàn)3 n=60,q=4,T=500,待估計(jì)的因子載荷矩陣中C元素有240個(gè),非0元素占比p分別也是10%、20%、30%。
三個(gè)實(shí)驗(yàn)都設(shè)定Q=0.01?In×n,R=0.01?Iq×q。按照以上設(shè)計(jì),用100個(gè)不同的因子載荷矩陣隨機(jī)產(chǎn)生100組數(shù)據(jù),重復(fù)實(shí)驗(yàn)。為了評價(jià)ERM算法的性能,計(jì)算了因子載荷矩陣C的假陽率(FP)和假陰率(FN),計(jì)算方法為:
表1 實(shí)驗(yàn)1仿真結(jié)果(n=40,q=4,T=300)
表2 實(shí)驗(yàn)2仿真結(jié)果(n=60,q=4,T=300)
表3 實(shí)驗(yàn)3仿真結(jié)果(n=60,q=4,T=500)
(1)對比三種正則化方法,自適應(yīng)彈性網(wǎng)的效果優(yōu)于自適應(yīng)lasso和彈性網(wǎng)。
(2)對比表1和表2,在控制其他因素不變的前提下,當(dāng)待估計(jì)的元素個(gè)數(shù)逐漸增加時(shí),F(xiàn)P和FN都會略有增加。
(3)對比表2和表3,在控制其他因素不變的前提下,當(dāng)觀測時(shí)間點(diǎn)個(gè)數(shù)增加時(shí),F(xiàn)P和FN都有減少,這是因?yàn)楫?dāng)觀測數(shù)據(jù)增加時(shí),包含的信息也會越來越準(zhǔn)確。
本文隨機(jī)選取了深滬交所上市的120支股票(即A股)其中包含通信行業(yè)、制造業(yè)和互聯(lián)網(wǎng)行業(yè)各30支,其余30支為其他行業(yè)股票,數(shù)據(jù)為2018年1月2日到2018年12月28日(除節(jié)假日)的共242天的收盤價(jià)。
股票i的第t天收盤價(jià)為sit,對數(shù)收益率為yit=ln sitln si(t-1)。股票的歷史波動率[15]為由于n+1為股票價(jià)格時(shí)間區(qū)間,而本文計(jì)算的是日化波動率,則n=1,且對y已進(jìn)行標(biāo)準(zhǔn)化處理,故hit=|yit|,此時(shí)hit全為正數(shù),為使數(shù)據(jù)更好地服從正態(tài)分布,本文將收益率的平方取對數(shù)作為對數(shù)波動率git=。
在模型估計(jì)時(shí),首先要確定公共因子個(gè)數(shù),常用的方法有陡坡圖法[16]和IC信息準(zhǔn)則法[17]等,但當(dāng)因子相關(guān)性較高時(shí)陡坡圖法會造成重復(fù)。除此之外,由于因子載荷矩陣的稀疏性,經(jīng)IC信息準(zhǔn)則法估計(jì)出的因子載荷矩陣的某一列可能全部為0,不符合所確定的因子個(gè)數(shù),因此也不適用。為解決以上問題本文提出一種新的方法:預(yù)先給定不同的因子個(gè)數(shù),根據(jù)估計(jì)的稀疏的因子載荷矩陣,直接得到公共因子的實(shí)際個(gè)數(shù)及實(shí)際的因子載荷矩陣。
先假定因子個(gè)數(shù)分別為q=5,8,9,由此得到了股票收益率模型的參數(shù)估計(jì)。雖然q個(gè)數(shù)不同,但因子載荷矩陣C中都只有3列元素有非0元素,且其對應(yīng)元素位置和大小相似,因此實(shí)際上公共因子個(gè)數(shù)為3。此外因子載荷矩陣中元素絕大部分為正數(shù),可知公共因子與大部分股票收益率呈正相關(guān),即因子向上波動時(shí)對收益率有積極影響,反之有消極影響。
5.1.1 通信因子
由于因子載荷矩陣的稀疏性,表4列出的是因子載荷矩陣的第1列中前12支非0元素(按絕對值大小排序)及其對應(yīng)的股票和所屬行業(yè)。
從表4可知這些股票大部分屬于通信行業(yè),因此可將該公共因子歸結(jié)為通信因子。通信因子隨時(shí)間變化的線圖,如圖1。
圖1 通信因子隨時(shí)間變化線圖(收益率模型)
分析圖1,發(fā)現(xiàn)通信因子在年初、7到8月有小幅度的向上波動,5月因子也有明顯的向上波動。
結(jié)合政策因素分析,發(fā)現(xiàn)在通信行業(yè),2月份發(fā)改委通知5G規(guī)模組網(wǎng)建設(shè)工作逐步展開,5月底,5G已經(jīng)完成第一階段全功能標(biāo)準(zhǔn)化工作,進(jìn)入了沖刺新階段,7月到8月底,5G技術(shù)研發(fā)實(shí)驗(yàn)第三階段逐步完成。由此說明了此因子與5G技術(shù)的研發(fā)有關(guān)。
5.1.2 共同因子
因子載荷矩陣的第2列元素大部分非0,表5列出的是前20個(gè)(按絕對值大小排序)的非0元素及其對應(yīng)的股票和所屬行業(yè)。
由表5可知此公共因子對應(yīng)的因子載荷矩陣中元素大部分非0,即對大部分股票都有影響,因此可稱其共同因子。共同因子隨時(shí)間變化的線圖,如圖2。
圖2 共同因子隨時(shí)間變換線圖(收益率模型)
由圖2可知共同因子在年初、3月下旬、6月15日左右、10月中旬都出現(xiàn)了明顯的向下波動,而10月下旬出現(xiàn)了向上波動的趨勢,其余時(shí)刻處于相對平穩(wěn)狀態(tài)。
究其原因,3月份美國推出多項(xiàng)針對中國的貿(mào)易措施,導(dǎo)致A股大幅下跌。6月份美國再度加息,同時(shí)對華貿(mào)易爭端升級,對國內(nèi)股市影響加大。而10月底,面對A股滬指的弱勢,央行、銀保監(jiān)會全力維穩(wěn)市場,同時(shí)也推出各項(xiàng)改革政策致力于穩(wěn)定我國股票市場。
表4 通信因子影響的股票(收益率模型)
5.1.3 制造因子
表6是因子載荷矩陣的第4列中前12支非0元素(按絕對值大小排序)及其對應(yīng)的股票和所屬行業(yè)。
從表6可以看出,這些股票大多是制造業(yè),故將此公共因子歸為制造因子。制造因子隨時(shí)間變化線圖,如圖3所示。
圖3 制造因子隨時(shí)間變換線圖(收益率模型)
由圖3知,制造因子在6月中下旬有明顯向下波動的現(xiàn)象,而在10月下旬到11月初因子向上波動。結(jié)合當(dāng)前形勢,這與中美貿(mào)易戰(zhàn)爭有關(guān)。6月份,美國加大了中國出口貨物的稅率。但在10月份,我國深入實(shí)施推進(jìn)制造業(yè)建設(shè)解決深層次矛盾,對制造業(yè)產(chǎn)生了積極影響。
與收益率模型一樣,也假定因子個(gè)數(shù)分別為q=5,8,9,由此得到了股票波動率模型的參數(shù)估計(jì),所有因子載荷矩陣C中都只有2列元素有非0元素,且其對應(yīng)元素位置和大小相似,因此實(shí)際上公共因子個(gè)數(shù)為2。且因子載荷矩陣中元素絕大部分為正數(shù),可知公共因子與大部分股票波動率呈正相關(guān)。
5.2.1 共同因子
因子載荷矩陣的第1列元素大部分非0,表7列出的是前20個(gè)的非0元素(按絕對值大小排序)及其對應(yīng)的股票和所屬行業(yè)。
由表7可知此公共因子影響全國大部分股票,故稱其為共同因子。共同因子隨時(shí)間變化的線圖,如圖4。
表5 共同因子影響的股票(收益率模型)
表6 制造因子影響的股票(收益率模型)
表7 共同因子影響的股票(波動率模型)
圖4 共同因子隨時(shí)間變換線圖(波動率模型)
由圖4可知共同因子在1月下旬、5月底、10月中下旬都出現(xiàn)了明顯向下波動,其余時(shí)刻波動相對較小。
從政策方面看,1月金融監(jiān)管政策密集出臺,貨幣政策也致力于維持流動性穩(wěn)定,5月中美貿(mào)易關(guān)系日趨緊張,美國以貿(mào)易戰(zhàn)為突破口實(shí)施對華遏制戰(zhàn)略,旨在打擊我國對外貿(mào)易,10月份外圍氛圍爭端持續(xù)升級,國內(nèi)經(jīng)濟(jì)增長已然持續(xù)承壓。由此可見,中美貿(mào)易戰(zhàn)爭對我國金融市場產(chǎn)生了很多負(fù)面影響。
5.2.2 互聯(lián)網(wǎng)因子
表8是因子載荷矩陣的第3列中前12支非0元素(按絕對值大小排序)及其對應(yīng)的股票和所屬行業(yè)。
表8中股票大多為互聯(lián)網(wǎng)行業(yè),可將此公共因子歸為互聯(lián)網(wǎng)因子。互聯(lián)網(wǎng)因子隨時(shí)間變化的線圖,如圖5。
圖5可以看出,互聯(lián)網(wǎng)因子在2018年大多數(shù)時(shí)間都是呈現(xiàn)向上的波動,這與2018年人工智能領(lǐng)域的快速發(fā)展有關(guān)。因子在8月7日和11月中下旬有兩次明顯的波峰,這應(yīng)該是與國家政策有關(guān),8月有20多個(gè)省市發(fā)布相關(guān)文件和扶持政策,10月31日中共中央政治局進(jìn)行的集體學(xué)習(xí)中,習(xí)總書記強(qiáng)調(diào)了人工智能發(fā)展的重要性。
圖5 互聯(lián)網(wǎng)因子隨時(shí)間變換線圖(波動率模型)
5.3.1 公共因子類型異同
分析兩個(gè)模型的兩個(gè)共同因子,發(fā)現(xiàn)兩者波峰和波谷出現(xiàn)的時(shí)間和原因有相似之處,這是因?yàn)閲鴥?nèi)金融市場的重大事件如中美貿(mào)易爭端和政府出臺的政策措施,對兩者均有影響。但其他因子只對二者之一產(chǎn)生影響,如在收益率模型中的通信因子只對通信行業(yè)的收益率產(chǎn)生了影響;而波動率模型中的互聯(lián)網(wǎng)因子只對互聯(lián)網(wǎng)領(lǐng)域的波動率有影響。
5.3.2 模型中各公共因子的貢獻(xiàn)率
由于共同因子影響大部分股票,而行業(yè)因子只影響某行業(yè)股票,為研究兩種因子對行業(yè)股票的影響程度,本文進(jìn)一步利用方差分解的方法進(jìn)行度量。基本原理是:計(jì)算每個(gè)行業(yè)因子和共同因子的方差vi占總方差的比例作為因子的貢獻(xiàn)率,即。具體結(jié)果見表9。
由表9可知,在收益率模型的通信行業(yè)和制造業(yè),共同因子的貢獻(xiàn)率比行業(yè)因子的貢獻(xiàn)率略大,說明共同因子對股票收益率的影響要大于行業(yè)因子。但在波動率模型中互聯(lián)網(wǎng)行業(yè)的行業(yè)因子貢獻(xiàn)率要遠(yuǎn)大于共同因子,也就是說股票波動率受行業(yè)因子的影響更大。
本文基于高維動態(tài)因子模型,建立了金融市場的收益率和波動率模型,引入ERM算法得到了稀疏的參數(shù)估計(jì)。通過對滬深交所股票市場的分析,兩個(gè)模型中都有一個(gè)因子影響大部分股票,為共同因子,而其他因子是只對部分行業(yè)股票有影響的行業(yè)因子。本文分析了這些因子產(chǎn)生波動趨勢,并給出了可能的解釋,此外,通過計(jì)算因子貢獻(xiàn)率,發(fā)現(xiàn)通信行業(yè)和制造業(yè)股票的收益率更易受共同因子的影響,而互聯(lián)網(wǎng)行業(yè)股票的波動率更易受行業(yè)因子的影響,這些發(fā)現(xiàn)為研究金融市場的收益與風(fēng)險(xiǎn)提供了新的視角。以上研究是對金融市場動態(tài)因子模型的初步探討,也可從其他方面進(jìn)行研究,如分層動態(tài)因子模型,這些研究對理解金融市場的影響因素也有重要的意義。
表8 互聯(lián)網(wǎng)因子影響的股票(波動率模型)
表9 各因子方差及貢獻(xiàn)率