魯萬波,張 萌,鄭天照
(1.西南財經(jīng)大學 a.管理與工程學院,b.統(tǒng)計學院,四川 成都 611130;2.度小滿科技(北京)有限公司 風險管理部,北京 100089)
隨著現(xiàn)代社會信息化的發(fā)展,信息傳遞的方式發(fā)生了巨大的變化,以前多是通過報紙、廣播以及電視等獲取信息,但如今獲取與傳遞信息的方式主要依賴于互聯(lián)網(wǎng)。很多金融網(wǎng)站也專門為股市投資者提供了交流互動的股吧平臺,產(chǎn)生的海量評論所包含的信息在一定程度上反映著投資者的心理和行為。
行為金融理論認為非理性股市投資者的心理和行為會對股票市場的價格走勢產(chǎn)生影響,而且目前學術(shù)界已經(jīng)有很多學者研究股評等文本信息對股票市場的影響。然而還沒有學者研究股評信息對于股票市場下行風險的影響,股票下行風險發(fā)生的概率雖然很小,但產(chǎn)生的后果非常嚴重,于是本文探索性進行了股票評論信息與股票市場下行風險影響和預測能力的實證分析,一定程度上彌補了該領(lǐng)域研究的不足。
本文的主要貢獻體現(xiàn)在三個方面:第一,利用文本情感分析技術(shù)充分挖掘了東方財富網(wǎng)股吧評論數(shù)據(jù),探索性進行了股評信息與股票市場下行風險影響和預測能力的實證分析;第二,選擇基于情感詞典的無監(jiān)督學習的文本分類方法,并且構(gòu)建特定金融領(lǐng)域的情感詞典,提高了基于情感詞典的文本分類方法在股評上的文本分類準確度;第三,從反映投資者關(guān)注度的角度、反映投資者對于股市走向情感預期的角度以及從反映投資者情感預期傳播程度的角度構(gòu)建了較為完善的投資者情緒指標體系。
近年來,越來越多的學者通過挖掘股評等文本的情感傾向,研究投資者情緒對股票市場的影響。挖掘股評等文本的情感傾向涉及文本情感分析技術(shù),目前在互聯(lián)網(wǎng)數(shù)據(jù)呈爆炸性增長的背景下,文本情感分析技術(shù)已經(jīng)得到了蓬勃發(fā)展。
文本情感分類的算法主要有兩種,第一種是基于情感詞典的分類算法,在進行文本分類時,根據(jù)詞典設(shè)計一定規(guī)則組合來完成對句子情感極性的判斷。Ohana和Tierney提出將SentiWordNet詞典應(yīng)用于電影評論的情感分類,通過對正負情感詞得分計數(shù)來確定情感傾向[1]。Qiu等根據(jù)語法和共現(xiàn)模式提取了語料庫的意見詞匯,并基于此對產(chǎn)品評論信息進行情感分類[2]。明均仁研究并設(shè)計了一種融合語義關(guān)聯(lián)挖掘的文本情感分析算法,實現(xiàn)語義層面的情感分析與用戶情感知識挖掘[3]。在領(lǐng)域情感詞典構(gòu)建方面,鐘敏娟等構(gòu)建了音樂領(lǐng)域情感詞典[4]。唐曉波和蘭玉婷構(gòu)建了手機評論的領(lǐng)域情感詞典以及微博表情符號詞典[5]。郁圣衛(wèi)等構(gòu)建了電商領(lǐng)域的情感詞典[6]。姚加權(quán)等通過詞典重組和深度學習算法構(gòu)建了適用于正式文本與非正式文本的金融領(lǐng)域中文情緒詞典,并基于詞典構(gòu)建了上市公司的年報語調(diào)和社交媒體情緒指標[7]。第二種是基于機器學習的分類算法,即通過對已經(jīng)標注好的訓練文本進行分類學習,使其能夠應(yīng)用于新文本分類預測的一種有監(jiān)督學習算法。Pang等首次將SVM和貝葉斯分類應(yīng)用到情感分析中[8]。Zhang等提出了一種門控循環(huán)神經(jīng)網(wǎng)絡(luò),能夠考慮上下文之間的交互關(guān)系,從而使得文本分類效果得到顯著提升[9]。王剛等通過對經(jīng)典情感分析數(shù)據(jù)集進行試驗,提出了一種比其他半監(jiān)督學習方法效果都好的改進方法[10]。
在投資者情緒對于股票市場影響研究方面,Corredor等研究發(fā)現(xiàn)投資者情感對股票市場影響顯著[11]。Porshnev等提取股評情感利用神經(jīng)網(wǎng)絡(luò)與遺傳算法對道瓊斯工業(yè)指數(shù)進行了預測[12]。陳曉紅等考察了投資者情緒與股票市場指數(shù)的相關(guān)性及預測能力,結(jié)果表明情緒指數(shù)對股票價格有預測作用[13]。張寧等研究發(fā)現(xiàn)基于文本挖掘構(gòu)建的BSI指標與上證綜指的價格和收益顯著相關(guān)[14]。趙明清和武圣強結(jié)合百度指數(shù)構(gòu)建了基于微博情感分析的股市加權(quán)預測模型,結(jié)果表明微博情感綜合傾向與股票價格變化情形幾乎一致且預測準確率較高[15]。程蕭瀟通過VAR模型探討新聞熱度、新聞情感和社交媒體熱度對股指收益率的效應(yīng)及影響機制,研究新聞情感和社交媒體熱度對股指收益率產(chǎn)生顯著影響,而新聞熱度卻對股指收益率不產(chǎn)生顯著影響[16]。歐陽資生和李虹宣系統(tǒng)性梳理了國內(nèi)外學者從理論和實證分析等方面對網(wǎng)絡(luò)輿情對金融市場影響的研究[17]。黃創(chuàng)霞等使用情感分析技術(shù),提出了一種改進的個體投資者情緒度量的情感傾向點互信息算法,運用格蘭杰因果檢驗方法研究了個體投資者情緒與市場收益率和成交量的互動關(guān)系[18]。姜富偉等研究發(fā)現(xiàn)媒體文本情緒可以更準確地衡量中國股市投資者情緒的變化,對中國股票回報有顯著的樣本內(nèi)和樣本外預測能力[19]。
股票市場下行風險是指股價未來會發(fā)生下跌,并且下跌的程度會超出分析師或者投資者預期的風險。史永東和楊瑞杰選取2007—2016年中國A股上市公司股票為樣本,研究了不同信息對股價下行風險的影響,構(gòu)造股價下行風險度量指標——收益率分布的負偏度系數(shù)和收益率上升、下降階段的波動率之比考察了過度自信和損失厭惡兩種不同的投資者行為是否會影響信息與股價下行風險之間的關(guān)系[20]。Yamai和Yoshiba對風險測度指標VaR和ES的優(yōu)缺點進行了全面的比較[21-24]。VaR和ES雖然各有優(yōu)缺點,但是VaR測度被廣泛使用且其回測方法較為成熟,而ES的回測方法并不成熟且不被公認。對于VaR的度量,Ergün和Jun研究發(fā)現(xiàn)基于GARCH和極值理論(EVT)的模型能夠更好地預測標普500指數(shù)的VaR[25]。呂永健和王鵬基于包括GAST在內(nèi)的多種分布建立原油市場下行風險預測模型,得出GAST分布計算的VaR測度最精確的結(jié)論[26]。
綜上所述,越來越多的機器學習算法被應(yīng)用到文本情感分類的領(lǐng)域中,但是考慮到該方法需要大量已經(jīng)標注好的數(shù)據(jù),所以本文選擇了使用基于情感詞典的無監(jiān)督文本分類方法。雖然已經(jīng)有很多學者研究股票評論的情感傾向和股票市場之間的關(guān)系,但是鮮有學者研究股票評論與股票市場下行風險之間的影響關(guān)系以及股票評論對股票市場下行風險的預測能力,同時鑒于VaR測度的回測方法較為成熟,本文以VaR來測度股市下行風險。和以往研究相比,本文利用文本情感分析技術(shù)充分挖掘東方財富網(wǎng)股吧評論數(shù)據(jù),使用基于情感詞典的無監(jiān)督學習的文本分類方法構(gòu)建了特定金融領(lǐng)域的情感詞典和相應(yīng)的投資者情緒指標,并探索性地研究了股市評論對股票市場下行風險的影響關(guān)系以及預測能力,具有較高的應(yīng)用價值。
本文選取東方財富網(wǎng)股吧平臺上證指數(shù)吧的評論數(shù)據(jù),時間范圍是2018年7月2日至2020年6月30日,共抓取917 911條數(shù)據(jù),獲取的評論信息包含每條評論的時間、內(nèi)容以及閱讀量,例如,發(fā)布時間:2020-03-09,評論內(nèi)容:買了就跌,閱讀量:201。上證指數(shù)吧較為活躍,平均每天有近2 000條評論,能夠在一定程度上反映投資者的情感信息。
目前也已經(jīng)有較多的學者使用東方財富網(wǎng)的股吧評論數(shù)據(jù)來研究其與股市的影響關(guān)系。部慧等基于東方財富網(wǎng)股吧評論提出融合股評看漲看跌預期和投資者關(guān)注程度的投資者情緒度量指標,探討投資者情緒對中國股票市場的影響[27]。尹海員和吳興穎挖掘東方財富網(wǎng)股吧評論,構(gòu)建了投資者日度情緒指標并探討其對股票流動性的影響[28]。
通用基礎(chǔ)情感詞典在對特定領(lǐng)域文本進行情感分類時存在不足,于是在通用情感詞典的基礎(chǔ)上構(gòu)建了金融領(lǐng)域的情感詞典。所構(gòu)建的詞典組成結(jié)構(gòu)如圖1所示。
圖1 詞典的組成結(jié)構(gòu)
1.N-GRAM算法構(gòu)造新詞詞典
文本分詞效果對于自然語言處理非常重要,本文使用Python的jieba庫進行分詞,但是在處理特定領(lǐng)域文本時,因詞庫無法識別部分未登錄詞,便會對后續(xù)產(chǎn)生持續(xù)影響。本文采用N-GRAM算法進行新詞發(fā)現(xiàn),首先將字符組合分為1-k元組,同時考慮字符組合左右鄰字豐富程度和內(nèi)部凝聚度,構(gòu)造了一個統(tǒng)計量來衡量一個字符組合成詞的可能性大小:
score=AMI+L(W)
(1)
其中:
(2)
Entropy(w)=-∑wn∈WNeighborP(wn|w)log2P(wn|w)
(3)
(4)
LE、RE為候選詞左右信息熵,W表示字符組合,sigma是一個非常小的非0正數(shù),Entropy(w)為信息熵計算公式,WNeighbor為字符組合左/右鄰字的集合,c1,c2,…,cn表示字符組合包含的所有單個字符。
根據(jù)該統(tǒng)計量來判斷股評語料庫中最有可能成詞的字符組合,過濾jieba庫分詞詞典包含的候選詞,再通過人工判斷,生成特定領(lǐng)域的新詞分詞詞典,最終得到1 402個新詞。
2.基礎(chǔ)情感詞典構(gòu)建
本文將知網(wǎng)Hownet情感詞典、臺灣大學NTUSD簡體中文情感詞典和清華大學李軍褒貶義詞典進行合并去重,從而得到綜合后的基礎(chǔ)情感詞典,包含27 169個詞,其中積極情感詞11 879個,消極情感詞15 290個。
3.擴展基礎(chǔ)情感詞典
本文使用PMI算法對情感詞典擴展來構(gòu)建領(lǐng)域情感詞典,該方法認為如果一個詞語和帶有情感傾向的詞語相關(guān)性越大,那么該詞語就越有可能帶有相同的情感極性,這里用點互信息來代表詞語之間的相關(guān)性。
點互信息(PMI)的計算公式如下:
(5)
其中,word1和word2表示兩個詞匯,P(word1&word2)表示兩個詞匯在股票評論文本中同時出現(xiàn)的概率,P(word1)表示word1在股票評論文本中出現(xiàn)的概率,P(word2)表示word2在股票評論文本中出現(xiàn)的概率。
為了提高詞語極性判斷的可靠性,需要選擇一組積極情感種子詞匯(Pwords)和一組消極情感種子詞匯(Nwords)作為基準詞,然后把積極情感種子詞匯和消極情感種子詞匯與詞語之間的點間互信息之和進行作差,最后利用這個差值來衡量詞語的情感傾向。計算公式如下:
SO-PMI(word)=∑Pword∈PwordsPMI(word,Pword)-∑Nword∈NwordsPMI(word,Nword)
(6)
其中,word為待判斷詞性的詞匯,Pword是積極情感詞,Nword是消極情感詞。
最終擴展的情感詞包含股票領(lǐng)域的情感詞以及基礎(chǔ)情感詞典中沒有涵蓋的情感詞共有1 058個,其中新增積極情感詞有429個,新增消極情感詞有629個。
4.輔助情感詞典的構(gòu)建
本文所使用的停用詞詞典是對哈爾濱工業(yè)大學停用詞表、百度停用詞表和四川大學機器智能實驗室停用詞庫合并去重得到的,共有2 130個。在知網(wǎng)程度副詞詞典的基礎(chǔ)上,本文又添加了一些自行整理的程度副詞從而構(gòu)建了程度副詞詞典,根據(jù)詞語的程度分為6個級別,分別是最、很、較、稍、欠和超,個數(shù)分別為69、42、36、13、29和33。所使用的否定詞典是本文自行整理的否定詞,共87個。
一條股評包含多個分句,股評的情感應(yīng)該由這些分句共同決定。股評文本情感傾向值計算的思路是:首先對股票評論文本分句,分別對每一個分句計算情感傾向值;然后將分句情感傾向分數(shù)進行簡單平均,如果分數(shù)大于0說明股評的情感傾向是積極的,分數(shù)等于0說明股評的情感傾向是中性的,分數(shù)小于0說明股評的情感傾向是消極的。
對于分句的情感傾向計算,首先,依次搜索分句中的情感詞,記錄是積極情感詞還是消極情感詞,如果是積極情感詞則對該詞打分為1,如果是消極情感詞則對該詞打分為-1;其次,搜索當前情感詞和前一個情感詞之間的程度副詞和否定詞,計算并且判斷否定詞個數(shù)是奇數(shù)還是偶數(shù),如果是奇數(shù),當前情感詞的分數(shù)乘以-1,反之不變化,如果存在程度副詞,則根據(jù)程度副詞的級別對情感詞得分進行加權(quán);最后,將該分句所出現(xiàn)的所有情感詞的分數(shù)進行求和并作為該分句的情感傾向分數(shù)。
股評信息主要反映投資者對股票市場的關(guān)注度和對股票市場的情感傾向,因此本文構(gòu)建了關(guān)注度指標、情感傾向指標以及關(guān)注度和情感傾向相結(jié)合的指標。
關(guān)注度指標反映的是投資者對于股票市場的參與熱情,具體指標為每日每條評論的平均閱讀量。
投資者的情感傾向指標反映的是投資者對于股票后續(xù)漲跌的預期,具體指標分別是每日正向評論比例、每日負向評論比例、每日中性評論比例以及投資者一致性指數(shù),其中投資者一致性指數(shù)的計算公式是:
(7)
其中,xi是第i天的投資者分歧指數(shù),Npi是第i天積極情感傾向評論的個數(shù),Nni是第i天消極情感傾向評論的個數(shù)。
關(guān)注度和情感傾向相結(jié)合的指標反映了投資者情感預期傳播程度,具體指標分別是每日正向評論閱讀量的比例、每日中性評論閱讀量的比例、每日負向評論閱讀量的比例。
1.股票交易數(shù)據(jù)的選取與處理
本文選擇上證指數(shù)來綜合反映股市的價格變動,并且從CSMAR數(shù)據(jù)庫下載了2018年7月2日至2020年6月30日的交易數(shù)據(jù),數(shù)據(jù)量為485個。
上證指數(shù)的日收益率的計算公式如下:
(8)
其中,P_closet表示第t日的收盤價,P_opent表示第t日的開盤價。
2.建立ARMA-GARCH模型
對上證指數(shù)收益率建立ARMA-GARCH模型,通過選取不同的階數(shù)反復建模,綜合考慮AIC、BIC和SIC原則,最終確定的模型是ARMA(4,5)-GARCH(1,1)模型。其中,mu是ARMA模型的常數(shù)項,ar1~ar4是AR模型的變量,ma1~ma5是MA模型的變量,omega、alpha和beta1是GARCH模型的變量,r為ARMA-GARCH模型的標準化殘差。
根據(jù)表1可知,本文構(gòu)建的ARMA-GARCH模型除omega以外的參數(shù)都是顯著的,標準化殘差序列及其平方進行Ljung-Box檢驗,在階數(shù)分別為10、15和20時,得到的P值均遠大于顯著性水平0.05,則可以認為模型的標準化殘差序列及其平方均無自相關(guān),說明本文構(gòu)建的均值方程以及方差方程是充分的。
擬合的ARMA(4,5)-GARCH(1,1)模型為:
表1 上證指數(shù)收益率ARMA(4,5)-GARCH(1,1)模型估計及診斷結(jié)果
rt=0.002 3-0.454 4rt-1+0.459 0rt-2-0.536 8rt-3-0.843 6rt-4+0.314 0at-1-0.431 7at-2+
0.823 5at-3+0.788 0at-4-0.121 8at-5
(9)
at=σtεt
(10)
(11)
其中,假設(shè)εt服從標準正態(tài)分布。
3.VaR的計算與回測檢驗
根據(jù)上證指數(shù)收益率擬合的均值方程和方差方程,把均值方程和方差方程t時刻的擬合值,分別作為t時刻收益率假定分布的均值和標準差,然后利用VaR的計算公式,分別計算出在99%、95%、90%的顯著性水平下上證指數(shù)收益率各個時刻VaR。
表2 樣本內(nèi)數(shù)據(jù)回測檢驗結(jié)果
下面對擬合出來的VaR進行Kupiec檢驗,結(jié)果見表2。由表2可知,擬合出來的VaR在99%、95%和90%的置信水平下,檢驗統(tǒng)計量的P值都大于顯著性水平5%,則應(yīng)該認為建立的模型是有效的。
1.平穩(wěn)性檢驗
表3是本文所構(gòu)建的投資者情緒指標體系。
本文在使用VAR模型檢驗變量之間的相互影響關(guān)系之前,需要檢驗每一個投資者情緒指標和股票市場下行風險(本章節(jié)以95%置信水平的VaR為例)的平穩(wěn)性,各變量的ADF平穩(wěn)性檢驗結(jié)果如表4。根據(jù)表4結(jié)果可知,在5%的顯著性水平下,投資者情緒指標體系和95%置信水平下的VaR都是平穩(wěn)的時間序列,說明可以對這些變量進行格蘭杰因果檢驗。
表3 投資者情緒指標體系
表4 變量的平穩(wěn)性檢驗結(jié)果
2.格蘭杰因果檢驗
本文分別構(gòu)建了每一個投資者情緒指標與上證綜合指數(shù)95%置信水平VaR的VAR模型來研究其與上證指數(shù)95%置信水平VaR的影響關(guān)系。VAR模型滯后階數(shù)的選擇綜合考慮了AIC、HQ、SC、FPE這4項評判標準,然后確定大小適中的滯后階數(shù),這樣既可以體現(xiàn)模型的動態(tài)特征也不會導致模型的自由度過小。為了確定變量之間的因果關(guān)系,對構(gòu)建的每一個模型進行了格蘭杰因果檢驗,表5是格蘭杰因果檢驗的結(jié)果。
表5 投資者情緒特征對VaR的格蘭杰因果關(guān)系檢驗結(jié)果
根據(jù)表5可知,在5%的顯著性水平下,除了neuredrat(每日中性評論閱讀量的比例)以外的所有投資者情緒指標都是上證指數(shù)VaR的格蘭杰原因,但是反之均不成立。
3.VAR模型診斷
根據(jù)格蘭杰因果檢驗的結(jié)果可知,除了neuredrat(每日中性評論閱讀量的比例)以外的所有投資者情緒指標和股票市場的下行風險之間存在單向因果關(guān)系,接下來對每一個VAR模型進行了回歸方程的顯著性檢驗,并且對模型進行了系統(tǒng)平穩(wěn)性檢驗。模型回歸結(jié)果如表6、7和8所示。
根據(jù)回歸方程顯著性檢驗結(jié)果可知,本文所構(gòu)建的VAR模型涉及的回歸方程的顯著性檢驗P值都小于0.01,說明在1%的顯著性水平下,回歸方程是顯著的。
表6 VAR模型的估計及檢驗結(jié)果一
模型系統(tǒng)穩(wěn)定性檢驗的結(jié)果見圖2,該圖形的橫軸是時間,縱軸是殘差累計和,如果殘差累計和超出圖中的兩條臨界線,說明系統(tǒng)是不穩(wěn)定的。根據(jù)上述檢驗結(jié)果可知,模型都是系統(tǒng)穩(wěn)定的。
對于投資者情緒指標對股票市場下行風險的影響關(guān)系,avgred(每日每條評論的平均閱讀量)反映的是投資者對于股市的關(guān)注程度,關(guān)注程度增高,很有可能導致市場波動加劇,從而會導致下行風險增加,posrat(每日正向評論比例)和negrat(每日負性評論比例)代表了廣大投資者對于股市行情的漲跌預期,posrat和negrat的增多可能會加劇股市行情的變化,從而導致下行風險的增加,neurat(每日中性評論比例)反映的是廣大投資者對于股票市場行情的看平預期,icidx(投資者一致性指數(shù))反映的是廣大投資者對于股市行情漲跌預期的平衡程度,neurat和icidx的增加反映到市場上可能會導致股票市場行情的波動更小,從而導致下行風險的下降,posredrat(每日正向評論閱讀量的比例)和negredrat(每日負向評論閱讀量的比例)反映的是投資者看漲看跌預期的情感傳播程度,由于情緒的傳染性可能會出現(xiàn)posredrat和negredrat的增加導致股市行情的波動增加及股市的下行風險增加。
表7 VAR模型的估計及檢驗結(jié)果二
4.脈沖響應(yīng)分析
圖3是所建立的每一個模型的脈沖響應(yīng)函數(shù)圖,可以看出avgred(每日每條評論的平均閱讀量)的沖擊對于VaR的影響整體是正向的,這種影響在第一期的時候影響最大,后續(xù)波動幾期之后開始逐漸收斂;posrat(每日正向評論比例)的沖擊對VaR的影響整體上是正向的;neurat(每日中性評論比例)的沖擊對于VaR的影響是負向的,這種影響在第2期的時候影響達到最大,持續(xù)7期左右,影響開始逐漸消失;negrat(每日負向評論比例)的沖擊對于VaR的影響是正向的,這種影響在第4期達到最大,之后隨著時間的推移影響逐漸減小,最終收斂為0;icidx(投資者一致性指數(shù))的沖擊對于VaR的影響整體上是負向的;posredrat(每日正向評論閱讀量的比例)的沖擊對于VaR的影響整體上是正向的,這種影響在第2期達到最大,之后持續(xù)幾期之后逐漸收斂為0;negredrat(每日負向評論閱讀量的比例)的沖擊對于VaR的影響是正向的,這種影響在第3期達到最大,之后逐漸減弱,最終收斂為0??傮w來看投資者情緒指標對于股票市場下行風險的影響具有滯后效應(yīng),持續(xù)時間大概在兩周左右,并且脈沖響應(yīng)圖反映的影響關(guān)系符合預期。
表8 VAR模型的估計及檢驗結(jié)果三
圖2 系統(tǒng)穩(wěn)定性檢驗
圖3 脈沖響應(yīng)圖
上述研究結(jié)果表明,本文基于東方財富網(wǎng)構(gòu)建的情緒指標對于股票市場的下行風險是有影響的,接下來進一步研究投資者情緒指標對股票市場下行風險的預測能力。
1.預測的實證分析
因為VaR的真實數(shù)值是不可知的,但是能夠獲得VaR的擬合值,所以利用機器學習模型基于投資者情緒指標對樣本期內(nèi)擬合的VaR進行訓練,預測樣本期外的VaR,并使用VaR的評估指標來評估模型預測效果。
比較不同模型VaR的預測效果,分位數(shù)損失(QL)是最常見的選擇之一[29]。給定置信水平為1-α的分位數(shù)損失定義為:
QLt+1(α)=(α-dt(α))(yt-VaRt(α))
(12)
其中,dt(α)=1(yt-VaRt(α)),VaRt(α)表示置信水平為1-α的樣本期外第t期的VaR預測值。
對于A、B兩個模型之間的比較,如果QLA/QLB<1,則模型A優(yōu)于模型B,反之亦然。
為了評估投資者情緒指標對于股票市場下行風險VaR的預測能力,本文需要將上證指數(shù)收益率數(shù)據(jù)劃分為樣本期內(nèi)數(shù)據(jù)和樣本期外數(shù)據(jù),為了更好地體現(xiàn)樣本期外預測效果的差異,本文選擇的樣本期外數(shù)據(jù)約占總數(shù)據(jù)的1/4,劃分的樣本內(nèi)數(shù)據(jù)的時間范圍為2018年7月2日至2019年12月26日共365個數(shù)據(jù),樣本期外數(shù)據(jù)的時間范圍為2019年12月27日至2020年6月30日共120個數(shù)據(jù)。
由于VaR不是真實發(fā)生的,只有擬合值,所以在研究投資者情緒對上證指數(shù)VaR的預測能力時,不能直接使用全樣本數(shù)據(jù)擬合的VaR作為因變量,并對其劃分樣本期內(nèi)和樣本期外數(shù)據(jù),然后利用投資者情緒、收益率以及VaR的滯后項去預測VaR。如此設(shè)計,預測時便利用了未來數(shù)據(jù)的信息,即VaR的滯后項也是由全樣本數(shù)據(jù)擬合得到的,會導致結(jié)果不夠嚴謹。
因此,本文使用固定窗口為365來滾動擬合VaR,每次獲得365個VaR擬合值,接著訓練一個機器學習模型,并且去預測下一個時刻的VaR,這樣可以依次獲得120組長度為365的VaR擬合值,同時可以依次獲得120個VaR預測值。最后比較實驗組和對照組的預測效果,就可以判斷投資者情緒指標對于VaR的預測能力。
本文使用了LightGBM模型,對95%置信水平下的VaR進行預測,具體步驟如下:
第一步:實驗組和對照組的設(shè)定
實驗組的模型輸入特征包括除neuredrat以外的所有投資者情緒指標的滯后項(1~3階)以及上證指數(shù)收益率和下行風險的滯后項(1~3階),對照組的模型輸入特征只使用收益率和下行風險的滯后項(1~3階),目的是通過比較兩組的預測效果來驗證投資者情緒對于下行風險VaR的預測能力。
第二步:進行特征選擇和模型參數(shù)的設(shè)定
在滾動擬合并且利用機器學習模型進行預測時,由于模型的預測值沒有可供參考的真實值,所以沒有辦法進行特征篩選和模型參數(shù)調(diào)整,于是本文先對全樣本擬合出來的VaR劃分訓練數(shù)據(jù)集和測試數(shù)據(jù)集,從而訓練LightGBM模型并選擇模型最優(yōu)參數(shù)以及進行特征篩選。最終,對照組選擇的特征是收益率和下行風險的滯后項(1~3階)共6個特征,實驗組選擇的特征是特征重要程度前15個特征,包括收益率和下行風險的滯后項(1~3階)這6個特征以及投資者情緒的9個特征。
第三步:滾動窗口擬合VaR
使用ARMA-GARCH模型對上證指數(shù)的收益率進行滾動窗口擬合,由于樣本外的數(shù)據(jù)設(shè)置的是120個,所以共進行了120次的擬合,每一次模型擬合相應(yīng)地計算出擬合的VaR值,共獲得長度為365的VaR擬合值120組。
第四步:機器學習模型預測
基于前一步擬合出來的每一組VaR的值,構(gòu)建實驗組和對照組的輸入特征,對每一組數(shù)據(jù)訓練一個LightGBM模型,并且對下一個時刻的VaR進行預測。最終訓練了120個LightGBM模型,并且分別獲得了實驗組和對照組樣本外的120個VaR預測值。
第五步:實驗組和對照組的效果比較
對于獲得的120個VaR預測值,使用分位數(shù)損失的比例來評估兩個模型的優(yōu)劣,從而判斷投資者情緒對于VaR的預測能力。
表9 VaR預測效果檢驗和比較
檢驗結(jié)果表明,實驗組和對照組檢驗統(tǒng)計量的P值都大于0.05,說明在5%顯著水平下,VaR的預測是有效的。實驗組的分位數(shù)損失和對照組的分位數(shù)損失的比值小于1,說明實驗組對于VaR的預測效果更好一些,也即是說明投資者情緒對于VaR是有預測能力的,為了進一步驗證結(jié)論的穩(wěn)健性,下面進行了穩(wěn)健性分析。
2.穩(wěn)健性分析
從三個角度來驗證預測效果的穩(wěn)健性,第一個角度是使用LightGBM模型對不同置信水平下的VaR進行預測,置信水平的選擇分別是99%、95%和90%;第二個角度是使用不同的模型進行預測,本文除了使用LightGBM模型外,又使用了Random Forest模型進行預測;第三個角度是在使用ARMA-GARCH模型對上證指數(shù)收益率進行滾動建模時,又引入了擴展窗口滾動擬合,即以遞歸的方式用新的觀測值來增加采樣周期,例如第一次擬合的數(shù)據(jù)范圍是1-d,第二次擬合的數(shù)據(jù)范圍是1-d+1。預測出來的VaR的檢驗和比較結(jié)果如表10所示:
表10 基于滾動窗口擬合值的預測效果檢驗和比較
上述檢驗和比較結(jié)果表明,基于滾動窗口擬合值和基于擴展窗口擬合值的預測結(jié)論一樣的,在使用LightGBM模型和Random Forest模型進行預測時,無論是實驗組和對照組Kupiec檢驗的P值都大于0.05,說明在5%的顯著性水平下,都不能夠拒絕原假設(shè),應(yīng)該認為預測模型都是有效的,然后可以看出分位數(shù)損失的比值都小于1,說明實驗組的預測效果好于對照組的效果。這也說明投資者情感指標對于上證指數(shù)的VaR是有預測能力的,且預測能力是穩(wěn)健的。
表11 基于擴展窗口擬合值的預測效果檢驗和比較
本文選取2018年7月到2020年6月上證指數(shù)股評數(shù)據(jù)作為原始文本數(shù)據(jù),采用基于情感詞典的方法來挖掘股評的情感傾向信息,并且構(gòu)建了較為完善的投資者情緒指標,利用VAR模型研究投資者情緒指標對于上證指數(shù)下行風險的影響,并且使用機器學習模型實證考察了投資者情緒指標對于上證指數(shù)下行風險的預測能力。研究發(fā)現(xiàn):第一,基于情感詞典的文本分類方法,不僅將現(xiàn)有的各種較權(quán)威的詞典進行合并去重,而且還對新詞詞典和領(lǐng)域詞典進行了擴展,構(gòu)建了更加完善合理的金融領(lǐng)域詞典,實現(xiàn)了比只使用通用詞典進行文本情感分類更好的分類效果。第二,脈沖響應(yīng)的結(jié)果表明,投資者情緒指標在短期內(nèi)對股票市場下行風險有持續(xù)性的作用,其中每日每條評論的平均閱讀量、每日正向評論比例、每日負向評論比例、每日正向評論閱讀量的比例以及每日負向評論閱讀量的比例的沖擊整體上對于下行風險的影響是正向的,每日中性評論比例和投資者一致性指數(shù)的沖擊整體上對于下行風險的影響是負向的。第三,股票評論信息對于股票市場的下行風險具有一定的預測能力。通過使用LightGBM模型和Random Forest模型對股票市場的下行風險進行預測,結(jié)果表明,相對于只使用下行風險和收益率的滯后數(shù)據(jù),加入投資者情緒指標在樣本期外能更好地預測股票市場的下行風險。本文的研究結(jié)論支持了金融監(jiān)管機構(gòu)通過加強網(wǎng)絡(luò)輿論的監(jiān)管來維持中國金融市場的穩(wěn)定發(fā)展,從而能夠在一定程度上防范金融市場異常波動以及金融危機的發(fā)生。