瞿 慧,沈 微
(南京大學(xué)工程管理學(xué)院,江蘇 南京 210093)
傳統(tǒng)金融理論假設(shè)信息獲取并無成本,然而,Kahneman[1]認(rèn)為人的時間和精力有限,對某一事件的關(guān)注會犧牲對其他事件的關(guān)注。這可能會使投資者不能及時獲取某類信息,做出錯誤判斷,引起資產(chǎn)價格的波動。學(xué)者們常用成交量、廣告支出等變量來衡量投資者關(guān)注,但這些間接指標(biāo)受到多種因素影響[2]。
隨著時代的發(fā)展,網(wǎng)絡(luò)搜索成為信息獲取的主要渠道。搜索不是瀏覽,一旦投資者搜索某類信息,表明了他們對該類信息的主動關(guān)注,因此網(wǎng)絡(luò)搜索量可被用來衡量主動性投資者關(guān)注。Da等[2]首先提出用谷歌搜索指數(shù)衡量投資者關(guān)注,并應(yīng)用羅素3000股票進行實證,發(fā)現(xiàn)谷歌搜索指數(shù)不能被異常收益等已有的投資者關(guān)注代理變量完全解釋,包含一定的特質(zhì)信息,同時他們還認(rèn)為谷歌搜索指數(shù)更多衡量了個體投資者關(guān)注。Aouadi等[3]應(yīng)用法國CAC-40指數(shù)和其中的27只成分股實證指出,谷歌搜索指數(shù)衡量的投資者關(guān)注與法國股票市場的交易量密切相關(guān),且顯著影響股票流動性和波動性。Goddard等[4]同樣使用谷歌搜索指數(shù)代理投資者關(guān)注,研究發(fā)現(xiàn)投資者關(guān)注與同期外匯市場股票波動正相關(guān),并且能預(yù)測下期波動。Peltom?ki等[5]使用谷歌搜索指數(shù)和新興市場指數(shù)的研究發(fā)現(xiàn),投資者關(guān)注對新興市場的股價波動有較好的解釋能力。Dzieliński等[6]采用美國個股的實證則進一步指出,投資者關(guān)注的非對稱性一定程度上解釋了波動的非對稱性。
中國市場上,個體投資者群體龐大,股民和網(wǎng)民兩大群體存在高度耦合[7],同時相比于機構(gòu)投資者,個體投資者的異質(zhì)信念更能影響A股價格變化[8]。百度作為中國目前最大的網(wǎng)絡(luò)搜索引擎,市場份額高達70%,同時也提供百度指數(shù)對搜索量進行反映,能夠很好地代理國內(nèi)個體投資者關(guān)注。俞慶進和張兵[9]將百度指數(shù)作為投資者有限關(guān)注的代理變量,使用深圳證券交易所創(chuàng)業(yè)板股票進行實證,發(fā)現(xiàn)百度指數(shù)會顯著影響市場交易活動,給當(dāng)期股票價格帶來正向壓力,隨后發(fā)生反轉(zhuǎn)。張繼德等[10]將上證180指數(shù)中的114只成分股作為研究對象,用百度指數(shù)衡量投資者關(guān)注,研究發(fā)現(xiàn)投資者關(guān)注對市場流動性和當(dāng)期股票收益有顯著的正向影響。目前,百度指數(shù)將搜索來源分為電腦端和移動端。區(qū)分不同來源百度指數(shù)的研究不多,且以往集中在旅游分析領(lǐng)域,最近金融領(lǐng)域也有所涉及,如Wang Xiaolin等[11]用百度指數(shù)代理投資者情緒,研究其對中國股指期貨市場的影響,發(fā)現(xiàn)電腦端搜索會影響交易量和期貨收益,而移動端搜索只會影響交易量。
盡管已有多項研究[3-6]實證了投資者關(guān)注對股市波動的影響,但鮮少有將投資者關(guān)注變量應(yīng)用于波動率預(yù)測模型,僅有Dimpfl和Jank[12]和Afkhami等[13]將用谷歌搜索指數(shù)衡量的投資者關(guān)注線性引入波動率模型,并實證了模型預(yù)測能力的改進。我們認(rèn)為,投資者關(guān)注的增強和減弱,對投資者交易行為和股票價格波動的影響可能有所不同,因此考慮投資者關(guān)注的非線性引入。具體的,我們提出將百度指數(shù)作為邏輯平滑轉(zhuǎn)移(Logistic Smooth Transition,LST)[14]結(jié)構(gòu)的轉(zhuǎn)移變量,引入波動率模型。LST結(jié)構(gòu)采用單調(diào)遞增的轉(zhuǎn)移函數(shù),在轉(zhuǎn)移速率趨于無窮時退化為門限自回歸模型,可以更為靈活地刻畫不同機制之間的轉(zhuǎn)換,在不少非線性建模研究[15-16]中得到運用。
傳統(tǒng)波動率模型如廣義自回歸條件異方差模型和隨機波動率模型,將波動率視作不可觀測的隱變量,對收益條件方差進行建模。由于低頻日度收益率包含的信息有限,不能完全反映資產(chǎn)價格的日內(nèi)實際變動,依據(jù)其計算的波動率存在較大的測量誤差。隨著計算機技術(shù)的發(fā)展和高頻數(shù)據(jù)獲取難度的降低,Andersen和Bollerslev[17]提出了以日內(nèi)高頻收益平方和計算的已實現(xiàn)波動(Realized Volatility,RV),將金融波動率由隱變量轉(zhuǎn)變?yōu)榭芍苯佑^測和建模的顯變量??紤]到RV易受市場微觀結(jié)構(gòu)噪聲影響,Barndorff-Nielsen等[18]提出了對市場微觀結(jié)構(gòu)噪聲穩(wěn)健的已實現(xiàn)核(Realized Kernel,RK)作為真實波動率的估計,利用核函數(shù)平滑日內(nèi)收益率序列來達到降噪效果。進一步的研究發(fā)現(xiàn)波動率可以區(qū)分為具有不同統(tǒng)計特性的連續(xù)波動和跳躍波動。Andersen等[19]采用局部自適應(yīng)的門限值,構(gòu)建在有限樣本下對跳躍具穩(wěn)健性的已實現(xiàn)中值波動(Median Realized Volatility,MedRV)作為連續(xù)波動的無偏估計量。在此基礎(chǔ)上,可利用BNS方法[20]識別顯著跳躍。在已實現(xiàn)波動的預(yù)測模型構(gòu)建方面,Corsi[21]基于Müller的異質(zhì)市場假說,提出了由不同時間尺度的已實現(xiàn)波動構(gòu)成的異質(zhì)自回歸(Heterogeneous Autoregressive,HAR)模型。Andersen等[22]在其基礎(chǔ)上進一步提出區(qū)分連續(xù)波動和跳躍波動對波動預(yù)測貢獻的HAR-RV-J模型和HAR-RV-CJ模型。由于上述HAR類模型可用最小二乘法估計,且能較好地刻畫波動的長記憶性并較準(zhǔn)確地預(yù)測波動,此后得到了較多拓展和應(yīng)用[23-25]。因此,本文也將這三個模型作為基準(zhǔn)的波動率預(yù)測模型。
綜上所述,鑒于HAR類模型能直接對已實現(xiàn)波動建模,有較強的波動率預(yù)測能力且具備較好的經(jīng)濟詮釋,邏輯平滑轉(zhuǎn)移結(jié)構(gòu)能靈活刻畫外生變量的非線性影響,本文在HAR-RV、HAR-RV-J和HAR-RV-CJ模型的基礎(chǔ)上,引入以百度指數(shù)為轉(zhuǎn)移變量的邏輯平滑轉(zhuǎn)移結(jié)構(gòu),來刻畫投資者關(guān)注的強弱變化對市場未來波動的影響,構(gòu)建LSTHAR-SVI類模型,實證檢驗其預(yù)測性能,并進一步區(qū)分和比較不同來源百度指數(shù)對波動預(yù)測的貢獻。
令M為日內(nèi)采樣間隔數(shù),T為觀測的總天數(shù),lnpt,i為t日的第i個采樣間隔末的對數(shù)價格,t=1,2,…,T。那么,在t日的第i個采樣間隔內(nèi)的對數(shù)收益率為rt,i=100lnpt,i-100lnpt,i-1,i=1,2,…,M,t日的已實現(xiàn)核估計量[18]為:
(1)
高頻收益在日內(nèi)連續(xù)時間內(nèi)可能出現(xiàn)突然性的大幅變動,即跳躍。采用Andersen等[19]的已實現(xiàn)中值波動對連續(xù)波動進行估計:
(2)
采用Barndorff-Nielsen和Shephard[20]的BNS方法,構(gòu)建Z統(tǒng)計量來識別顯著跳躍:
(3)
其中MedRQt是積分四次冪的一致估計,形式如下:
(4)
BNS-Z統(tǒng)計量在大樣本條件下服從漸近正態(tài)分布,可根據(jù)其是否顯著來判斷t日是否存在顯著跳躍。用J表示跳躍波動,C表示連續(xù)波動,α是顯著性水平,Φα是標(biāo)準(zhǔn)正態(tài)分布的α臨界值,則有Jt=I(Zt>Φα)(RKt-MedRVt),Ct=RKt-Jt。
百度指數(shù)刻畫了特定關(guān)鍵詞的每日網(wǎng)絡(luò)搜索量情況。本文參考Da等[2]的異常谷歌搜索指數(shù)構(gòu)建方法處理原始百度指數(shù)以刻畫搜索量的變化,構(gòu)建SVI指數(shù):
SVIt=ln(BIt+1)
-ln(median(BIt-1,…,BIt-40)+1)
(5)
其中BIt表示t日以選定關(guān)鍵詞得到的原始百度指數(shù),Med(BIt-1,…,BIt-40)表示第t-40天到t-1天的日百度指數(shù)中位數(shù),反映了投資者關(guān)注的正常水平。當(dāng)SVIt為正時,表明t日投資者關(guān)注水平高于正常水平,投資者關(guān)注增強;當(dāng)SVIt為負時,表明t日投資者關(guān)注水平低于正常水平,投資者關(guān)注減弱。
基于異質(zhì)市場假說的HAR-RV模型[21],形式如下:
(6)
在HAR-RV模型基礎(chǔ)上進行拓展的HAR-RV-J模型和HAR-RV-CJ模型[22],形式如下:
HAR-RV-J模型:
(7)
HAR-RV-CJ模型:
(8)
本文提出在HAR類模型的基礎(chǔ)上引入將百度指數(shù)作為轉(zhuǎn)移變量的LST結(jié)構(gòu)G(γ,c;SVIt)=[1+exp(-γ(SVIt-c))]-1,構(gòu)建LSTHAR-SVI類模型,以靈活刻畫投資者關(guān)注的變化對未來波動率的非線性影響。具體形式如下:
LSTHAR-RV-SVI模型:
G(γ,c;SVIt)+εt+1
(9)
LSTHAR-J-SVI模型:
G(γ,c;SVIt)+εt+1
(10)
LSTHAR-CJ-SVI模型:
G(γ,c;SVIt)+εt+1
(11)
其中SVIt是轉(zhuǎn)移變量。γ是平滑參數(shù),表示狀態(tài)轉(zhuǎn)移的速率,應(yīng)該大于零。c是位置參數(shù),用來確定機制轉(zhuǎn)移的位置,應(yīng)該在轉(zhuǎn)移變量的取值范圍之內(nèi)。G(·)是轉(zhuǎn)移變量SVIt的單調(diào)增函數(shù),在0到1之間取值。當(dāng)γ→∞時,G(·)成為示性函數(shù),SVIt
使用基于網(wǎng)格搜索的非線性最小二乘法對LSTHAR-SVI類模型進行估計。具體步驟如下:首先,運用網(wǎng)格搜索法找到便于迭代的位置參數(shù)c和平滑參數(shù)γ的初始值。具體的,在0到150范圍內(nèi),以5作為步長選擇平滑參數(shù)γ,同時在轉(zhuǎn)移變量SVIt的取值范圍內(nèi),以0.05作為步長選擇位置參數(shù)c,從而構(gòu)造約900個網(wǎng)格點。根據(jù)各網(wǎng)格點的參數(shù)取值,通過非線性最小二乘法估計其余參數(shù)并計算殘差平方和,選擇殘差平方和最小時的c和γ作為二者的初始值。然后,在模型參數(shù)初始值設(shè)定的前提下,運用非線性最小二乘法得到模型估計結(jié)果。
軟件方面,使用Eviews6.0進行模型估計。三類LSTHAR-SVI模型中,LSTHAR-CJ-SVI類模型的估計用時相對較長,但耗時可控,程序整體效率較高。
采用華夏上證50ETF(510050)的5分鐘高頻數(shù)據(jù)和以“50ETF”為關(guān)鍵詞的百度指數(shù)數(shù)據(jù)進行實證。華夏上證50ETF是中國境內(nèi)首只交易型開放式指數(shù)基金,它緊密跟蹤上證50指數(shù),追求實現(xiàn)與上證50指數(shù)類似的風(fēng)險與收益特征。而上證50指數(shù)挑選了上海證券市場規(guī)模大、流動性好的最具代表性的50只股票組成樣本股,綜合反映了上海證券市場最具市場影響力的一批優(yōu)質(zhì)大盤企業(yè)的整體狀況,是上海證券市場具有代表性的藍籌指數(shù)。隨著50ETF期權(quán)的推出,以上證50指數(shù)為標(biāo)的的金融產(chǎn)品趨于完善,市場套利機會不斷增多,相關(guān)產(chǎn)品愈發(fā)吸引廣大投資者的關(guān)注。數(shù)據(jù)顯示,50ETF日交易量高于180ETF、300ETF和綜指ETF,具有更高的活躍度。樣本區(qū)間為2014年1月2日到2017年11月30日,剔除因為熔斷導(dǎo)致日內(nèi)沒有完整交易的2016年1月4日和2016年1月7日,共剩余954個交易日。根據(jù)公式(5)構(gòu)建SVI指數(shù)時,需要考慮前40天的百度指數(shù),故應(yīng)用2014年3月6日到2017年11月30日共計914個交易日的數(shù)據(jù)進行后續(xù)實證。對于原始百度指數(shù)考慮三種情況:總體指數(shù)(電腦端與移動端百度指數(shù)之和)、電腦端指數(shù)和移動端指數(shù),分別用BI1、BI2和BI3表示,處理后的百度指數(shù)分別用SVI1、SVI2和SVI3表示。所用數(shù)據(jù)來自wind數(shù)據(jù)庫和百度。
表1為全樣本段內(nèi)主要變量的描述性統(tǒng)計。BI2的均值為328.495,BI3的均值為295.689,說明目前“50ETF”的電腦端搜索量高于移動端。在1%的水平上,ADF統(tǒng)計量均顯著,說明各變量序列平穩(wěn),可以直接進行建模。
表1 變量描述性統(tǒng)計
根據(jù)采用的HAR類基礎(chǔ)模型,將所有模型分成3個組別,各組內(nèi)有HAR-RV/HAR-RV-J/HAR-RV-CJ模型中的1個,以及在其基礎(chǔ)上分別引入SVI1、SVI2和SVI3的3個LSTHAR-SVI類模型。表2中給出各組模型在全樣本段的部分參數(shù)估計結(jié)果和擬合性能指標(biāo)。
在各組內(nèi),相較于該組基礎(chǔ)模型(HAR-RV、HAR-RV-J、HAR-RV-CJ),3個LSTHAR-SVI類模型的調(diào)整后R2和log L值都明顯更大,AIC值和SIC值都明顯更小,且LR檢驗在1%的水平上都顯著,說明考慮百度指數(shù)的LSTHAR-SVI類模型的全樣本段擬合效果都顯著優(yōu)于相應(yīng)的HAR類基礎(chǔ)模型,即百度指數(shù)包含50ETF波動預(yù)測的有益信息。另外,引入SVI1、SVI2和SVI3的LSTHAR-SVI類模型在擬合性能上有所差異。各組內(nèi)比較中,LSTHAR-SVI2類模型都有最大的調(diào)整后R2值和log L值,最小的AIC值和SIC值,表明考慮電腦端百度指數(shù)的LSTHAR-SVI2類模型在全樣本段擬合上表現(xiàn)最優(yōu),即電腦端百度指數(shù)代表的投資者關(guān)注對市場波動有更大的影響。此外,9個LSTHAR-SVI類模型的位置參數(shù)c的取值基本顯著為正,說明LSTHAR-SVI類模型的機制轉(zhuǎn)換并非完全以投資者關(guān)注的增強和減弱劃分,還與變化的程度有關(guān);在投資者關(guān)注的增強達到一定程度時,其對未來波動率的影響會明顯加大,明顯改變未來波動率對過去日、周、月波動率的敏感性。
表2 模型全樣本段擬合結(jié)果
模型的樣本外預(yù)測性能是衡量預(yù)測模型好壞的重要標(biāo)準(zhǔn)。本文將2016年1月6日到2017年11月30日共464個交易日用作模型的樣本外預(yù)測性能比較。具體地,以450個交易日作為估計窗長,采用一步向前滾動預(yù)測法,即先以2014年3月6日到2016年1月5日的450個交易日為估計窗,預(yù)測2016年1月6日的波動率,接著以2014年3月7日到2016年1月6日的450個交易日為估計窗,預(yù)測2016年1月8日的波動率,以此類推。
(12)
(13)
(14)
(15)
(16)
(17)
表3報告了3組共計12個模型的損失函數(shù)均值,其中各組內(nèi)各損失函數(shù)均值的最小值已加粗表示。各組模型內(nèi),LSTHAR-SVI2類模型的6個損失函數(shù)均值都最小,其次是LSTHAR-SVI3類模型,再是LSTHAR-SVI1類模型,HAR類基礎(chǔ)模型的損失函數(shù)均值則最大。比如HAR-RV模型所在組1內(nèi)的MSE損失函數(shù)下,LSTHAR-RV-SVI2模型的損失函數(shù)均值為2.264,LSTHAR-RV-SVI3模型的損失函數(shù)均值為2.275,LSTHAR-RV-SVI1模型的損失函數(shù)均值為2.374,HAR-RV模型的損失函數(shù)均值為2.383。三種LSTHAR-SVI類模型的損失函數(shù)均值表現(xiàn)全部優(yōu)于對應(yīng)的HAR類基礎(chǔ)模型,說明考慮百度指數(shù)的LSTHAR-SVI類模型具有較HAR類基礎(chǔ)模型更強的波動預(yù)測能力,本研究對投資者關(guān)注的非線性引入可以改進波動預(yù)測。其中考慮電腦端百度指數(shù)的LSTHAR-SVI2類模型在各組內(nèi)均表現(xiàn)最佳,說明電腦端百度指數(shù)所代表的投資者關(guān)注對波動預(yù)測有更大影響。上述結(jié)論與表2的樣本內(nèi)擬合結(jié)果一致。
表3 模型損失函數(shù)均值
僅憑損失函數(shù)均值判斷模型預(yù)測性能并不準(zhǔn)確,一方面是因為損失函數(shù)均值極易受某些極端值影響,另一方面則是損失函數(shù)均值無法判斷模型預(yù)測性能差異的顯著性。進一步,本文運用Diebold和Mariano[26]的DM檢驗判斷LSTHAR-SVI類模型樣本外預(yù)測性能改進的顯著性。單邊DM檢驗的原假設(shè)是基準(zhǔn)模型的預(yù)測能力不弱于被比較的模型,原假設(shè)被拒絕時,表示被比較模型的預(yù)測能力顯著強于基準(zhǔn)模型。表4報告了以HAR類基礎(chǔ)模型為基準(zhǔn)的DM檢驗結(jié)果。可以看到,考慮電腦端百度指數(shù)的LSTHAR-SVI2類模型的DM統(tǒng)計量均在1%的水平上顯著,考慮移動端百度指數(shù)的LSTHAR-SVI3類模型的DM統(tǒng)計量除一個值外均在10%的水平上顯著,考慮總體百度指數(shù)的LSTHAR-SVI1類模型也有半數(shù)以上的DM統(tǒng)計量在10%的水平上顯著,說明考慮百度指數(shù)的LSTHAR-SVI類模型的預(yù)測能力顯著強于對應(yīng)的HAR類基礎(chǔ)模型。
表4 DM檢驗(以HAR類基礎(chǔ)模型為基準(zhǔn))
進一步采用模型置信集(Model Confidence Set, MCS)檢驗[27],對多個模型同時進行比較,以挑選預(yù)測性能顯著最優(yōu)的模型。該檢驗無須指定基準(zhǔn)模型,通過等價檢驗TM和剔除規(guī)則EM對一系列模型進行比較,選出一定置信度下表現(xiàn)最好的一個或多個模型形成模型置信集。等價檢驗TM的原假設(shè)是當(dāng)前模型集中的任意兩個候選模型預(yù)測能力相同。如果在顯著水平α下原假設(shè)被拒絕,則采用剔除規(guī)則EM來剔除當(dāng)前模型集中表現(xiàn)最差的模型。接著在新的模型集中重復(fù)等價檢驗,直至“接受”原假設(shè),此時留下的模型即構(gòu)成了置信水平1-α下的模型置信集。檢驗統(tǒng)計量有多種形式,本文選擇范圍統(tǒng)計量:
(18)
表5 分組MCS檢驗
引入不同來源百度指數(shù)的LSTHAR-SVI類模型的預(yù)測性能差異,可能與不同客戶端用戶的搜索特性差異有關(guān)。近年來,隨著智能手機的推出、移動網(wǎng)絡(luò)的完善和WIFI熱點的普及,移動端應(yīng)用逐漸占領(lǐng)人們的日常生活和工作,移動搜索成為網(wǎng)絡(luò)搜索的重要分支。相比于電腦搜索,移動搜索有明顯不同的特性:首先,移動搜索由于其便利性可以做到隨需隨搜,相比于電腦搜索的計劃性,它更多地反映了投資者的即時想法,有一定的突發(fā)性和偶然性,因而無法具體暗示投資者之后的交易行為。其次,移動搜索有移動端設(shè)備界面大小、輸入鍵盤設(shè)置等限制,使投資者在信息獲取上并不十分清晰、全面和方便,這種信息的非充分性和操作的不友好性可能使投資者的情緒和決策受到影響,因而降低移動搜索對投資者之后交易行為的指示意義。再加上本實證區(qū)間正好包含了中國股市異常波動的2015年,此時市場各類信息層出不窮,投資者情緒緊張焦慮,更會放大移動搜索的不可控性,使移動搜索數(shù)據(jù)異于往常,對交易行為的指示意義下降。所以,相比引入移動端百度指數(shù),引入電腦端百度指數(shù)對波動預(yù)測的貢獻更大。當(dāng)然,隨著移動智能的進一步發(fā)展和人們行為方式的轉(zhuǎn)變,投資者利用移動端進行搜索和交易的行為會日漸成熟,進而移動端百度指數(shù)的波動預(yù)測作用可能會越來越大。至于結(jié)合了二者的總體百度指數(shù),可能因為將不同特性的兩類搜索指數(shù)直接相加,間接失去了衡量特定投資者行為的含義,使其對波動預(yù)測的貢獻相對較小。
圖1 總體MCS檢驗(p值)
為使結(jié)果更具一般性,選用以“上證綜指”為關(guān)鍵詞的百度指數(shù)數(shù)據(jù)和富國上證綜指ETF(510210)的5分鐘高頻價格進行穩(wěn)健性檢驗。受限于wind數(shù)據(jù)庫只能獲取綜指ETF 最近3年的高頻價格數(shù)據(jù),本次檢驗區(qū)間無法與上文實證區(qū)間完全吻合。為保證一定的數(shù)據(jù)量,樣本區(qū)間選為2015年8月20日到2018年8月17日,剔除因為熔斷導(dǎo)致日內(nèi)沒有完整交易的2016年1月4日和2016年1月7日,共剩余729個交易日。構(gòu)建用作回歸量的月已實現(xiàn)波動時,需要考慮前21天的日已實現(xiàn)波動,故實際采用2015年9月22日到2018年8月17日共計708個交易日的數(shù)據(jù)進行后續(xù)實證。在樣本外預(yù)測時,與上文一致使用450個交易日作為估計窗長,采用一步向前滾動預(yù)測法,將2017年8月1日到2018年8月17日共258個交易日用作樣本外預(yù)測區(qū)間。我們也嘗試了以2017年8月1日到2017年11月30日的83個交易日作為樣本外預(yù)測區(qū)間,即采用和50ETF一致的預(yù)測窗終止日期,取得了基本一致的結(jié)論,由于篇幅限制不再匯報。
各組模型在全樣本段的部分參數(shù)估計結(jié)果和擬合性能指標(biāo)如表6所示??梢钥吹剑诟鹘M內(nèi),相較于該組基礎(chǔ)模型(HAR-RV、HAR-RV-J、HAR-RV-CJ),3個LSTHAR-SVI類模型的調(diào)整后R2值和log L值都明顯更大,AIC值都明顯更小,且LR檢驗在1%的水平上都顯著,說明考慮百度指數(shù)的LSTHAR-SVI類模型的全樣本段擬合效果都顯著優(yōu)于相應(yīng)的HAR類基礎(chǔ)模型,即百度指數(shù)包含綜指ETF波動預(yù)測的有益信息。另外,引入SVI1、SVI2和SVI3的LSTHAR-SVI類模型在擬合性能上有所差異。各組內(nèi)比較中,LSTHAR-SVI2類模型都有最大的調(diào)整后R2值和log L值,最小的AIC值和SIC值,表明考慮電腦端百度指數(shù)的LSTHAR-SVI2類模型在全樣本段擬合上表現(xiàn)最優(yōu),即電腦端百度指數(shù)代表的投資者關(guān)注對綜指ETF波動有更大的影響。以上結(jié)論與采用50ETF進行全樣本段擬合獲得的結(jié)論(表2)一致。
表6 模型全樣本段擬合結(jié)果(綜指ETF)
續(xù)表6 模型全樣本段擬合結(jié)果(綜指ETF)
各模型樣本外預(yù)測的損失函數(shù)均值和DM檢驗結(jié)果如表7和表8所示。由于富國上證綜指ETF的交易量近幾年維持在較低水平,市場活躍度不足,實證區(qū)間內(nèi)出現(xiàn)已實現(xiàn)波動為0(無交易)的情況,因此未計算MSELN和MAELN損失函數(shù)。由表7可知,在各組模型中,LSTHAR-SVI類模型的損失函數(shù)均值絕大多數(shù)情況下都小于對應(yīng)的HAR類基礎(chǔ)模型,表明考慮百度指數(shù)的LSTHAR-SVI類模型具有較HAR類基礎(chǔ)模型更強的綜指ETF波動預(yù)測能力。其中,LSTHAR-SVI2類模型在各組內(nèi)的損失函數(shù)均值基本最小,說明電腦端百度指數(shù)所代表的投資者關(guān)注對綜指ETF波動預(yù)測有更大影響。由表8可知,在MSE損失函數(shù)下,LSTHAR-SVI類模型的DM統(tǒng)計量大多為正,但不顯著,在MAE、MSESD和MAESD損失函數(shù)下,LSTHAR-SVI類模型的預(yù)測能力大多顯著強于對應(yīng)的HAR類基礎(chǔ)模型,表明本研究對投資者關(guān)注的非線性引入可以有效改進對綜指ETF的波動預(yù)測。上述結(jié)論與采用50ETF獲得的結(jié)論(表3、表4)一致。
表7 模型損失函數(shù)均值(綜指ETF)
表8 DM檢驗(以HAR類基礎(chǔ)模型為基準(zhǔn))(綜指ETF)
圖2 總體MCS檢驗(p值)(綜指ETF)
本文采用2014年1月2日到2017年11月30日的華夏上證50ETF高頻價格和百度指數(shù)數(shù)據(jù),以及2015年8月20日到2018年8月17日的富國上證綜指ETF高頻價格和相應(yīng)百度指數(shù)數(shù)據(jù),運用異質(zhì)自回歸類模型和邏輯平滑轉(zhuǎn)移結(jié)構(gòu),研究百度指數(shù)代表的投資者關(guān)注對未來市場波動的影響,同時還區(qū)分不同來源百度指數(shù)對波動預(yù)測的貢獻。
實證結(jié)果表明:(1)百度指數(shù)對波動預(yù)測有顯著貢獻。相較于對應(yīng)的HAR類基礎(chǔ)模型,本文新提出的LSTHAR-SVI類模型有顯著更優(yōu)的擬合效果和顯著更強的預(yù)測性能,揭示了投資者關(guān)注所引導(dǎo)的交易行為對市場波動的影響,肯定了考慮投資者心理和投資者行為對股市研究的重要意義。而對模型參數(shù)的分析顯示,投資者關(guān)注對市場波動的影響并非完全以關(guān)注的增強和減弱劃分,還與關(guān)注變化的程度有關(guān);在投資者關(guān)注的增強達到一定程度時,其對市場波動率的影響會明顯加大,明顯改變?nèi)铡⒅?、月波動率對未來波動率的貢獻,即明顯改變不同頻率投資者的交易行為對未來波動率的影響。(2)不同來源百度指數(shù)對波動預(yù)測的影響情況不同。考慮電腦端百度指數(shù)的LSTHAR-SVI2類模型的預(yù)測表現(xiàn)顯著更優(yōu),也一定程度上說明雖然移動端占比在日益增加,但在目前的金融投資領(lǐng)域,有計劃性的電腦端搜索對資產(chǎn)價格未來波動的影響更大。(3)引入電腦端百度指數(shù)帶來的預(yù)測性能改進效果超越了HAR類基礎(chǔ)模型形式對波動預(yù)測的影響。在對所有12個波動率預(yù)測模型的比較中,考慮電腦端百度指數(shù)的LSTHAR-RV-SVI2模型、LSTHAR-J-SVI2模型和LSTHAR-CJ-SVI2模型的預(yù)測性能都具有顯著優(yōu)勢,并沒有因為HAR類基礎(chǔ)模型的選擇不同而出現(xiàn)明顯差異,說明了電腦端百度指數(shù)是構(gòu)建中國股市波動率預(yù)測模型時值得納入的重要變量。
本文充分利用市場上的日內(nèi)可用信息和投資者關(guān)注信息,實現(xiàn)了對市場波動率的更精準(zhǔn)預(yù)測,其結(jié)果對風(fēng)險管理、資產(chǎn)定價和投資組合構(gòu)建等實務(wù)應(yīng)用都有指導(dǎo)意義。后續(xù)研究還將考慮百度指數(shù)在多資產(chǎn)協(xié)方差預(yù)測模型中的引入,并將其應(yīng)用于期貨的動態(tài)套期保值、最小方差投資組合的構(gòu)建等實務(wù)場景。