許啟發(fā),伯仲璞,蔣翠俠
1 合肥工業(yè)大學 管理學院,合肥 230009 2 合肥工業(yè)大學 過程優(yōu)化與智能決策教育部重點實驗室,合肥 230009
管理科學
基于分位數(shù)Granger因果的網絡情緒與股市收益關系研究
許啟發(fā)1,2,伯仲璞1,蔣翠俠1
1 合肥工業(yè)大學 管理學院,合肥 230009 2 合肥工業(yè)大學 過程優(yōu)化與智能決策教育部重點實驗室,合肥 230009
行為金融學理論認為,股票市場的價格變動除受宏觀基本因素影響外,還在很大程度上受眾多個體投資者或噪音交易者行為左右。中國股票市場擁有龐大的個人投資者群體,且股民群體與網民群體之間具有高度耦合性,使用網絡情緒等信息能夠探索中國股市收益變動基本規(guī)律。
為揭示個體投資者行為對股市收益的影響,以個體投資者情緒為視角,以網絡環(huán)境中個體投資者的情緒信息為切入點,檢驗投資者情緒與股市收益的關聯(lián)關系,評估網絡情緒信息價值。使用中文文本情感分析方法,從新浪微博文本中提取出網絡情緒時間序列;分別運用均值Granger因果和分位數(shù)Granger因果檢驗方法,探討網絡情緒波動與股市收益之間是否存在因果關系;將股票市場發(fā)展階段進行細致劃分,研究不同市場階段下網絡情緒波動與股市收益之間的因果關系。
對滬深300指數(shù)收益進行實證研究,結果表明,盡管在均值框架下網絡情緒波動與股市收益之間因果關系并不明顯,但基于分位數(shù)Granger因果分析卻發(fā)現(xiàn)兩者在極端分位點區(qū)間處存在廣泛且顯著的因果關系。數(shù)據(jù)顯示,在40個因果關系檢驗中,分位數(shù)Granger因果檢驗的因果關系發(fā)現(xiàn)了23個顯著的因果關系,發(fā)現(xiàn)率為57.5%,遠高于均值Granger因果檢驗的7.5%。此外,股市收益受到網絡情緒波動影響的程度和方式在不同市場階段下有所不同。
研究結果具有一定的理論意義和應用價值。在一些特定分位點區(qū)間網絡情緒波動對股市收益存在顯著因果關系影響,這為在特定條件下股市收益的可預測性提供了佐證。網絡情緒能夠預測股市收益的尾部(上尾或下尾)行為特征,可以為金融風險防范提供決策參考。研究結果為股票市場的定價、收益預測和波動率估計等相關研究提供了新的研究思路,也為網絡情緒信息使用提供了新的方向。
分位數(shù)回歸;Granger因果檢驗;網絡情緒;股市收益;微博數(shù)據(jù)
股市收益變化及預測一直是學界和業(yè)界關注的焦點。有效市場假說認為,在信息透明、充分競爭的市場環(huán)境下,無法利用公開的市場信息對股市收益進行預測。然而,現(xiàn)實市場環(huán)境與理想狀態(tài)相去甚遠,一些研究發(fā)現(xiàn),在一定時空范圍內,股市收益具有一定的可預測性。NOFSINGER[1]研究發(fā)現(xiàn)社會情緒與金融行為和金融市場之間存在相互作用;PRECHTER[2]以人類社會行為的波動影響現(xiàn)象解釋金融市場;還有以社會行為視角研究股票市場[3]。這些研究都從行為金融的角度為股票市場的預測提供了可行的著眼點。行為金融將行為科學引入金融分析,旨在揭示金融市場的非理性行為和決策規(guī)律,已有的行為金融的相關研究從理論和實證兩個層面論證了投資者情緒與股票市場之間具有顯著的相關性。YAO et al.[4]研究證明中國股票市場中存在明顯的羊群效應,這一結論同樣可以從情緒傳遞的角度解釋;HUANG et al.[5]構建了一種投資者情緒代理變量,并實證了投資者情緒對股票市場的預測能力;KIM et al.[6]通過分析YAHOO金融信息內容測量投資者情緒,進而預測股票市場走勢。
隨著互聯(lián)網絡的迅速普及和快速發(fā)展,一方面網絡行為勢必影響到金融市場運行機制;另一方面,網絡行為在一定程度上也必然反映了金融市場的運行狀況,網絡行為中無疑蘊藏著金融市場變化的“蛛絲馬跡”。JOSEPH et al.[7]使用谷歌搜索數(shù)據(jù)預測股票市場的異常波動;張誼浩等[8]嘗試使用百度搜索數(shù)據(jù)預測股票市場波動,結果良好;洪濤等[9]從中國網民在線搜索行為中挖掘出了用于預測房價的有用信息。此外,中國股票市場具有個人投資者群體龐大的特點,股民群體與網民群體之間呈現(xiàn)出高度耦合的特性,使用網絡情緒等信息探討中國股市收益變動基本規(guī)律具有可行性和必要性。
已有相關研究多采用基于均值回歸的研究方法,適合于探討在中心位置或正常環(huán)境下網絡情緒對股市收益的影響,存在一定局限。本研究認為,中國網絡情緒與股票市場之間確實存在某種聯(lián)系,但這種聯(lián)系未必表現(xiàn)在中心位置,更有可能存在于尾部極端分位區(qū)間處。本研究借助網絡社交平臺,通過情感分析方法,提取網絡情緒信息;綜合應用均值Granger和分位數(shù)Granger因果檢驗,探討不同市場環(huán)境下網絡情緒對股市收益的影響,并進一步刻畫該影響存在的分位區(qū)間、影響程度和影響方式等,深入揭示網絡情緒對股市收益的預測能力。
在已有關于使用網絡情緒數(shù)據(jù)分析股票市場的研究中,早期研究多以相關網絡論壇或網站為情緒數(shù)據(jù)來源。GILBERT et al.[10]從社交網站Live Journal上的2 000萬文章中提取了焦慮、擔憂和恐懼,在Granger因果分析框架下發(fā)現(xiàn)焦慮情緒的增長能夠用于預測S&P 500指數(shù)的下降。還有其他更早期的研究,GRUHL et al.[11]使用博客、媒體和網頁中關于50萬冊書籍的相關貼文,預測書籍的銷量排名;MISHNE et al.[12]使用博客數(shù)據(jù)預測了電影的票房走勢;LIU et al.[13]借助PLSA模型提取博客中的情緒指標,進而成功預測了產品未來銷量;PENG et al.[14]的研究表明股票市場受投資者情緒和顧客滿意程度兩大群體情緒的影響。
隨著網絡社交平臺的興起,研究者們逐漸將目光轉向網絡社交平臺,國外相關研究中多以Twitter為主。ZHANG et al.[15]收集了6個月內的Twitter數(shù)據(jù),并從中隨機抽選百分之一用于測量每日Twitter中的hope和fear值,研究發(fā)現(xiàn)情緒化Twitter的占比與Dow Jones、NASDAQ和S&P 500都表現(xiàn)出顯著負相關,與VIX(CBOT Volatility Index)表現(xiàn)出顯著正相關,從而證明Twitters中的情緒信息具有巨大價值。更進一步,BOLLEN et al.[16]著眼于研究Twitter中影響股票市場的具體情緒種類,通過對Twitter文本進行自然語言處理,提取出Twitter中包含的情緒信息,根據(jù)提取方法的不同,共提取出7個不同維度情感時間序列(分別為polarity、calm、alert、sure、vital、kind、happy),并將其作為參數(shù)做Twitter mood與股票市場之間的Granger因果關系檢驗,結果表明Twitter中的calm與股票市場之間存在較明顯且持久的因果關系,還發(fā)現(xiàn)加入了情緒數(shù)據(jù)的自組織模糊神經網絡在股票市場的預測上表現(xiàn)良好。COREA et al.[17]嘗試使用Twitter數(shù)據(jù)預測NASDAQ的未來走勢,結果顯示加入Twitter數(shù)據(jù)的預測模型具有更高的預測精度。WEI et al.[18]不再具體分析Twitter中的情緒信息,轉而使用與股票相關的Twitter的數(shù)量分析股票市場,發(fā)現(xiàn)Twitter量的波峰與股市波動率、隱含波動率之間具有密切的關聯(lián)性,并根據(jù)研究結論提出了新的股票交易策略。
此領域研究中,也不乏著眼于中國股票市場的研究工作,此類研究多以新浪微博為網絡數(shù)據(jù)來源。賴凱聲等[19]使用協(xié)整檢驗和誤差修正模型發(fā)現(xiàn),微博情緒綜合指數(shù)與同期的上證指數(shù)以及下一個交易日的上證指數(shù)之間存在顯著的長期均衡關系,證明微博與股票市場之間存在相關性。黃潤鵬等[20]使用ROST Content Mining軟件對新浪微博文本進行處理,提取出根據(jù)積極和消極程度劃分的7個情緒傾向時間序列,使用Granger因果分析發(fā)現(xiàn)高度積極情緒時間序列的變化能夠預測滯后4天的上證指數(shù)收盤價變化,引入機器學習的方法,發(fā)現(xiàn)加入情緒傾向數(shù)據(jù)的支持向量機在股票預測方面比對照組提升了13.62%的準確率。朱南麗等[21]引入博客和微博發(fā)布量作為對投資者關注度的代理指標,通過對滬深300指數(shù)股的實證研究發(fā)現(xiàn),博客和微博量能夠作為投資者關注的有效度量,特別對個人或中小投資者的度量效果最佳。此研究成果一定程度上證明了網絡用戶與股民之間存在較大重疊或存在較強相互影響,為使用網絡情緒做投資者情緒的代理變量提供了實證支持。孟雪井等[22]運用文本挖掘技術對中國知網CSSCI期刊與新浪微博話題信息進行文本分析,結合百度關鍵詞推薦系統(tǒng)獲得投資者的網絡搜索關鍵詞,進而采用時差相關系數(shù)法、隨機森林算法、因子分析法等將對上述關鍵詞的百度指數(shù)時間序列綜合成滬市投資者情緒指數(shù)。
上述國內外研究,從實證角度證明了網絡平臺數(shù)據(jù)在股票市場預測中的有效性,但尚有不足。首先,多數(shù)研究未能細致區(qū)分不同市場狀態(tài)(牛市、熊市以及正常波動情況)下網絡情緒與股市收益的相關性;其次,已有研究主要在均值回歸框架下開展研究工作,能夠揭示投資者情緒對股市收益平均水平的影響,卻無法刻畫其在不同分位點處的異質影響模式。為此,本研究綜合使用均值Granger和分位數(shù)Granger因果檢驗,探討網絡情緒波動對股市收益的影響,以期有新的發(fā)現(xiàn)。
2.1網絡情緒界定
(1)實質為情緒氛圍
網絡情緒并非網絡世界中部分人的情緒,而是整個網絡環(huán)境中的情緒氛圍。網絡中每一個參與者的個人情緒共同構成了網絡中的情緒氛圍,這種情緒氛圍并非是個人情緒的簡單相加,而是由所有參與者之間相互影響、共同作用形成。一方面,所有個人參與者的情緒共同構成網絡中的情緒氛圍,情緒氛圍中包含了每個人的情緒;另一方面,情緒氛圍會反向影響每一個參與者的情緒,參與者會受同一網絡中其他人情緒的感染,改變甚至逆轉其原有情緒。曾小夢[23]研究表明中國網絡環(huán)境中的個體易受整體輿情左右,參與者之間具有較強的相互作用。這種情緒間的相互影響和共同作用,受參與者交流的暢通程度影響,當參與者之間的交流暢通時,交流頻次和質量都有所提升,從而互相間情緒的影響作用也越強。
(2)范圍為網絡社交平臺
伴隨著互聯(lián)網絡的發(fā)展,網絡社交及其平臺得到廣泛普及并被接受。盡管網絡用戶的情緒信息會散布在互聯(lián)網絡世界的各個角落,但主要集中在諸如博客、微博、論壇、QQ等網絡社交平臺中。新浪微博是目前中國最大的微型博客服務類社交網站,其用戶可以通過網頁、WAP頁面、手機客戶端、手機短信、彩信等形式參與微博互動。根據(jù)新浪微博2016年5月12日發(fā)布的第一季度財務報表顯示,截至2016年1季度末,新浪微博月活躍用戶達到2.61億人,日活躍用戶1.2億人??紤]到新浪微博龐大的用戶基數(shù)及其即時性、開放性、貼近用戶等特點,本研究選取新浪微博作為網絡社交平臺代表開展研究工作,以下網絡情緒數(shù)據(jù)如非特別聲明均來自新浪微博。
(3)類型為多種情緒類型
人的情緒有喜、怒、哀、樂等多種類型,每個人在同一時間其情緒狀態(tài)可能同時包含兩種或多種不同類型,不同類型的情緒對人的行為影響的強度、方向和作用時間可能都有所不同。本研究在探討網絡情緒與股市收益之間關系時,考慮多個不同情緒維度,探討不同情緒類型對股市收益的異質影響。
2.2網絡情緒分析
網絡社交平臺中,用戶與用戶之間的交流方式主要是文字和表情符號,用戶在發(fā)布微博時,其實時情緒蘊藏于微博文本之中。因而,微博文本中包含著用戶的實時情緒信息,本研究使用中文情感分析方法實現(xiàn)微博文本的情緒信息提取。
情感分析是自然語言處理下的一個分支學科,目前已有的文本情感分析以基于詞典的匹配方法和基于機器學習的分類方法為主,其中機器學習分類方法常見的有樸素貝葉斯[24]、支持向量機方法[25-26]、神經網絡方法[27]、K近鄰方法[28]以及其他方法[29]。由于此類方法需要大量訓練樣本且參數(shù)設置復雜,因此在中文情感分析領域目前比較成熟且常用的方法是基于情緒詞典的情緒分析方法,如馬秉楠等[30]使用的表情符號詞典和蔣盛益等[31]使用的面向微博語料的語義詞典。詞典類方法的主要步驟有:①對經過初步數(shù)據(jù)清洗后的微博文本進行分詞,即將完整的語句根據(jù)中文語言習慣及語義將其分割為若干詞匯或短語;②對每一條微博文本中的情緒因子(詞、短語、常見搭配、表情符號等)與情緒詞典進行匹配并求和計算,獲得每一條微博的情緒向量。提取流程見圖1。
中文文本情感分析效果的關鍵在于情緒詞典的質量,本研究綜合大連理工大學建立的中文情感詞匯本體庫和臺灣大學建立的中文情感極性詞典構建本研究所用情感詞典。中文情感詞匯本體庫是大連理工大學信息檢索研究室整理和標注的一個中文本體資源,該情感分類體系在國外比較有影響的Ekman的6大類情感分類體系的基礎上,將詞匯本體加入情感類別“好”,對褒義情感進行了更細致的劃分,最終詞匯本體中的情感共分為7大類21小類。本研究使用其中的7大類劃分方式。臺灣大學建立的中文情感極性詞典數(shù)據(jù)是基于文本情感二元劃分方法的一個中文詞語數(shù)據(jù)庫,它將11 086個詞語分為2 810個積極屬性詞語和8 276個消極屬性詞語。在此基礎上,本研究將Boson NLP提供的網絡情感詞庫添加進已有詞庫。Boson NLP情感詞典是玻森中文語義開放平臺(http:∥bosonnlp.com/)從微博、新聞、論壇等數(shù)據(jù)來源的上百萬篇情感標注數(shù)據(jù)中自動構建的情感極性詞典。因為標注包括微博數(shù)據(jù),該詞典囊括了很多網絡用語及非正式簡稱,對非規(guī)范文本有較高的覆蓋率。
表1給出文本情感分析工作使用的情緒詞典示例,(a)和(b)分別為前文中所述用于提取7類情感維度的中文情感詞匯本體庫和用于提取情感極性的中文情感極性詞典。此外,本研究還整理并設置了(c)反義詞庫和(d)程度詞庫(分5個等級)。當文本中出現(xiàn)“程度詞+情緒詞”時,該情緒詞對應情緒值會加上程度詞權重;當出現(xiàn)“反義詞+情緒詞”時,該情緒會逆轉(僅適用于部分情感,如情感極性、開心和悲傷、好和怒)。本研究還對表情符號表達的情緒進行手動設定,表情符號在文本形式的微博中會以“[表情名]”的形式展現(xiàn),如[開心]。根據(jù)所使用情緒詞典,本研究得到情感極性、樂、好、怒、悲、懼、厭惡、驚訝共8個維度的日情緒時間序列。
圖1 情緒向量提取流程Figure 1 Procedure of Sentiment Vector Extraction
(a)中文情感詞匯本體庫情緒詞情感分類強度(b)中文情感極性詞典情緒詞極性(c)反義詞庫詞(d)程度詞庫程度詞程度臟亂惡7 強悍1 不一點兒微弱賊眼惡5 強勢1 非有點微弱晴朗好5 巧奪天工1 無更更倍兒棒好7 巧妙1 未越來越更少見多怪惡3 俏麗1 不曾實在強哀莫大于心死哀9 俏皮1 沒很強標兵好5 煽動-1 沒有極度極強倒霉哀3 瑣碎-1 請勿奇極強敗家子惡7 疑心-1 不用微不足陰沉怒5 疑慮-1 無須相對不足
2.3網絡情緒測量
為獲得原始微博文本,本研究使用網絡爬蟲技術抓取2014年1月1日至2016年4月1日34 466名微博用戶共計4 934 549條新浪微博條目。根據(jù)上文中網絡社交平臺情緒的界定,本研究沒有選擇特定目標用戶群(如經常參與股票市場相關話題討論的用戶群體)作為抓取范圍,而是進行隨機抓取??紤]到新浪微博龐大的活躍用戶基數(shù),要實施全樣本數(shù)據(jù)抓取幾乎無法實現(xiàn),本研究以微博用戶之間相互“關注”關系為線索,使用深度遍歷的檢索模式實現(xiàn)對樣本的隨機抽樣。韓運榮等[32]研究發(fā)現(xiàn),微博輿論傳遞呈漩渦蔓延型、星系擴散型和節(jié)外生枝型,表明用戶之間存在緊密聯(lián)系;尹書華[33]的研究表明,新浪微博用戶關系網絡具有小世界特性。所謂小世界特性是指在新浪微博用戶關系網絡中,任意兩個節(jié)點(用戶)之間的平均路徑長度較短,具體為3.314,即平均約每3個節(jié)點就可以將任意兩個用戶關聯(lián)起來。基于此,本研究采取上述數(shù)據(jù)抓取規(guī)則并認為此規(guī)則實現(xiàn)了隨機抽樣。
在進行數(shù)據(jù)抓取時,為保證情緒數(shù)據(jù)可靠性和有用性,只抓取符合以下篩選條件的微博用戶的微博數(shù)據(jù):①非認證用戶,即非名人、官方、自媒體等帶有“V”字標記的微博用戶。此類用戶關注者數(shù)量巨大,本身多偏娛樂或官方,通常不含有效情緒信息。②粉絲數(shù)大于20且小于1 500的用戶,用于剔除廣告營銷賬號和非活躍用戶。廣告營銷類微博賬戶通常擁有1 500以上的關注者(粉絲),個人用戶關注者數(shù)目一般不超過1 500;非活躍用戶包含兩類,一類為雖注冊微博賬號但不經常使用的用戶,此類用戶通常不會使用微博表達其個人情緒故剔除,另一類為所謂“僵尸粉”。
在對抓取到的微博文本內容進行數(shù)據(jù)清洗時,主要剔除以下內容:①轉發(fā)及評論內容,為保證情緒提取的準確性,此處僅保留代表微博發(fā)布者主觀觀點的微博內容。②用戶昵稱,包括本人用戶昵稱及好友用戶昵稱。③話題內容,部分微博圍繞某一熱門話題時會加上“#話題名稱#”,此處剔除。④定位信息,客戶端信息等不包含情緒的無關信息。完成上述數(shù)據(jù)清洗工作以后,用于下一步情緒提取的數(shù)據(jù)僅含微博發(fā)布者的原創(chuàng)微博,此類微博內容由發(fā)布者編輯并發(fā)布,其中包含更多且更主觀的用戶情緒信息,無論是情緒提取的難易程度或是情緒提取的準確性都有顯著提升。
在計算網絡情緒得分時,主要分為3個步驟。①使用網絡情緒分析中所述方法,對經過清洗后的微博文本進行情緒提取,得到每條微博的情緒向量;②對同一天內所有微博的情緒向量各維度數(shù)值求均值,得到當天的情緒向量;③將某一時間段內所有情緒向量按日期排列獲得該時間段內的情緒時間序列。圖2給出本研究提取到的2014年1月1日至2016年4月1日微博情緒時間序列。
為研究網絡情緒是否影響股市收益,本研究使用Granger因果檢驗方法,探討其對股市收益的預測能力。
3.1均值Granger因果檢驗
均值Granger因果檢驗主要考察解釋變量X是否有利于預測Y的行為。一般地,如果增加X及其滯后值有助于改善對Y條件均值的預測能力,則認為X是Y的均值Granger原因,記為X?EY;反之,則認為X不是Y的均值Granger原因,記為X≠>EY。將X≠>EY作為原假設H0,檢驗(1)式是否成立,即
(1)
其中,E(·)為條件期望,t為時間,Ωt-1(·)為直到(t-1)時刻的信息集。
E(Rt)=a+∑pi=1αiRt-i
(2)
E(Rt)=a+∑pi=1αiRt-i+∑qj=1βjSt-j
(3)
(a)情感極性 (b)樂 (c)好 (d)怒
(e)悲 (f)懼 (g)厭惡 (h)驚訝
圖2微博情緒時間序列
Figure2TimeSeriesofWeiboSentiment
其中,Rt為t時刻股票收益率,i為收益率的滯后階,p為收益率的最大滯后階數(shù),j為網絡情緒指標的滯后階,q為網絡情緒指標的最大滯后階數(shù),St-j為(t-j)時刻網絡情緒波動指標值,a為截距項。(2)式為有約束均值回歸模型,表明S對R無顯著影響;(3)式為無約束均值回歸模型,表明S對R有顯著影響。通過兩個均值回歸模型,得到無約束模型殘差平方和RSSU和有約束模型殘差平方和RSSR,進而構建F檢驗統(tǒng)計量,即
(4)
其中,m為滯后項的個數(shù),n為觀測值個數(shù),k為無約束回歸中待估計參數(shù)的個數(shù)。如果F統(tǒng)計值的尾概率小于0.05,則在5%顯著性水平下拒絕原假設H0,認為網絡情緒是股市收益的均值Granger原因,意味著可以使用網絡情緒預測股市收益均值的變動規(guī)律。
3.2分位數(shù)Granger因果檢驗
均值Granger因果檢驗只能探測解釋變量對響應變量條件均值的預測能力,無法細致刻畫其對響應變量在其他位置(如上尾或下尾)的預測能力。分位數(shù)Granger因果檢驗可以彌補這一缺憾,它將分位數(shù)回歸與均值Granger因果檢驗相結合,能夠找到變量間因果關系成立的具體位置(分位點區(qū)間),從而可能捕獲均值Granger因果檢驗無法發(fā)現(xiàn)的因果關系。關于分位數(shù)回歸的基本原理可以參見KOENKER et al.[34-35]的研究,關于分位數(shù)Granger因果檢驗的具體原理和方法參見CHUANG et al.[36]、GEBKA et al.[37]和LEE et al.[38]的研究。
QYt[τ|(Y,X)t-1]=QYt(τ|Yt-1), ?τ∈(b,c)
(5)
其中,QYt(τ|·)為條件τ分位數(shù);τ為分位點;(b,c)為特定的分位點區(qū)間,且0
(6)
由(6)式的分位數(shù)回歸可以推導構建確定分位點τ處的Wald檢驗統(tǒng)計量為
(7)
(8)
其中,τi為第i個分位點。根據(jù)supWT檢驗統(tǒng)計量值及相應臨界值可以判斷對應分位點區(qū)間內分位數(shù)Granger因果是否成立,進而判斷因果關系成立的具體分位點區(qū)間,如若檢驗統(tǒng)計量表明在分位點區(qū)間[0.05,0.95]內非Granger原因不成立,但[b,c](b>0.05且c<0.95)內非Granger原因成立,則意味著Granger因果成立的分位點區(qū)間為[0.05,b]∪[c,0.95]。進一步,可以證明
(9)
故有
(10)
實證中,首先,在[0.05,0.95]區(qū)間內等距取1 000個分位點,進行如下的分位數(shù)回歸,即
τ∈(b,c)
(11)
其次,根據(jù)分位數(shù)回歸結果,由(7)式和(10)式得到Sup-Wald檢驗統(tǒng)計量的值,進而篩選出在[0.05,0.95]分位點區(qū)間內與股市收益有顯著因果關系的情緒時間序列,并確定因果關系成立的分位點區(qū)間。Sup-Wald統(tǒng)計量在區(qū)間(b,c)上的臨界值可以通過Monte Carlo模擬方式得到,部分臨界值已由ANDREWS[39]和KOENKER et al.[40]給出,表2給出分位點區(qū)間[0.05,0.95]的Sup-Wald檢驗臨界值。
表2 分位點區(qū)間[0.05,0.95]的Sup-Wald檢驗臨界值Table 2 Critical Values of the Sup-Wald Test within Quantile Interval of [0.05,0.95]
注:待檢驗參數(shù)向量維度即本研究實證中的滯后天數(shù);
數(shù)據(jù)來源:ANDREWS D W K.Tests for parameter instability and structural change with unknown change point.Econometrica,1993,61(4):821-856.
分別使用均值Granger因果檢驗和分位數(shù)Granger因果檢驗,探討網絡情緒對股市收益的影響,并將兩種方法取得的結果進行對比。
4.1數(shù)據(jù)選取
為探討網絡情緒與股市收益之間的因果關系,除網絡情緒日數(shù)據(jù)外,還需要股市收益數(shù)據(jù)。考慮到滬深300指數(shù)的代表性,本研究使用其作為整個滬深股市收益的代表,樣本選取2014年1月1日至2016年4月1日期間的滬深300指數(shù)日收盤價,數(shù)據(jù)來源于Wind數(shù)據(jù)庫。表3給出樣本期間滬深300指數(shù)對數(shù)收益率和網絡情緒描述性統(tǒng)計結果,情感極性可以取負值(表示消極情緒),其他情緒值大于或等于0,偏度和峰度的標準值均為0。根據(jù)滬深300指數(shù)對數(shù)收益率的偏度和峰度可以看出其具有明顯的尖峰厚尾特性,表明中國證券市場不服從正態(tài)分布,適合使用分位數(shù)回歸方法加以分析。
為探討不同股市發(fā)展階段下網絡情緒對股票市場影響的差異,本研究將股票市場劃分為3個階段。①股市波動階段,即在此期間股指有正常的上下波動但整體上基本持平;②股市上升階段,即在此期間股指總體走勢呈明顯上升趨勢;③股市下降階段,即在此期間股指總體走勢呈明顯下降趨勢。
根據(jù)各走勢階段的定義,結合圖3的滬深300指數(shù)價格波動情況,對股票市場進行階段劃分,詳見表4。整個樣本期間內,股市波動階段共有3個,考慮到2015年1月5日至2015年3月1日和2015年8月25日至2015年12月21日兩區(qū)間為股市大幅波動前后的盤整階段,此時股市雖整體表現(xiàn)為上下波動但并不能視為“正?!保颂幉贿m用;股市下降階段共有3個,但2015年8月17日至2015年8月25日股市下降時間區(qū)間過短(去除休息日及滯后項數(shù)據(jù)后僅4條數(shù)據(jù)),此處不適用。剔除上述3個時間區(qū)間后,本研究選取2014年1月1日至2014年10月26日作為股市波動時間段(S1),選取2014年10月31日至2015年1月5日和2015年3月5日至2015年6月2日兩個時間段分別作為股市上升階段1(S2)和股市上升階段2(S3),選取2015年6月7日至2015年7月8日和2015年12月21日至2016年1月27日兩個時間段分別作為股市下降階段1(S4)和股市下降階段2(S5)。
在使用Granger因果檢驗探討網絡情緒與股票市場之間關系時,要求數(shù)據(jù)對象必須是平穩(wěn)的時間序列。為此,在股指價格和網絡情緒指數(shù)基礎上,通過一階差分,分別得到股指收益和網絡情緒波動為
Rt=ln(Pt)-ln(Pt-1)
(12)
St=Mt-Mt-1
(13)
其中,Pt為t時刻滬深300收盤價,Mt為t時刻網絡情緒指數(shù)。
4.2結果分析
分別使用均值Granger因果檢驗和分位數(shù)Granger因果檢驗,探討網絡情緒波動對股市收益的影響??紤]到股市每周有5個交易日,本研究分別使用滯后1階到滯后5階,進行Granger因果檢驗。
在進行Granger因果檢驗之前,為避免出現(xiàn)偽回歸,首先對所有8個情感時間序列和一個股市收益率時間序列進行單位根檢驗。為此,選取PP檢驗和KPSS檢驗兩個非參數(shù)檢驗方法,前者以“時間序列非平穩(wěn)”作為原假設,容易犯“存?zhèn)五e誤”;后者則把“時間序列平穩(wěn)”作為原假設,可以視為PP檢驗的補充。同時使用兩種檢驗方法,可以降低“存?zhèn)五e誤”的可能,使檢驗更全面、更具說服力。表5給出PP檢驗和KPSS檢驗的尾概率,兩種檢驗方法一致表明,在1%顯著性水平下都拒絕原假設,認為不存在單位根,意味著9個時間序列都平穩(wěn),可以進行Granger因果檢驗。
表3 各變量描述性統(tǒng)計結果Table 3 Results of Description Statistics of Variables
圖3 2014年1月1日至2016年4月1日滬深300指數(shù)價格Figure 3 Price of CSI 300 from 2014-01-01 to 2016-04-01
股市階段時間區(qū)間是否選擇劃分結果股市波動2014-01-01~2014-10-26是股市波動階段:S12015-01-05~2015-03-01否2015-08-25~2015-12-21否股市上升2014-10-31~2015-01-05是股市上升階段1:S22015-03-05~2015-06-02是股市上升階段2:S3股市下降2015-06-07~2015-07-08是股市下降階段1:S42015-08-17~2015-08-25否2015-12-21~2016-01-27是股市下降階段2:S5
表5 單位根檢驗結果Table 5 Results of Unit Root Tests
4.2.1 均值Granger因果檢驗
在股市不同階段,對各網絡情緒波動與股市收益之間關系進行均值Granger因果檢驗,結果見表6。表6給出的滯后階數(shù)為最優(yōu)滯后階數(shù),由SIC準則從滯后1天~滯后5天中確定。由表6可得到如下結論。
(1)在股市上升階段網絡情緒波動與股市收益之間存在更多因果關系
各網絡情緒波動與股市收益之間的因果關系在股市波動階段(S1)和股市下降階段(S4和S5)整體不顯著。不過,在股指兩個上升階段(S2和S3),網絡情緒波動與股市收益之間出現(xiàn)了比股市波動階段和股市下降階段更為廣泛的因果關系,意味著當股票市場處于上升時期時更容易受到網絡情緒的影響。究其原因,可能由于在股票市場整體向上的階段,投資者心理壓力減輕,對股市投資的謹慎程度降低,從而導致其決策的隨意性、非理性程度比平時要強,其投資決策容易受各類情緒的影響。
表6 不同股市走勢階段下均值Granger因果檢驗結果Table 6 Results of Mean Granger Causality Tests under Different Stages of Stock Market Trend
注:p值為均值Granger因果檢驗中的Wald檢驗p值;*為在5%水平下顯著,下同。
(2)不同股市走勢階段股市收益受網絡情緒波動影響差異明顯
這種差異主要體現(xiàn)在與股市收益有顯著因果關系的情緒種類上。例如,同為股市上升階段,但上升階段1和上升階段2中能夠作為股市收益Granger原因的網絡情緒種類并不一致,在股市上升階段1中主要為厭惡,在股市上升階段2中主要為好和怒。這可能是由不同波動階段的具體特性造成,經過盤整之后繼續(xù)上漲的股市上升階段2相較股市上升階段1投資者心理發(fā)生變化,能夠對其決策產生顯著影響的情緒維度有所不同,這一結果反映了兩個階段內市場中的投資者情緒狀態(tài)有所不同。
4.2.2 分位數(shù)Granger因果檢驗
在表6的40個均值Granger因果檢驗中,存在3個顯著的Granger因果關系,占比僅為7.50%,似乎說明網絡情緒并不能顯著影響且準確預測股市收益。這一結果是否可靠,本研究使用分位數(shù)Granger因果檢驗,探討網絡情緒波動與股市收益之間的關系,結果見表7。表7給出的滯后階數(shù)為最優(yōu)滯后階數(shù),也是根據(jù)SIC準則從滯后1天~滯后5天中確定。在表7的40個分位數(shù)Granger因果檢驗中,發(fā)現(xiàn)存在23個顯著的Granger因果關系,占比上升到57.50%。由表7可以進一步得到如下主要結論。
(1)使用分位數(shù)Granger因果檢驗能夠揭示均值Granger因果檢驗難以發(fā)現(xiàn)的因果關系
無論股市處于哪個階段,在0.05~0.95分位點之間表現(xiàn)出與股市收益之間存在顯著因果關系的網絡情緒波動數(shù)量都多于均值Granger因果檢驗。這一結果表明,一些在特定分位點區(qū)間真實存在的網絡情緒與股市收益之間的因果關系,使用均值Granger因果檢驗方法往往難以發(fā)現(xiàn),而分位數(shù)Granger因果檢驗則可以彌補這一缺憾,能夠準確地捕捉到在不同分位點區(qū)間的因果關系。例如,在波動階段(S1),均值Granger因果檢驗認為情感極性波動不是股市收益的Granger原因,而分位數(shù)Granger因果檢驗卻發(fā)現(xiàn),在[0.92,0.95]分位區(qū)間上,情感極性波動是股市收益的Granger原因。此外,在S1階段,均值Granger因果檢驗認為不存在對股市收益存在顯著因果影響的情緒,而分位數(shù)Granger因果檢驗卻發(fā)現(xiàn)情感極性、懼、厭惡、驚訝等4個情緒波動對股市收益存在顯著的因果關系。在5個不同階段,均值Granger因果檢驗認為情感極性都不是股市收益的Granger原因,而分位數(shù)Granger因果檢驗卻發(fā)現(xiàn)情感極性一直都是股市收益的Granger原因。
表7 不同股市走勢階段下分位數(shù)Granger因果檢驗Table 7 Results of Quantile Granger Causality Tests under Different Stages of Stock Market Trend
注:Sup-Wald為分位數(shù)Granger因果檢驗中的Sup-Wald檢驗統(tǒng)計值;**為在1%水平下顯著;分位區(qū)間為分位數(shù)Granger因果關系顯著成立的分位點所在區(qū)間,沒有數(shù)據(jù)表示不存在分位區(qū)間使分位數(shù)Granger因果成立。
這一結果可能存在兩個方面的原因。①就方法論而言,基于分位數(shù)回歸的分位數(shù)Granger因果檢驗能夠揭示解釋變量對響應變量在不同分位點處的異質影響,網絡情緒的影響可能表現(xiàn)為部分分位點區(qū)間為正向且顯著影響、部分分位點區(qū)間為負且顯著影響、部分分位點區(qū)間無顯著影響等情形,從而出現(xiàn)一些特定分位點區(qū)間存在網絡情緒與股市收益之間的因果關系。這一特定分位點區(qū)間的Granger因果關系很難被基于均值回歸的均值Granger因果檢驗發(fā)現(xiàn),因為部分分位點區(qū)間(如上尾部)的正向且顯著影響與部分分位點區(qū)間(如下尾部)的負向且顯著影響可能互相抵消,導致均值回歸中網絡情緒對股市收益的均值影響不顯著,得出不存在Granger因果關系的結論。②就實際問題而言,行為金融理論認為,市場上存在眾多非理性投資行為,投資者情緒反映了市場上的投機傾向,在一些極端收益目標追求下,投資者情緒往往更容易與極端收益建立起關聯(lián),從而表現(xiàn)為在一些極端分位點區(qū)間上形成對股市收益的Granger因果影響。
(2)不同市場走勢階段下股市收益受網絡情緒影響具有異質性
從具有顯著因果關系的具體分位點區(qū)間看,當市場處于波動階段(S1)期間,所有因果關系均在高分位點(靠近0.95)處成立;當市場處于股市上升階段(S2和S3)期間,所有因果關系均在低分位點(靠近0.05)處成立。不過,同為股市下降階段S4和S5,其具有因果關系的分位點區(qū)間卻截然不同。在S4階段,情感極性在分位區(qū)間[0.05,0.07]上構成股市收益的Granger原因;在S5階段,其構成Granger原因的分位區(qū)間為[0.93,0.95]。這可能源于兩個下降階段各自的特殊性造成心理狀態(tài)的差異性。股市下降階段1為本次股指大幅漲落期間的首次大幅下跌,且下跌速度快,下跌程度劇烈,下跌之前為股指瘋漲階段,在下跌局面發(fā)送之前多數(shù)投資者對此次下跌沒有預期和心理準備;而股市下降階段2為本期間股指的第3次大跌,下跌相對緩和且大跌之前市場處于盤整階段,下跌發(fā)生之前投資者已有一定程度的心理準備。以上結果表明,當市場處于不同走勢階段時情緒對股市收益的影響具有異質性,其異質性不僅表現(xiàn)在影響收益的情緒種類上,還表現(xiàn)在所影響收益率的分位區(qū)間上。
更進一步,本研究認為造成這種異質性的根本原因在于,不同心理狀態(tài)下投資者情緒受網絡情緒影響效果的異質性。當市場處于波動狀態(tài)時,市場上的意外情況較少,投資者處于放松的心理狀態(tài),此時投資者受網絡情緒影響較多且情緒對市場收益率的影響發(fā)生在高分位區(qū)間;當市場處于上升階段時,投資者處于樂觀輕松的心理狀態(tài),此時市場受情緒影響較多,且此時情緒的影響發(fā)生在低分位區(qū)間;當市場處于下降階段尤其是突發(fā)、劇烈的下降階段時,市場整體不樂觀且意外情況頻發(fā),投資者處于緊張的心理狀態(tài),此時投資者受網絡情緒的影響極少且均發(fā)生在低分位區(qū)間。
(3)分位數(shù)Granger因果檢驗結果包含了均值Granger因果檢驗結果
首先,比較不同股市走勢階段下的分位數(shù)Granger因果檢驗結果,發(fā)現(xiàn)在股市上升階段與股市收益之間存在顯著因果關系的情緒總體上要多于股市下降階段,此結果與均值Granger因果檢驗一致,表明在股市上升階段股市收益受情緒的影響更大。其次,不同股市走勢階段下,股市收益受網絡情緒影響差異明顯,其中股市上升階段存在顯著因果關系的情緒種類較多,如在上升階段2(S3)有情感極性、好、怒、悲、懼、厭惡、驚訝等7種情緒波動與股市收益之間存在顯著的因果關系,比上升階段1(S2)多了懼和驚訝。本研究認為,這是因為在經過盤整之后繼續(xù)上漲的股指上升階段2(S3),投資者的心理狀態(tài)比股指上升階段1(S2)期間擔憂的成分有所增加,更容易受到諸如懼和驚訝等情緒的影響。而在處于股市下降階段時,網絡情緒與股市收益之間的因果關系總體偏少,如在股市下降階段1(S4)時,僅有情感極性和驚訝具有顯著的因果關系。因此,從情緒種類角度看,股票市場在不同市場走勢階段下受情緒影響是十分敏感的。
本研究旨在揭示網絡情緒對股市收益的影響,一方面給出網絡情緒的分析方法和測量結果,另一方面綜合使用均值Granger因果和分位數(shù)Granger因果檢驗方法進行實證檢驗。選取新浪微博數(shù)據(jù)和滬深300指數(shù)為研究對象,實證檢驗網絡情緒波動對股市收益的影響。研究結果表明,在一些極端分位點區(qū)間兩者存在顯著且廣泛的Granger因果關系,這為在特定條件下股市收益的可預測性提供了佐證。①使用分位數(shù)Granger因果檢驗,能夠揭示均值Granger因果檢驗難以發(fā)現(xiàn)的因果關系,前者的發(fā)現(xiàn)率為57.50%,遠高于后者的7.50%。②在一些特定分位點區(qū)間存在網絡情緒波動與股市收益之間的因果關系,表明蘊藏于互聯(lián)網絡中的情緒信息有助于增加對股市收益的理解,可以將其納入經濟計量模型之中,與宏觀或(和)微觀經濟變量一起研究股市收益行為,能夠提高模型的解釋能力和預測效果。③網絡情緒波動對股市收益的影響表現(xiàn)出隨著分位點變化而變化的異質效應,需要深入考慮并揭示在不同分位點處或不同分位點區(qū)間上網絡情緒的作用和貢獻,如好和悲只在低分位點區(qū)間上成為股市收益的Granger原因。④不同市場走勢階段下網絡情緒波動與股市收益之間的Granger因果關系有著不同的表現(xiàn),主要體現(xiàn)在Granger因果關系成立的分位點區(qū)間和情緒種類的差異上,當市場處于波動階段(S1),所有因果關系均在高分位點(靠近0.95)處成立;當市場處于股市上升(S2和S3)期間,所有因果關系均在低分位點(靠近0.05)處成立;而同為股市下降階段的S4和S5,其具有因果關系的分位點區(qū)間卻截然不同。
本研究意義在于兩個方面。①為如何有效挖掘并使用微博信息提供一種新的可行思路。鑒于中國網絡用戶群體基數(shù)大、網絡普及范圍廣的現(xiàn)狀,在海量的互聯(lián)網絡信息中必然蘊藏著大量能夠揭示中國經濟、政治等方面當前狀態(tài)及民情、民意、民生等關乎國計民生的有用信息,因而有效挖掘并使用這些信息能夠有助于企業(yè)制定合理的發(fā)展規(guī)劃和競爭戰(zhàn)略,有助于政府進行科學決策和制度設計。②為在特定條件下股市收益的可預測性提供了佐證。實證發(fā)現(xiàn),在一些特定分位點區(qū)間網絡情緒與股市收益之間存在顯著的因果關系,意味著網絡情緒對股市收益的條件分位數(shù)具有一定的預測能力,可以利用網絡情緒變化預測股市收益的尾部行為特征,為金融風險防范提供決策參考。需要注意的是,本研究的分位數(shù)Granger因果關系大多發(fā)生在極端分位點區(qū)間,如上尾的[0.90,0.95]和下尾的[0.05,0.10],表明網絡情緒對股市收益的預測能力有較強的限制條件。
本研究使用新的計量方法得到一些有意義的發(fā)現(xiàn),但受客觀條件限制,研究工作尚存在不足之處。①網絡情緒對股票市場的影響主要通過影響投資者情緒來完成,其背后的作用機理需要進一步明確,可以開展進一步的理論研究工作來探索網絡情緒對股市波動的影響渠道、影響方式和影響程度等。②目前中文自然語言處理準確率尚有所不足,從文本中提取情緒信息還存在一定程度的誤差,進一步研究工作可以通過人工標注大量語料,配合機器學習方法(如神經網絡方法等)提高情緒提取準確率。③本研究主要針對中國股市開展,得到的研究結果是否適合發(fā)達國家或者成熟市場國家的股市值得進一步探討。
[1]NOFSINGER J R.Social mood and financial economics.JournalofBehavioralFinance,2005,6(3):144-160.
[2]PRECHTER,Jr R R.Thewaveprincipleofhumansocialbehaviorandthenewscienceofsocionomics. Gainesville,Ga:New Classics Library,1999:241-254.
[3]PRECHTER,Jr R R,PARKER W D.The financial/economic dichotomy in social behavioral dynamics:the socionomic perspective.JournalofBehavioralFinance,2007,8(2):84-108.
[4]YAO J,MA C,HE W P.Investor herding behaviour of Chinese stock market.InternationalReviewofEconomics&Finance,2014,29:12-29.
[5]HUANG D,JIANG F,TU J,et al.Investor sentiment aligned:a powerful predictor of stock returns.TheReviewofFinancialStudies,2015,28(3):791-837.
[6]KIM S H,KIM D.Investor sentiment from internet message postings and the predictability of stock returns.JournalofEconomicBehavior&Organization,2014,107(2):708-729.
[7]JOSEPH K,WINTOKI M B,ZHANG Z.Forecasting abnormal stock returns and trading volume using investor sentiment:evidence from online search.InternationalJournalofForecasting,2011,27(4):1116-1127.
[8]張誼浩,李元,蘇中鋒,等.網絡搜索能預測股票市場嗎?.金融研究,2014(2):193-206.
ZHANG Yihao,LI Yuan,SU Zhongfeng,et al.Can internet search predict the stock market?.JournalofFinancialResearch,2014(2):193-206.(in Chinese)
[9]洪濤,厲偉.基于網絡搜索數(shù)據(jù)的住房價格預期與實際價格波動分析.統(tǒng)計與信息論壇,2015,30(11):49-53.
HONG Tao,LI Wei.A study on the relationship between expectation and real housing prices based on query index.Statistics&InformationForum,2015,30(11):49-53.(in Chinese)
[10] GILBERT E,KARAHALIOS K.Widespread worry and the stock market∥ProceedingsoftheFourthInternationalAAAIConferenceonWeblogsandSocialMedia.Washington,DC:AAAI Press,2010:58-65.
[11] GRUHL D,GUHA R,KUMAR R,et al.The predictive power of online chatter∥ProceedingsoftheEleventhACMSIGKDDInternationalConferenceonKnowledgeDiscoveryinDataMining.Chicago,Illinois:ACM Press,2005:78-87.
[12] MISHNE G,DE RIJKE M.Capturing global mood levels using blog posts∥ProceedingsoftheAAAI2006SpringSymposiumonComputationalApproachestoAnalysingWeblogs.California:AAAI Press,2006:145-152.
[13] LIU Y,HUANG X,AN A,et al.ARSA:a sentiment-aware model for predicting sales performance using blogs∥Proceedingsofthe30thAnnualInternationalACMSIGIRConferenceonResearchandDevelopmentinInformationRetrieval.Amsterdam,Netherlands:ACM Press,2007:607-614.
[14] PENG C L,LAI K L,CHEN M L,et al.Investor sentiment,customer satisfaction and stock returns.EuropeanJournalofMarketing,2015,49(5/6):827-850.
[15] ZHANG X,FUEHRES H,GLOOR P A.Predicting stock market indicators through twitter “I hope it is not as bad as I fear”.Procedia-SocialandBehavioralSciences,2011,26:55-62.
[16] BOLLEN J,MAO H,ZENG X.Twitter mood predicts the stock market.JournalofComputationalScience,2011,2(1):1-8.
[17] COREA F,CERVELLATI E M.The power of micro-blogging:how to use twitter for predicting the stock market.EurasianJournalofEconomicsandFinance,2015,3(4):1-7.
[18] WEI W,MAO Y,WANG B.Twitter volume spikes and stock options pricing.ComputerCommunications,2016,73(2):271-281.
[19] 賴凱聲,陳浩,錢衛(wèi)寧,等.微博情緒與中國股市:基于協(xié)整分析.系統(tǒng)科學與數(shù)學,2014,34(5):565-575.
LAI Kaisheng,CHEN Hao,QIAN Weining,et al.Weibo emotion and Chinese stock market:a study based on co-integration analysis.JournalofSystemsScienceandMathematicalSciences,2014,34(5):565-575.(in Chinese)
[20] 黃潤鵬,左文明,畢凌燕.基于微博情緒信息的股票市場預測.管理工程學報,2015,29(1):47-52,215.
HUANG Runpeng,ZUO Wenming,BI Lingyan.Predicting the stock market based on microblog mood.JournalofIndustrialEngineeringandEngineeringManagement,2015,29(1):47-52,215.(in Chinese)
[21] 朱南麗,鄒平,張永平,等.基于博客/微博信息量的投資者關注度測量研究:來自中國股票市場的經驗數(shù)據(jù).經濟問題探索,2015(2):159-166.
ZHU Nanli,ZOU Ping,ZHANG Yongping,et al.Investor attention measurement based on the number of blogs and microblogs.InquiryintoEconomicIssues,2015(2):159-166.(in Chinese)
[22] 孟雪井,孟祥蘭,胡楊洋.基于文本挖掘和百度指數(shù)的投資者情緒指數(shù)研究.宏觀經濟研究,2016(1):144-153.
MENG Xuejing,MENG Xianglan,HU Yangyang.Research on the investor sentiment index based on text mining and baidu index.Macroeconomics,2016(1):144-153.(in Chinese)
[23] 曾小夢.基于網民心理的網絡輿情引導研究.長沙:湖南大學,2013:20-28.
ZENG Xiaomeng.Researchonhowtoguidenetworkpublicopinionbasedontheinternetpsychology.Changsha:Hunan University,2013:20-28.(in Chinese)
[24] ZHOU G,ZHAO J,ZENG D.Sentiment classification with graph co-regularization∥Proceedingsofthe25thInternationalConferenceonComputationalLinguistics:TechnicalPapers.Dublin,2014:1331-1340.
[25] POURSEPANJ H,WEISSBOCK J,INKPEN D.uOttawa:system description for SemEval 2013 task 2 sentiment analysis inTwitter∥ProceedingsoftheSecondJointConferenceonLexicalandComputationalSemantics:SeventhInternationalWorkshoponSemanticEvaluation.Atlanta,Georgia,2013:380-383.
[26] 李婷婷,姬東鴻.基于SVM和CRF多特征組合的微博情感分析.計算機應用研究,2015,32(4):978-981.
LI Tingting,JI Donghong.Sentiment analysis of micro-blog based on the featured combinations of SVM and CRF.ApplicationResearchofComputers,2015,32(4):978-981.(in Chinese)
[27] 蘇小英,孟環(huán)建.基于神經網絡的微博情感分析.計算機技術與發(fā)展,2015,25(12):161-164,168.
SU Xiaoying,MENG Huanjian.Sentiment analysis of micro-blog based on neural networks.ComputerTechnologyandDevelopment,2015,25(12):161-164,168.(in Chinese)
[28] 劉曉菲,丁香乾,石碩,等.基于改進KNN的消費者評價信息情感分類研究.微型機與應用,2014,33(24):81-83,86.
LIU Xiaofei,DING Xiangqian,SHI Shuo,et al.Research on classifying sentiment of consumer evaluation based on modified KNN algorithm.Microcomputer&ItsApplications,2014,33(24):81-83,86.(in Chinese)
[29] YANG B,CARDIE C.Context-aware learning for sentence-level sentiment analysis with posterior regularization∥Proceedingsofthe52ndAnnualMeetingoftheAssociationforComputationalLinguistics.Baltimore,Maryland,2014:325-335.
[30] 馬秉楠,黃永峰,鄧北星.基于表情符的社交網絡情緒詞典構造.計算機工程與設計,2016,37(5):1129-1133.
MA Bingnan,HUANG Yongfeng,DENG Beixing.Generating sentiment lexicon of online social network based on emotions.ComputerEngineeringandDesign,2016,37(5):1129-1133.(in Chinese)
[31] 蔣盛益,黃衛(wèi)堅,蔡茂麗,等.面向微博的社會情緒詞典構建及情緒分析方法研究.中文信息學報,2015,29(6):166-171,202.
JIANG Shengyi,HUANG Weijian,CAI Maoli,et al.Building social emotional lexicons for emotional analysis on microblog.JournalofChineseInformationProcessing,2015,29(6):166-171,202.(in Chinese)
[32] 韓運榮,高順杰.微博輿論傳播模式探究.現(xiàn)代傳播:中國傳媒大學學報,2012,34(7):35-39.
HAN Yunrong,GAO Shunjie.Research on the mode of micro-blog public opinion communication.ModernCommunication:JournalofCommunicationUniversityofChina,2012,34(7):35-39.(in Chinese)
[33] 尹書華.基于復雜網絡的微博用戶關系網絡特性研究.西南師范大學學報:自然科學版,2011,36(6):57-61.
YIN Shuhua.A research of user relations properties based on a complex network of microblog.JournalofSouthwestChinaNormalUniversity:NaturalScienceEdition,2011,36(6):57-61.(in Chinese)
[34] KOENKER R.Quantileregression.New York:Cambridge University Press,2005:145-271.
[35] KOENKER R,HALLOCK K F.Quantile regression.JournalofEconomicPerspectives,2001,15(4):143-156.
[36] CHUANG C C,KUAN C M,LIN H Y.Causality in quantiles and dynamic stock return-volume relations.JournalofBanking&Finance,2009,33(7):1351-1360.
[37] GEBKA B,WOHAR M E.Causality between trading volume and returns:evidence from quantile regressions.InternationalReviewofEconomics&Finance,2013,27:144-159.
[38] LEE T H,YANG W.Granger-causality in quantiles between financial markets:using copula approach.InternationalReviewofFinancialAnalysis,2014,33:70-78.
[39] ANDREWS D W K.Tests for parameter instability and structural change with unknown change point.Econometrica,1993,61(4):821-856.
[40] KOENKER R,MACHADO J A F.Goodness of fit and related inference processes for quantile regression.JournaloftheAmericanStatisticalAssociation,1999,94(448):1296-1310.
FundedProject:Supported by the National Natural Science Foundation of China(71671056), the National Social Science Foundation of China(15BJY008) and the Humanity and Social Sciences Research of Ministry of Education(14YJA790015)
Biography:XU Qifa, doctor in management, is a professor in the School of Management at Hefei University of Technology. His research interests include theoretical and methodology of quantitative economics, and financial econometrics. His representative paper titled “Composite quantile regression neural network with applications” was published in theExpertSystemswithApplications(Volume 76, 2017). E-mail:xuqifa1975@126.com
BO Zhongpu is a master degree candidate in the School of Management at Hefei University of Technology. His research interest focuses on financial econometrics. E-mail:zp2576302465@163.com
JIANG Cuixia, doctor in management, is an associate professor in the School of Management at Hefei University of Technology. Her research interests include financial time series analysis and financial econometrics. Her representative paper titled “Hedge fund investment strategies based on LASSO quantile regression” was published in theJournalofManagementSciencesinChina(Issue 3, 2016). E-mail:jiangcx1973@163.com
ExploringtheRelationshipbetweenInternetSentimentandStockMarketReturnsBasedonQuantileGrangerCausalityAnalysis
XU Qifa1,2,BO Zhongpu1,JIANG Cuixia1
1 School of Management, Hefei University of Technology, Hefei 230009, China2 Key Laboratory of Process Optimization and Intelligent Decision-making of Ministry of Education, Hefei University of Technology, Hefei 230009, China
According to the behavioral finance theory, besides fundamental macro-economic factors, the change of stock market price is also influenced by individual investors or noise traders to a large extent. There are a large amount of individual investors in Chinese stock market. Most of them are also Internet users. Due to the high degree of coincidence between the group of individual investors and Internet users, it is possible to explore the fundamental rule of stock returns in China using internet sentiment information.
To investigate the impacts of individual investor behavior, we examine the relationship between investor sentiment and stock returns. In particular, we focus on and evaluate the impacts of internet sentiment information on stock returns from the perspective of individual investor sentiment. First, we extract several Internet Sentiment time series from Sina Weibo texts using Chinese text sentiment analysis approach. Second, we explore the causal relationship between internet sentiment changes and stock market returns using both the mean and quantile Granger causality tests. Third, Chinese stock market is divided into three stages based on its trends and we study the Granger causal relationship between internet sentiment changes and stock returns in different stages.
An empirical study is conducted on the CSI 300 index. The empirical results show that there is a widespread and significant causal relationship between the two variables at extreme quantile intervals via the quantile Granger causality test, instead of the naive mean Granger causality test. Specifically, in 40 causal relationship tests, the quantile Granger causality test confirms that there are 23 significant causal relationships. The discovery ratio is 57.5%, which is obviously larger than that of 7.5% of the naive mean Granger causality test. In addition, the effects of internet sentiment changes on stock returns are heterogeneous over the different market stages.
The empirical findings have great significance both in theory and practice. A significant causal impact of internet sentiment on the stock market returns has proved to be for some specific quantile intervals. It provides evidences for the predictability of stock market returns under certain conditions. Therefore, internet sentiment can be used to predict the tail(for instance upper or lower tail) of stock return, which offers a decision-making scheme to avoid financial risk. These results eventually provide a new idea for stock market research involving asset pricing, return prediction, volatility estimation, and so on. They have also shed some lights on a new direction for the application of internet sentiment information.
quantile regression;Granger causality test;stock market returns;internet sentiment;Weibo data
Date:August 20th, 2016
DateMarch 21st, 2017
F830.91
A
10.3969/j.issn.1672-0334.2017.03.013
1672-0334(2017)03-0147-14
2016-08-20修返日期2017-03-21
國家自然科學基金(71671056);國家社會科學基金(15BJY008);教育部人文社會科學研究規(guī)劃基金(14YJA790015)
許啟發(fā),管理學博士,合肥工業(yè)大學管理學院教授,研究方向為數(shù)量經濟理論與方法、金融計量等,代表性學術成果為“Composite quantile regression neural network with applications”,發(fā)表在2017年第76卷《Expert Systems with Applications》,E-mail:xuqifa1975@126.com
伯仲璞,合肥工業(yè)大學管理學院碩士研究生,研究方向為金融計量等,E-mail:zp2576302465@163.com
蔣翠俠,管理學博士,合肥工業(yè)大學管理學院副教授,研究方向為金融時間序列分析和金融計量等,代表性學術成果為“基于LASSO分位數(shù)回歸的對沖基金投資策略研究”,發(fā)表在2016年第3期《管理科學學報》,E-mail:jiangcx1973@163.com
□