蔡志剛 賴明明
摘 要:本文使用了三種不同的數(shù)據(jù)降維方法——主成分、卡爾曼濾波和拉普拉斯特征映射,選取了城鎮(zhèn)居民投資意愿、IPO首日收益率、對數(shù)開戶比和流通市值加權換手率,建立了三3個從1999年至2015年跨度17年的測度中國股票市場投資者情緒的月度復合指數(shù)。同時,基于“孿生股票”現(xiàn)象,使用AH股溢價指數(shù)對三個情緒指數(shù)進行了有效性檢驗。結果發(fā)現(xiàn),基于卡爾曼濾波方法的情緒指數(shù)最為有效,基于主成分方法的情緒指數(shù)次之,而基于拉普拉斯特征映射的情緒指數(shù)沒有達到實證研究的有效性要求。
關鍵詞:投資者情緒;卡爾曼濾波;拉普拉斯特征映射;有效性檢驗
中圖分類號:F830.91 文獻標識碼:A 文章編號:1674-2265(2016)07-0024-07
一、引言
行為金融學認為,投資者的認知偏差、投資行為的模仿學習和市場套利的有限性都會使投資人受到某些心理情緒因素的影響做出錯誤的投資行為,資產(chǎn)價格隨之長期偏離其價值,投資者情緒成為影響資產(chǎn)價格的系統(tǒng)性因子。貝克和沃格勒(Baker和Wurgler,2007)指出,投資者情緒是一種不能被已有事實所證實的關于金融資產(chǎn)未來現(xiàn)金流和風險的信念,它是投資者的認知偏誤在資本市場上的總體表現(xiàn)。通過對投資者情緒的研究,可以揭示有限理性的投資者是如何長期影響市場的。
投資者情緒的實證研究首先需要解決的是如何對其進行測量的問題。已有研究中有選擇主觀調查數(shù)據(jù)來度量投資者對市場預期的總體判斷的;有選擇市場客觀指標來度量總體投資者錯誤定價程度的;還有通過對財經(jīng)雜志或網(wǎng)絡信息分析,測量投資者對市場的情緒態(tài)度的。這些都屬于單一情緒指標的范疇。布朗和克利夫(Brown和Cliff,2004)提出,可以將暗藏在多個情緒相關變量中的共同因素提取出來,形成一個復合的指標,更加精確地測量投資者情緒。因為,單一指標既含有投資者情緒因素,也含有其他的干擾因素,如果能夠有效地剔除干擾因素、保留共同因素,復合指標對情緒的測量會更準確。
本文從復合指標的角度來構建中國股市的投資者情緒指數(shù)。構建復合指數(shù)本質上是一個數(shù)據(jù)降維過程,現(xiàn)有的研究絕大部分都采用主成分分析的方法。不同的數(shù)據(jù)降維方法是否會對測量結果產(chǎn)生不同的影響?已有文獻中并沒有回答這個問題。本文使用三種不同的數(shù)據(jù)降維方法——主成分、卡爾曼濾波和拉普拉斯特征映射(LE)來比較情緒因素的提取測量效果。
投資者情緒研究中的另一個現(xiàn)象是在情緒與市場的相互作用實證研究結果上,已有文獻存在較大分歧。有的研究認為,情緒對市場有顯著影響;另有一些研究持不同的觀點。易志高和茅寧(2009)指出上述現(xiàn)象的一種解釋是不同的研究采用的情緒指數(shù)測量方法不同。特別是,復合指標中采用的原始情緒相關變量中含有的干擾因素太多,就會造成最主要的共同因素已經(jīng)不是研究所需要的情緒因素,復合指標的可靠性受到質疑。解決這個問題的思路,一是要細致選擇原始情緒變量,確保與情緒緊密相關;二是需要一種檢驗復合投資者情緒指標可靠性的方法,確認對情緒測量的準確性。前者需要在對已有實證研究結果進行比較的基礎上,對中國股市特征進行分析來獲得?!皩\生股票”現(xiàn)象為后者提供了一種檢驗思路。貝克等(Baker等,2012)指出投資者情緒是造成“孿生股票”現(xiàn)象——價值相同的資產(chǎn)在不同市場定價不同——的一個重要原因,一個準確測量的投資者情緒指數(shù)應該能夠顯著影響資產(chǎn)價差。本文首次對構建的多個中國股市情緒指數(shù)進行了嚴格的有效性檢驗比較。
二、文獻綜述與評論
投資者情緒的測量是情緒實證研究中最基礎的問題。研究中有單一指數(shù)和復合指數(shù)兩類劃分。單一指數(shù)是復合指數(shù)構建的基礎成分,在不同的研究中使用靈活;復合指數(shù)有理論上的優(yōu)勢,如果構建的方法得當,可以獲得更精確的情緒測量。
(一)單一情緒指數(shù)
單一情緒指數(shù)包括:直接調查數(shù)據(jù)、間接的市場變量和文本信息挖掘變量。
1. 直接調查數(shù)據(jù):這一類指標主要通過直接詢問投資者對未來市場看漲看跌的態(tài)度,或者對未來的投資信心來了解總體上投資者對市場預期的看法。國外研究中多使用:美國投資者協(xié)會指數(shù)、投資者智能指數(shù)、華爾街戰(zhàn)略家指數(shù)、瑞銀/蓋樂普指數(shù)、希勒股票市場信心指數(shù)和消費者信心指數(shù);國內研究中多使用:央視機構看市、央視個人看市、好淡指數(shù)、華鼎多空民意調查、巨潮投資者信心指數(shù)、中國人民銀行城鎮(zhèn)居民投資意愿調查、消費者信心指數(shù)。
直接調查數(shù)據(jù)可以獲得可持續(xù)、可比較和具有一定獨立性的投資者情緒時間序列,但缺點在于:其一,一般這類數(shù)據(jù)的調查樣本都不大,甚至很多調查沒有披露抽樣方法和樣本量,代表性上存在疑問;其二,卡托納(Katona,1975)指出被調查者往往有選擇使自己滿意答案的傾向,他們的回復不一定等同于他們的真實想法或狀態(tài);其三,很多調查對投資者情緒只有定性的劃分,沒有定量的描述。
2. 間接的市場變量:這一類指標主要是尋找能夠代表投資者預期或者投資行為的證券市場變量,主要有:市場流動性指標、IPO指標、衍生品市場指標、基金流量指標、資產(chǎn)價格和市場績效指標。
這是現(xiàn)有研究中最為重要、使用最多的一類變量。但應該注意到,不同國家、不同的市場機制、不同的投資者理性程度,都會使變量的效果產(chǎn)生差異。更嚴重的問題是,大量文獻是研究投資者情緒對市場的影響,而在選擇的代理變量時,實際上就已經(jīng)假設該變量是與情緒相關的,即也是受到了情緒的影響,而不同的研究選擇不同的代理變量,在某個研究中的情緒代理變量——自變量,也許就是另一個研究中的因變量。例如,波爾克和薩皮恩扎(Polk和Sapienza,2009)將市場對公司股票的錯誤定價作為投資者情緒的代理變量,而斯坦博(Stambaugh等,2012)使用BW指數(shù)研究情緒對一大類包含股票錯誤定價的金融異象的影響。這種現(xiàn)象使得聯(lián)合假設的問題更嚴重,這也是催生復合指標的一個重要原因。
3. 文本信息挖掘變量:這一類數(shù)據(jù)主要是通過對雜志、網(wǎng)絡搜索和網(wǎng)絡討論等文本信息進行分析,運用人工或者計算機自動識別的方法,將各種信息按照情緒的不同分類進行統(tǒng)計,測量投資者對市場或者個別股票的情緒。達(Da,2011)和泰特洛克(Tetlock,2007)分別使用股票在Google上的搜索量和機器學習方法分析了華爾街雜志上報道信息的態(tài)度。汪昌云和武佳薇(2015)分析了IPO公司上市前在中國主流財經(jīng)報道中正負面詞匯數(shù),來測量同期市場的情緒。近期對這一類變量的研究不斷增多,說明其具有一定的優(yōu)勢。其一,情緒相關的網(wǎng)絡文本信息數(shù)量巨大。情緒是基于個體感受產(chǎn)生的,微信、微博和Twitter這類個性化的信息源是獲取個體情緒的理想渠道。其二,當前投資者中使用網(wǎng)絡工具進行股票交易的占到了相當比例,而且大多數(shù)是中小投資者,這些投資者會在互聯(lián)網(wǎng)上搜索、發(fā)表相關信息,這些信息具有代表性。其三,隨著互聯(lián)網(wǎng)的不斷發(fā)展,情緒信息的數(shù)據(jù)量越來越巨大并且很多都是實時信息,依靠傳統(tǒng)的人工辨識分類的方式已經(jīng)無法處理如此海量的信息,但自然語言理解和情感計算等相關技術可以大大提高數(shù)據(jù)采集分析的效率。其四,網(wǎng)絡信息的實時性有助于建立高頻情緒變量。
(二)復合情緒指數(shù)
布朗和克利夫(Brown和Cliff,2004)對流行的一些投資者情緒指數(shù)進行了分類,采用主成分和卡爾曼濾波兩種方法從多個單一投資者情緒變量中提取出一個共同的成分——純粹的投資者情緒。這種復合指標的方法從理論上更合理,因為研究者很難從單一指數(shù)的測量中分離出情緒成分和干擾誤差成分。這種方法在后續(xù)情緒研究中廣泛采用,最著名的情緒指數(shù)就是貝克和沃格勒(Baker和Wurgler,2006)提出的BW指數(shù)。他們利用主成分分析法,通過6個市場變量合成了BW情緒指數(shù),證實了情緒能夠反向預測那些小市值、新上市、高波動、可預測性差、不分紅、高度成長性、破產(chǎn)概率較高的股票的收益。后續(xù)對美國市場的情緒研究很多都基于他們的研究成果或將BW指數(shù)作為標桿進行對比研究。
復合指數(shù)也存在缺點:(1)研究中一定要確保情緒成分在構成復合指標的源指標中一定是占優(yōu)的,否則提取出來的共同成分可能就會偏離很遠;(2)現(xiàn)有研究中復合指標投資者情緒主要代表的是市場的總體情緒,而一些特定群體——機構投資者或個體投資者的情緒復合指數(shù)的構造比較困難。
三、研究設計
(一)投資者情緒指數(shù)源變量的選取
基于上述分析,本文在構建中國股票市場投資者情緒指數(shù)時選取了城鎮(zhèn)居民投資意愿、月度 IPO 首日收益率、對數(shù)開戶比和月度流通市值加權換手率四個指標作為構建復合情緒指標的源指標。樣本期從1999年1月至2015年12月,共204期,表1中列出了4個指標說明,表2中給出了4個指標的描述統(tǒng)計量。
由于IPO 發(fā)行的中斷,204期中有40個月IPO數(shù)據(jù)缺失,本文采用與伍燕然等(2012)相同的方法,用其余情緒代理變量作為因變量,IPO月平均收益作為自變量來建立線性回歸模型,用缺失月份的預測值來替代缺失值。
(二)合成復合情緒指數(shù)的方法
本文采用了三種方法來合成復合情緒指數(shù):主成分分析、卡爾曼濾波和拉普拉斯特征映射(Laplacian Eigenmaps,以下簡稱LE)。這三種方法都保證降維后的數(shù)據(jù)最大限度地反映原始數(shù)據(jù)的特征,但每個方法的解釋角度不同。
1. 主成分分析。主成分分析是數(shù)據(jù)降維中使用頻率最高的方法。主成分分析的思想是在減少數(shù)據(jù)維數(shù)的同時保持數(shù)據(jù)中對方差解釋能力最大的特征。主成分分析本質上是一個正交化線性變換,把數(shù)據(jù)變換到一個新的坐標系統(tǒng)中,使得這一數(shù)據(jù)的任何投影的第一大方差在第一個坐標上,稱為第一主成分,第二大方差在第二個坐標上,稱為第二主成分,依次類推。
如果在情緒源變量中,投資者情緒所占的方差解釋比率最大,那么第一主成分就是對投資者情緒的一個良好的估計量。
2.卡爾曼濾波??柭鼮V波能夠從一系列的不完全及包含噪聲的測量中,估計動態(tài)系統(tǒng)中不可直接觀測的狀態(tài),它在經(jīng)濟分析中的一個重要作用是對狀態(tài)空間模型的推斷。一個典型的時間序列的線性狀態(tài)空間模型由“量測方程”式(1)和“狀態(tài)方程”式(2)共同組成:
其中,表示樣本長度,是可觀測的包含k個經(jīng)濟變量的維向量,是不可觀測的維狀態(tài)變量,服從一階馬爾科夫過程,,,,和都為待估參數(shù),在所有時間區(qū)間上擾動項和相互獨立,且都與初始狀態(tài)無關。
在擾動項與以及初始狀態(tài)向量正態(tài)假設下,卡爾曼濾波方法給出狀態(tài)向量在最小均方誤差意義下的一個最優(yōu)預測??柭鼮V波在宏觀經(jīng)濟的研究中比較常見,而投資者情緒作為一種不可直接觀測的變量也適用該種建模方法。
3. 拉普拉斯特征映射。貝爾金和尼若吉(Belkin和Niyogi,2002)提出了一種基于數(shù)據(jù)幾何性質的降維方法——LE方法。該方法將每一個樣本視為高維空間中的一個點,樣本點之間通過空間上距離的遠近構成相互關系。數(shù)據(jù)降維的過程就是將高維空間中的點投射到低維空間上來,保證在原有空間中距離接近的點在低維空間中也接近,該方法反映出數(shù)據(jù)內在的流形結構。
LE首先要構建相鄰關系圖,定義樣本數(shù)據(jù)之間的相鄰矩陣W,W代表了數(shù)據(jù)流形的局部結構特征。如果兩個樣本點和很相似,即兩點在原空間中距離接近,那么和在降維后目標子空間中應該盡量接近。設樣本點的數(shù)目為n,目標子空間的維度為m。定義大小的矩陣Y,其中每一個行向量就是樣本點在目標m維子空間中的向量表示,LE需要優(yōu)化的目標函數(shù)為:
(二)情緒指數(shù)的有效性檢驗
隨著對投資者情緒的研究越來越豐富,一個現(xiàn)實的問題擺在了研究者面前:實證中使用的投資者情緒指數(shù)是否是真實有效的?哪一個指數(shù)更能反映投資者情緒的變化?本文嘗試從定性與定量兩個角度來進行投資者情緒指數(shù)的有效性驗證。
1. 定性的有效性檢驗。貝克和沃格勒(2007)指出,如果一個投資者情緒指數(shù)是有效的,它應該能夠直觀地反映資本市場的波動變化,即情緒的高低與牛熊市能夠同步。在本文研究的樣本期中,中國股市出現(xiàn)的三輪大牛市,一是1999—2001年以網(wǎng)絡股為代表的一輪暴漲,網(wǎng)絡概念股的強勁噴發(fā)推動滬指創(chuàng)下2245點的當時歷史最高點;二是2005年開始,以股權分置改革啟動為起點,以6124點歷史高點為標志的階段;三是2014年初至2015年6月,號稱“改革?!钡囊惠啽q。這三輪牛市之間都是一些小幅波動的行情。從圖1中不難發(fā)現(xiàn)3個情緒指數(shù)都能夠捕獲到這幾次資本市場的波動變化,3個波峰都能夠與之匹配。由于4個源變量中有3個都是市場變量,合成的情緒指數(shù)與市場波動一致并不出乎意料。
2. 定量的有效性檢驗。貝克等(2012)首次提出了一種定量分析的思路,利用“孿生股票”來檢驗投資者情緒的有效性。經(jīng)典金融理論的“一價定律”指出,除去交易成本,同一種金融資產(chǎn)在市場上只能以一種價格交易,只要存在價差,就會馬上涌現(xiàn)大量的套利行為,消除差異。而“孿生股票”現(xiàn)象是針對“一價定律”的一個最重要的反例。“孿生股票”是指一家公司股票在不同的市場上市交易,除去交易成本的差異后往往不同市場上的股票價格上還存在一定的差異,而且這種差異有時會很大,超出了隨機誤差的范圍。經(jīng)典金融理論不能很好地解釋這種現(xiàn)象,而行為金融指出,不同市場的交易者會受到市場情緒的影響,即某一市場情緒上漲會推高在該市場交易的股票的價格,從而影響到“孿生股票”的價差。
中國市場上存在一個特有的現(xiàn)象就是大量公司到中國香港市場上市,形成了很多的“孿生股票”,特別是港交所在2006年推出了A-H股溢價指數(shù),即港交所按照流通額作為權重計算了同時發(fā)行A股和H股的上市公司股票的加權溢價,基點100表示兩地股票同價,高于100表示A股對H股存在溢價。這是檢驗投資者情緒指數(shù)的有效的數(shù)據(jù)基礎。按照貝克等(2012)研究思路,本文提出的具體的檢驗方程為:
其中,代表t時刻的A-H股溢價指數(shù),和分別是t時刻的A股市場投資者情緒與港股市場投資者情緒,是誤差項,方程考慮了溢價指數(shù)的自相關性。如果投資者情緒是有效的,在上述方程中,應該顯著大于0,顯著小于0。
該方法應用上的一個難點是需要同一時刻兩個市場的情緒指數(shù),缺少一個市場的指數(shù)等同于在上式中缺少了一個自變量,因為兩個市場情緒指數(shù)之間一定存在相關性,所以缺少一個自變量會造成參數(shù)估計量的非一致。與阿奎特等(Arquette等,2008)以及伯德金和楊(Burdekin和Yang,2013)的研究一致,本文選擇了恒生指數(shù)月度PE值作為中國香港股市投資者情緒的代理變量。(11)式的回歸結果見表3。
表3中比較了三組不同方法獲得的理性投資者情緒和非理性投資者情緒的回歸結果。首先發(fā)現(xiàn),在所有非理性投資者情緒作為自變量的回歸方程中,都顯著大于0;但在所有理性投資者情緒作為自變量的回歸方程中,都是不顯著的,即非理性投資者情緒解釋了兩個市場“孿生股票”的溢價現(xiàn)象,情緒的波動是造成資產(chǎn)溢價的重要原因,這與理論的預期是完全一致的。反之也說明,剔除了宏觀因素的三組非理性情緒指數(shù)是基本有效的,能夠有效地測量市場情緒的變化。
進一步,考察將非理性投資者情緒作為自變量的回歸方程系數(shù)。三個方程的都是負值,說明中國香港市場的情緒上升會提高港股的市場估值,降低AH股的溢價,這也是符合理論預期的。有意思的是,在以主成分和卡爾曼濾波為方法建立的情緒指數(shù)的前兩個方程中,是顯著的,但在以LE為方法的第三個方程中并不顯著。因為,三個方程中使用了同一個香港市場情緒指數(shù),溢價需要通過兩個市場情緒的對比來解釋,港股情緒指數(shù)的不顯著性是受到了A股市場情緒指數(shù)的影響。特別是,可以觀察到在所有以理性投資者情緒作為自變量的回歸方程中,都是不顯著的。所以,本文認為可以通過顯著性的大小來體現(xiàn)A股市場情緒指數(shù)有效性的強弱。的不顯著一定程度上可以解釋為A股市場情緒指數(shù)含有了過多的噪聲,沒有能夠對比反襯出港股市場的情緒,即該A股市場情緒指數(shù)的有效性較低。
總之,對比三種方法建立的情緒指數(shù)的回歸結果,本文認為,三個指數(shù)都能夠基本捕獲A股市場情緒的變化,但在有效性上使用主成分和卡爾曼濾波方法建立的和情緒指數(shù)是有效的,含有的噪聲較少,可以在后續(xù)的實證研究中使用,而且首選是;使用LE方法建立的可能含有較多的噪音,有效性較差,還需要進一步改進。
五、結論
本研究使用了三種不同的數(shù)據(jù)降維方法——主成分、卡爾曼濾波和拉普拉斯特征映射(LE),選取了適合中國國情的4個情緒源指標——城鎮(zhèn)居民投資意愿、IPO 首日收益率、對數(shù)開戶比和流通市值加權換手率,建立了3個測度中國股票市場投資者情緒的月度復合指數(shù)。同時,在控制了宏觀因素影響的基礎上,基于“孿生股票”溢價現(xiàn)象,使用AH股溢價指數(shù)對3個情緒指數(shù)進行了有效性檢驗,發(fā)現(xiàn)基于卡爾曼濾波方法的情緒指數(shù)最為有效,基于主成分方法的情緒指數(shù)次之,而基于LE方法的情緒指數(shù)沒有達到實證研究的有效性要求。本研究的主要貢獻在于印證了復合情緒指數(shù)方法的可行性,拓寬了復合情緒指數(shù)建立的方法,對復合情緒指數(shù)進行了較完整的有效性檢驗。
注:
①開戶數(shù)為A股賬戶開戶總數(shù),2014年7月后不公布A股賬戶開戶數(shù),只公布A股投資者數(shù),2014年7月后用開立A股賬戶自然人投資者數(shù)替換A股賬戶開戶總數(shù)。
②本文也采用貝克和沃格勒(2006)和易志高和茅寧(2009)研究中的方法考慮了指標“提前”與“滯后”的問題,但采用該方法后會損失一期數(shù)據(jù),而且新的第一主成分的方差貢獻率反而有微量減少,達到65.2,出于模型的簡便性仍然采用當期源變量進行主成分分析。
③本研究嘗試了n從5到30,t從5到50的參數(shù)變化,主要結論沒有改變,后續(xù)報道的是n=10,t=5的結果。
參考文獻:
[1]Baker M.,J.Wurgler. 2007. Investor Sentiment in the Stock Market[J].The Journal of Economic Perspectives,21(2).
[2]Brown G. W.,M. T. Cliff. 2004. Investor Sentiment and the Near-term Stock Market[J].Journal of Empirical Finance,11(1).
[3]Baker M.,J. Wurgler. 2006. Investor Sentiment and the Cross-section of Stock Returns[J].The Journal of Finance,61(4).
[4]Baker M.,J. Wurgler,Y. Yuan. 2012. Global, Local, and Contagious Investor Sentiment[J].Journal of Financial Economics,104(2).
[5]Katona G. 1975. Psychological Economics[M].New York: Elsevier.
[6]Polk C., P. Sapienza. 2009. The Stock Market and Corporate Investment: A Test of Catering Theory [J]. Review of Financial Studies,22(1).
[7]Stambaugh R. F., J. F. Yu, Y. Yuan. 2012. The Short of It: Investor Sentiment and Anomalies[J].Journal of Financial Economics,104(2).
[8]Da Z., J. Engelberg, P. Gao. 2011. In Search of Attention[J].The Journal of Finance,66(5).
[9]Tetlock P. C. 2007. Giving Content to Investor Sentiment: the Role of Media in the Stock Market[J].The Journal of Finance,62(3).
[10]Burdekin R., R. Luke. 2009. Sentiment Effects on Chinese Share Prices and Savings Deposits: The Post-2003 Experience[J].China Economic Review,20(2).
[11]Baker M.,J. C. Stein. 2004. Market Liquidity as a Sentiment Indicator[J].Journal of Financial Markets,7(3).
[12]Belkin M.,P. Niyogi. 2002. LaplacianEigenmaps and Spectral Techniques for Embedding and Clustering[J].Advances in Neural Information Processing Systems,14(6).
[13]Arquette G. C.,W. O. Brown,R. Burdekin. 2008. US ADR and Hong Kong H-share Discounts of Shanghai-listed Firms[J].Journal of Banking & Finance,32(9).
[14]Burdekin R.,Y. Yang. 2013. Cross-market Trading in Chinas Large State-owned Commercial Bank, 2006-2011[J].Contemporary Economic Policy,31(2).
[15]易志高,茅寧.中國股市投資者情緒測量研究: CICSI 的構建[J].金融研究,2009,(11).
[16]汪昌云,武佳薇.媒體語氣、投資者情緒與IPO定價[J].金融研究,2015,(9).
[17]韓立巖,伍燕然. 投資者情緒與IPOs之謎——抑價或者溢價[J].管理世界,2007,(3).
[18]伍燕然,潘可,胡松明,江婕. 行業(yè)分析師盈利預測偏差的新解釋[J].經(jīng)濟研究,2012,(4).
Abstract:This paper uses three composite indexes to measure the investor sentiment of the China stock market during the last seventeen years from 1999 to 2015 through selecting the Chinese households' investment preferences,IPOR,logarithm of rate of stock account amount and weighted turnover rate by applying three different methods, namely,principal component analyses,Kalman filtering and Laplacian Eigenmaps. At the same time,the authors use A-H stock premium index to test the effectiveness of three sentiment indexes based on the premium phenomenon of "twin stocks". The results show that the sentiment index based on Kalman filtering is the most effective,followed by the principal component analysis. However,the sentiment index based on Laplacian Eigenmaps hasn't reached the effective requirement of the empirical study.
Key Words:investor sentiment,Kalman Filtering,Laplacian Eigenmaps,effectiveness test