楊玉龍,吳文,高永靖,張倩男
(1. 浙江工商大學(xué) 財(cái)務(wù)與會(huì)計(jì)學(xué)院,浙江 杭州 310018;2. 清華大學(xué) 五道口金融學(xué)院,北京 100083;3. 上海財(cái)經(jīng)大學(xué) 會(huì)計(jì)學(xué)院,上海 200433)
我國的媒體最具特色之處是其雙重性,以及由此衍生的媒體產(chǎn)業(yè)的雙軌制運(yùn)營(李良榮,2003)。改革開放以后,我國經(jīng)濟(jì)開始逐步轉(zhuǎn)型,媒體產(chǎn)業(yè)結(jié)構(gòu)也開始出現(xiàn)變化。特別是1992年之后,媒體企業(yè)化經(jīng)營取得突破,部分媒體由政府撥款轉(zhuǎn)向自負(fù)盈虧,經(jīng)濟(jì)上逐漸獨(dú)立(田中初,2005)。同時(shí),媒體數(shù)量迅速增長,管理機(jī)構(gòu)開始對(duì)媒體產(chǎn)業(yè)采取“抓大放小”的分層管理策略。于是,媒體出現(xiàn)分化,一部分媒體繼續(xù)維持傳統(tǒng)運(yùn)營模式,資訊內(nèi)容偏重在政策方面;另一部分媒體如都市商業(yè)類報(bào)刊則逐步獲得相對(duì)獨(dú)立的編輯權(quán),并開始注重市場對(duì)于資訊的訴求(李良榮,2003)。我們將前者稱為“政策導(dǎo)向媒體”,將后者稱為“市場導(dǎo)向媒體”,這便形成了我國媒體產(chǎn)業(yè)雙軌制運(yùn)營的特色。
通過對(duì)政策導(dǎo)向媒體和市場導(dǎo)向媒體正負(fù)面詞匯使用的橫向與縱向比較,我們可以看到媒體雙軌制運(yùn)營對(duì)資訊內(nèi)容的鮮明影響。圖1繪制了巨靈財(cái)經(jīng)數(shù)據(jù)庫2000?2013年所收錄的政策導(dǎo)向媒體與市場導(dǎo)向媒體(相關(guān)定義與分類見下文)的正負(fù)面報(bào)道比例情況。圖中有三點(diǎn)值得注意:一是媒體的正面報(bào)道比例遠(yuǎn)高于負(fù)面報(bào)道;二是市場導(dǎo)向媒體的正面報(bào)道要少于政策導(dǎo)向媒體,而負(fù)面報(bào)道要多于政策導(dǎo)向媒體;三是從時(shí)間趨勢(shì)來看,正面報(bào)道比例在逐步減少,負(fù)面報(bào)道比例則逐漸增加,而且這一趨勢(shì)在市場導(dǎo)向媒體中更加明顯。
圖1 2000?2013年政策導(dǎo)向媒體與市場導(dǎo)向媒體歷年的正負(fù)面報(bào)道比例
資訊文本是信息的載體,不同類型媒體在資訊文本方面的差異必然導(dǎo)致在信息傳遞效果上有所不同。以往的文獻(xiàn)從整體上探討了媒體在優(yōu)化公司治理、提升資本市場信息效率方面的作用,并給予了正面評(píng)價(jià)。更深入的研究還需要對(duì)媒體類型和資訊文本特征同時(shí)進(jìn)行識(shí)別和分析,從而考察不同類型媒體的差異化表現(xiàn)。畢竟,對(duì)資本市場上的投資者而言,他們更感興趣的問題是選取哪一類媒體、閱讀哪一類資訊來支持其決策。換言之,他們需要識(shí)別對(duì)資本市場信息整合有實(shí)質(zhì)性影響的媒體與資訊。因此,本文將從我國媒體的雙軌制運(yùn)營出發(fā),探討政策導(dǎo)向媒體與市場導(dǎo)向媒體在影響資本市場信息整合方面的差異,并分析導(dǎo)致這種差異的原因。
本文發(fā)現(xiàn),媒體做出的負(fù)面報(bào)道能夠促進(jìn)特質(zhì)性信息反映在個(gè)股股價(jià)中,正面報(bào)道反而不利于特質(zhì)性信息整合。在將媒體區(qū)分為政策導(dǎo)向媒體和市場導(dǎo)向媒體后,本文發(fā)現(xiàn)媒體對(duì)資本市場的影響主要由政策導(dǎo)向媒體促成,市場導(dǎo)向媒體則無顯著影響。隨后,本文對(duì)媒體的資訊內(nèi)容進(jìn)行了文本分析,并計(jì)量了資訊內(nèi)容的兩項(xiàng)特征:信息傳遞和信息挖掘。分析結(jié)果表明,政策導(dǎo)向媒體的報(bào)道在這兩項(xiàng)特征上顯著不同于市場導(dǎo)向媒體。引入調(diào)節(jié)變量模型后,我們發(fā)現(xiàn)政策導(dǎo)向媒體主要憑借更深層次的信息挖掘與更精準(zhǔn)的信息傳遞,更有力地在影響資本市場的信息整合。
本文可能存在以下兩點(diǎn)貢獻(xiàn):第一,從我國媒體產(chǎn)業(yè)雙軌制運(yùn)營的特色入手,探討了政策導(dǎo)向媒體與市場導(dǎo)向媒體在影響資本市場信息整合效率方面的差異。我們使用股價(jià)同步性和知情交易概率兩個(gè)指標(biāo)來衡量媒體信息整合效率,發(fā)現(xiàn)政策導(dǎo)向媒體可以更好地提升資本市場信息效率。另外,本文還發(fā)現(xiàn)媒體提升資本市場信息效率的關(guān)鍵在于信息挖掘的深入程度和信息傳遞的精準(zhǔn)程度。這有助于監(jiān)管部門評(píng)價(jià)和選擇信息發(fā)布的媒體平臺(tái),并在資訊內(nèi)容方面對(duì)媒體報(bào)道給予指引與建議。
第二,在技術(shù)方面,本文依托中國知網(wǎng)“中文信息結(jié)構(gòu)庫”提供的正負(fù)面詞庫,結(jié)合Loughran和McDonald(2011)提供的英文正負(fù)面詞匯清單,通過文本挖掘得到了適用于我國媒體報(bào)道的正負(fù)面詞庫。同時(shí),我們使用Python編程語言,以巨靈財(cái)經(jīng)報(bào)刊數(shù)據(jù)庫為基礎(chǔ),構(gòu)建了時(shí)間跨度超過十年(2000?2013年)的媒體正負(fù)面報(bào)道數(shù)據(jù)庫。此外,我們還利用潛在語義主題分配模型(Latent Dirichlet Allocation,簡稱LDA主題分析)度量了不同類型媒體對(duì)上市公司公告跟蹤報(bào)道的信息挖掘深度和信息傳遞精度,并以此為基礎(chǔ)解釋了政策導(dǎo)向媒體和市場導(dǎo)向媒體在影響資本市場信息整合效率方面的差異。
(一)正負(fù)面報(bào)道與資本市場信息效率
公司股票價(jià)格的形成和變動(dòng)有賴于三個(gè)層面的信息,即宏觀信息、行業(yè)信息以及公司特質(zhì)性信息(Piotroski和Roulstone,2004)。其中,宏觀信息和行業(yè)信息會(huì)引起資本市場上所有公司或特定行業(yè)所有公司的股價(jià)波動(dòng),只有與公司基本面相關(guān)的特質(zhì)性信息才會(huì)引起單個(gè)公司股價(jià)產(chǎn)生獨(dú)立于市場或行業(yè)趨勢(shì)的特異性波動(dòng)。宏觀和行業(yè)信息所引發(fā)的市場上多只股票的同向價(jià)格波動(dòng)導(dǎo)致了股市的“同漲同跌”現(xiàn)象,即股價(jià)同步性。因此,股價(jià)同步性可以作為個(gè)股股價(jià)中特質(zhì)性信息含量的反向測(cè)度(Morck等,2000)。本文主要使用股價(jià)同步性作為資本市場信息效率的測(cè)度指標(biāo)。之所以選取這個(gè)指標(biāo),主要基于以下兩點(diǎn)考慮:第一,股價(jià)同步性指標(biāo)可以測(cè)度個(gè)股交易中整合的公司特質(zhì)性信息(Morck等,2000),這便于我們直接探討哪種類型的媒體能夠挖掘更多的公司特質(zhì)性信息;第二,媒體跟蹤上市公司時(shí)覆蓋的時(shí)間跨度往往很長,能夠涵括這一時(shí)間跨度影響的市場類指標(biāo)以股價(jià)同步性為佳,因?yàn)樗梢跃_地截取研究所需的市場交易時(shí)段進(jìn)行計(jì)算。
在資本市場中,不同類型信息的擴(kuò)散模式存在差異。這種信息傳播差異可能來自兩個(gè)方面:一方面,讀者有關(guān)注負(fù)面消息的傾向。相對(duì)于好消息,人們更傾向于傳播壞消息,所謂“好事不出門,壞事行千里”。在演化過程中,人類繼承了原始社會(huì)狩獵環(huán)境下的相關(guān)習(xí)性,出于生存需要對(duì)負(fù)面與危險(xiǎn)信號(hào)極為關(guān)注(Liu等,2014),這一遺傳習(xí)性直接影響了我們對(duì)于信息資訊的傳遞。個(gè)體在獲知好消息后,平均而言會(huì)向6個(gè)人傳遞;而在獲知壞消息后,平均而言會(huì)向23個(gè)人傳遞(趙亞東和高研,2012)。Heath(1996)的實(shí)驗(yàn)研究也表明,在社會(huì)氛圍普遍消極的情境下,人們更樂意傳遞壞消息。另一方面,個(gè)體有累積壞消息并打包釋放的傾向。個(gè)體在面臨多項(xiàng)損失或多項(xiàng)收益時(shí),為了得到最大的效用,通常將損失合并在一起而將收益逐一分開(Kahneman和Tversky,1979)。這導(dǎo)致上市公司管理層有動(dòng)機(jī)暫時(shí)隱藏壞消息,而等待特定時(shí)機(jī)一起公布(Kothari等,2009)。
綜上所述,當(dāng)媒體大規(guī)模披露壞消息時(shí),壞消息應(yīng)當(dāng)比好消息傳遞得更快,①Hong等(2000)認(rèn)為“Bad news travels slowly”,這看似與本文矛盾。但他們強(qiáng)調(diào)的是管理層會(huì)有意識(shí)地暫時(shí)隱藏公司的負(fù)面信息,使壞消息的釋放與好消息相比會(huì)出現(xiàn)延遲。本文試圖論證的是公司的壞消息被媒體挖掘(釋放)出來后,在資本市場上傳遞的速度要快于好消息。這也與生活常識(shí)相一致,所謂“好事不出門,壞事傳千里”。因此,本文的觀點(diǎn)與其并不矛盾。而且管理層可能暫時(shí)隱藏壞消息而等待時(shí)機(jī)一起釋放,導(dǎo)致壞消息披露時(shí)包含的公司特質(zhì)性信息更多。因此,媒體針對(duì)上市公司的負(fù)面報(bào)道比例越高,上市公司股價(jià)同步性越低。而正面信息在傳遞中則相對(duì)緩慢且分散,使得上市公司股價(jià)在整合正面資訊時(shí)不如負(fù)面資訊及時(shí),股價(jià)更多地隨宏觀或行業(yè)層面信息波動(dòng),從而股價(jià)同步性較高。據(jù)此,本文提出以下假說:
假說1:對(duì)上市公司的報(bào)道中,負(fù)面報(bào)道比例越高,該上市公司股價(jià)同步性越低;正面報(bào)道比例越高,該上市公司股價(jià)同步性越高。
(二)媒體雙軌制運(yùn)營與資本市場信息整合
政策導(dǎo)向媒體與市場導(dǎo)向媒體的資金來源不同。政策導(dǎo)向媒體享有公費(fèi)訂閱的支持,并在稅收上得到減免等優(yōu)惠;市場導(dǎo)向媒體則被推向市場,自負(fù)盈虧,易為廣告費(fèi)用等商業(yè)利益所俘獲,從而在針對(duì)上市公司的報(bào)道中表現(xiàn)出較弱的獨(dú)立性。
媒體的利益訴求會(huì)影響其報(bào)道行為,其中以商業(yè)利益最為典型。媒體挖掘和傳播有關(guān)上市公司的私有信息可以促進(jìn)資本市場的信息整合,但在挖掘出上市公司私有信息之后,并不必然通過發(fā)布報(bào)道來擴(kuò)大報(bào)刊銷量獲益,也可通過威脅上市公司高管索取封口費(fèi)來謀利,這便是“有償沉默”。方軍雄(2014)發(fā)現(xiàn),如果公司在IPO期間向媒體支付費(fèi)用以換取沉默,那么這類公司在IPO之后的盈余質(zhì)量更差,也更可能出現(xiàn)業(yè)績反轉(zhuǎn)。這表明媒體的有償沉默縱容了內(nèi)部人的私有信息交易,犧牲其他投資者利益而謀取了私利。
與“有償沉默”相對(duì)應(yīng)的是“有償報(bào)道”,既然媒體會(huì)屈從商業(yè)利益,自然有公司或機(jī)構(gòu)會(huì)加以利用,使媒體發(fā)布對(duì)自身有利的信息。逯東等(2016)認(rèn)為,機(jī)構(gòu)投資者存在主動(dòng)管理媒體的行為,即利用媒體制造信息噪音來引導(dǎo)市場熱點(diǎn)的短期炒作行為;實(shí)證研究發(fā)現(xiàn),為了獲取超額收益,機(jī)構(gòu)投資者會(huì)通過主動(dòng)管理媒體來提高其重倉股票的媒體關(guān)注度。盡管這種“主動(dòng)媒體管理”能在短期內(nèi)推動(dòng)股價(jià)上漲,但同時(shí)也會(huì)導(dǎo)致壞消息被藏匿,從而惡化資本市場的信息環(huán)境,增加未來的股價(jià)崩盤風(fēng)險(xiǎn)(逯東等,2016)。
媒體因商業(yè)利益而做出的有偏或虛假報(bào)道,會(huì)因投資者的羊群效應(yīng)而將不良影響放大。媒體報(bào)道中充斥著大量所謂股評(píng)家的專業(yè)建議,普通投資者極易受其引導(dǎo),爭相購入特定股票。熱點(diǎn)資訊總是稀缺資源,媒體通常會(huì)針對(duì)某一熱點(diǎn)事件進(jìn)行多次報(bào)道,而且不同媒體也會(huì)針對(duì)同一熱點(diǎn)事件進(jìn)行重復(fù)報(bào)道。這很可能會(huì)凸顯本來微不足道的事件的重要性,對(duì)投資者預(yù)期產(chǎn)生正反饋?zhàn)饔茫M(jìn)而增強(qiáng)原有事件對(duì)投資者預(yù)期和決策的沖擊。游家興和吳靜(2012)研究發(fā)現(xiàn),股票價(jià)格對(duì)基本面的背離程度受媒體報(bào)道影響,特別地,媒體報(bào)道情緒越極端,股價(jià)對(duì)基本面的背離程度就越大。股價(jià)原本是公司價(jià)值的良好信號(hào),但媒體的有偏或虛假報(bào)道會(huì)扭曲這一信號(hào),加劇資本市場上的信息不對(duì)稱。
政策導(dǎo)向媒體的收入來源主要是財(cái)政支持,因而更注重信息公平因素。①容易引發(fā)爭議的是,有相反觀點(diǎn)認(rèn)為,政策導(dǎo)向媒體既然受財(cái)政支持,則有可能受到行政干預(yù)或管制,所報(bào)道的資訊更多的是宏觀或行業(yè)層面信息,導(dǎo)致特質(zhì)性信息更少。然而,這一觀點(diǎn)在財(cái)經(jīng)資訊領(lǐng)域并無可靠的證據(jù)支持。以《中國證券報(bào)》為例,它是典型的政策導(dǎo)向媒體,由于不可能每天都有政策變動(dòng)或宏觀事件發(fā)生,該報(bào)刊每天都有大量的個(gè)股信息。從大樣本實(shí)證考察來看,中央媒體(主要由政策導(dǎo)向媒體構(gòu)成)的確發(fā)掘了大量特質(zhì)性信息(楊玉龍等,2016)。市場導(dǎo)向媒體的收入來源主要是廣告收入等市場業(yè)務(wù),因而更容易被商業(yè)利益所俘獲,其“有償沉默”與“有償報(bào)道”等違規(guī)行為與政策導(dǎo)向媒體相比要更為嚴(yán)重。此外,資訊發(fā)布有著嚴(yán)格的紀(jì)律要求,低級(jí)別媒體通常需要等待高級(jí)別媒體的指示或訊號(hào)。政策導(dǎo)向媒體在行政級(jí)別上往往高于市場導(dǎo)向媒體,意味著其報(bào)道不僅獨(dú)立于商業(yè)利益,而且更加及時(shí),這強(qiáng)化了其對(duì)資本市場的影響。因此,在資本市場信息整合方面,我國媒體的影響主要體現(xiàn)在政策導(dǎo)向媒體上,而較少體現(xiàn)在市場導(dǎo)向媒體上。據(jù)此,本文提出以下假說:
假說2:我國媒體對(duì)資本市場信息效率的影響主要體現(xiàn)在政策導(dǎo)向媒體上,而市場導(dǎo)向媒體則無顯著影響。
(一)數(shù)據(jù)來源與樣本選取
1.媒體類型與媒體報(bào)道數(shù)據(jù)。本文以巨靈財(cái)經(jīng)報(bào)刊數(shù)據(jù)庫為基礎(chǔ),該數(shù)據(jù)庫涵括了2000?2013年的媒體報(bào)道。本文使用Python編程語言,對(duì)數(shù)據(jù)庫提供的上市公司相關(guān)報(bào)道進(jìn)行統(tǒng)計(jì),得到媒體報(bào)道相關(guān)變量。通過對(duì)數(shù)據(jù)庫所覆蓋的137家媒體進(jìn)行追根溯源,我們可以準(zhǔn)確地甄別和區(qū)分各個(gè)媒體,挖掘其主辦單位及行政級(jí)別、注冊(cè)地等信息,以便于探討不同類型的媒體在資本市場信息整合方面的差異化表現(xiàn)。上市公司公告雖然借助媒體發(fā)布,但這是上市公司的主動(dòng)披露行為,并不反映媒體的態(tài)度,不符合本文研究意圖,故予以剔除。
2.上市公司數(shù)據(jù)來源與樣本選取。本文以2003?2013年我國A股上市公司為樣本,并做了如下篩選:(1)剔除金融保險(xiǎn)類公司;(2)剔除在公司治理和股權(quán)性質(zhì)等變量存在數(shù)據(jù)缺失的公司。樣本期之所以從2003年開始,是因?yàn)镃SMAR數(shù)據(jù)庫從這一年開始提供公司治理和股權(quán)性質(zhì)數(shù)據(jù)。本文最終得到了18419個(gè)樣本。媒體的主辦單位、行政級(jí)別、注冊(cè)地信息等數(shù)據(jù)均手工搜集得到,其他數(shù)據(jù)來自CSMAR數(shù)據(jù)庫和Wind數(shù)據(jù)庫。本文對(duì)所有連續(xù)變量進(jìn)行了上下1%的縮尾處理。
(二)主要變量定義。本文主要涉及三類變量:媒體類型與媒體報(bào)道相關(guān)變量、上市公司市場交易相關(guān)變量以及公司財(cái)務(wù)與治理相關(guān)變量。
1.媒體類型。本文將媒體區(qū)分為政策導(dǎo)向媒體和市場導(dǎo)向媒體兩種類型。我們?cè)诜诸悤r(shí)主要依據(jù)媒體主辦單位的行政級(jí)別,并兼顧該媒體所在城市影響力。本文對(duì)政策導(dǎo)向媒體和市場導(dǎo)向媒體的劃分參考了楊玉龍等(2017)等文獻(xiàn)。
2.媒體正負(fù)面報(bào)道。我們參照汪昌云和武佳薇(2015)及張純和吳明明(2015)提供的計(jì)量方案來識(shí)別媒體的正面報(bào)道與負(fù)面報(bào)道。具體而言,我們根據(jù)每篇媒體報(bào)道中正負(fù)面詞匯數(shù)的相對(duì)大小來判斷報(bào)道是正面的還是負(fù)面的:如果報(bào)道中的正面詞匯數(shù)超過負(fù)面詞匯數(shù),則定義為正面報(bào)道;如果報(bào)道中的負(fù)面詞匯數(shù)超過正面詞匯數(shù),則定義為負(fù)面報(bào)道;其他則視為中立報(bào)道。進(jìn)一步地,對(duì)每一家公司的所有媒體報(bào)道進(jìn)行描述性統(tǒng)計(jì),得到該上市公司的負(fù)面報(bào)道比例和正面報(bào)道比例。在此基礎(chǔ)上,我們進(jìn)一步區(qū)分不同媒體類型,得到政策導(dǎo)向媒體的負(fù)面報(bào)道比例和正面報(bào)道比例,以及市場導(dǎo)向媒體的負(fù)面報(bào)道比例和正面報(bào)道比例。
3.股價(jià)同步性。本文參考楊玉龍等(2016)的計(jì)量方法,使用實(shí)證CAPM模型的擬合系數(shù)R2來衡量股價(jià)同步性:
模型的擬合系數(shù)R2越大,表明股價(jià)的波動(dòng)包含越多的市場風(fēng)險(xiǎn)因素,即公司特質(zhì)風(fēng)險(xiǎn)對(duì)股價(jià)的解釋力越差。為了滿足OLS的正態(tài)分布條件,我們對(duì)擬合系數(shù)R2進(jìn)行了對(duì)數(shù)變換,得到股價(jià)同步性指標(biāo)RSQm。
本文變量定義見表1。
表1 變量定義
續(xù)表 1 變量定義
(三)模型設(shè)定。本文采用模型(3)至模型(5)來研究媒體的正負(fù)面報(bào)道對(duì)股價(jià)同步性的影響。模型(3)等式右側(cè)前兩項(xiàng)是關(guān)鍵解釋變量負(fù)面報(bào)道比例(Neg_News_Ratio)和正面報(bào)道比例(Pos_News_Ratio),模型(4)等式右側(cè)前兩項(xiàng)分別為政策導(dǎo)向媒體負(fù)面報(bào)道比例(Politic_Neg_Ratio)與正面報(bào)道比例(Politic_Pos_Ratio),模型(5)等式右側(cè)前兩項(xiàng)分別為市場導(dǎo)向媒體負(fù)面報(bào)道比例(Market_Neg_Ratio)與正面報(bào)道比例(Market_Pos_Ratio)。
Controln表示控制變量,包括操控性應(yīng)計(jì)項(xiàng)目Da、上市公司政治關(guān)聯(lián)Pc、獨(dú)立董事比例Indep_dir、機(jī)構(gòu)持股比例Inst、是否由四大審計(jì)Big4、第一大股東持股Lshr,股權(quán)制衡Othshr、高管持股比例Excutive、銷售增長率Sgrowth、盈利相對(duì)波動(dòng)Droe、個(gè)股股價(jià)波動(dòng)Stdp、個(gè)股換手率Tvr、公司規(guī)模Size、公司上市年限Age以及行業(yè)虛擬變量Ind和年度虛擬變量Year。
(一)描述性統(tǒng)計(jì)
1.媒體類型與正負(fù)面報(bào)道。表2列示了我國媒體的正負(fù)面報(bào)道比例,以及每篇報(bào)道的正負(fù)面詞匯使用情況??梢钥吹剑瑹o論是市場導(dǎo)向媒體還是政策導(dǎo)向媒體,正面報(bào)道比例遠(yuǎn)遠(yuǎn)大于負(fù)面報(bào)道比例(3倍以上),而且每篇報(bào)道中使用的正面詞匯平均數(shù)量也遠(yuǎn)遠(yuǎn)超過負(fù)面詞匯(約為2倍)。此外,相對(duì)于政策導(dǎo)向媒體,市場導(dǎo)向媒體的負(fù)面報(bào)道比例顯著較高,而正面報(bào)道比例則顯著較低,而且每篇報(bào)道中使用的負(fù)面詞匯數(shù)量也顯著較多,正面詞匯數(shù)量顯著較少。因此,政策導(dǎo)向媒體與市場導(dǎo)向媒體因其功能定位差異,的確在資訊內(nèi)容方面表現(xiàn)不同。
表2 媒體類型與正負(fù)面報(bào)道
2.變量描述性統(tǒng)計(jì)。從表3中可以看出,無論是政策導(dǎo)向媒體還是市場導(dǎo)向媒體,負(fù)面報(bào)道比例都小于正面報(bào)道比例,說明媒體對(duì)不同上市公司也以正面報(bào)道為主。需要指出的是,表2是針對(duì)媒體所有報(bào)道所做的統(tǒng)計(jì)分析,表3則是針對(duì)上市公司的媒體報(bào)道所做的統(tǒng)計(jì)分析。
表3 變量描述性統(tǒng)計(jì)
(二)回歸分析
1.正負(fù)面報(bào)道與資本市場信息效率。本文采用模型(3)至模型(5)來研究媒體的正負(fù)面報(bào)道對(duì)股價(jià)同步性的影響,以普通最小二乘法(OLS)進(jìn)行估計(jì)。從表4中可以看到,在對(duì)上市公司的報(bào)道中,負(fù)面報(bào)道比例越高,股價(jià)同步性越低,但不顯著;正面報(bào)道比例越高,股價(jià)同步性越高。這一結(jié)果部分支持了假說1,我們將在下文考察不同類型媒體報(bào)道對(duì)股價(jià)同步性的影響。此外,公司信息不夠透明(Da較高)或者具有政治關(guān)聯(lián),均會(huì)導(dǎo)致較高的股價(jià)同步性。
2.媒體雙軌制與資本市場信息整合。我們進(jìn)一步將媒體區(qū)分為政策導(dǎo)向媒體和市場導(dǎo)向媒體,以便考察我國媒體的雙軌制運(yùn)營對(duì)資本市場信息整合功能的影響。從表4中可以看到,促成資本市場信息整合的媒體報(bào)道主要是政策導(dǎo)向媒體的負(fù)面報(bào)道,市場導(dǎo)向媒體的負(fù)面報(bào)道并沒有顯著傳遞有關(guān)上市公司的特質(zhì)性信息。值得注意的是,市場導(dǎo)向媒體的正面報(bào)道也會(huì)提高上市公司的股價(jià)同步性。本文認(rèn)為,市場導(dǎo)向媒體的正面資訊進(jìn)入股價(jià)的速度緩慢,而且在報(bào)道方面通常緊跟政策導(dǎo)向媒體,造成信息冗余重復(fù)而特質(zhì)性信息不足,這也是其導(dǎo)致股價(jià)同步性上升的重要原因。
表4 媒體正負(fù)面報(bào)道與股價(jià)同步性
(一)穩(wěn)健性測(cè)試。以股價(jià)同步性來反映股價(jià)對(duì)公司特質(zhì)性信息的整合是有爭議的。West(1988)研究發(fā)現(xiàn),基于噪聲信息的交易降低了公司的股價(jià)同步性。Kelly(2014)認(rèn)為,公司股票的R2越低,其信息環(huán)境越差,表明R2并非度量信息效率的有效指標(biāo)。為解決這一問題,我們將使用直接反映特質(zhì)性信息整合的指標(biāo)知情交易概率進(jìn)行穩(wěn)健性測(cè)試。
知情交易概率(Possibility of Informed Trading,PIN)是指個(gè)股交易中知情交易的比重。其基本計(jì)量思路是將給定區(qū)間內(nèi)針對(duì)個(gè)股的交易分為兩類:一類是由私有信息促成的知情交易;另一類是由隨機(jī)擾動(dòng)因素驅(qū)動(dòng)的噪聲交易。促使股價(jià)向真實(shí)價(jià)值回歸的動(dòng)力主要來自知情交易,因此個(gè)股交易中知情交易的比重越高,股價(jià)對(duì)于信息的整合越有效。我們沿用已有研究中估計(jì)PIN 指數(shù)的經(jīng)典方法(Easley 和 O’hara,1987,1992),計(jì)量方法詳見朱偉驊(2008)及孔東民等(2013)。
表5列示了PIN對(duì)媒體正負(fù)面報(bào)道的回歸結(jié)果??梢钥吹剑?fù)面報(bào)道可促使知情交易比例上升,而正面報(bào)道則會(huì)減少知情交易,這與上文所論證的“負(fù)面報(bào)道促進(jìn)特質(zhì)性信息整合,正面報(bào)道不利于特質(zhì)性信息整合”相一致。同時(shí),我們可以看到媒體報(bào)道對(duì)知情交易產(chǎn)生影響主要體現(xiàn)在政策導(dǎo)向媒體上,市場導(dǎo)向媒體對(duì)知情交易概率則無顯著影響。
表5 媒體正負(fù)面報(bào)道與知情交易概率
(二)拓展性分析。本文的主要實(shí)證結(jié)果表明,在促進(jìn)資本市場信息整合方面,政策導(dǎo)向媒體顯示出了強(qiáng)于市場導(dǎo)向媒體的影響力。我們將從資訊特征的角度,探討造成這一差異的原因。本文主要考察兩項(xiàng)資訊特征:信息挖掘和信息傳遞。所謂信息挖掘,是指媒體通過公開信息渠道或者調(diào)查暗訪等手段搜集各類信息,并進(jìn)行分析比對(duì),形成獨(dú)立的觀點(diǎn)和結(jié)論。所謂信息傳遞,是指媒體針對(duì)上市公司已經(jīng)發(fā)布的信息,通過對(duì)語句進(jìn)行重新組織、概括、演繹等,以投資者更容易理解的方式再次呈現(xiàn)出來。
以文本分析來考察媒體的資訊特征,目前只有很少的研究關(guān)注了媒體報(bào)道更深層次的信息角色。Drake等(2014)將媒體對(duì)上市公司盈余公告的跟蹤報(bào)道區(qū)分為被上市公司雇用以傳播信息的“信息傳遞”類報(bào)道(Presswire Services)和帶有作者“信息創(chuàng)造”的報(bào)道(Newswire Services),發(fā)現(xiàn)媒體對(duì)上市公司年度盈余公告的報(bào)道能夠減少現(xiàn)金流誤定價(jià),但不能降低應(yīng)計(jì)誤定價(jià),且這種降低會(huì)計(jì)誤定價(jià)的作用主要是由媒體“信息傳遞”而非“信息創(chuàng)造”功能實(shí)現(xiàn)的。他們對(duì)于信息傳遞和信息挖掘的度量,得益于特殊的數(shù)據(jù)庫(News Wire),很難被復(fù)制。
在分析師跟蹤的相關(guān)研究中,有文獻(xiàn)探討了分析師報(bào)告的不同“信息角色”。這類研究主要通過市場反應(yīng)來度量分析師報(bào)告的“信息解釋”與“信息挖掘”兩類信息角色。Huang等(2014)認(rèn)為用市場反應(yīng)來間接度量分析師報(bào)告的“信息角色”有兩點(diǎn)局限:一是以市場反應(yīng)來度量信息挖掘和信息解釋,其前提條件是投資者能夠充分理解分析師報(bào)告中的信息,且信息能迅速融在價(jià)格中,但現(xiàn)有研究表明這一前提條件并不成立;二是上市公司披露信息和分析師跟蹤發(fā)布報(bào)告在時(shí)間上比較接近,學(xué)者難以區(qū)分資本市場反應(yīng)是針對(duì)上市公司信息披露還是分析師跟蹤報(bào)告。因此,他們主張用潛在語義主題分配模型(Latent Dirichlet Allocation,簡稱LDA主題分析)來直接度量分析師報(bào)告的信息挖掘和信息解釋程度。本文也使用LDA主題分析來直接度量我國媒體報(bào)道的“信息角色”,并區(qū)分政策導(dǎo)向媒體和市場導(dǎo)向媒體,探討兩者之間的差異。
1.信息挖掘與信息傳遞的度量。以LDA模型來度量媒體信息挖掘與信息傳遞的基本思想是,比較上市公司公告與隨后的媒體跟蹤報(bào)道之間的差異,根據(jù)這一差異來衡量分析師報(bào)告信息挖掘或傳遞的程度。附錄A描述了我們對(duì)公司公告與隨后的媒體跟蹤報(bào)道進(jìn)行匹配的具體過程。為避免出現(xiàn)噪音,本文僅選擇公司當(dāng)天有且僅有一條信息公告的觀測(cè)值,從而可以對(duì)上市公司公告與媒體報(bào)道進(jìn)行精確匹配。這會(huì)使樣本量略有變化,我們最終得到18108個(gè)公司年份觀測(cè)值。
本文參考Huang等(2014)及張純和吳明明(2015)的方法,以公司公告和媒體報(bào)道的文本內(nèi)容為對(duì)象進(jìn)行LDA主題建模。這一建模的基本思路是,所有公告或媒體報(bào)道的內(nèi)容盡管千差萬別,但是主題(話題)卻很有限,無非是產(chǎn)業(yè)支持政策、信息披露、股權(quán)發(fā)行、風(fēng)險(xiǎn)和相關(guān)披露、債務(wù)和擔(dān)保、法律訴訟等,我們發(fā)現(xiàn)這些公告和資訊大致可以歸結(jié)為40個(gè)有意義的主題(建模過程詳見附錄B)。而后我們可以測(cè)算兩項(xiàng)內(nèi)容:一是每篇上市公司公告與隨后的跟蹤報(bào)道所涵括的主題數(shù)量;二是每篇上市公司公告與隨后的跟蹤報(bào)道在描述同一主題時(shí)的用詞分布。
在此基礎(chǔ)上,我們采用媒體跟蹤報(bào)道與對(duì)應(yīng)的上市公司公告之間的主題分布差異來度量媒體跟蹤報(bào)道的信息挖掘程度。這樣處理背后的邏輯是,如果媒體對(duì)上市公司公告進(jìn)行了深入分析,則其報(bào)道的隱含主題集合與公司公告的隱含主題集合之間會(huì)存在差異。因此,公司公告和媒體報(bào)道的主題分布差異越大,則媒體對(duì)公司信息進(jìn)行了越深入的解讀和挖掘。
同時(shí),我們統(tǒng)計(jì)了媒體報(bào)道與公司公告在描述同一主題時(shí)的用詞差異,反映媒體的信息傳遞水平。這樣處理背后的邏輯是,如果媒體對(duì)上市公司公告進(jìn)行了有效的信息傳遞,那么其報(bào)道的用詞和表述應(yīng)當(dāng)與上市公司公告高度一致。因此,在描述同一主題時(shí)的用詞分布差異越小,則信息傳遞的扭曲越小。
媒體的信息挖掘水平和信息傳遞水平分別記為Discover和Dissemination,本文對(duì)這兩個(gè)變量的計(jì)量主要參考了Huang等(2014)及張純和吳明明等(2015)的研究,略有調(diào)整,詳見附錄C。
2.媒體類型與資訊特征。表6列示了政策導(dǎo)向媒體和市場導(dǎo)向媒體在資訊特征上的差異化表現(xiàn)??梢钥吹剑邔?dǎo)向媒體在信息挖掘方面的表現(xiàn)要顯著優(yōu)于市場導(dǎo)向媒體(0.387>0.341);同時(shí),政策導(dǎo)向媒體的信息傳遞水平均值為0.325,大于市場導(dǎo)向媒體的信息傳遞水平均值0.269。可見,政策導(dǎo)向媒體在信息挖掘和信息傳遞方面顯著優(yōu)于市場導(dǎo)向媒體,這與上文所述政策導(dǎo)向媒體具有更強(qiáng)的經(jīng)濟(jì)獨(dú)立性與及時(shí)性相一致。
表6 媒體類型與資訊特征
資訊特征必然會(huì)對(duì)媒體報(bào)道的效果產(chǎn)生影響,本文使用調(diào)節(jié)效應(yīng)模型來探討這種影響。我們?nèi)砸怨蓛r(jià)同步性來衡量資本市場信息效率,區(qū)分政策導(dǎo)向媒體和市場導(dǎo)向媒體后,在模型(4)和模型(5)的基礎(chǔ)上,加入不同類型媒體的正面報(bào)道比例、負(fù)面報(bào)道比例與資訊特征的交叉項(xiàng),構(gòu)建了模型(6)至模型(9)。
表7列示了回歸結(jié)果??梢钥吹?,政策導(dǎo)向媒體通過更深入的信息挖掘與更精準(zhǔn)的信息傳遞,不僅可以強(qiáng)化負(fù)面報(bào)道的信息整合作用,還可以削弱正面報(bào)道對(duì)資本市場信息整合的不利影響。唯一的例外是,政策導(dǎo)向媒體對(duì)負(fù)面報(bào)道的信息傳遞在進(jìn)一步降低股價(jià)同步性方面不顯著。市場導(dǎo)向媒體的信息挖掘與信息傳遞則基本上沒有展示出增強(qiáng)媒體報(bào)道效力的作用?;谝陨献C據(jù),我們認(rèn)為政策導(dǎo)向媒體在信息挖掘方面更加深入,在信息傳遞方面更加精準(zhǔn),使其整合資本市場信息的作用強(qiáng)于市場導(dǎo)向媒體。
表7 資訊特征、媒體報(bào)道與股價(jià)同步性
續(xù)表 7 資訊特征、媒體報(bào)道與股價(jià)同步性
改革開放以后,我國媒體產(chǎn)業(yè)發(fā)展迅速,媒體形式也逐漸多樣化。然而,媒體數(shù)量上的增長帶來了諸多問題,如經(jīng)濟(jì)利益對(duì)媒體獨(dú)立性的綁架、媒體從業(yè)者水平有待提高等,使得讀者在選取資訊來源時(shí)猶豫不決,并對(duì)資訊內(nèi)容產(chǎn)生了諸多疑問。因此,需要科學(xué)的量化研究來探討媒體的資訊特征,為讀者遴選媒體與資訊提供指引。資本市場為我們理解我國媒體的影響力提供了良好的量化場景,盡管這一量化僅限于金融資源配置這一狹小領(lǐng)域,但是仍可以為我們理解媒體的社會(huì)功能提供參考。
本文從我國媒體產(chǎn)業(yè)的雙軌制特色入手,借助文本分析技術(shù),考察了政策導(dǎo)向媒體和市場導(dǎo)向媒體的正負(fù)面報(bào)道影響資本市場信息整合的效力。本文發(fā)現(xiàn),媒體的負(fù)面報(bào)道對(duì)資本市場信息整合有促進(jìn)作用,而正面報(bào)道則不利于特質(zhì)性信息反映在股價(jià)中,這意味著負(fù)面報(bào)道對(duì)投資者而言更具決策價(jià)值。特別地,媒體報(bào)道對(duì)資本市場的影響主要集中在政策導(dǎo)向媒體上,這進(jìn)一步縮小了投資者決策時(shí)的媒體參考范圍。本文進(jìn)一步探察了政策導(dǎo)向媒體與市場導(dǎo)向媒體出現(xiàn)上述差異的原因。本文利用LDA主題分析模型,測(cè)量了兩者在信息挖掘深度與信息傳遞精度上的表現(xiàn)差異。本文發(fā)現(xiàn),政策導(dǎo)向媒體在信息挖掘方面更加深入,在信息傳遞方面更加精準(zhǔn),使其整合資本市場信息的功能強(qiáng)于市場導(dǎo)向媒體。這一研究結(jié)果具有重要的現(xiàn)實(shí)意義,有助于投資者重新審視不同的資訊來源,并給予其一定的啟發(fā)與指引。
[1]方軍雄.信息公開、治理環(huán)境與媒體異化——基于IPO有償沉默的初步發(fā)現(xiàn)[J].管理世界,2014,(11):95?104.
[2]孔東民,劉莎莎,應(yīng)千偉.公司行為中的媒體角色:激濁揚(yáng)清還是推波助瀾?[J].管理世界,2013,(7):145?162.
[3]李良榮.論中國新聞媒體的雙軌制——再論中國新聞媒體的雙重性[J].現(xiàn)代傳播,2003,(4):1?4.
[4]逯東,付鵬,楊丹.機(jī)構(gòu)投資者會(huì)主動(dòng)管理媒體報(bào)道嗎?[J].財(cái)經(jīng)研究,2016,(2):73?84.
[5]田中初.新聞實(shí)踐與政治控制[M].濟(jì)南:山東人民出版社,2005.
[6]汪昌云,武佳薇.媒體語氣、投資者情緒與 IPO 定價(jià)[J].金融研究,2015,(9):174?189.
[7]楊玉龍,孫淑偉,孔祥.媒體報(bào)道能否彌合資本市場上的信息鴻溝?——基于社會(huì)關(guān)系網(wǎng)絡(luò)視角的實(shí)證考察[J].管理世界,2017,(7):99?119.
[8]楊玉龍,吳明明,王璟,等.異質(zhì)性媒體與資本市場信息效率[J].財(cái)經(jīng)研究,2016,(3):83?94.
[9]游家興,吳靜.沉默的螺旋:媒體情緒與資產(chǎn)誤定價(jià)[J].經(jīng)濟(jì)研究,2012,(7):141?152.
[10]張純,吳明明.媒體在資本市場中的角色:信息解釋還是信息挖掘?[J].財(cái)經(jīng)研究,2015,(12):72?83.
[11]趙亞東,高巖.公安網(wǎng)絡(luò)輿論的生成機(jī)制及其引導(dǎo)功能[J].中國人民公安大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2012,(2):136?141.
[12]朱偉驊.公司治理與內(nèi)幕交易監(jiān)管效率研究[J].經(jīng)濟(jì)學(xué)(季刊),2008,(1):271?288.
[13]Drake M S,Guest N M,Twedt B J.The media and mispricing:The role of the business press in the pricing of accounting information[J].The Accounting Review,2014,89(5):1673?1701.
[14]Easley D,O’hara M.Price,trade size,and information in securities markets[J].Journal of Financial Economics,1987,19(1):69?90.
[15]Easley D,O’hara M.Time and the process of security price adjustment[J].The Journal of Finance,1992,47(2):577?605.
[16]Heath C.Do people prefer to pass along good or bad news?Valence and relevance of news as predictors of transmission propensity[J].Organizational Behavior and Human Decision Processes,1996,68(2):79?94.
[17]Hong H,Lim T,Stein J C.Bad news travels slowly:Size,analyst coverage,and the profitability of momentum strategies[J].The Journal of Finance,2000,55(1):265?295.
[18]Huang A,Lehavy R,Zang A Y,et al.A thematic analysis of analyst information discovery and information interpretation roles[R].Working Paper No.1229,2014.
[19]Kahneman D,Tversky A.Prospect theory:An analysis of decision under risk[J].Econometrica,1979,47(2):263?292.
[20]Kelly P J.Information efficiency and firm-specific return variation[J].Quarterly Journal of Finance,2014,4(4):1?44.
[21]Kothari S P,Shu S,Wysocki P D.Do managers withhold bad news?[J].Journal of Accounting Research,2009,47(1):241?276.
[22]Liu G,Xin Z,Lin C.Lax decision criteria lead to negativity bias:Evidence from the emotional stroop task[J].Psychological Reports,2014,114(3):896?912.
[23]Loughran T,McDonald B.When is a liability not a liability?Textual analysis,dictionaries,and10-Ks[J].The Journal of Finance,2011,66(1):35?65.
[24]Morck R,Yeung B,Yu W.The information content of stock markets:Why do emerging markets have synchronous stock price movements?[J].Journal of Financial Economics,2000,58(1-2):215?260.
[25]Piotroski J D,Roulstone D T.The influence of analysts,institutional investors,and insiders on the incorporation of market,industry,and firm-specific information into stock prices[J].The Accounting Review,2004,79(4):1119?1151.
[26]West K D.Bubbles,fads and stock price volatility tests:A partial evaluation[J].The Journal of Finance,1988,43(3):639?656.
附錄A 媒體跟蹤報(bào)道和上市公司信息披露公告的匹配過程
1.對(duì)于上市公司披露的財(cái)務(wù)報(bào)表,由于主要內(nèi)容是表格和數(shù)字,不適用LDA主題模型進(jìn)行文本分析,本文剔除了這類公告。
2.由于媒體跟蹤上市公司公告一般會(huì)在新聞內(nèi)容中出現(xiàn)“**(公司)**(時(shí)間)公告稱”之類的用語,本文在新聞全文中首先定位找到“公告”這一關(guān)鍵詞,將其之前直到上一個(gè)句終標(biāo)點(diǎn)(句號(hào)、嘆號(hào)、問號(hào)等)或新聞全文字符串的首個(gè)字符截取下來,然后刪除其中的空格,進(jìn)行時(shí)間關(guān)鍵詞掃描。之所以不包括逗號(hào)、頓號(hào)等非句終標(biāo)點(diǎn),是因?yàn)榇嬖谝韵滦问降谋硎觯骸?*(公司)**(時(shí)間)進(jìn)行了**披露,公告稱……”。時(shí)間關(guān)鍵詞包括:
(1)“昨”,代表昨天,可以是“昨天”、“昨日”、“昨晚”等。
(2)“前日”“前天”,代表 2 天前。
(3)“今日”“今天”“今晚”“今早”,代表當(dāng)天。
(4)具體的年月日,對(duì)于“年”“月”“日”之前的數(shù)字,可以是阿拉伯?dāng)?shù)字和中文數(shù)字及相應(yīng)的全角數(shù)字。
(5)如果沒有出現(xiàn)以上四類時(shí)間關(guān)鍵詞,但是出現(xiàn)了“晚間”“上午”“下午”“早間”“一早”“晚上”“傍晚”,則代表當(dāng)天。
附錄B 對(duì)上市公司公告和媒體跟蹤報(bào)道文本集進(jìn)行LDA主題建模過程
1.LDA 主題模型
LDA主題模型是在自然語言信息處理中提取大規(guī)模語料集的主題結(jié)構(gòu)任務(wù)的一類機(jī)器學(xué)習(xí)模型。它可以從文本集中估算提取出主題信息,并把每個(gè)文本表示為關(guān)于主題的多項(xiàng)式分布,而每個(gè)主題被表示為關(guān)于語料集合中所有不同詞語的多項(xiàng)式分布。因此,學(xué)者可以利用LDA主題模型的輸出結(jié)果,對(duì)不同文本的差異進(jìn)行比較。
LDA主題模型用統(tǒng)計(jì)過程來模仿文本的生成過程。該算法假設(shè)所有語料集的所有文檔共享同一組主題,但是主題在不同文檔間的分布不同。每個(gè)文檔被建模為關(guān)于主題的概率分布,而每個(gè)主題被建模為關(guān)于詞語的概率分布。該算法假定文檔中的每個(gè)詞語通過以下兩個(gè)步驟生成:第一步,文檔的作者從所有可用的主題分布中選擇一個(gè)主題;第二步,對(duì)于選定的主題,文檔的作者從表現(xiàn)該主題的詞語分布中選擇一個(gè)詞語。重復(fù)這兩個(gè)步驟,逐詞生成整個(gè)文檔。每篇文檔的生成過程都是一樣的且相互獨(dú)立。
在上述假定的基礎(chǔ)上,LDA主題模型估算出最匹配(似然度最大)文本數(shù)據(jù)的模型參數(shù)。參數(shù)估算過程依賴于詞語在同一篇文檔中的出現(xiàn)情況。直觀地講,如果兩個(gè)詞頻繁在同一篇文檔中出現(xiàn),那么LDA模型把這兩個(gè)詞歸類為同一個(gè)主題的概率就會(huì)較高。LDA模型的主要輸出結(jié)果是每個(gè)主題的詞頻分布矩陣(用Topic_Word表示),這也可以作為LDA的建模結(jié)果;另外,LDA模型也會(huì)同時(shí)輸出訓(xùn)練集中每個(gè)文檔關(guān)于主題的頻率分布矩陣(用Doc_Topic表示)。
2.LDA建模前的文本數(shù)據(jù)預(yù)處理
與一般的中文文本分析準(zhǔn)備步驟一樣,在LDA主題分析之前,首先要對(duì)全文進(jìn)行中文分詞。我們采用NLPIR中文分詞系統(tǒng),將每篇上市公司公告和財(cái)經(jīng)媒體跟蹤報(bào)道分拆成詞語列表。然后,為了防止對(duì)主題建模的干擾,我們剔除了分詞結(jié)果中的非中文詞語(包括數(shù)字、英文等),并根據(jù)《哈工大停用詞表》剔除了中文停用詞(Stop Words),如功能詞“還有”、“即便”等。最后,中文分詞系統(tǒng)會(huì)把媒體報(bào)道中大量存在的人名、公司名等非常見專有名詞切割成出現(xiàn)頻率較高的單個(gè)漢字,如“嘉”、“宏”等,這會(huì)對(duì)主題建模產(chǎn)生干擾,所以我們進(jìn)一步剔除了分詞結(jié)果中以單個(gè)漢字形式呈現(xiàn)的中文詞。
3.決定主題個(gè)數(shù)
LDA主題分析的算法需要人工輸入主題個(gè)數(shù),而主題個(gè)數(shù)的選擇會(huì)影響結(jié)果解讀。設(shè)定太少的主題數(shù)會(huì)導(dǎo)致最后的主題區(qū)分過于寬泛和模糊,而設(shè)定太多的主題數(shù)又會(huì)產(chǎn)生一些沒有經(jīng)濟(jì)意義的主題?;贖uang等(2014)及張純和吳明明(2015)的研究,我們使用“復(fù)雜度”(Perplexity)統(tǒng)計(jì)量來確定LDA模型的主題數(shù),最后選取40作為最優(yōu)的主題數(shù)。
4.LDA 建模結(jié)果
由于不同行業(yè)的上市公司公告和媒體跟蹤報(bào)道內(nèi)容會(huì)涉及含有各自行業(yè)特點(diǎn)的主題,我們按照證監(jiān)會(huì)二級(jí)行業(yè)代碼,剔除“金融、保險(xiǎn)業(yè)”,對(duì)余下的21個(gè)行業(yè)進(jìn)行了LDA主題分析。表8列示了樣本中文檔數(shù)最多的制造業(yè)中“機(jī)械、設(shè)備、儀表”(C7)行業(yè)的LDA建模結(jié)果。其中,“主題的詞語分布中前20個(gè)詞語”為LDA建模后輸出結(jié)果,而“人工擬定主題名稱”為我們根據(jù)該主題的詞語分布中前20個(gè)詞語人工判定的主題語義。從前10個(gè)主題的前20個(gè)詞語可以看出,LDA較好地概括了上市公司公告和財(cái)經(jīng)媒體跟蹤報(bào)道經(jīng)常涉及的主題,其中第二個(gè)主題“產(chǎn)業(yè)支持政策對(duì)公司的影響”、第四個(gè)主題“新項(xiàng)目機(jī)會(huì)”和第八個(gè)主題“出口、海外市場”體現(xiàn)了一定的行業(yè)特點(diǎn),另外六個(gè)主題則是上市公司一般都會(huì)涉及的主題。
表8 樣本中文檔數(shù)最多的“機(jī)械、設(shè)備、儀表”行業(yè)LDA建模結(jié)果(前10個(gè)主題的前20個(gè)詞語)
附錄C 信息挖掘(Discover)和信息傳遞(Dissemination)計(jì)量步驟
1.以文檔d標(biāo)記上市公司公告與媒體報(bào)道的文本,構(gòu)建文檔d中的主題向量Td。在文檔分詞的基礎(chǔ)上,利用LDA建??梢匀〉酶鱾€(gè)行業(yè)文檔集的主題?詞匯分布矩陣Topic_Word,這一矩陣將實(shí)現(xiàn)特定主題(S)與一組詞匯的對(duì)應(yīng)。針對(duì)某一文檔d(可以是上市公司公告,也可以是媒體報(bào)道),以句子為單位,分析句中的詞匯,若該句所用詞匯歸屬于主題S的最多,則該句被歸為主題S。以此類推,我們可以對(duì)文檔d中所有句子進(jìn)行主題歸類。我們?cè)侔盐臋nd中歸屬于各個(gè)主題的句子數(shù)除以文檔d中句子總數(shù),形成如下向量:
2.確定文檔d中的主題后,針對(duì)特定主題S,匯總文檔中出現(xiàn)的歸屬于主題S的詞匯列表,并統(tǒng)計(jì)各個(gè)詞匯出現(xiàn)的頻數(shù),進(jìn)而形成每篇文檔中每個(gè)主題的詞語向量。
其中,元素viS或wiS代表所在文檔中詞語i用于描述主題S的頻數(shù)。
3.度量媒體跟蹤的信息挖掘程度。本文計(jì)算了上市公司公告與媒體跟蹤報(bào)道的主題向量余弦值,用1減去該余弦值來衡量兩者之間的主題分布差異,其現(xiàn)實(shí)意義便是媒體跟蹤報(bào)道的信息挖掘程度,計(jì)算公式如下:
其中,SMedia,s和SAnn,s分別代表媒體跟蹤報(bào)道和上市公司公告的主題向量中第s個(gè)元素。
4.度量媒體跟蹤的信息傳遞效果。首先針對(duì)每個(gè)主題S,計(jì)算該主題的詞語向量的余弦,然后將所對(duì)應(yīng)上市公司公告中的前Sd個(gè)主題下計(jì)算的這個(gè)值進(jìn)行算數(shù)平均。我們對(duì)每篇上市公司公告的主題頻率從高到低排序,取累積頻率達(dá)到80%的前Sd個(gè)主題進(jìn)行檢驗(yàn),以排除文檔中不太重要的主題所帶來的干擾。
其中,N為文檔d中所有不同的詞語個(gè)數(shù),vjs和wjs分別為上市公司公告和媒體跟蹤報(bào)道中主題S的詞語向量中第j個(gè)元素。