呂 品,武秦娟,許 嘉
1.廣西大學(xué) 計(jì)算機(jī)與電子信息學(xué)院,南寧530004
2.廣西多媒體通信與網(wǎng)絡(luò)技術(shù)重點(diǎn)實(shí)驗(yàn)室,南寧530004
3.廣西高校并行分布式計(jì)算技術(shù)重點(diǎn)實(shí)驗(yàn)室,南寧530004
上市公司對(duì)外發(fā)布的信息是人們掌握公司最新動(dòng)態(tài)的第一手資料,這些信息中不僅包含結(jié)構(gòu)化的數(shù)值信息,如歷史股票數(shù)據(jù)[1]、財(cái)務(wù)比率[2]等,還包含大量的文本信息。其中數(shù)值信息的獲取和處理成本較低,蘊(yùn)含的信息能比較直接地反映公司的經(jīng)營(yíng)現(xiàn)狀。文本信息所占篇幅較大,信息獲取和處理的成本都更高,但它蘊(yùn)含更豐富的信息量,如公司發(fā)展的相關(guān)細(xì)節(jié),對(duì)投資者決策行為具有重大影響。越來(lái)越多的學(xué)者對(duì)上市公司文本信息披露進(jìn)行研究。
公告是上市公司文本信息披露的主要載體。企業(yè)對(duì)公司有關(guān)事項(xiàng)主動(dòng)披露,能夠減輕公司管理層和信息需求者的信息不對(duì)稱問(wèn)題。為了讓外界對(duì)公司有全面的了解,公司對(duì)外公布的公告一般包含多個(gè)方面的內(nèi)容,比如反映公司運(yùn)營(yíng)狀況的業(yè)績(jī)報(bào)告,重大事項(xiàng)、重大風(fēng)險(xiǎn)公告,停牌復(fù)牌的交易提示公告等。投資者通過(guò)閱讀公司公告可以了解公司的運(yùn)營(yíng)狀況,做出合理的投資決策;監(jiān)督機(jī)構(gòu)通過(guò)審核上市公司的日常公告,保證公司信息披露的質(zhì)量,有效維護(hù)投資市場(chǎng)的健康發(fā)展;對(duì)于公司本身來(lái)說(shuō),分析一些與企業(yè)經(jīng)營(yíng)發(fā)展相關(guān)的運(yùn)營(yíng)數(shù)據(jù),能夠?qū)ζ髽I(yè)未來(lái)的發(fā)展趨勢(shì)做出預(yù)測(cè),有利于企業(yè)未來(lái)戰(zhàn)略定位。
正確使用這些文本信息披露,能夠?yàn)閭€(gè)人投資策略制定、監(jiān)管機(jī)構(gòu)日常審計(jì)和企業(yè)實(shí)踐提供價(jià)值。但是,隨著企業(yè)信息披露日益增多,僅依靠人工追蹤和理解大量的金融文本信息變得困難。例如,為了理解年報(bào)中傳達(dá)的信息,分析師有時(shí)需要閱讀長(zhǎng)達(dá)上百頁(yè)的年報(bào),才能從中找出一些反映公司價(jià)值的信息。這個(gè)過(guò)程不僅耗時(shí),而且成本較高。并且,文本披露中即使含有一些有價(jià)值的信息,也可能被淹沒(méi)在大量的數(shù)據(jù)中,投資者很難將這些信息與相應(yīng)的市場(chǎng)反應(yīng)聯(lián)系起來(lái)并做出合理的決策,容易導(dǎo)致自身投資出現(xiàn)虧損的情況,難以發(fā)揮這些金融信息的價(jià)值。
文本挖掘技術(shù)的發(fā)展使得自動(dòng)分析上市公司文本信息披露成為可能。但是傳統(tǒng)的文本挖掘技術(shù)存在著信息提取效率不高的問(wèn)題,而且在涉及具體領(lǐng)域的知識(shí)發(fā)現(xiàn)任務(wù)時(shí),要求研究者有著比較豐富的領(lǐng)域知識(shí)。隨著機(jī)器學(xué)習(xí)在文本分析、數(shù)據(jù)挖掘等領(lǐng)域應(yīng)用的不斷深入,將該技術(shù)用于公司文本信息披露的分析,給市場(chǎng)提供了一個(gè)新的解決思路,成為一種流行的研究方向。近十年來(lái),金融市場(chǎng)上關(guān)于上市公司文本信息披露的研究成果越來(lái)越多,研究者通過(guò)收集公司披露的文本信息,結(jié)合機(jī)器學(xué)習(xí)算法進(jìn)行建模訓(xùn)練,給出預(yù)測(cè)結(jié)果或分析結(jié)果,這些分析方法極大提高了信息獲取效率。本文對(duì)這些研究成果進(jìn)行了梳理歸納,以幫助讀者了解現(xiàn)有的發(fā)展?fàn)顩r。根據(jù)具體的應(yīng)用場(chǎng)景和數(shù)據(jù)特點(diǎn),研究者們使用了不同的機(jī)器學(xué)習(xí)方法,大多數(shù)文獻(xiàn)的研究過(guò)程可以歸納為以下3個(gè)步驟,具體如圖1所示。
圖1 金融文本處理的三個(gè)步驟Fig.1 Three steps in financial text processing
(1)數(shù)據(jù)收集及預(yù)處理:數(shù)據(jù)預(yù)處理工作的基礎(chǔ)是確定研究需要使用的數(shù)據(jù)集。數(shù)據(jù)集一般包含兩個(gè)部分,一部分是研究需要的文本數(shù)據(jù)集,另一部分是與該研究相關(guān)的外生反饋數(shù)據(jù)集。例如對(duì)于股票預(yù)測(cè)問(wèn)題,外生反饋數(shù)據(jù)集一般是該文本消息集公布后相對(duì)應(yīng)的股價(jià)反應(yīng)數(shù)據(jù)集。在構(gòu)建有效的實(shí)驗(yàn)數(shù)據(jù)集后,需要對(duì)原始的數(shù)據(jù)進(jìn)行預(yù)處理,預(yù)處理一般包含數(shù)據(jù)清洗、分詞、去除停用詞等過(guò)程。
(2)特征工程:特征工程主要包括特征提取和特征選擇。特征提取能選擇出一些具有代表性的詞,充分反映文本的信息。特征選擇在特征提取的基礎(chǔ)上,選擇出一組最優(yōu)的特征子集。特征提取和選擇的本質(zhì)是降維,通過(guò)領(lǐng)域知識(shí)創(chuàng)建一組最能代表原始數(shù)據(jù)的特征。
(3)模型構(gòu)建:數(shù)據(jù)預(yù)處理、特征工程是將文本轉(zhuǎn)化成為機(jī)器能夠理解的數(shù)學(xué)符號(hào),模型構(gòu)建的過(guò)程是選擇合適的機(jī)器學(xué)習(xí)算法對(duì)變量進(jìn)行處理。不同的機(jī)器學(xué)習(xí)算法具有不同的優(yōu)勢(shì),需要選擇與數(shù)據(jù)特征相契合的算法。
上市公司發(fā)布的文本披露包含多種事件類型,不同事件類型往往蘊(yùn)含不同的信息量,適用于不同的金融場(chǎng)景。本章對(duì)不同事件類型文本披露的研究現(xiàn)狀進(jìn)行歸納,一方面有助于對(duì)不同事件類型文本披露的價(jià)值內(nèi)涵進(jìn)行探究,另一方面可提高信息獲取的效率。按照文本分析過(guò)程中使用的數(shù)據(jù)源的不同可將現(xiàn)有研究分為兩類:一類工作對(duì)多種事件類型的文本披露進(jìn)行聯(lián)合分析;另一類工作只分析某一特定事件類型的文本披露。
一種事件類型文本所包含的信息往往不全面,為此研究者將多種類型的數(shù)據(jù)集聯(lián)合分析,以宏觀把握公司文本信息披露對(duì)金融市場(chǎng)的影響。臨時(shí)公告是企業(yè)對(duì)外發(fā)布的一種重要類型的公告,包含多種事件類型(如會(huì)議決議、資產(chǎn)重組、人事變動(dòng)以及收購(gòu)兼并等事件),在企業(yè)對(duì)外披露的信息中占有很大比重。對(duì)臨時(shí)公告的研究有助于理解公司臨時(shí)發(fā)生的事件對(duì)金融市場(chǎng)造成的長(zhǎng)短期影響,幫助投資者制定合理的投資策略,具有十分重要的研究?jī)r(jià)值。
文獻(xiàn)[3-7]將臨時(shí)公告作為新聞?wù)Z料庫(kù),捕捉一些企業(yè)臨時(shí)事件對(duì)股票市場(chǎng)造成的影響。Groth等人[8]從公司臨時(shí)公告中提取信息,開(kāi)發(fā)了一個(gè)預(yù)測(cè)系統(tǒng),研究企業(yè)臨時(shí)信息披露是否會(huì)對(duì)市場(chǎng)流動(dòng)性造成影響。為了研究企業(yè)對(duì)外公布的金融事件是否包含風(fēng)險(xiǎn)信息,文獻(xiàn)[9]提出了一種基于文本挖掘的日內(nèi)風(fēng)險(xiǎn)預(yù)測(cè)模型。在數(shù)據(jù)收集的過(guò)程中,為了避免一些低質(zhì)量的新聞對(duì)模型的訓(xùn)練結(jié)果造成干擾,研究者構(gòu)造了一個(gè)預(yù)判模型,根據(jù)公司文本披露之后的市場(chǎng)波動(dòng)大小來(lái)確定該披露是否納入預(yù)測(cè)模型,實(shí)驗(yàn)表明使用這種方法構(gòu)造的數(shù)據(jù)集可以用來(lái)預(yù)測(cè)日內(nèi)風(fēng)險(xiǎn)波動(dòng)。
綜上所述,對(duì)多種事件類型的公告進(jìn)行聯(lián)合分析,有利于系統(tǒng)地識(shí)別上市公司臨時(shí)文本信息披露與股市、金融市場(chǎng)流動(dòng)性以及企業(yè)未來(lái)風(fēng)險(xiǎn)之間的聯(lián)系。但是,聯(lián)合分析法存在一定的局限:一是不同事件類型公告的信息發(fā)布側(cè)重點(diǎn)不同,造成的市場(chǎng)影響也不同。聯(lián)合分析法只能定性評(píng)估多種事件類型的公告是否會(huì)對(duì)市場(chǎng)造成影響,而難以對(duì)這些影響結(jié)果進(jìn)行量化。二是聯(lián)合分析法涉及多種事件類型的公告,各個(gè)事件類型的公告內(nèi)容差別較大,信息質(zhì)量也不一致,增加了分析難度。
企業(yè)對(duì)外公開(kāi)披露的這些信息中,并不是所有的事件類型都能夠引起明顯的市場(chǎng)波動(dòng),一些日常的董事會(huì)決議報(bào)告、工商變更登記等,對(duì)市場(chǎng)的影響很小,一般不會(huì)引起投資者的過(guò)分關(guān)注,因而對(duì)上市公司公告的研究也集中在一些特定的事件類型中。按照不同的維度對(duì)研究的文獻(xiàn)進(jìn)行分類,可以分為以下五類:第一類是財(cái)務(wù)文本信息披露,如收益公告、股利變動(dòng)公告;第二類是定期文本披露,如年報(bào)、季報(bào)等;第三類是提示信息,如澄清公告、風(fēng)險(xiǎn)提示信息等;第四類是重大事項(xiàng)公告,如董事會(huì)變動(dòng)公告、收購(gòu)兼并消息等;第五類是其他類型的公告,如補(bǔ)充更正公告等。下文按照這種分類方式進(jìn)行總結(jié)。
1.2.1 財(cái)務(wù)文本信息披露
財(cái)務(wù)披露是指公司披露的有關(guān)其財(cái)務(wù)狀況、經(jīng)營(yíng)績(jī)效和發(fā)展前景的信息,一般包括數(shù)字指標(biāo)和文本描述。文本描述部分是對(duì)數(shù)字信息的細(xì)化和補(bǔ)充,可以幫助信息的需求者更加全面地了解企業(yè)信息。
收益公告是上市公司對(duì)其一段時(shí)間內(nèi)的盈利和收入情況進(jìn)行披露的文件。作為上市公司財(cái)務(wù)狀況披露的重要載體之一,收益公告的發(fā)布一般會(huì)對(duì)投資市場(chǎng)帶來(lái)信息沖擊,引起市場(chǎng)價(jià)格的波動(dòng)。Truong等人[10]采用收益公告發(fā)布后隱含波動(dòng)率的變化來(lái)研究期權(quán)市場(chǎng)對(duì)收益消息的反應(yīng),隱含波動(dòng)率的變化可以很好地反映期權(quán)價(jià)值的總體變化。實(shí)驗(yàn)結(jié)果表明,盈利公告對(duì)期權(quán)市場(chǎng)短期波動(dòng)和長(zhǎng)期波動(dòng)都有重要影響,而且對(duì)短期波動(dòng)的影響更為顯著。文獻(xiàn)[11]證明了債券價(jià)格對(duì)收益公告的反應(yīng)能夠被用于預(yù)測(cè)未來(lái)的股票市場(chǎng)收益,該研究結(jié)果加深了對(duì)股票市場(chǎng)和債券市場(chǎng)之間關(guān)系的理解。
收益公告中披露的公司業(yè)績(jī)狀況是投資者判斷公司內(nèi)在價(jià)值的重要參考信息。股利分配是上市公司針對(duì)其收益狀況對(duì)盈利進(jìn)行分配或者留存再投資的決策行為,是投資收益的重要組成部分。股利公告是董事會(huì)對(duì)股利的支付情況予以說(shuō)明的文件,一直是學(xué)者研究的熱點(diǎn)。為了探究股利公告對(duì)金融市場(chǎng)的影響,Hu等人[12]分析了中國(guó)市場(chǎng)上股利公告對(duì)股票價(jià)格的影響,發(fā)現(xiàn)股利增加公告發(fā)布后,股票價(jià)格隨之上漲;但是在股利減少的公告日上,股利公告對(duì)股票價(jià)格的負(fù)面影響并不顯著。一些研究表明,股利公告的發(fā)布會(huì)對(duì)投資者的行為造成影響,如交易行為和賣空行為等[13-14]。這些研究成果對(duì)于理解金融市場(chǎng)提供了一定的幫助,但是,市場(chǎng)對(duì)同一類型公告在不同經(jīng)濟(jì)發(fā)展?fàn)顩r、市場(chǎng)背景下的反應(yīng)有待進(jìn)一步探究。經(jīng)濟(jì)的發(fā)展?fàn)顩r會(huì)影響股民的情緒,導(dǎo)致股票市場(chǎng)對(duì)同一公告的反應(yīng)存在差異。Khanal等人[15]研究了美國(guó)蕭條時(shí)期股價(jià)對(duì)股利公告的反應(yīng),發(fā)現(xiàn)這個(gè)時(shí)期股票市場(chǎng)的異常收益明顯小于經(jīng)濟(jì)平穩(wěn)時(shí)的異常收益。這可能是因?yàn)榻?jīng)濟(jì)的持續(xù)衰退削減了投資者的信心,導(dǎo)致投資者積極性不高,從而對(duì)股票市場(chǎng)產(chǎn)生一定的影響。
財(cái)務(wù)重述公告是企業(yè)為了糾正之前發(fā)布的財(cái)務(wù)數(shù)據(jù)中的問(wèn)題而發(fā)布的一類公告。財(cái)務(wù)重述公告一般會(huì)在資本市場(chǎng)中引起負(fù)面的反應(yīng),對(duì)公司發(fā)展造成一系列不利的后果。Albring等人[16]探究了財(cái)務(wù)重述公告對(duì)企業(yè)發(fā)展的影響。研究結(jié)果表明,在公司發(fā)布財(cái)務(wù)重述公告之后,公司的整體增長(zhǎng)率會(huì)下降,此外不同情況下財(cái)務(wù)重述公告對(duì)公司影響不同:財(cái)務(wù)重述公告對(duì)那些發(fā)布了虛假信息報(bào)告的公司影響更大,而對(duì)一些糾正以前會(huì)計(jì)錯(cuò)誤的公司影響相對(duì)較小。文獻(xiàn)[17]從財(cái)務(wù)重述的角度探究了中國(guó)市場(chǎng)上的公司財(cái)務(wù)報(bào)告質(zhì)量。研究結(jié)果表明中國(guó)資本市場(chǎng)在過(guò)去幾年確實(shí)存在著一些質(zhì)量不高的財(cái)務(wù)報(bào)告,但是伴隨著監(jiān)督機(jī)構(gòu)監(jiān)管力度的增強(qiáng),公司發(fā)布重述公告的頻率有所下降,企業(yè)披露信息質(zhì)量不高的問(wèn)題得到改善。
1.2.2 定期文本信息披露
定期報(bào)告主要有年報(bào)、季報(bào)和中期報(bào)告等。在定期的文本披露中,年報(bào)是被最廣泛研究的數(shù)據(jù)形式。它是上市公司對(duì)上一年經(jīng)營(yíng)活動(dòng)和未來(lái)發(fā)展的客觀描述,是企業(yè)信息披露的核心內(nèi)容之一。年報(bào)的內(nèi)容一般比較固定,除了財(cái)務(wù)報(bào)告之外,還包括公司的基本情況簡(jiǎn)介、股東及其變動(dòng)情況等11個(gè)部分,其中,“管理層討論與分析”(簡(jiǎn)稱“MD&A”)是年報(bào)中最重要的部分之一,不僅包含公司對(duì)財(cái)務(wù)報(bào)表的進(jìn)一步解釋和分析,而且包含管理層對(duì)未來(lái)發(fā)展經(jīng)營(yíng)狀況的預(yù)測(cè),一些公司發(fā)展過(guò)程中存在的風(fēng)險(xiǎn)和不確定性因素也包含在內(nèi)[18]。MD&A作為反映公司績(jī)效和戰(zhàn)略風(fēng)險(xiǎn)的重要部分,受到了越來(lái)越多的關(guān)注。研究發(fā)現(xiàn),使用美國(guó)上市公司年報(bào)(10-k)的MD&A部分,不僅能夠有效識(shí)別欺詐行為[19-22],還能預(yù)測(cè)破產(chǎn)事件[23]。
大多數(shù)使用年報(bào)進(jìn)行分析的文獻(xiàn)都傾向于對(duì)文本的語(yǔ)言特征和情感傾向進(jìn)行研究。語(yǔ)言的特征隱含管理層的真實(shí)心理,是傳遞公司發(fā)展的一種重要信號(hào)。一些學(xué)者發(fā)現(xiàn),年報(bào)敘述部分語(yǔ)氣的積極程度[24]、表達(dá)語(yǔ)調(diào)[25]、語(yǔ)氣特征[26]等與未來(lái)的市場(chǎng)反應(yīng)有關(guān),可以用于預(yù)測(cè)未來(lái)公司業(yè)績(jī)。陳藝云[27]發(fā)現(xiàn)中文年報(bào)MD&A部分的語(yǔ)調(diào)包含預(yù)測(cè)財(cái)務(wù)困境的增量信息,這些增量信息可以用于提高企業(yè)財(cái)務(wù)困境的預(yù)測(cè)準(zhǔn)確率。情感詞匯包含一些管理層的主觀判斷,也是一種重要的金融分析預(yù)測(cè)方法。通過(guò)情感分析可以得出其褒貶性傾向,發(fā)現(xiàn)管理人員的真實(shí)意圖,為企業(yè)管理提供決策信息[28]。Tsai等人[29]證明,使用情緒分析法能夠有效降低文本的維度,預(yù)測(cè)公司未來(lái)的風(fēng)險(xiǎn)。有學(xué)者證明公司年報(bào)中提取的情緒特征,能夠用于公司股票市場(chǎng)的未來(lái)收益預(yù)測(cè)[30]。
以上文獻(xiàn)說(shuō)明了年報(bào)中的情感傾向和語(yǔ)言特征在公司披露文本信息挖掘中的重要性。企業(yè)定期披露除了包含與公司發(fā)展有關(guān)的語(yǔ)言特征和情感傾向之外,其他特征因子也可用于文本分析。有學(xué)者發(fā)現(xiàn),從公司披露的年報(bào)或季報(bào)中提取一些風(fēng)險(xiǎn)因子,能夠用于風(fēng)險(xiǎn)預(yù)測(cè)[31],幫助利益相關(guān)者制定合理和及時(shí)的風(fēng)險(xiǎn)管理策略[32]。此外,一些學(xué)者利用企業(yè)信息披露的時(shí)間這一特征進(jìn)行研究,分析了公司信息披露時(shí)間與企業(yè)舞弊行為的聯(lián)系。研究結(jié)果表明一些公司通過(guò)把握重大信息披露的時(shí)機(jī),利用投資者注意力的變化來(lái)隱藏壞消息。監(jiān)督機(jī)構(gòu)可以有效利用這一特征,檢查一些公司有無(wú)違規(guī)行為[33]。
上述研究表明,企業(yè)定期文本披露中含有大量有用的價(jià)值信息,通過(guò)對(duì)文本的語(yǔ)調(diào)、情感傾向、語(yǔ)言風(fēng)格、可讀性等特征進(jìn)行分析,能夠?qū)Χㄆ谖谋九缎畔⒌膬r(jià)值內(nèi)涵進(jìn)行深入探究。這些研究成果能夠?yàn)槠髽I(yè)業(yè)績(jī)預(yù)測(cè)、價(jià)值識(shí)別、風(fēng)險(xiǎn)預(yù)警等眾多場(chǎng)景提供預(yù)測(cè)價(jià)值。
1.2.3 提示信息
公司對(duì)外發(fā)布的提示信息如操作風(fēng)險(xiǎn)提示、交易異動(dòng)提示等信息對(duì)于投資者了解公司風(fēng)險(xiǎn)、把握投資時(shí)機(jī)具有重要意義。此外一些其他類型的提示信息如停牌信息、澄清信息等在保障投資者利益、穩(wěn)定市場(chǎng)波動(dòng)方面發(fā)揮著重要作用,因而一些學(xué)者探究了這些類型的公告信息對(duì)市場(chǎng)造成的影響。
企業(yè)發(fā)展中存在的一些不安全事件如業(yè)務(wù)中斷、系統(tǒng)故障等風(fēng)險(xiǎn)可能對(duì)公司造成不利的影響,企業(yè)有必要及時(shí)將這些信息告知投資者。Barakat等人[34]的研究表明操作風(fēng)險(xiǎn)的發(fā)生可能會(huì)增加企業(yè)與投資者之間的信息不對(duì)稱程度。此外該實(shí)驗(yàn)結(jié)果表明,在操作風(fēng)險(xiǎn)公告首次發(fā)布前后,投資者交易量大幅增加,市場(chǎng)流動(dòng)性整體改善。該研究有助于理解企業(yè)發(fā)布操作風(fēng)險(xiǎn)公告的事件后果。
一些停牌信息可能對(duì)市場(chǎng)造成影響。停牌是因?yàn)槟承┰蛟斐傻墓竟善眱r(jià)格連續(xù)上升或者下降,證券交易所暫時(shí)停止該公司的股票交易,避免股價(jià)異常波動(dòng)對(duì)投資者利益造成損害。Jiang等人[35]收集了公司的停牌公告,建立基于該類型公告的預(yù)測(cè)模型,探究停牌公告是否會(huì)引起股票價(jià)格的波動(dòng)。實(shí)驗(yàn)數(shù)據(jù)表明,股票停牌期間的公告會(huì)造成異常的市場(chǎng)收益。陳舒寧等人[36]利用事件分析法對(duì)比了深圳交易所取消交易停牌制度前后中小板的股票異常數(shù)據(jù),結(jié)果顯示停牌公告在短期內(nèi)對(duì)中小板的市場(chǎng)波動(dòng)具有穩(wěn)定作用,但長(zhǎng)期的穩(wěn)定作用并不顯著。
市場(chǎng)上流傳的一些謠言或者猜測(cè)可能對(duì)公司形象不利,誤導(dǎo)消費(fèi)者的行為,也可能對(duì)市場(chǎng)造成波動(dòng)。為此,公司需要立即對(duì)這些事情進(jìn)行澄清,投資者收到這些澄清的消息之后會(huì)做出相應(yīng)的反應(yīng),從而引起股價(jià)的二次波動(dòng)。文獻(xiàn)[37]探究了公司傳聞、澄清公告和賣空交易行為之間的聯(lián)系。研究結(jié)果表明賣空者能夠提前探知公司的傳聞信息,并且能夠?qū)Τ吻骞娴慕Y(jié)果進(jìn)行預(yù)先判斷做出合理的決策。文獻(xiàn)[38]探究了在不同背景下(熊市和牛市)投資者在澄清公告前后的反應(yīng)是否一致。通過(guò)建立謠言和澄清模型,作者發(fā)現(xiàn)熊市和牛市投資者對(duì)澄清公告的反應(yīng)是一致的,當(dāng)謠言出現(xiàn)時(shí),投資者具有比較強(qiáng)烈的反應(yīng),而且好消息比壞消息反應(yīng)更強(qiáng)烈,此外投資者會(huì)傾向忽略澄清公告。
1.2.4 重大事項(xiàng)公告
上市公司會(huì)對(duì)近期內(nèi)公司發(fā)生的一些重大事項(xiàng)對(duì)外進(jìn)行披露,從而引起股價(jià)的變化。Negre等人[39]探究了法國(guó)公司宣布裁員公告之后投資者的反應(yīng)。研究結(jié)果表明,當(dāng)公司對(duì)外宣布裁員事件時(shí),市場(chǎng)會(huì)做出負(fù)面的反應(yīng)。公司管理層變動(dòng)消息一般也會(huì)引起投資者的關(guān)注。文獻(xiàn)[40]通過(guò)分析CEO繼任公告發(fā)布之后的推特情緒,預(yù)測(cè)公司股票收益。研究發(fā)現(xiàn),高水平的推特情緒特征往往與較低的未來(lái)超額回報(bào)相聯(lián)系,這一研究表明社交媒體上的信息可以幫助投資者和公司做出決策。
兼并收購(gòu)、資產(chǎn)重組作為企業(yè)的一個(gè)重大事項(xiàng),能夠?qū)镜氖兄诞a(chǎn)生影響。文獻(xiàn)[41]研究了上市公司兼并收購(gòu)行為對(duì)公司市值管理的影響。研究結(jié)果表明,兼并收購(gòu)行為的確能夠提升市值,但是如果企業(yè)在收購(gòu)后沒(méi)有很好地整合雙方資源,兼并帶來(lái)的市值增長(zhǎng)并不穩(wěn)定。文獻(xiàn)[42]探究了兼并收購(gòu)和融資事件在公告發(fā)布前后是否會(huì)對(duì)股票市場(chǎng)造成影響,這些影響包括股票的交易量、收益率波動(dòng)性和定價(jià)效率。研究發(fā)現(xiàn),公司兼并收購(gòu)事件并未顯著改變股票的交易流動(dòng)性。該研究結(jié)果將有助于監(jiān)管決策者、計(jì)劃重組活動(dòng)的公司理解公司重組事件對(duì)市場(chǎng)造成的影響。文獻(xiàn)[43]以企業(yè)發(fā)布的重大資產(chǎn)重組公告為研究對(duì)象,探究該類型的公告對(duì)股票買賣的操作方向和累積超額收益的影響。實(shí)驗(yàn)結(jié)果表明,公告發(fā)布后短期時(shí)間內(nèi)投資者會(huì)選擇賣出該類公告對(duì)應(yīng)的股票,且投資者的累積收益為負(fù)。文獻(xiàn)[44]以重大關(guān)聯(lián)銷售事項(xiàng)為研究對(duì)象,探究了該類型事件對(duì)中國(guó)A股市場(chǎng)的影響。研究表明市場(chǎng)對(duì)該類型的公告反應(yīng)不足,事件發(fā)生后一般只產(chǎn)生微弱的正向反應(yīng)。
1.2.5 其他類型公告
一些企業(yè)日常的一些補(bǔ)充說(shuō)明、信息變更,對(duì)市場(chǎng)造成的影響不大,但也有少數(shù)學(xué)者對(duì)其進(jìn)行了研究。文獻(xiàn)[45]探究了控制權(quán)變更公告在首次披露日和正式披露日對(duì)市場(chǎng)的影響,檢驗(yàn)首次公告效應(yīng)和正式實(shí)施公告效應(yīng)是否具有時(shí)差效應(yīng)。實(shí)驗(yàn)結(jié)果表明控制權(quán)變更公告在首次公告日和正式公告日均對(duì)股價(jià)具有正向沖擊效應(yīng),但是公告披露后對(duì)累積收益的影響相反。Rosati等人[46]調(diào)查了受數(shù)據(jù)泄露影響的公司,發(fā)布社交媒體信息是否會(huì)對(duì)公司股價(jià)造成影響,以判斷企業(yè)采用這種對(duì)外解釋的方式是否加劇了數(shù)據(jù)泄露的成本。數(shù)據(jù)分析表明,通過(guò)社交媒體發(fā)布數(shù)據(jù)泄露的公告會(huì)對(duì)股價(jià)產(chǎn)生負(fù)面影響,導(dǎo)致在兩天的事件周期內(nèi)股價(jià)平均額外下跌1.2%。
通過(guò)對(duì)不同類型公告的研究現(xiàn)狀進(jìn)行歸納梳理,可以發(fā)現(xiàn)現(xiàn)有針對(duì)上市公司文本信息披露的研究主要集中在財(cái)務(wù)文本信息披露和公司定期文本信息披露兩類事件類型中。大多數(shù)投資者對(duì)與財(cái)務(wù)相關(guān)的信息表現(xiàn)出高度的敏感性,公司發(fā)布的收益變化、股利變動(dòng)以及財(cái)務(wù)重述等信息都能引起投資者的廣泛關(guān)注,造成金融市場(chǎng)的波動(dòng)。財(cái)務(wù)文本信息披露作為企業(yè)對(duì)外披露的一類重要文件,具有重要的研究?jī)r(jià)值。通過(guò)識(shí)別不同內(nèi)容的財(cái)務(wù)文本信息披露對(duì)市場(chǎng)造成的影響,有助于投資者從公告發(fā)布的反應(yīng)中尋找投資機(jī)會(huì),構(gòu)建事件交易策略,提高投資收益。定期文本信息披露中包含公司對(duì)一段時(shí)間內(nèi)發(fā)展?fàn)顩r的總結(jié)信息和未來(lái)的前瞻性描述信息,這些信息對(duì)于投資者識(shí)別公司價(jià)值、判斷公司未來(lái)發(fā)展起著重要作用,對(duì)市場(chǎng)沖擊較大,獲得的關(guān)注也更多。
重點(diǎn)闡述了如何從公司文本信息披露中提取有價(jià)值信息,對(duì)公司文本信息披露中常用的機(jī)器學(xué)習(xí)算法以及這些算法的優(yōu)缺點(diǎn)進(jìn)行了總結(jié)。這些算法不僅包含傳統(tǒng)的回歸分析(regression analysis method)算法、樸素貝葉斯算法(Naive Bayesian Model,NBM),還有一些以卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)、循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)為代表的深度學(xué)習(xí)算法。
在研究不同類型的公告對(duì)市場(chǎng)的影響時(shí),事件分析法和回歸分析法是兩種常用的模型。事件分析法一般使用某類公告發(fā)布后特定時(shí)間窗口內(nèi)的超額收益、平均超額收益等衡量特定事件對(duì)公司的影響?;貧w分析法通過(guò)建立選定變量與超額收益之間的回歸方程,根據(jù)回歸系數(shù)的大小、顯著程度判斷公告信息對(duì)市場(chǎng)的影響。這兩種方法的分析過(guò)程雖然存在一定的差別,但是在分析的過(guò)程中都需要建立回歸方程進(jìn)行回歸分析。事件分析法一般用回歸模式計(jì)算事件發(fā)生后的累積影響。基本步驟如圖2所示,從中可以看出,建立回歸方程,檢驗(yàn)信息披露前后的市場(chǎng)變化是事件分析的重要環(huán)節(jié)。因此,本文將事件分析法納入回歸分析的范疇。
圖2 事件分析法的一般過(guò)程Fig.2 General process of event analysis
Leitch等人[40]運(yùn)用事件分析法探究了公司發(fā)布CEO繼任公告之后,Twitter上的股民情緒對(duì)股票回報(bào)率的影響。他們將社交情緒得分和其他變量作為自變量,建立回歸方程計(jì)算累積異常收益。文獻(xiàn)[25]用公司累積收益作為檢驗(yàn)方法,探究公司年報(bào)敘述部分的基調(diào)(即管理層對(duì)公司對(duì)未來(lái)收益或者發(fā)展方向的正面或者負(fù)面的評(píng)價(jià))對(duì)企業(yè)當(dāng)前業(yè)績(jī)和盈余持久性的影響。分析結(jié)果顯示,公司當(dāng)前的業(yè)績(jī)?cè)胶?,公司年?bào)的基調(diào)越積極,未來(lái)收益持久性就越差。事件分析法是一種有效的金融分析工具,分析過(guò)程中假定只有一個(gè)類型的事件對(duì)公司的收益造成影響。但是現(xiàn)實(shí)的情況一般比較復(fù)雜,某一次市場(chǎng)的波動(dòng)可能與多個(gè)金融事件相關(guān)聯(lián),因此事件分析法存在一定的缺陷。
回歸分析可以判斷自變量和因變量之間的關(guān)系。在進(jìn)行回歸分析之前,首先要對(duì)變量進(jìn)行相關(guān)分析,皮爾遜相關(guān)系數(shù)、單變量分析法都是一種常用的分析方法[24]。分析的結(jié)果可以為兩個(gè)變量之間是否具有一定的關(guān)系提供初步的證據(jù),只有當(dāng)兩個(gè)變量之間存在明確的相關(guān)關(guān)系時(shí),建立回歸方程才有意義。文獻(xiàn)[47]通過(guò)建立回歸方程,控制其他變量,觀察MD&A對(duì)公司財(cái)務(wù)績(jī)效的影響。實(shí)驗(yàn)結(jié)果證明了公司MD&A信息披露與財(cái)務(wù)績(jī)效顯著正相關(guān),可以用作未來(lái)公司業(yè)績(jī)預(yù)測(cè)。文獻(xiàn)[48]的回歸分析結(jié)果表明,年報(bào)中的管理層超額樂(lè)觀語(yǔ)調(diào)指標(biāo)與企業(yè)財(cái)務(wù)危機(jī)負(fù)相關(guān)。
綜上所述,回歸分析可以精準(zhǔn)地評(píng)估各個(gè)因素之間的相關(guān)程度。但是,該方法只能對(duì)線性關(guān)系進(jìn)行擬合,不能擬合非線性關(guān)系?,F(xiàn)實(shí)狀況下很多變量之間的關(guān)系并不能簡(jiǎn)單地使用線性關(guān)系來(lái)描述,尤其是在處理文本的非線性和高維特征時(shí)存在很大限制。
支持向量機(jī)(Support Vector Machine,SVM)算法以統(tǒng)計(jì)學(xué)習(xí)理論為基礎(chǔ),能夠解決非線性、高維度、樣本有限的問(wèn)題,被認(rèn)為是一種優(yōu)秀的文本分類算法,具有良好的推廣性能。SVM可以被用在金融事件的與預(yù)測(cè)問(wèn)題中,如欺詐行為檢測(cè)[35,49]、新聞發(fā)布之后產(chǎn)生的流動(dòng)性沖擊影響預(yù)測(cè)等[8]。
一些學(xué)者將SVM作為預(yù)測(cè)模型,并用其他的分類器做對(duì)比,實(shí)驗(yàn)結(jié)果證明SVM擁有最好的結(jié)果。其中,文獻(xiàn)[50]用支持向量機(jī)預(yù)測(cè)公告消息發(fā)布后所帶來(lái)的股價(jià)影響,并比較了人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Networks,ANN)、樸素貝葉斯和SVM的預(yù)測(cè)性能,發(fā)現(xiàn)SVM的預(yù)測(cè)性能最佳。有學(xué)者使用了4個(gè)分類器預(yù)測(cè)公告發(fā)布之后的日內(nèi)市場(chǎng)波動(dòng)[9]:K近鄰算法(K-Nearest Neighbor,KNN)、樸素貝葉斯、神經(jīng)網(wǎng)絡(luò)和SVM,實(shí)驗(yàn)結(jié)果表明,SVM在解決風(fēng)險(xiǎn)評(píng)估問(wèn)題時(shí)效果最好。文獻(xiàn)[51]為了研究公司文本信息披露之后是否會(huì)產(chǎn)生顯著的股價(jià)波動(dòng),選擇SVM作為數(shù)據(jù)挖掘算法分類器,證明了SVM的分類結(jié)果優(yōu)于其他幾個(gè)分類算法。
綜上所述,SVM在高維、非線性問(wèn)題的文本分類問(wèn)題中具有很大的優(yōu)勢(shì),在股價(jià)預(yù)測(cè)、日內(nèi)波動(dòng)檢測(cè)、欺詐行為檢測(cè)等場(chǎng)景中都能取得較高的分類準(zhǔn)確率。此外,SVM具有較好的泛化性能,計(jì)算開(kāi)銷也比較小。但是,SVM在文本分類問(wèn)題中也存在一些限制,比如算法的精度在很大程度上依賴于核函數(shù)的選擇。另外,在樣本量較大的問(wèn)題中SVM的訓(xùn)練時(shí)間過(guò)長(zhǎng)。因此,在一些預(yù)測(cè)問(wèn)題中,為了獲得更好的分類效果,需要結(jié)合其他算法對(duì)支持向量機(jī)的性能進(jìn)行改進(jìn)。文獻(xiàn)[52]提出了一個(gè)基于模糊超平面的雙核支持向量機(jī)算法用于股價(jià)分析,模糊集能夠處理金融新聞中引入的大量噪聲,使得股價(jià)的預(yù)測(cè)更加準(zhǔn)確。
樸素貝葉斯是被廣泛使用的分類器之一,其所需的參數(shù)較少,算法也比較簡(jiǎn)單,能夠解決一些場(chǎng)景下的金融文本分類問(wèn)題。Feng[53]使用了樸素貝葉斯算法對(duì)年報(bào)中MD&A部分的前瞻性敘述的信息內(nèi)容進(jìn)行分析。研究結(jié)果表明,前瞻性敘述披露的平均基調(diào)與未來(lái)收益正向關(guān)。文獻(xiàn)[54]使用了樸素貝葉斯主題建模算法量化了年報(bào)敘述性披露部分的主題內(nèi)容,實(shí)驗(yàn)證明樸素貝葉斯算法能夠產(chǎn)生一組有意義的主題用來(lái)預(yù)測(cè)財(cái)務(wù)誤報(bào)事件。對(duì)于大規(guī)模的訓(xùn)練集,樸素貝葉斯一般能取得好于其他模型的分類效果[55]。有學(xué)者使用了14個(gè)分類器用于財(cái)務(wù)報(bào)表弊端的智能檢測(cè)[22],這些分類器包括:邏輯回歸(Logistic Regression,LR)模型、樸素貝葉斯分類器、支持向量機(jī)、決策樹(shù)(Decision Tree)、人工神經(jīng)網(wǎng)絡(luò)等,對(duì)比結(jié)果顯示,樸素貝葉斯在欺詐檢測(cè)問(wèn)題上的準(zhǔn)確率最高,這一研究成果可以為一些開(kāi)發(fā)智能欺詐檢測(cè)的研究者在選擇合適的機(jī)器學(xué)習(xí)算法時(shí)提供借鑒。樸素貝葉斯在訓(xùn)練的過(guò)程中對(duì)缺失數(shù)據(jù)并不敏感,所需估計(jì)的參數(shù)也比較少,但是該算法假定樣本屬性之間是不相關(guān)的,故樸素貝葉斯在樣本屬性相關(guān)性比較大的分類問(wèn)題中效果并不好。
決策樹(shù)是一種常見(jiàn)的機(jī)器學(xué)習(xí)算法,能夠?qū)W習(xí)對(duì)帶有分類標(biāo)記的訓(xùn)練數(shù)據(jù)進(jìn)行正確分類。在遞歸的訓(xùn)練過(guò)程中,決策樹(shù)一般通過(guò)信息增益來(lái)選擇屬性。在財(cái)務(wù)預(yù)測(cè)任務(wù)中,Chan等人[56]從文本信息的淺文本模式中提取事件序列,并使用基于決策樹(shù)分類器的推理引擎預(yù)測(cè)金融事件發(fā)生的可能性。實(shí)驗(yàn)結(jié)果表明,基于決策樹(shù)構(gòu)建的決策系統(tǒng)能夠揭示事件之間的隱藏規(guī)律,預(yù)測(cè)未來(lái)的股票價(jià)格變動(dòng)趨勢(shì)。決策樹(shù)能直觀地顯示其決策過(guò)程,生成容易理解的分類規(guī)則。但是,在訓(xùn)練過(guò)程中對(duì)訓(xùn)練樣本的數(shù)據(jù)特征擬合過(guò)于精確,無(wú)法對(duì)新的樣本進(jìn)行合理分析,容易出現(xiàn)過(guò)擬合現(xiàn)象。此外,對(duì)于新加入的樣本,需要重新調(diào)整樹(shù)的結(jié)構(gòu)以訓(xùn)練新的規(guī)則。
深度學(xué)習(xí)具有很強(qiáng)的學(xué)習(xí)能力,“多隱層”網(wǎng)絡(luò)結(jié)構(gòu)使得它擅長(zhǎng)捕捉高度非線性的關(guān)系。傳統(tǒng)的機(jī)器學(xué)習(xí)算法如決策樹(shù)、樸素貝葉斯等雖然適合龐大的數(shù)據(jù)集處理,但是在處理文本的非線性特征時(shí)仍然存在很多局限,比如決策樹(shù)算法受限于樹(shù)結(jié)構(gòu)的約束,很難學(xué)習(xí)到變量之間錯(cuò)綜復(fù)雜的非線性關(guān)系。在一些金融預(yù)測(cè)問(wèn)題中,深度學(xué)習(xí)模型確實(shí)能取得好于傳統(tǒng)機(jī)器學(xué)習(xí)模型的分類準(zhǔn)確率。有學(xué)者評(píng)估了不同預(yù)測(cè)算法對(duì)于建模性能的影響,使用前饋神經(jīng)網(wǎng)絡(luò)(Feedforward Neural Network,F(xiàn)NN)、決策樹(shù)和邏輯回歸三種不同的建模算法預(yù)測(cè)股票收益,多次實(shí)驗(yàn)結(jié)果證明了前饋神經(jīng)網(wǎng)絡(luò)算法的優(yōu)越性能[57]。Feuerriegel等人[58]采用遞歸自動(dòng)編碼器(Recursive Autoencoders)從底層文本語(yǔ)料庫(kù)中學(xué)習(xí)合適的特征,預(yù)測(cè)公司文本信息披露后的股票價(jià)格走勢(shì),實(shí)驗(yàn)獲得了比隨機(jī)森林(Random Forest)算法高5.66%的精度。
將情感分析與深度學(xué)習(xí)模型相結(jié)合可以提高文本分類的準(zhǔn)確率。Lutz等人[59]采用長(zhǎng)短期記憶人工神經(jīng)網(wǎng)絡(luò)(Long Short-Term Memory,LSTM)來(lái)學(xué)習(xí)基于句子級(jí)別的新聞極性(積極和消極)以預(yù)測(cè)股票市場(chǎng)的收益,實(shí)驗(yàn)結(jié)果表明該方法優(yōu)于普通的基于詞語(yǔ)和文檔級(jí)別的分析方法。
在一些研究中,對(duì)神經(jīng)網(wǎng)絡(luò)的模型改進(jìn)有助于提高預(yù)測(cè)效率。文獻(xiàn)[60]使用RNN和CNN預(yù)測(cè)財(cái)務(wù)資料披露后的股票收益,采用遷移學(xué)習(xí)(Transfer Learning)調(diào)整模型的性能。分析結(jié)果顯示,當(dāng)進(jìn)一步使用遷移學(xué)習(xí)對(duì)模型進(jìn)行預(yù)訓(xùn)練時(shí),分類準(zhǔn)確率得到進(jìn)一步增強(qiáng)。進(jìn)一步的研究發(fā)現(xiàn),使用深度學(xué)習(xí)的文本預(yù)測(cè)模型有時(shí)能取得比數(shù)值模型更好的預(yù)測(cè)效果。文獻(xiàn)[61]提出了一個(gè)由卷積神經(jīng)網(wǎng)絡(luò)和長(zhǎng)短期記憶網(wǎng)絡(luò)組成的網(wǎng)絡(luò)結(jié)構(gòu),并加入注意力機(jī)制來(lái)突出對(duì)預(yù)測(cè)結(jié)果重要的單詞。將構(gòu)建的模型與基于數(shù)值據(jù)的預(yù)測(cè)模型進(jìn)行了對(duì)比,發(fā)現(xiàn)文本構(gòu)建模型的預(yù)測(cè)準(zhǔn)確率明顯好于數(shù)值對(duì)比模型。此外,一些實(shí)驗(yàn)結(jié)果表明,當(dāng)文本數(shù)據(jù)和傳統(tǒng)的數(shù)值變量一起使用時(shí),深度學(xué)習(xí)的預(yù)測(cè)精度可以進(jìn)一步提高。文獻(xiàn)[23]首先利用深度學(xué)習(xí)分別驗(yàn)證了基于文本和數(shù)據(jù)的獨(dú)立預(yù)測(cè)能力,最后將兩者結(jié)合進(jìn)行分析預(yù)測(cè),實(shí)驗(yàn)表明混合數(shù)據(jù)源能取得比單一數(shù)據(jù)源(文本或者數(shù)值)更高的精度。
深度學(xué)習(xí)克服了傳統(tǒng)文本挖掘方法的局限,但是其模型的構(gòu)造是一項(xiàng)非常具有挑戰(zhàn)性的任務(wù),需要廣泛的參數(shù)調(diào)整才能取得比較好的效果。此外,深度學(xué)習(xí)模型的可解釋性較差,模型內(nèi)部結(jié)構(gòu)非常復(fù)雜,一般很難判斷訓(xùn)練出來(lái)模型是如何得到最終的預(yù)測(cè)結(jié)果的。
強(qiáng)化學(xué)習(xí)(Reinforcement Learning,RL)的基本思想是以試錯(cuò)的方式不斷學(xué)習(xí),從環(huán)境的交互中不斷學(xué)習(xí)以達(dá)成回報(bào)最大化。這種方法試圖復(fù)制人類的學(xué)習(xí)方式,因此非常適合自然語(yǔ)言處理。有學(xué)者使用強(qiáng)化學(xué)習(xí)的技術(shù)來(lái)支持金融決策,并通過(guò)否定范圍檢測(cè)來(lái)改進(jìn)情感分析,克服基于規(guī)則的算法和基于概率生成模型在否定范圍檢測(cè)中的局限性,使分類精度達(dá)到70.17%[6]。文獻(xiàn)[62]使用強(qiáng)化學(xué)習(xí)的方法識(shí)別金融中的否定詞,以便正確衡量句子的極性,提高股票預(yù)測(cè)的準(zhǔn)確率。Ye等人[63]提出了一個(gè)強(qiáng)化學(xué)習(xí)的框架用于投資組合管理,該強(qiáng)化學(xué)習(xí)框架能夠?qū)?shù)值和上市公司文本數(shù)據(jù)整合起來(lái),克服金融系統(tǒng)的不穩(wěn)定性,獲得累積收益的同時(shí)降低投資風(fēng)險(xiǎn)。
強(qiáng)化學(xué)習(xí)在訓(xùn)練數(shù)據(jù)的過(guò)程中無(wú)需標(biāo)記,通過(guò)反復(fù)的實(shí)驗(yàn)來(lái)學(xué)習(xí)合適的分類,在文本分析的過(guò)程中可以對(duì)任意長(zhǎng)度的復(fù)雜句子進(jìn)行分析。目前強(qiáng)化學(xué)習(xí)在文本分析中的應(yīng)用還比較有限,伴隨著強(qiáng)化學(xué)習(xí)技術(shù)的不斷成熟和自然語(yǔ)言處理技術(shù)的不斷進(jìn)步,可以預(yù)見(jiàn)未來(lái)借助強(qiáng)化學(xué)習(xí)的力量,自然語(yǔ)言處理中的一些問(wèn)題能夠得到有效的解決。
本節(jié)對(duì)上市公司文本披露的智能分析方法做了一個(gè)總結(jié)。文獻(xiàn)中使用的模型可以概括為兩類:分析模型和預(yù)測(cè)模型。分析模型可以評(píng)估變量之間的相關(guān)關(guān)系,回歸分析是一種常用的方法。預(yù)測(cè)模型包含:樸素貝葉斯算法、決策樹(shù)、支持向量機(jī)等機(jī)器學(xué)習(xí)模型。表1對(duì)文獻(xiàn)中使用的機(jī)器學(xué)習(xí)的優(yōu)缺點(diǎn)進(jìn)行了總結(jié)。從表1中可以看出,支持向量機(jī)和神經(jīng)網(wǎng)絡(luò)是兩種常用的預(yù)測(cè)模型,在文本分類中取得較高的分類準(zhǔn)確率。支持向量機(jī)能捕獲數(shù)據(jù)的內(nèi)在特征,并嵌入了結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則使每個(gè)子集都能取得最小的經(jīng)驗(yàn)風(fēng)險(xiǎn)。神經(jīng)網(wǎng)絡(luò)適合高維非線性數(shù)據(jù)處理。但是,目前沒(méi)有一個(gè)模型能很好地應(yīng)用于所有金融事件的分析中,每一個(gè)算法都存在相應(yīng)的缺陷。比如,支持向量機(jī)是一種優(yōu)秀的文本分類算法,但在一些數(shù)據(jù)規(guī)模較大的問(wèn)題中分類效果不如樸素貝葉斯。
表1 各機(jī)器學(xué)習(xí)模型在應(yīng)用中的優(yōu)缺點(diǎn)總結(jié)Table 1 Summary of advantages and disadvantages of each machine learning model in application
基于機(jī)器學(xué)習(xí)的文本分析技術(shù)充分發(fā)揮了公司文本信息披露的數(shù)據(jù)價(jià)值,目前該技術(shù)已經(jīng)在金融領(lǐng)域的眾多場(chǎng)景中得到了廣泛的應(yīng)用,如:股票市場(chǎng)分析預(yù)測(cè)、投資組合問(wèn)題、決策支持、金融風(fēng)險(xiǎn)管理、企業(yè)舞弊行為檢測(cè)和公司未來(lái)發(fā)展?fàn)顩r預(yù)測(cè)等,本章將對(duì)這些應(yīng)用場(chǎng)景進(jìn)行總結(jié)。
股票的走勢(shì)不僅反映著近期市場(chǎng)的變化,也與投資者的個(gè)人利益息息相關(guān),合理的股票預(yù)測(cè)有助于投資者做出正確的投資決策,降低投資風(fēng)險(xiǎn)。股票預(yù)測(cè)問(wèn)題按照研究對(duì)象的不同可以分為股票價(jià)格預(yù)測(cè)和股票指數(shù)預(yù)測(cè)。其中,股票價(jià)格預(yù)測(cè)是針對(duì)具體的上市公司進(jìn)行的,能夠反映企業(yè)資產(chǎn)的價(jià)值。股票指數(shù)是證券交易所編制的一種表明市場(chǎng)行情變動(dòng)的指示數(shù)字,反映市場(chǎng)的整體變動(dòng)趨勢(shì)。
3.1.1 股票價(jià)格分析預(yù)測(cè)
股票價(jià)格預(yù)測(cè)一直是金融領(lǐng)域的重要研究點(diǎn),以往的研究大多數(shù)依賴于數(shù)字信息的分析,但是這種分析方法忽略了現(xiàn)實(shí)世界不斷發(fā)生的一些事件對(duì)股票造成的影響。近些年,大量可獲得的在線文本信息和計(jì)算機(jī)技術(shù)的發(fā)展促進(jìn)了文本分析預(yù)測(cè)股價(jià)的研究。有學(xué)者從大量的公司在線新聞中提取隱藏的主題和情感信息用于公司股價(jià)預(yù)測(cè)[52]。Hu等人[64]從人類的學(xué)習(xí)過(guò)程中受到啟發(fā),設(shè)計(jì)了一個(gè)基于混合注意力機(jī)制的金融新聞股價(jià)預(yù)測(cè)系統(tǒng)。實(shí)驗(yàn)發(fā)現(xiàn)利用該系統(tǒng)交易能產(chǎn)生可觀的利潤(rùn)。此外,一些學(xué)者致力于開(kāi)發(fā)混合新聞和數(shù)值分析的預(yù)測(cè)系統(tǒng),以獲得更高的股價(jià)預(yù)測(cè)精度[57]。
一般情況下,要用公司發(fā)布的文本數(shù)據(jù)預(yù)測(cè)股價(jià),不僅需要選定的文本信息,還需要能夠反映股價(jià)變化的數(shù)值信息,如開(kāi)盤價(jià)和收盤價(jià)等。如果僅僅對(duì)未來(lái)的股價(jià)走向進(jìn)行預(yù)測(cè),那么研究的問(wèn)題一般是一個(gè)分類問(wèn)題[8,50,58]。這種不精確的預(yù)測(cè)雖然可以作為投資者做出決策的依據(jù),但是大多數(shù)投資者還是希望能夠精準(zhǔn)地預(yù)測(cè)股價(jià)的漲跌程度,回歸分析法能夠?qū)善钡臐q跌程度進(jìn)行擬合[24,29,58]。
很多投資者依據(jù)公司文本信息披露做出買賣股票的決定。目前依靠公司文本信息披露建立股市預(yù)測(cè)模型是一項(xiàng)具有挑戰(zhàn)性的任務(wù)[65],這是因?yàn)槭褂靡粍t公司文本信息披露對(duì)股市進(jìn)行預(yù)測(cè)往往不能得到準(zhǔn)確的結(jié)果,在實(shí)際中股市的走向常常受到多條新聞的綜合影響,這種新聞之間的相互作用增加了預(yù)測(cè)的難度。
3.1.2 股票指數(shù)預(yù)測(cè)
通常情況下,一個(gè)股票指數(shù)由多支股票組成。由此,股指預(yù)測(cè)能夠反映股票市場(chǎng)的總體價(jià)格趨勢(shì)和經(jīng)濟(jì)的運(yùn)行狀況。Groth等人[9]使用公司披露的文本進(jìn)行長(zhǎng)期的股票指數(shù)預(yù)測(cè),發(fā)現(xiàn)利用公司披露的文本數(shù)據(jù)能夠預(yù)測(cè)股票指數(shù)的長(zhǎng)期變化,這一研究成果彌補(bǔ)了金融市場(chǎng)上利用文本數(shù)據(jù)進(jìn)行長(zhǎng)期股指預(yù)測(cè)的空白。
股市是一個(gè)不斷變化的動(dòng)態(tài)系統(tǒng),為了獲得投資組合分配的最佳解決方案,交易者必須不斷分散和重新分配資金,以最大限度地增加利潤(rùn),同時(shí)最小化風(fēng)險(xiǎn)。馬爾可夫決策過(guò)程(Markov Decision Process,MDP)可以對(duì)投資組合分配的決策過(guò)程建模,該過(guò)程將監(jiān)督學(xué)習(xí)方法所需的預(yù)測(cè)和決策兩個(gè)步驟結(jié)合成一個(gè)單一的綜合步驟,克服了傳統(tǒng)監(jiān)督學(xué)習(xí)方法的局限性。文獻(xiàn)[63]使用強(qiáng)化學(xué)習(xí)方法來(lái)訓(xùn)練一個(gè)智能交易系統(tǒng),并將市場(chǎng)情緒這一因素納入到定量模型中以提高收益率和降低風(fēng)險(xiǎn)。與現(xiàn)有的投資組合模型相比,該方法能獲得更高的投資回報(bào)和更低的夏普比率(基金績(jī)效評(píng)價(jià)標(biāo)準(zhǔn)化指標(biāo))。為了探究年報(bào)的敘述性披露是否可以用來(lái)構(gòu)建投資組合策略,文獻(xiàn)[26]構(gòu)建了信息披露向量和投資組合規(guī)?;貓?bào)之間的映射,實(shí)驗(yàn)表明基于預(yù)測(cè)模型構(gòu)建的實(shí)施的交易策略可以得到年超額收益率為12.16%的回報(bào)。
決策支持是指計(jì)算機(jī)系統(tǒng)根據(jù)發(fā)現(xiàn)和總結(jié)到的知識(shí)輔助人類決策,最大程度地提高機(jī)構(gòu)運(yùn)行效率和管理水平。決策支持一般針對(duì)具體的應(yīng)用場(chǎng)景,比如在股票預(yù)測(cè)中,研究者們使用各種先進(jìn)的文本挖掘方法,預(yù)測(cè)股票的走向、漲跌程度,據(jù)此做出買入、持有或者賣出的決策[58]。此外,決策支持需要根據(jù)某種設(shè)定的規(guī)則來(lái)確定應(yīng)該采取的操作,其可能根據(jù)某個(gè)具體的域值或者一個(gè)事先設(shè)定的權(quán)值來(lái)確定是否采取的相應(yīng)措施。Chiong等人[4]在新聞情緒和購(gòu)買決策之間建立了一種關(guān)系,當(dāng)新聞情緒的指標(biāo)超過(guò)某個(gè)正負(fù)域值時(shí),自動(dòng)觸發(fā)買入和賣出的決定,這種在股市價(jià)格做出調(diào)整之前自動(dòng)交易的方式能夠使投資者獲益。文獻(xiàn)[6]計(jì)算了金融新聞的情緒值,將這些新聞情緒值與相應(yīng)的股票市場(chǎng)回報(bào)率的相聯(lián)系,進(jìn)而做出合理的金融決策。
風(fēng)險(xiǎn)是指未來(lái)的不確定性或者波動(dòng)性,其可能對(duì)資金、財(cái)產(chǎn)或者公司信譽(yù)造成很大影響,甚至在嚴(yán)重之時(shí),可能對(duì)整個(gè)金融系統(tǒng)的穩(wěn)健構(gòu)成影響,導(dǎo)致社會(huì)經(jīng)濟(jì)秩序的混亂。近些年人們逐漸認(rèn)識(shí)到金融風(fēng)險(xiǎn)管理的重要性和迫切性。上市公司文本信息披露中包含了公司目前運(yùn)營(yíng)狀況的描述性信息和管理層對(duì)未來(lái)發(fā)展?fàn)顩r的分析,通過(guò)對(duì)這些信息的解讀,可以預(yù)測(cè)企業(yè)未來(lái)發(fā)展中的一些不確定因素和潛在的風(fēng)險(xiǎn),進(jìn)而采取有效的措施降低風(fēng)險(xiǎn)。
企業(yè)披露的文本信息非常復(fù)雜,要建立這些信息披露和風(fēng)險(xiǎn)預(yù)測(cè)之間的聯(lián)系,必須選擇一種合適的角度。有學(xué)者探究了公司的信息披露中的風(fēng)險(xiǎn)關(guān)鍵字與企業(yè)發(fā)生風(fēng)險(xiǎn)的概率之間的關(guān)系,研究發(fā)現(xiàn)伴隨著公司信息披露的風(fēng)險(xiǎn)關(guān)鍵字?jǐn)?shù)增多,信用風(fēng)險(xiǎn)也隨之增多[31]。文獻(xiàn)[28]通過(guò)文本挖掘公司披露中的情緒詞,預(yù)測(cè)金融風(fēng)險(xiǎn)。這些研究從統(tǒng)計(jì)學(xué)和情緒分析的角度出發(fā),進(jìn)一步拓展了現(xiàn)有金融風(fēng)險(xiǎn)管理的思路。
一些學(xué)者探究了利用企業(yè)文本信息披露預(yù)測(cè)公司未來(lái)發(fā)生金融風(fēng)險(xiǎn)的可能性。Groth等人[9]建立了一個(gè)日內(nèi)風(fēng)險(xiǎn)預(yù)測(cè)模型,采用一個(gè)二分類的機(jī)器學(xué)習(xí)模型來(lái)預(yù)測(cè)未來(lái)是否會(huì)發(fā)生風(fēng)險(xiǎn),當(dāng)風(fēng)險(xiǎn)敞口大于某個(gè)閾值時(shí)被判斷為“陽(yáng)性”,否則為“陰性”。有學(xué)者分析發(fā)現(xiàn),通過(guò)識(shí)別與公司風(fēng)險(xiǎn)有關(guān)的披露,構(gòu)建一個(gè)有效的風(fēng)險(xiǎn)預(yù)測(cè)數(shù)據(jù)集,能夠預(yù)測(cè)公司未來(lái)風(fēng)險(xiǎn)[5]。文獻(xiàn)[66]以上市公司年報(bào)為研究對(duì)象,探究了管理層語(yǔ)調(diào)是否會(huì)提高公司信用風(fēng)險(xiǎn)預(yù)警的效力。實(shí)驗(yàn)證明了年報(bào)中的描述性文本能夠提供定量財(cái)務(wù)數(shù)據(jù)所不能反映的增量信息。因此為了更好地防范信用風(fēng)險(xiǎn),有必要在風(fēng)險(xiǎn)評(píng)估模型中加入定性信息。
上市公司雖然有必要對(duì)公司的經(jīng)營(yíng)狀況進(jìn)行披露,但是因?yàn)檎Z(yǔ)言的多義性,管理者很可能掩蓋一些真實(shí)情況或者提供虛假信息,投資者因?yàn)椴涣私馄髽I(yè)披露的信息的質(zhì)量而對(duì)其利益造成損害。然而,管理層精心設(shè)計(jì)的隱瞞和串通行為是有跡可循的,比如為了掩飾現(xiàn)有的公司經(jīng)營(yíng)狀況,管理者可能會(huì)過(guò)分夸大正面消息,或者盡量隱藏負(fù)面信息。在一些上市公司披露中,管理層可能通過(guò)敘述過(guò)多的無(wú)關(guān)信息轉(zhuǎn)移讀者的注意力。
使用文本挖掘的技術(shù)可以對(duì)這類欺詐性的文本特征進(jìn)行總結(jié)。Humpherys等人[20]發(fā)現(xiàn)與非欺詐性的披露相比,欺詐性披露使用更多的詞匯、意象等以及更少的詞匯多樣性。此外,為了顯得內(nèi)容更加可信,欺詐性的文本通常寫得更多但是實(shí)際包含的內(nèi)容較少。有學(xué)者發(fā)現(xiàn)文本中的情緒詞匯是識(shí)別企業(yè)欺詐行為的有效工具[9],這啟發(fā)信息需求者可以通過(guò)探究文本信息的情感表達(dá)方式,分析公司披露內(nèi)容的真實(shí)性。
公司文本信息披露在企業(yè)舞弊行為檢測(cè)中發(fā)揮了重要作用。文獻(xiàn)[22]基于公司年報(bào)開(kāi)發(fā)了智能財(cái)務(wù)報(bào)表欺詐檢測(cè)系統(tǒng),該系統(tǒng)能夠區(qū)分欺詐和非欺詐的行為。文獻(xiàn)[67]發(fā)現(xiàn)通過(guò)分析年報(bào)中的文本數(shù)據(jù),可以有效檢測(cè)欺詐行為,降低投資者的投資風(fēng)險(xiǎn)。有學(xué)者使用公司披露的定性部分識(shí)別欺詐行為,并將披露信息的定量和定性部分結(jié)合進(jìn)行探究[17]。實(shí)驗(yàn)結(jié)果顯示,利用年報(bào)的MD&A能夠區(qū)分75%的欺詐和非欺詐行為,當(dāng)定量信息和定性部分合并時(shí),能獲得83.87%的準(zhǔn)確率。欺詐檢測(cè)要求系統(tǒng)能夠自動(dòng)區(qū)分欺詐和非欺詐的行為,所以該問(wèn)題一般轉(zhuǎn)化成為分類問(wèn)題。好的檢測(cè)模型不僅可以有助于降低金融欺詐行為,而且可以降低信息處理的成本。
公司披露的文本信息可以用來(lái)預(yù)測(cè)未來(lái)具體的業(yè)績(jī)狀況,也可以預(yù)測(cè)某些金融事件的發(fā)生概率,如破產(chǎn)、陷入困境等。Hajek等人[68]認(rèn)為,僅利用數(shù)值信息預(yù)測(cè)未來(lái)公司業(yè)績(jī)是不全面的,他們用公司年報(bào)來(lái)預(yù)測(cè)未來(lái)的公司績(jī)效(增長(zhǎng)、無(wú)變化、減少),實(shí)驗(yàn)取得了比較高的預(yù)測(cè)精度。Kang等人[25]發(fā)現(xiàn)年報(bào)的基調(diào)和公司業(yè)績(jī)之間存在積極的正面關(guān)系,即公司的當(dāng)前績(jī)效越好,公司年報(bào)的基調(diào)就越積極。除了預(yù)測(cè)公司的業(yè)績(jī)狀況,也有學(xué)者用公司披露的文本信息預(yù)測(cè)未來(lái)公司是否會(huì)陷入困境或者破產(chǎn)。有學(xué)者挖掘年度報(bào)告文本片段,提取有用的信息預(yù)測(cè)公司財(cái)務(wù)困境[60]。Cecchini等人[19]研究了公司公開(kāi)的年報(bào)信息與破產(chǎn)事件之間的關(guān)系,發(fā)現(xiàn)年報(bào)的MD&A中的信息內(nèi)容有助于預(yù)測(cè)金融事件,這一研究結(jié)果能夠幫助投資者們確定存在風(fēng)險(xiǎn)的公司。
企業(yè)披露信息中包含大量非結(jié)構(gòu)化的文本信息,借助文本挖掘技術(shù),可以從這些信息中提取有價(jià)值的知識(shí),幫助信息需求者理解企業(yè)行為、預(yù)測(cè)企業(yè)未來(lái)發(fā)展。本文討論了如何使用機(jī)器學(xué)習(xí)技術(shù)智能分析上市公司披露的文本信息,并對(duì)金融市場(chǎng)上近十年的研究成果進(jìn)行了總結(jié),從上市公司文本信息披露的研究狀況、分析模型的選擇和智能分析的應(yīng)用場(chǎng)景三個(gè)方面進(jìn)行歸納。
從歸納的結(jié)果可以發(fā)現(xiàn),在眾多類型的上市公司文本信息披露中,企業(yè)定期文本信息披露是學(xué)者們研究最廣泛的事件類型,通過(guò)構(gòu)建支持向量機(jī)、樸素貝葉斯、決策樹(shù)等多種類型的預(yù)測(cè)模型,企業(yè)定期文本披露尤其是年報(bào)可以用于股票預(yù)測(cè)、風(fēng)險(xiǎn)管理、決策支持、舞弊行為分析等多個(gè)場(chǎng)景。一些其他類型的上市公司文本信息披露,如財(cái)務(wù)報(bào)告、重大事項(xiàng)報(bào)告、市場(chǎng)提示信息等公告因?yàn)樾畔⒑坎蝗缒陥?bào)豐富,一般被學(xué)者們用于研究某類事件對(duì)市場(chǎng)造成的沖擊,其采用的方法一般為事件分析法。目前學(xué)術(shù)界對(duì)公司披露文本信息的研究取得了一定的進(jìn)展,但還有很多難題等待突破,如:傳統(tǒng)的機(jī)器學(xué)習(xí)方法依賴于手工的特征選擇,自動(dòng)化程度不高;在文本的預(yù)測(cè)準(zhǔn)確率方面,現(xiàn)有的模型大多接近猜測(cè)概率,具有很大的提升空間。一些學(xué)者提出了改進(jìn)現(xiàn)有文本分析的方法,如選擇合適的預(yù)測(cè)指標(biāo)、增量地添加其他信息源(如社交媒體投資者情緒、證券分析師預(yù)測(cè)報(bào)告)等,這些策略可以在一定程度上提高文本的準(zhǔn)確率,但是并沒(méi)有從本質(zhì)上改變模型提取信息效率不高的問(wèn)題。針對(duì)這些問(wèn)題,未來(lái)圍繞公司信息披露的研究可能從以下幾個(gè)方面展開(kāi):
(1)改進(jìn)現(xiàn)有模型結(jié)構(gòu),提升算法的性能。深度學(xué)習(xí)能夠克服傳統(tǒng)機(jī)器學(xué)習(xí)技術(shù)在處理非線性特征時(shí)的局限性,在文本分析領(lǐng)域已經(jīng)獲取了比較廣泛的應(yīng)用,未來(lái)仍然會(huì)被當(dāng)作研究熱點(diǎn)之一,也會(huì)作為模型的改進(jìn)重點(diǎn)之一。有學(xué)者提出將CNN和時(shí)序模型LSTM相結(jié)合的策略[69],CNN選擇合適的文本特征,而LSTM關(guān)注文本的時(shí)序特性,這種改進(jìn)方式有利于發(fā)揮兩個(gè)算法各自的優(yōu)勢(shì)。此外,一些學(xué)者將強(qiáng)化學(xué)習(xí)和深度學(xué)習(xí)結(jié)合起來(lái),利用強(qiáng)化學(xué)習(xí)的決策能力和深度學(xué)習(xí)處理復(fù)雜非線性問(wèn)題的能力自動(dòng)感知市場(chǎng)的變化并及時(shí)自主調(diào)整,實(shí)現(xiàn)投資智能化[70]。深度學(xué)習(xí)技術(shù)作為一種有效的文本分析工具,其不斷提升的性能將會(huì)推動(dòng)自然語(yǔ)言處理的進(jìn)步,在公司智能文本分析中發(fā)揮新的作用。
(2)探索新的模型在公司文本披露中的應(yīng)用。近些年不斷涌現(xiàn)的一些新的自然語(yǔ)言處理模型,與傳統(tǒng)模型相比具有更多的優(yōu)勢(shì),借助這些模型的力量可以在公司文本分析中發(fā)揮新的作用。其中,注意力機(jī)制在自然語(yǔ)言處理的任務(wù)中廣泛使用,能夠自動(dòng)篩選出一些高質(zhì)量的信息,忽略一些低質(zhì)量信息[71]。在一些基于機(jī)器學(xué)習(xí)的文本分析任務(wù)中引入注意力機(jī)制,能使得模型更加專注于選擇對(duì)文本分析任務(wù)起關(guān)鍵作用的詞,提高預(yù)測(cè)效果[72]。Transformer[73]和BERT[74]是基于注意力機(jī)制提出的兩種重要的自然語(yǔ)言處理模型。Transformer能夠克服傳統(tǒng)循環(huán)神經(jīng)網(wǎng)絡(luò)的梯度消失問(wèn)題,具有強(qiáng)大的文本編碼能力,BERT使用了Transformer的編碼器部分,在使用過(guò)程中僅需要微調(diào)就能達(dá)到比較好的結(jié)果。目前這兩個(gè)模型被廣泛應(yīng)用于各種文本挖掘的場(chǎng)景中,未來(lái)可以通過(guò)進(jìn)一步地融合金融領(lǐng)域的一些知識(shí)和具體場(chǎng)景的特點(diǎn),對(duì)模型進(jìn)行優(yōu)化改進(jìn),在公司披露的文本信息任務(wù)中取得比較好的表現(xiàn)。但是,Transformer和BERT訓(xùn)練的過(guò)程中含有較多參數(shù),不適合一些實(shí)時(shí)性需求比較高的場(chǎng)景。pQRNN是一款輕量級(jí)的自然語(yǔ)言處理工具,采用有監(jiān)督的數(shù)據(jù)集,僅需少量的參數(shù)就能達(dá)到與BERT類似的效果[75],未來(lái)可以將其應(yīng)用于一些計(jì)算能力低下且需要實(shí)時(shí)分析的金融場(chǎng)景中。
(3)從信息披露中提取出更多的文本特征,展現(xiàn)數(shù)據(jù)更多元的價(jià)值。上市披露的文本信息含量豐富,一些文本的特征如:信息披露的時(shí)間[76]、披露文本的長(zhǎng)度[77]、文本的復(fù)雜性[78]和文本的可讀性[79]等,都是非常有用的信息,對(duì)于投資者獲取公司價(jià)值信息是非常重要的?,F(xiàn)有研究大多從單一的維度來(lái)分析,無(wú)法完整體現(xiàn)出管理層的真實(shí)意圖,因而未來(lái)可以從多個(gè)維度對(duì)上市公司文本披露信息進(jìn)行分析或者探索更有價(jià)值的文本特征,獲得更深層次的信息,把握公司的決策行為和未來(lái)的發(fā)展趨勢(shì)。
(4)人工智能技術(shù)在為金融企業(yè)賦能的同時(shí)也產(chǎn)生了一系列復(fù)雜的倫理問(wèn)題,目前從倫理學(xué)的角度對(duì)上市公司文本信息披露進(jìn)行研究的文獻(xiàn)相對(duì)較少,伴隨著機(jī)器學(xué)習(xí)技術(shù)在公司文本分析中應(yīng)用的不斷深入,各種倫理問(wèn)題也逐漸顯現(xiàn),未來(lái)有關(guān)倫理問(wèn)題的研究將會(huì)得到更多的重視。概括來(lái)說(shuō),從倫理學(xué)的角度對(duì)上市公司文本信息披露進(jìn)行的研究未來(lái)可能主要集中在三個(gè)方面:一是從不同角度分析上市公司文本信息披露質(zhì)量和企業(yè)倫理之間的沖突,揭示上市公司文本信息披露質(zhì)量和企業(yè)倫理沖突的成因,以期制定基于企業(yè)倫理觀念的上市公司文本信息披露的信息質(zhì)量控制策略[80]。二是分析智能分析技術(shù)的應(yīng)用帶來(lái)的責(zé)任倫理問(wèn)題[81],比如在一些大型的交易決策系統(tǒng)中過(guò)分依賴人工智能分析技術(shù)導(dǎo)致企業(yè)決策失誤帶來(lái)難以挽回的損失,如何對(duì)責(zé)任的主體人進(jìn)行認(rèn)定,如何進(jìn)行責(zé)任分配是目前存在爭(zhēng)議的一個(gè)話題。三是分析智能分析技術(shù)的廣泛應(yīng)用帶來(lái)的社會(huì)問(wèn)題。智能分析技術(shù)代替了很多傳統(tǒng)人力的工作,沖擊了金融勞動(dòng)市場(chǎng),造成了一些金融工作者的失業(yè)問(wèn)題[82],如何解決這些傳統(tǒng)從業(yè)者的失業(yè)問(wèn)題有待于進(jìn)一步研究。