摘要:在人工智能蓬勃發(fā)展的時(shí)代背景下,為提高會(huì)計(jì)信息有用性,本文采用LSTM神經(jīng)網(wǎng)絡(luò)模型以及財(cái)務(wù)報(bào)表信息對(duì)上市公司的盈利進(jìn)行預(yù)測(cè),并與分析師預(yù)測(cè)的結(jié)果進(jìn)行對(duì)比。在來自滬深300的企業(yè)的盈利預(yù)測(cè)任務(wù)中,LSTM模型的平均正確率為88?60%比分析師預(yù)測(cè)的平均正確率高13?52%,并且在正確率分布中,LSTM模型的結(jié)果不存在厚尾現(xiàn)象,其峰度明顯高于分析師預(yù)測(cè)結(jié)果,且方差顯著低于分析師預(yù)測(cè)結(jié)果。揭示了人工智能模型應(yīng)用在財(cái)務(wù)預(yù)測(cè)方面的現(xiàn)實(shí)意義。
關(guān)鍵詞:盈利預(yù)測(cè);LSTM;分析師
中圖分類號(hào):F279??文獻(xiàn)識(shí)別碼:A??文章編號(hào):
2096-3157(2020)01-0176-02
一、引言
在人工智能蓬勃發(fā)展的背景下,以大數(shù)據(jù)為基礎(chǔ),機(jī)器學(xué)習(xí)為工具的數(shù)據(jù)處理方式正在改變著我們的工作與生活。如何將機(jī)器學(xué)習(xí)的算法與學(xué)習(xí)工作相結(jié)合,越來越受到各行各業(yè)的關(guān)注。尤其在金融、會(huì)計(jì)、審計(jì)等領(lǐng)域,由于有大量歷史數(shù)據(jù)的沉淀,使得機(jī)器學(xué)習(xí)與這些領(lǐng)域的結(jié)合成為必然。本文主要研究運(yùn)用機(jī)器學(xué)習(xí)中處理序貫數(shù)據(jù)的能手—LSTM(Long Short-Term Memory)模型對(duì)企業(yè)盈利預(yù)測(cè)。
普通投資者由于缺乏專業(yè)知識(shí),對(duì)于企業(yè)未來業(yè)績(jī)的表現(xiàn)往往不能做出準(zhǔn)確的判斷,因此分析師提供的企業(yè)盈利預(yù)測(cè)具有很高的決策有用性。一份具有含金量的分析師研究報(bào)告需要分析師多年的經(jīng)驗(yàn)和積累,并且精準(zhǔn)的預(yù)測(cè)需要耗費(fèi)大量人力物力。如果能將機(jī)器學(xué)習(xí)很好地運(yùn)用到分析師的預(yù)測(cè)工作中,不僅能提升工作效率,還能為分析師以及投資者提供新的決策思路與依據(jù)。
分析師向外部投資者傳遞的信息包括企業(yè)戰(zhàn)略分析、財(cái)務(wù)分析、盈余預(yù)測(cè)、估值、投資建議等,其中盈余預(yù)測(cè)是一份正式研究報(bào)告最能體現(xiàn)其信息價(jià)值的部分。分析師預(yù)測(cè)的準(zhǔn)確率也尤為重要。而分析師的預(yù)測(cè)準(zhǔn)確率隨著信息資源的豐富而增加[1],說明信息是分析師的生命線,但是分析師對(duì)于某些信息卻不敏感[2];Abarbanell[3]認(rèn)為分析師對(duì)于先前的股價(jià)變動(dòng)反應(yīng)不足,并且低估了季度盈余間的相關(guān)性(例如在企業(yè)季度盈余信息公告后出現(xiàn)股價(jià)漂移),但其程度比普通投資者低[4,5];而且分析師普遍會(huì)因?yàn)楹孟⒍吖榔髽I(yè)業(yè)績(jī),對(duì)于壞消息的反應(yīng)卻不足,說明分析師是過于樂觀的[6];并且分析師對(duì)于盈余的陡增和銳減不能做出很好的預(yù)測(cè)[7]。
LSTM神經(jīng)網(wǎng)絡(luò)是循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中的一員,對(duì)循環(huán)神經(jīng)網(wǎng)絡(luò)最直觀的解釋是其內(nèi)部拓?fù)浣Y(jié)構(gòu)中至少有一個(gè)環(huán)[8]。LSTM是由Hochreiter 和 Schmidhuber[9]提出的,并且在之后得到了長(zhǎng)足的發(fā)展。該模型是專門為長(zhǎng)序列的學(xué)習(xí)設(shè)計(jì)的,它能克服RNN的很多缺點(diǎn),比如梯度爆炸或消失等。LSTM模型不僅擁有神經(jīng)網(wǎng)絡(luò)捕捉非線性信息的優(yōu)點(diǎn),而且在序列到序列的預(yù)測(cè)與識(shí)別任務(wù)中也具有天然的優(yōu)勢(shì)。本文采用LSTM神經(jīng)網(wǎng)絡(luò)模型進(jìn)行盈利預(yù)測(cè),并與分析師盈利預(yù)測(cè)進(jìn)行對(duì)比,論證采用LSTM進(jìn)行預(yù)測(cè)的意義。
本文的目的旨在提出一種提高會(huì)計(jì)信息有用性的方案,為包括分析師在內(nèi)的會(huì)計(jì)信息使用者豐富輔助決策的思路。例如2017年3595家上市企業(yè)中僅有1917家上市公司被分析師跟蹤并發(fā)布研究報(bào)告。運(yùn)用本研究的模型可以為剩余1678家上市企業(yè)的投資者提供較為精準(zhǔn)的盈利預(yù)測(cè)。在人工智能向各行各業(yè)深度滲透的背景下,考慮深度學(xué)習(xí)與財(cái)務(wù)領(lǐng)域的結(jié)合點(diǎn)是具有重大建設(shè)性意義的。
二、實(shí)驗(yàn)設(shè)計(jì)
本文用LSTM模型輸入歷史數(shù)據(jù)后對(duì)企業(yè)的營(yíng)業(yè)收入做預(yù)測(cè),并與分析師的預(yù)測(cè)結(jié)果作對(duì)比。采用的歷史數(shù)據(jù)是剔除了滬深300中2015年后上市的樣本企業(yè)的數(shù)據(jù),最終剩下224個(gè)樣本企業(yè),預(yù)測(cè)的營(yíng)業(yè)收入為2017年12月31日各個(gè)樣本企業(yè)的營(yíng)業(yè)收入。預(yù)測(cè)集與驗(yàn)證集的劃分由于企業(yè)上市時(shí)間不同而不同,但至少需要8個(gè)季度的數(shù)據(jù)作為驗(yàn)證集。
歷史數(shù)據(jù)的組成可以分為在t時(shí)刻主要來自資產(chǎn)負(fù)債表,利潤(rùn)表,現(xiàn)金流量表的15個(gè)維度的數(shù)據(jù)作為輸入,t+1時(shí)刻的營(yíng)業(yè)利潤(rùn)作為輸出。將數(shù)據(jù)劃分為訓(xùn)練集與測(cè)試集后,用訓(xùn)練集的數(shù)據(jù)進(jìn)行模型的擬合以及權(quán)值矩陣和偏置值矩陣的生成,再用驗(yàn)證集的數(shù)據(jù)對(duì)模型性能進(jìn)行檢驗(yàn)并最終輸出預(yù)測(cè)值。
三、描述性統(tǒng)計(jì)
本文研究的目的在于提出一種預(yù)測(cè)模型,以增強(qiáng)會(huì)計(jì)信息有用性,輔助包括分析師在內(nèi)的投資者進(jìn)行決策。在模型因變量選取時(shí),主要從資產(chǎn)負(fù)債表、利潤(rùn)表、現(xiàn)金流量表中選取。其中輸入變量包括:上市公司基本情況:總股本、總市值、流通市值;財(cái)務(wù)指標(biāo):市盈率、市現(xiàn)率、市凈率;資產(chǎn)負(fù)債表:資產(chǎn)總計(jì)、負(fù)債合計(jì)、股東權(quán)益合計(jì);利潤(rùn)表:營(yíng)業(yè)收入、營(yíng)業(yè)總成本、凈利潤(rùn)?,F(xiàn)金流量表:經(jīng)營(yíng)活動(dòng)現(xiàn)金流入小計(jì)、經(jīng)營(yíng)活動(dòng)產(chǎn)生的現(xiàn)金流量?jī)纛~、投資活動(dòng)產(chǎn)生的現(xiàn)金流量?jī)纛~、現(xiàn)金及現(xiàn)金等價(jià)物增加凈額。
本文選取2005年~2014年上市的224家滬深300企業(yè)作為研究對(duì)象,滬深300的名單以截至2018年6月31日前公布的最新名單為準(zhǔn)。采用的數(shù)據(jù)庫(kù)為JQdata(其數(shù)據(jù)采購(gòu)于上交所,深交所,中金所,大商所,上期所,鄭商所以及上海國(guó)際能源期貨交易中心)。在LSTM模型訓(xùn)練部分,采用的數(shù)據(jù)為224個(gè)研究對(duì)象自上市以來至2017年12月31日的季報(bào)數(shù)據(jù);分析師預(yù)測(cè)數(shù)據(jù)來自CSMAR數(shù)據(jù)庫(kù),采用的數(shù)據(jù)為224個(gè)研究對(duì)象自上市以來至2017年12月31日的分析師預(yù)測(cè)數(shù)據(jù)。
表1列示了上述變量的描述性統(tǒng)計(jì)。以滬深300截至2018年6月31日前公布的最新名單為準(zhǔn)的224個(gè)研究對(duì)象從2005年起的季度數(shù)據(jù),共3865個(gè)觀測(cè)值。表2為L(zhǎng)STM模型預(yù)測(cè)準(zhǔn)確率和分析師預(yù)測(cè)準(zhǔn)確率的描述性統(tǒng)計(jì)。其中,224個(gè)研究對(duì)象中僅有141家企業(yè)有分析師跟蹤分析。并將分析師預(yù)測(cè)錯(cuò)誤率超過200%的觀測(cè)值進(jìn)行刪除處理。
四、盈利預(yù)測(cè)——來自滬深300經(jīng)驗(yàn)數(shù)據(jù)的檢驗(yàn)
在對(duì)141家上市公司2017年第四季度的預(yù)測(cè)任務(wù)中,結(jié)果如下。表2是LSTM預(yù)測(cè)錯(cuò)誤率與分析師預(yù)測(cè)錯(cuò)誤率的方差分析,由于兩組數(shù)據(jù)的方差不同故采用Scheffe檢驗(yàn)方法。檢驗(yàn)結(jié)果顯示Prob>chi2 = 0?000 強(qiáng)烈拒絕組間均方相同的假設(shè),說明LSTM預(yù)測(cè)錯(cuò)誤率與分析師預(yù)測(cè)錯(cuò)誤率的數(shù)據(jù)分布差異較大,分析師預(yù)測(cè)的結(jié)果有更大的均方差;從均值上看,分析師預(yù)測(cè)錯(cuò)誤率比LSTM模型預(yù)測(cè)錯(cuò)誤率高了13?51%,且在統(tǒng)計(jì)上是顯著的。以上結(jié)果可以說明LSTM模型對(duì)營(yíng)業(yè)收入的預(yù)測(cè)的準(zhǔn)確性比分析師要高。
五、結(jié)論
人工智能第三次浪潮的興起以及機(jī)器學(xué)習(xí)在各行各業(yè)的廣泛運(yùn)用,為投資者處理會(huì)計(jì)財(cái)務(wù)信息提供了新的思路。本文利用滬深300企業(yè)作為研究對(duì)象,對(duì)比分析師與機(jī)器學(xué)習(xí)算法對(duì)企業(yè)盈利的預(yù)測(cè)準(zhǔn)確率。研究發(fā)現(xiàn),LSTM模型錯(cuò)誤率均值顯著低于分析師預(yù)測(cè)錯(cuò)誤率。
分析師在距離企業(yè)財(cái)報(bào)公布日越近時(shí),由于獲取了更多的信息,往往做出的預(yù)測(cè)越準(zhǔn)確。這也為后續(xù)研究提供了方向,應(yīng)在LSTM模型中加入對(duì)于企業(yè)文字公告的識(shí)別與反應(yīng)機(jī)制,以汲取更多的相關(guān)信息,以提高預(yù)測(cè)精度。基于轉(zhuǎn)移學(xué)習(xí)的觀點(diǎn),在模型結(jié)構(gòu)上也可以做出新的創(chuàng)新,使得LSTM模型不僅能夠分析獨(dú)立樣本,應(yīng)在訓(xùn)練模型時(shí)把對(duì)于其他樣本的分析也作為經(jīng)驗(yàn)進(jìn)行儲(chǔ)存。未來研究中可以將LSTM神經(jīng)網(wǎng)絡(luò)加入加強(qiáng)學(xué)習(xí)模型中,進(jìn)一步提升預(yù)測(cè)精度。
參考文獻(xiàn):
[1]Clement,M.B.J.J.o.A,Economics?Analyst forecast accuracy:Do ability,resources,and portfolio complexity matter?[J].1999,27(3):285-303.
[2]Lys,T.,S.J.J.o.A.Sohn,Economics.The association between revisions of financial analysts' earnings forecasts and security-price changes[J].1990,13(4):341-63.
[3]Abarbanell,J.S.J.J.o.A,Economics.Do analysts' earnings forecasts incorporate information in prior stock price changes?[J].1991,14(2):147~65.
[4]endenhall,R.R.J.J.o.A.R.Evidence on the possible underweighting of earnings-related information[J].1991,29(1):170~9.
[5]Abarbanell,J.S.and V.L.J.T.J.o.F.Bernard.Tests of analysts' overreaction/underreaction to earnings information as an explanation for anomalous stock price behavior[J].1992,47(3):1181~207.
[6]Bradshaw,M.T.,S.A.Richardson,and R.G.J.J.o.A.r.Sloan.Do analysts and auditors use information in accruals?[J].2001,39(1):45~74.
[7]Jain,L.C.and L.R.Medsker.Recurrent neural networks:design and applications[M].CRC Press,2000.
[8]Hochreiter,S.and J.J.N.c.Schmidhuber.Long short-term memory[J].1997,9(8):1735~80.
[9]Hochreiter,S.,et al.Gradient flow in recurrent nets:the difficulty of learning long-term dependencies[M].A field guide to dynamical recurrent neural networks.IEEE Press.2001.
作者簡(jiǎn)介:
劉昊,云南財(cái)經(jīng)大學(xué)會(huì)計(jì)學(xué)院,碩士研究生;研究方向:公司治理。