• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于事件嵌套的財務(wù)報告知識推理研究

      2020-11-06 07:15:36鄧原簡書娜滕劍侖
      會計之友 2020年21期

      鄧原 簡書娜 滕劍侖

      【摘 要】 文本挖掘與信息提取是企業(yè)財務(wù)報告自動化處理的難點。文章提出事件嵌入方法,將財務(wù)報告文本信息轉(zhuǎn)化為機器可讀、可操作的規(guī)范化數(shù)據(jù)形式,并構(gòu)建事件語義關(guān)系規(guī)則;為解決跨段落事件信息提取的問題,采用圖論方法,構(gòu)建整篇文本特征,形成體現(xiàn)篇章-語義塊-句子-詞匯特征詞及其相互關(guān)系的語義感知方法,為大批量抽取財務(wù)報告文本信息提供了系統(tǒng)解決思路。文章還提供了實際應(yīng)用場景,并予以驗證。

      【關(guān)鍵詞】 事件嵌套; 企業(yè)財務(wù)報告; 文本語義分析; 語義感知

      【中圖分類號】 F233? 【文獻標(biāo)識碼】 A? 【文章編號】 1004-5937(2020)21-0127-04

      一、引言

      財務(wù)報告信息披露質(zhì)量是企業(yè)利益相關(guān)者進行合理決策的重要保障。數(shù)字經(jīng)濟時代,企業(yè)面臨的環(huán)境日益復(fù)雜,傳統(tǒng)會計信息處理方法即便按照新發(fā)生業(yè)務(wù)情況進行了部分調(diào)整,依然無法全面覆蓋當(dāng)前經(jīng)濟業(yè)務(wù)的方方面面,難以掌控和反映經(jīng)濟業(yè)務(wù)的風(fēng)險。以文本報告形式盡可能詳盡地呈現(xiàn)企業(yè)重要經(jīng)濟事件內(nèi)容,為利益相關(guān)者提供決策參考與判斷依據(jù),是財務(wù)報告逐漸冗長的重要原因。然而,財務(wù)報告文本披露形式的多樣性和披露內(nèi)容過于龐雜,使得財務(wù)信息的可操作性、可調(diào)用性、一致性無法得到充分保障。為此,發(fā)現(xiàn)更為智能的方法與技術(shù),讓決策者迅速獲取文本信息中的關(guān)鍵內(nèi)容,減少信息冗長的影響,成為當(dāng)前財務(wù)報告信息處理的重要改革方向。本文提出事件嵌套方法,用于財務(wù)報告的信息提取,定義了文本段落語義塊和感知推理規(guī)則,據(jù)此建立信息與文本之間的映射關(guān)系,實現(xiàn)大規(guī)模財務(wù)報告文本語義的批量分析,并且,以上市公司股票價格變化為例,充分展示出財務(wù)報告語義分析方法對預(yù)測市場反應(yīng)方面的有效性。

      二、相關(guān)研究

      研究者認(rèn)為,公司應(yīng)該重視自愿披露信息的可理解性,有助于公司更加規(guī)范地發(fā)展,更重要的是樹立企業(yè)良好的形象,幫助企業(yè)拓展自身價值。企業(yè)價值的不斷提升有賴于其通過信息的公開、透明和公平的披露方式[1-3]。在分析和檢驗大數(shù)據(jù)的過程中,學(xué)者進一步發(fā)現(xiàn)公司偏好利益為上,即相對于信息質(zhì)量來說,企業(yè)更在意于自身在股市的價值表現(xiàn)和公眾的認(rèn)同程度。因此,自愿信息披露時,企業(yè)更愿意披露利好的消息,隱匿那些有可能造成公司價值波動的信息[4]。隨著信息披露的不斷復(fù)雜化,財務(wù)報告利益相關(guān)者已經(jīng)難以區(qū)分有利于自身決策的關(guān)鍵信息。研究者利用知識管理的方法,手工整理了前瞻性信息,識別不同的積極性信息和消極信息,在觀測市場波動后,研究表明,因披露方式不同,同樣的信息會帶來價格波動截然不同結(jié)果[5]。然而,隨著公司的業(yè)務(wù)日漸復(fù)雜,逐條分析的成本過高。

      國內(nèi)學(xué)者結(jié)合國內(nèi)股票市場中上市公司的不確定前瞻信息開展了相應(yīng)的研究。他們通過樣本分析得出不確定信息,尤其是那些利好的消息和引起利益相關(guān)者恐慌的消息是造成股市波動的主要原因之一[6]。針對我國股市發(fā)展時間較短,股市監(jiān)控不盡完善的問題,提出了企業(yè)應(yīng)加強對不確定信息和公司內(nèi)部一些可能涉及內(nèi)部控制信息和公司業(yè)務(wù)變動以及高層更迭等信息的披露,以便幫助投資者盡快做出自身認(rèn)知能力基礎(chǔ)上的最優(yōu)決策[7]。然而,股市中上市公司和利益相關(guān)者信息優(yōu)勢差別較大,上市公司利益偏好加劇了信息披露以自身利益為導(dǎo)向的發(fā)展勢頭。為了防止上市公司損害利益相關(guān)者正當(dāng)權(quán)益,盡快建立信息批量處理與分析方法已成為迫在眉睫的任務(wù)[8-9]。

      上述研究表明,財務(wù)報告文本信息因其內(nèi)容較為紛繁,信息噪聲較多,難以為企業(yè)利益相關(guān)者提供有利于決策的有用信息。雖然研究者也試圖通過人工整理的方式精確識別那些可能產(chǎn)生歧義的信息,但是研究者本身的偏好、認(rèn)知特征、情緒干擾都將影響信息識別的準(zhǔn)確性。雖然關(guān)于財務(wù)報告的定量數(shù)據(jù)分析和處理已開發(fā)出眾多軟件,但是仍無法處理海量且無序的定性數(shù)據(jù),特別是占財務(wù)報告絕大篇幅的文本信息,必須尋找有效的信息識別與提取方法。為此,本文首先建立財務(wù)報告文本事件表達的統(tǒng)一范式,在語料標(biāo)注和事件嵌套的基礎(chǔ)上,提出文本段落的語義推理方法,實現(xiàn)大規(guī)模批量提取事件信息與語義分類,以提供決策支持。最后采用實例進行展示。

      三、財務(wù)報告文本的事件嵌套

      (一)財務(wù)報告事件定義

      財務(wù)報告反映了企業(yè)某個會計期間發(fā)生的各種經(jīng)濟業(yè)務(wù)活動,其中可準(zhǔn)確計量并予以確認(rèn)的在財務(wù)報表中體現(xiàn),而一些難以量化的經(jīng)濟業(yè)務(wù)則需要通過自然語言表述的文本信息予以披露。經(jīng)濟業(yè)務(wù)圍繞事件展開,方法構(gòu)建上可采用自然語言處理方法,進行事件抽取,然而,針對財務(wù)報告的長文本特點,如何批量抽取事件信息是我們關(guān)注的重點。本文通過事件嵌入,提出以學(xué)習(xí)方法構(gòu)建實踐特征的特征元組,進行大批量文本事件信息抽取,并在此基礎(chǔ)上分析事件類型、關(guān)系及其影響。

      在進行事件關(guān)系推理之前,應(yīng)對事件及其屬性的內(nèi)部關(guān)系進行梳理。根據(jù)財務(wù)報告關(guān)于信息披露“準(zhǔn)確、相關(guān)、真實”的基本原則,交易及事件的主體、發(fā)生時間、對應(yīng)金額均采用較為規(guī)范的表述方式。但段落中關(guān)聯(lián)事件間的對應(yīng)關(guān)系表達較為復(fù)雜。

      參照文獻[10]的方法,定義財務(wù)報告文本事件Event表示模型e:

      e=Ke∪Ae∪Re? ?(1)

      其中,Ke={Arg0,Arg1,Pre,Time-Key},Ae={Place,Type,Cause,State,…},Re={LookUp,Token,…}

      定義1:e由事件主要素集合(Ke)、事件輔助要素集合(Ae)和事件推理要素集合(Re)組成。

      定義2:事件主要素集合(Ke)由主體、客體、謂語動詞、時間組成。

      定義3:事件輔助要素集合(Ae)由發(fā)生地點、事件類型、事件原因、事件狀態(tài)構(gòu)成。輔助事件是對事件的補充和完善,依賴于事件主要素的存在。

      定義4:事件推理要素集合(Re)由標(biāo)注類型為LookUp和Token的中間過程元素構(gòu)成。主要為計算機抽取事件主輔要素提供識別與判斷信號,用于推導(dǎo)和確定事件主要素。這類要素不構(gòu)成最終的事件結(jié)構(gòu)化信息。

      (二)財務(wù)報告事件語義關(guān)系定義

      在事件統(tǒng)一表達的基礎(chǔ)上,還應(yīng)形成事件分類與影響分析。參照文獻[11]的事件抽取框架定義,以及事件語義類別[12],定義了推理事件要素語義關(guān)系,如表1所示。

      通過上述方法可將財務(wù)報告文本的事件嵌套,形成文本數(shù)據(jù)事件標(biāo)注,實現(xiàn)事件信息的結(jié)構(gòu)化表達。

      四、財務(wù)報告文本事件語義分析

      (一)財務(wù)報告結(jié)構(gòu)抽取

      在對財務(wù)文本進行事件嵌套后,考慮構(gòu)建文本的段落與語義塊的映射關(guān)系,以描述完整的事件群。因此,采取圖論的方法,以詞為節(jié)點,位置關(guān)系為有向邊,將文本抽象為圖結(jié)構(gòu),將識別詞在文章中的位置(篇章-段落-句子)及其相互關(guān)系轉(zhuǎn)化為文本結(jié)構(gòu)特征,保留財務(wù)報告結(jié)構(gòu)與語義信息,以此對事件群進行語義分類,可形成單一事件向關(guān)聯(lián)事件群的映射。具體而言,就是形成以段落為單位事件群和句子為單位的單個事件的語義分析基礎(chǔ)。

      在財務(wù)報告結(jié)構(gòu)的圖譜表示中,篇章C={b1,b2,…,bn}。段落(語義塊)bn在進行分詞處理后,得到特征詞集S={s1,s2,…,sm}。

      (二)財務(wù)報告結(jié)構(gòu)圖與語義子圖構(gòu)建

      1.財務(wù)報告結(jié)構(gòu)圖構(gòu)建

      Input:財務(wù)報告篇章C={b1,b2,…,bn}

      Output:財務(wù)報告的特征詞集S={Sb1,Sb2,…,Sbn}

      Sbn為語義塊bn的特征詞集,該特征詞集可映射成一個子圖g=(x,y)。x={x1,x2,…,xi}中xi代表特征詞。有向邊集y={y12,y13,…,yj k}中yj k(j,k=1,2,…,i且j≠k)表示共詞節(jié)點xj和xk之間的語序關(guān)系。

      2.語義子圖構(gòu)建

      Input:Sbn={S1,S2,…,Sm}

      Output:gbn={[x1,x2,y12],[x1,x3,y13],…,[xj,xk,yjk]}

      至此,財務(wù)報告C抽象成圖G。在引入語序圖后,可借助語義相似度模型對其進行分類。例如,若標(biāo)準(zhǔn)語義塊對應(yīng)的事件性質(zhì)的分類集為{1,0,-1}即正面、中性、負(fù)面三個類別,則可借助上述子圖來進行最大公共子圖語義相似度計算。標(biāo)準(zhǔn)語義塊gs和新塊g'的最大公共子圖是越重合,相似度越高。語義相似度評價模型如式2所示:

      SemanticSimilarity(g',gs)=■? (2)

      其中,SemanticSimilarity(g',gs)為最大語義子圖,X(g)、Y(g)分別表示其中節(jié)點和邊的數(shù)量。maximum(X(g'),X(gs))表示兩個比較語義塊中節(jié)點最大值,maximum(Y(g'),Y(gs))則是兩者邊的最大值。語義相似度取值范圍[0,1],值越大意味著兩者越相似,取最大值確定其所屬類別。

      五、應(yīng)用

      采用前述方法,得到了財務(wù)報告文本的事件信息標(biāo)注數(shù)據(jù)和篇章結(jié)構(gòu)圖。接下來將展示依賴語義感知的事件分類與推理及其應(yīng)用。

      財務(wù)報告的事件類型如投融資、盈利變更、股權(quán)變更等事件對預(yù)測企業(yè)未來表現(xiàn)至關(guān)重要,其文本段落是對單個事件或事件群的描述,識別事件的觸發(fā)詞并分析其屬性類別具有顯著的應(yīng)用價值,如觸發(fā)詞“重組通過”標(biāo)識具有正面意義,“重組”對應(yīng)無法判斷即中性的事件,“重組中止”對應(yīng)負(fù)面屬性。那么,如何推理文本段落的語義類型則成為文本分析的關(guān)鍵。參照文獻[13],采用“三輸入一輸出”方式構(gòu)建推理規(guī)則,其中輸入為事件語義分類結(jié)果,輸出則為系統(tǒng)對財務(wù)報告文本中核心事件的評價:

      Result→{[X1]×[X2]×[X3],Xi∈{1,0,-1}}

      其中,X為事件,Result為推理結(jié)果。規(guī)則由不同的輸入(事件)/輸出(后果)構(gòu)成,即由n個輸入事件變量,每個變量都有z項屬性,可能的輸出變量具有r種結(jié)果,則規(guī)則數(shù)為r×nz。因此,“三輸入一輸出”模式下包含81條(3×33)規(guī)則。采用沖突解決機制,得到以下規(guī)則庫,這些規(guī)則可以對于財務(wù)報告中的核心事件快速地做出結(jié)論,表2列示了部分規(guī)則。

      以《?觹?觹?觹?觹股份有限公司2017年年度報告》為例進行分析。財務(wù)報告完整結(jié)構(gòu)樹中“篇章9(重要事項)-段落2(報告期內(nèi)公司收購資產(chǎn)的簡要情況及進程)-句子”給出了語義塊:

      X1:2016年9月28日公司與?觹?觹?觹汽車運輸集團簽訂了《合作協(xié)議書》

      X2:2016年10月10日與?觹?觹?觹汽車運輸集團簽訂了《資產(chǎn)轉(zhuǎn)讓協(xié)議書》

      X3:2016年11月11日與?觹?觹?觹奔騰高速客運有限公司簽訂了《資產(chǎn)轉(zhuǎn)讓協(xié)議書》

      系統(tǒng)對觸發(fā)詞自動標(biāo)記為“1”,并做語義分類。如用戶提出分析請求,知識庫將能依據(jù)Rule27,給出“1”(1×1×1)的結(jié)論。經(jīng)驗證,財務(wù)報告發(fā)布后30天內(nèi)企業(yè)股價上升了15%以上,同期上證指數(shù)卻處于下跌狀態(tài)。

      綜上,以自然語言處理事件抽取框架為基礎(chǔ),定義了財務(wù)報告文本事件類型與屬性的表達框架,對時間信息、金額信息、對象信息等文本標(biāo)注;以財務(wù)報告中文本篇章—段落—句子—詞匯的結(jié)構(gòu)化表達為起點,構(gòu)建財務(wù)報告文本段落語義感知模型,在數(shù)據(jù)表達上實現(xiàn)事件嵌套,將非結(jié)構(gòu)化文本信息轉(zhuǎn)化成結(jié)構(gòu)化信息。通過實例展示文本事件信息語義基元的構(gòu)建過程,實現(xiàn)了文本段落語義塊感知的方法,為大規(guī)模財務(wù)報告文本自動分析提供了系統(tǒng)的解決路徑。

      在不斷完善既有語料庫的基礎(chǔ)上,初步完成財務(wù)報告文本結(jié)構(gòu)的規(guī)范性表達,提出了段落語義感知的推理方法。后續(xù)研究中,將結(jié)合企業(yè)所屬行業(yè)、概念板塊對企業(yè)財務(wù)報告自然語言表達特征進行梳理,提高語義感知推理的精確度。同時,結(jié)合財務(wù)管理、金融和企業(yè)管理等專業(yè)領(lǐng)域,提取財務(wù)報告文本語義塊與領(lǐng)域知識的映射關(guān)系,進一步拓展語義感知推理方法的應(yīng)用范圍。

      【參考文獻】

      [1] BUSHMAN R,SMITH A.Financial accounting information and corporate governance[J].Journal of Accounting and Economics,2001,32:237-334.

      [2] MADHAVAN A.Consolidation,fragmentation,and the disclosure of trading information[J].Review of Financial Studies,1995,8(3):579-603.

      [3] LANGBERG N,SIVARAMAKRISHNAN K.Voluntary disclosures and analyst feedback[J].Journal of Accounting Research,2010,48(3):603-646.

      [4] MAXIMILIAN A M,EDWARD J R,THORSTEN S.Recognition versus disclosure of fair values[J].The Accounting Review,2015,90(6):2411-2447.

      [5] LI F.The information content of forward-looking statements in corporate filings:a na?觙ve bayesian machine learning approach[J].Journal of Accounting Research,2010,48(5):1049-1101.

      [6] 李常青,王毅輝,張鳳展.上市公司“管理層討論與分析”披露質(zhì)量影響因素研究[J].經(jīng)濟管理,2008(4):29-34.

      [7] 薛爽,肖澤忠,潘妙麗.管理層討論與分析是否提供了有用信息——基于虧損上市公司的實證探索[J].管理世界,2010(5):130-140.

      [8] 張繼勛,周冉,孫鵬.內(nèi)部控制披露、審計意見、投資者的風(fēng)險感知和投資決策:一項實驗證據(jù)[J].會計研究,2011(9):66-73.

      [9] 楊清香,俞麟,宋麗.內(nèi)部控制信息披露與市場反應(yīng)研究——來自中國滬市上市公司的經(jīng)驗證據(jù)[J].南開管理評論,2012(1):123-130.

      [10] 李培峰,周國棟,朱巧明.基于語義的中文事件觸發(fā)詞抽取聯(lián)合模型[J].軟件學(xué)報,2016,27(2):280-294.

      [11] DING X,ZHANG Y,LIU T,et al.Deep learning for event-driven stock prediction[C]//International Conference on Artificial Intelligence.AAAI Press,2015.

      [12] WEI LU,DAN ROTH.Automatic event extraction with structured preference modeling[C].Proc.of the 50th Annual Meeting of the Association for Computational Linguistics,2012:835-844.

      [13] 羅明,黃海量.基于詞匯—語義模式的金融事件信息抽取方法[J].計算機應(yīng)用,2018(1):84-90.

      石棉县| 大渡口区| 长沙市| 斗六市| 治多县| 西城区| 桂平市| 肥东县| 开江县| 沽源县| 亳州市| 广东省| 永宁县| 宁夏| 荆门市| 阿克陶县| 塘沽区| 兴安盟| 石景山区| 隆化县| 库车县| 文山县| 华蓥市| 桦甸市| 河曲县| 辛集市| 新乡市| 琼海市| 合川市| 瓦房店市| 澎湖县| 毕节市| 上杭县| 隆林| 嘉禾县| 宜昌市| 曲阜市| 景德镇市| 玉龙| 博客| 汶上县|