■/ 張 悅 宋海濤
財(cái)務(wù)造假是一個(gè)長期困擾市場發(fā)展的世界性問題,放眼國內(nèi)外,安然、世通、泰科等商業(yè)巨擘轟然倒塌,藍(lán)田股份、銀廣夏等商業(yè)神話陸續(xù)破滅。由于我國證券市場發(fā)展時(shí)間相對(duì)較短,近幾年財(cái)務(wù)造假現(xiàn)狀愈發(fā)嚴(yán)峻,不斷有上市公司前赴后繼:樂視IPO 造假、瑞幸被渾水公司做空而后退市、康美連續(xù)三年造假,等等。財(cái)務(wù)造假不僅損害投資者切身利益,還對(duì)市場發(fā)展產(chǎn)生無法磨滅的深遠(yuǎn)負(fù)面影響。然而隨著財(cái)務(wù)造假的加劇,審計(jì)、法務(wù)會(huì)計(jì)、舞弊審查師等專業(yè)人員受時(shí)間、精力、成本等限制逐漸無法滿足監(jiān)管需要,以機(jī)器學(xué)習(xí)與深度學(xué)習(xí)為主的數(shù)據(jù)挖掘技術(shù)為財(cái)務(wù)造假識(shí)別提供了有力的幫助。財(cái)務(wù)造假識(shí)別是一個(gè)典型數(shù)據(jù)不平衡問題,同時(shí)具有嚴(yán)重的代價(jià)敏感性,盡管發(fā)生概率相對(duì)較小但造成的損失極大。
現(xiàn)實(shí)世界的數(shù)據(jù)往往呈現(xiàn)長尾分布,數(shù)據(jù)分布空間存在偏斜,不同類別的數(shù)據(jù)存在數(shù)量級(jí)的差異,盡管財(cái)務(wù)造假公司數(shù)量攀升,但相對(duì)于龐大的上市公司基數(shù)仍舊是小樣本,這就是數(shù)據(jù)不平衡(Data imbalance)。另一方面,遵循著“二八定律”,少數(shù)類數(shù)據(jù)往往包含著更重要的信息,在財(cái)務(wù)造假識(shí)別上漏報(bào)成本遠(yuǎn)遠(yuǎn)高于錯(cuò)報(bào)成本,這種誤分類成本的不同引發(fā)了代價(jià)敏感性問題(Cost sensitivity)。目前機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的標(biāo)準(zhǔn)算法研究大多基于類分布平衡或誤分類成本相同假設(shè),即認(rèn)為數(shù)據(jù)集中的各類樣本無顯著差異,這將導(dǎo)致學(xué)習(xí)會(huì)因偏向數(shù)量多的類別而在財(cái)務(wù)造假識(shí)別的應(yīng)用上效率低下甚至失效。
本文針對(duì)財(cái)務(wù)造假識(shí)別的數(shù)據(jù)不平衡與代價(jià)敏感性,首先構(gòu)建代價(jià)敏感決策樹作為財(cái)務(wù)造假識(shí)別模型,接著根據(jù)舞弊成因理論選擇特征指標(biāo),再以2015年我國上市公司作為研究對(duì)象進(jìn)行對(duì)比實(shí)驗(yàn),以驗(yàn)證代價(jià)敏感學(xué)習(xí)模型的有效性,并通過對(duì)比實(shí)驗(yàn)結(jié)果的分析輸出財(cái)務(wù)造假識(shí)別路徑。
在機(jī)器學(xué)習(xí)與深度學(xué)習(xí)中,數(shù)據(jù)不平衡和代價(jià)敏感性是阻礙分類性能的巨大挑戰(zhàn),其技術(shù)解決取決于三個(gè)因素:數(shù)據(jù)分布、分類器的選擇和性能測量方法,對(duì)應(yīng)著數(shù)據(jù)層、算法層、評(píng)估層方法。數(shù)據(jù)層面是在預(yù)處理階段對(duì)數(shù)據(jù)集進(jìn)行平衡,主要采用重采樣技術(shù),包括以SMOTE、Borderline-SMOTE、ADASYN、MWMOTE、DBCSMOTE 為代表的過采樣,及以NearMiss、ENN、CNN、CBO 為代表的欠采樣。算法層面以代價(jià)敏感學(xué)習(xí)為代表,主要對(duì)學(xué)習(xí)模型進(jìn)行改造及參數(shù)調(diào)整,對(duì)誤分類成本進(jìn)行修正。集成學(xué)習(xí)將數(shù)據(jù)層與算法層方法結(jié)合,如EasyEnsemble、BalanceCascade。評(píng)估層面是一種事后處理,通過評(píng)價(jià)指標(biāo)評(píng)價(jià)學(xué)習(xí)的有效性。另外,半監(jiān)督學(xué)習(xí)和自監(jiān)督學(xué)習(xí)經(jīng)過驗(yàn)證也能夠有效提高學(xué)習(xí)表現(xiàn),通過對(duì)無標(biāo)簽數(shù)據(jù)的利用在數(shù)據(jù)和算法層面實(shí)現(xiàn)學(xué)習(xí)。
代價(jià)敏感學(xué)習(xí)通過引入代價(jià)矩陣描述不同類別的誤分類成本來解決不平衡問題,其目標(biāo)不在于誤報(bào)率最小化,而在于誤分類成本最小化,學(xué)習(xí)途徑包括模型選擇與損失函數(shù)改進(jìn)。決策樹常被看做是最適合解決樣本不均衡問題的模型,因此學(xué)者們展開了對(duì)決策樹的代價(jià)敏感學(xué)習(xí),主要從決策閾值移動(dòng)、中間節(jié)點(diǎn)分裂標(biāo)準(zhǔn)以及剪枝進(jìn)行。Domingos(2002)提出MetaCost,根據(jù)貝葉斯風(fēng)險(xiǎn)理論將代價(jià)矩陣引入,為后續(xù)研究提供重要基礎(chǔ)。Zouboulidis&Kotsiantis(2012)將集成學(xué)習(xí)、MetaCost 與代價(jià)敏感決策樹相結(jié)合,用于希臘上市公司財(cái)務(wù)報(bào)表造假預(yù)測。Sahin et al(2013)提出了一種代價(jià)敏感決策樹用于檢測信用卡欺詐,分類效果優(yōu)于其他標(biāo)準(zhǔn)算法。Kim et al(2016)結(jié)合MetaCost 構(gòu)建出多分類代價(jià)敏感模型MLogit,識(shí)別出92%的故意財(cái)務(wù)錯(cuò)報(bào)。Moepya et al(2017)在SVM、KNN 和NB的基礎(chǔ)上構(gòu)建代價(jià)敏感模型,并在南非上市公司樣本集取得良好效果,隨后又對(duì)決策樹與隨機(jī)森林模型進(jìn)行改造,并利用缺失值處理改善財(cái)務(wù)造假識(shí)別模型。Lin et al(2020)提出Focal Loss,通過改造交叉熵?fù)p失函數(shù)解決目標(biāo)檢測中的樣本不平衡問題。從評(píng)估指標(biāo)來看,可以考慮代價(jià)信息對(duì)標(biāo)準(zhǔn)指標(biāo)賦予權(quán)重以改進(jìn)。Sahin et al(2013)提出了Saved Loss Rate 用于衡量分類效果。Hajek&Henriques(2017)利用財(cái)務(wù)造假損失金額和審計(jì)費(fèi)用度量分類錯(cuò)誤成本,為錯(cuò)報(bào)率與漏報(bào)率賦予不同權(quán)重。Long et al(2020)提出一種均衡準(zhǔn)確度為TPR和TNR賦予不同權(quán)重。
針對(duì)數(shù)據(jù)不平衡與代價(jià)敏感性問題,國外學(xué)者從不同角度進(jìn)行算法研究并應(yīng)用于欺詐檢測,而國內(nèi)研究主要集中在理論與算法上,相對(duì)缺乏對(duì)財(cái)務(wù)造假識(shí)別的應(yīng)用。本文主要從算法層和評(píng)估層入手,選取決策樹模型進(jìn)行代價(jià)敏感學(xué)習(xí),通過對(duì)損失函數(shù)和評(píng)價(jià)指標(biāo)進(jìn)行改進(jìn)以優(yōu)化財(cái)務(wù)造假識(shí)別模型。
財(cái)務(wù)造假識(shí)別是一個(gè)典型的二分類問題,常用的分類算法有邏輯回歸、支持向量機(jī)、決策樹、神經(jīng)網(wǎng)絡(luò)等,但標(biāo)準(zhǔn)算法受不平衡數(shù)據(jù)集與代價(jià)敏感性的影響向多數(shù)類(正常)偏移。由于決策樹作為ifthen規(guī)則集合具有可解釋性強(qiáng)的優(yōu)點(diǎn),因此選擇對(duì)決策樹進(jìn)行代價(jià)敏感學(xué)習(xí)。
決策樹是基于樹結(jié)構(gòu)進(jìn)行決策的分類與回歸模型,由一個(gè)根結(jié)點(diǎn)、若干中間結(jié)點(diǎn)(特征)和葉結(jié)點(diǎn)(決策結(jié)果)構(gòu)成。決策樹學(xué)習(xí)主要包括特征選擇、決策樹生成和修剪:特征選擇基于信息增益和基尼系數(shù)最大化原則,剪枝通常是基于整體損失函數(shù)最小化達(dá)成。經(jīng)典算法有ID3、C4.5、CART,前兩者只能處理離散變量,而CART算法還可以處理連續(xù)變量。輕型梯度提升樹(LightGBM)是基于決策樹的集成學(xué)習(xí)算法,在梯度上升決策樹(GBDT)的基礎(chǔ)上,通過直方圖算法和具深度限制的leaf-wise生長策略等改善在訓(xùn)練速度緩慢、內(nèi)存占用過大及過擬合方面的問題,且自身能夠進(jìn)行特征選擇、分類特征處理與缺失值處理。
代價(jià)敏感決策樹主要通過引入代價(jià)矩陣,對(duì)損失函數(shù)和評(píng)價(jià)指標(biāo)進(jìn)行修改,從而實(shí)現(xiàn)性能優(yōu)化。
二分類問題的代價(jià)矩陣(見表1)涉及4個(gè)分類成本,即CTN、CFP、CFN、CTP??梢哉J(rèn)為預(yù)測正確的情況下不產(chǎn)生誤分類成本,即CTN=CTP=0。誤分類成本比CFP:CFN源于數(shù)據(jù)不平衡性與代價(jià)敏感性,其中數(shù)據(jù)不平衡性可以用樣本不平衡度NN:NP衡量,代價(jià)敏感性來自上市公司審計(jì)費(fèi)用與財(cái)務(wù)造假費(fèi)用比值,即CostA:(CostF+CostA)。兩者之間的關(guān)系通過尋優(yōu)法進(jìn)行確定。
表1 代價(jià)矩陣
代價(jià)敏感學(xué)習(xí)通過引入代價(jià)矩陣對(duì)損失函數(shù)進(jìn)行改造,用代價(jià)敏感交叉熵函數(shù)(CS_logloss)代替標(biāo)準(zhǔn)交叉熵?fù)p失函數(shù)(logloss):
集成學(xué)習(xí)在迭代過程中,利用代價(jià)敏感總損失(CS_costs)進(jìn)行評(píng)價(jià):
1.樣本選擇。本文對(duì)2010—2020 年我國上市公司展開初步研究,數(shù)據(jù)來源于國泰安經(jīng)濟(jì)數(shù)據(jù)庫、中國證監(jiān)會(huì)等?;羧A德M·施利特等(2012)將財(cái)務(wù)報(bào)表造假定義為“故意錯(cuò)報(bào)或漏報(bào)財(cái)務(wù)報(bào)表內(nèi)容,使得在和其他可獲得信息一并考慮時(shí)具有誤導(dǎo)性,影響使用者判斷或決策,以欺騙其他方如利益相關(guān)者和監(jiān)管者”?;诖?,我們對(duì)國泰安上市公司違規(guī)信息數(shù)據(jù)庫截至2020 年12 月31 日的違規(guī)數(shù)據(jù)進(jìn)行篩選:選擇違規(guī)類型為虛構(gòu)利潤、虛列資產(chǎn)、虛假記載、推遲披露、重大遺漏、披露不實(shí)、欺詐上市、一般會(huì)計(jì)處理不當(dāng)?shù)臄?shù)據(jù),并結(jié)合證監(jiān)會(huì)的處罰公告《行政處罰決定》進(jìn)行準(zhǔn)確篩選;剔除金融行業(yè)上市公司、關(guān)鍵數(shù)據(jù)缺失公司、上市前造假公司。
統(tǒng)計(jì)發(fā)現(xiàn)(見圖1),2010—2020年的75起財(cái)務(wù)造假事件,共涉及73家上市公司,且財(cái)務(wù)造假行為具有連續(xù)性;財(cái)務(wù)造假的識(shí)別具有時(shí)滯性。2015年是財(cái)務(wù)造假高發(fā)年,共有27家上市公司財(cái)務(wù)舞弊,因此選擇2015年國內(nèi)上市公司作為研究對(duì)象。
圖1 2010-2020年財(cái)務(wù)造假上市公司統(tǒng)計(jì)
2.指標(biāo)構(gòu)建。目前對(duì)財(cái)務(wù)造假成因理論的研究主要包括三角理論、鉆石理論、3C模型、GONE理論、風(fēng)險(xiǎn)因子理論與冰山理論,盡管表現(xiàn)不同但其含義相互聯(lián)通(見圖2)。其中Bologna et al(1993)提出的GONE理論認(rèn)為,貪婪與需要是舞弊者造假的主觀因素,機(jī)會(huì)與暴露為舞弊行為創(chuàng)造客觀條件,共同導(dǎo)致舞弊行為得以實(shí)現(xiàn)?!柏澙贰狈从澄璞渍叩牡赖滤郊皟r(jià)值判斷;“需要”反映舞弊動(dòng)機(jī),主要來自各類壓力;“機(jī)會(huì)”主要指在公司內(nèi)部與權(quán)力相關(guān)的因素,由于缺乏監(jiān)督與制約而讓舞弊者有機(jī)可乘,包括企業(yè)缺乏內(nèi)部控制、無法正確進(jìn)行工作質(zhì)量評(píng)估、缺乏懲罰措施、信息不對(duì)稱、能力不足以及審計(jì)制度不健全;“暴露”作為客觀條件中的外部環(huán)境因子,包括舞弊行為被發(fā)現(xiàn)的可能性以及披露后對(duì)舞弊者的懲罰性質(zhì)與程度,與“機(jī)會(huì)”共同促使舞弊行為的發(fā)生。
圖2 財(cái)務(wù)造假成因理論
結(jié)合財(cái)務(wù)造假成因理論與財(cái)務(wù)造假案例的研究,從貪婪、需要、暴露、機(jī)會(huì)等角度將上市公司特征劃分為財(cái)務(wù)數(shù)據(jù)與非財(cái)務(wù)數(shù)據(jù)以進(jìn)行定性與定量分析(見圖3),包含了說明性信息和特征信息。
圖3 財(cái)務(wù)造假特征
說明性信息包括上市公司的所處行業(yè)、上市交易所、成立時(shí)間、上市時(shí)間等;非財(cái)務(wù)特征信息包含了公司的股本結(jié)構(gòu)、股權(quán)性質(zhì)、內(nèi)部治理以及審計(jì)信息;財(cái)務(wù)特征信息主要從償債能力、經(jīng)營能力、盈利能力、獲現(xiàn)能力、發(fā)展能力、綜合表現(xiàn)、風(fēng)險(xiǎn)水平以及結(jié)構(gòu)分布等,由當(dāng)年靜態(tài)數(shù)據(jù)和動(dòng)態(tài)增量數(shù)據(jù)共同構(gòu)成。
1.實(shí)驗(yàn)過程。首先對(duì)數(shù)據(jù)集進(jìn)行劃分。針對(duì)2015 年國內(nèi)上市公司創(chuàng)建樣本集,正常樣本與造假樣本2815:27,以4:1 等比例劃分訓(xùn)練集與測試集,并保證子集數(shù)據(jù)分布與原數(shù)據(jù)集一致。
基準(zhǔn)模型(邏輯回歸與支持向量機(jī))需要進(jìn)行預(yù)處理,包括獨(dú)熱編碼、缺失值處理、標(biāo)準(zhǔn)化處理等。由于輕型梯度提升樹內(nèi)嵌相關(guān)功能,因此無需進(jìn)行其他預(yù)處理操作。
訓(xùn)練過程中利用網(wǎng)格搜索與交叉驗(yàn)證(Grid-SearchCV)對(duì)訓(xùn)練模型進(jìn)行參數(shù)優(yōu)化,涉及的主要超參數(shù)包括learning_rate、max_depth、num_leaves等。
2.評(píng)估指標(biāo)。混淆矩陣是評(píng)估的基礎(chǔ),由四個(gè)一級(jí)指標(biāo)構(gòu)成(見表2)。
表2 混淆矩陣
根據(jù)混淆矩陣,構(gòu)成單一標(biāo)準(zhǔn)的二級(jí)分類評(píng)估指標(biāo):
由于在標(biāo)準(zhǔn)評(píng)價(jià)指標(biāo)的鼓勵(lì)下大部分方法識(shí)別正常樣本比識(shí)別造假更準(zhǔn)確,因此,在這類問題上需要明確,查全率(recall)比查準(zhǔn)率(precision)更重要,高敏感性(sensitivity)比高特異性(specificity)更重要。F-score能夠同時(shí)衡量查全率與查準(zhǔn)率間的關(guān)系,而受試者工作特征曲線(ROC)可根據(jù)特征曲線下的面積(AUC)同時(shí)衡量TPR和FPR。
3.實(shí)驗(yàn)結(jié)果。根據(jù)尋優(yōu)法發(fā)現(xiàn),誤分類成本CFP:CFN=1:50 時(shí)性能最佳,考慮到數(shù)據(jù)不平衡度與代價(jià)敏感性兩者的共同作用有所交叉。
選擇標(biāo)準(zhǔn)邏輯回歸(LR)、支持向量機(jī)(SVM)和輕型梯度上升樹(LGBM)作為基準(zhǔn)模型,各個(gè)模型在測試集的預(yù)測結(jié)果如表3所示:
表3 實(shí)驗(yàn)結(jié)果
在標(biāo)準(zhǔn)算法中:三種算法在總體準(zhǔn)確度上表現(xiàn)都很出色,能達(dá)到95%以上;從綜合表現(xiàn)來看,輕型梯度上升樹明顯優(yōu)于其他兩種算法,在保證正常樣本識(shí)別率達(dá)到98%的基礎(chǔ)上能夠正確識(shí)別40%的造假樣本;但三種方法對(duì)于造假樣本的正確識(shí)別率都非常低,其中支持向量機(jī)的造假查全率甚至為0。實(shí)驗(yàn)結(jié)果驗(yàn)證了標(biāo)準(zhǔn)算法在不平衡數(shù)據(jù)集上會(huì)出現(xiàn)向多數(shù)類的偏移,導(dǎo)致實(shí)際應(yīng)用效率低下。
經(jīng)過代價(jià)敏感學(xué)習(xí)的輕型梯度上升樹(CS_LGBM)在各個(gè)方面性能都有所提升,尤其是對(duì)于財(cái)務(wù)造假公司的識(shí)別,正確率能夠達(dá)到60%,并輸出樹形結(jié)構(gòu)(見上圖4)與特征重要性(見圖5),反映與財(cái)務(wù)造假風(fēng)險(xiǎn)相關(guān)的關(guān)鍵指標(biāo)。例如,當(dāng)上市公司成立年數(shù)為14、17、18、19、27、28、32 時(shí),每股凈資產(chǎn)大于3.44,且資本支出與折舊攤銷比小于等于0.389時(shí),財(cái)務(wù)造假概率較大。
圖4 決策樹
圖5 特征重要性
4.結(jié)果分析。根據(jù)對(duì)比實(shí)驗(yàn),將LGBM與CS_LGBM的輸出結(jié)果進(jìn)行可視化對(duì)比,發(fā)現(xiàn)兩個(gè)模型的異同,并聚焦于代價(jià)敏感模型(見圖6),其中節(jié)點(diǎn)大小代表不同特征的重要性。
圖6 CS_LGBM模型特征
通過對(duì)代價(jià)敏感模型的輸出結(jié)果進(jìn)行進(jìn)一步的聚類與分析,發(fā)現(xiàn)財(cái)務(wù)造假行為的識(shí)別可以從財(cái)務(wù)壓力引起的動(dòng)機(jī)、公司的綜合能力以及可能存在隱患的異常項(xiàng)目三個(gè)方面展開(見圖7)。
圖7 財(cái)務(wù)造假識(shí)別路徑
根據(jù)成因理論,壓力與需要是公司財(cái)務(wù)造假的重要因素,而過高財(cái)務(wù)杠桿與償債壓力將提高公司的財(cái)務(wù)造假動(dòng)機(jī)。償債能力可通過流動(dòng)負(fù)債比率、利息保障倍數(shù)、經(jīng)營活動(dòng)產(chǎn)生現(xiàn)金流金額與流動(dòng)負(fù)債比進(jìn)行衡量。另外,當(dāng)負(fù)債居高不下的同時(shí)存款也很高時(shí),是財(cái)務(wù)造假的一個(gè)重要信號(hào)。公司處于不同發(fā)展階段將面臨不同的發(fā)展壓力,因此成立時(shí)間也可能是識(shí)別財(cái)務(wù)造假的入手點(diǎn)。
經(jīng)營能力、盈利能力、獲現(xiàn)能力、發(fā)展能力等特征是評(píng)估公司綜合能力的重要方面,在一定程度上從現(xiàn)實(shí)反映公司財(cái)務(wù)造假的可能。銷售費(fèi)用的異常增長是財(cái)務(wù)風(fēng)險(xiǎn)的重大信號(hào),隱含著盈利問題,以瑞幸和新大地為代表?,F(xiàn)金滿足投資比率偏低表明企業(yè)經(jīng)營活動(dòng)產(chǎn)生的現(xiàn)金無法支持資本支出、存貨增加以及現(xiàn)金股利發(fā)放,暴露公司經(jīng)營能力的不足。營運(yùn)資金對(duì)流動(dòng)資產(chǎn)比率衡量資產(chǎn)結(jié)構(gòu)健康程度,綜合收益增長率衡量公司持續(xù)發(fā)展能力,每股凈資產(chǎn)綜合衡量上市公司的內(nèi)在價(jià)值,是財(cái)務(wù)風(fēng)險(xiǎn)的重要衡量指標(biāo)。
為虛增現(xiàn)金流與利潤,財(cái)務(wù)造假的一般手段包括虛構(gòu)資產(chǎn)、虛減費(fèi)用與損失,反映為一些重要項(xiàng)目的異常。固定資產(chǎn)、在建工程等長期資產(chǎn)項(xiàng)目是公司虛增資產(chǎn)的重要手段,例如康美藥業(yè)通過將不滿足會(huì)計(jì)確認(rèn)和計(jì)量條件工程項(xiàng)目納入報(bào)表以達(dá)到虛增固定資產(chǎn)的目的,因此過高的固定資產(chǎn)增長率值得警戒。一些公司還會(huì)通過對(duì)長期資產(chǎn)的費(fèi)用資本化并對(duì)折舊、攤銷、減值的操縱以低估費(fèi)用與損失,可通過資本支出與折舊攤銷比分析。經(jīng)營現(xiàn)金流凈額利潤比和現(xiàn)金利潤比可對(duì)利潤與現(xiàn)金流的來源進(jìn)行檢測,以防虛增利潤資金。另外,實(shí)驗(yàn)結(jié)果表明,異常的審計(jì)支出也是一個(gè)關(guān)鍵點(diǎn)。
為應(yīng)對(duì)財(cái)務(wù)造假識(shí)別的數(shù)據(jù)不平衡與代價(jià)敏感性問題,研究提出了一種基于代價(jià)敏感學(xué)習(xí)的輕型梯度提升樹模型,通過向損失函數(shù)與評(píng)價(jià)指標(biāo)引入代價(jià)矩陣實(shí)現(xiàn)。理論研究和對(duì)比實(shí)驗(yàn)表明:一是代價(jià)敏感輕量梯度提升樹比其他標(biāo)準(zhǔn)模型綜合表現(xiàn)更好,能夠在保證總體準(zhǔn)確度83%的同時(shí),將造假公司識(shí)別率提高到60%;二是對(duì)上市公司財(cái)務(wù)造假的識(shí)別可以從“動(dòng)機(jī)+現(xiàn)實(shí)+可能”出發(fā)研究財(cái)務(wù)壓力、公司綜合能力及異常項(xiàng)目三個(gè)方面,對(duì)財(cái)務(wù)杠桿、流動(dòng)負(fù)債比率、現(xiàn)金滿足投資比率、營運(yùn)資金比率、綜合收益增長率、每股凈資產(chǎn)、銷售費(fèi)用增長率、固定資產(chǎn)增長率、現(xiàn)金流與利潤比等指標(biāo)展開分析。
雖然如此,但研究仍有不足:一方面,樣本標(biāo)簽源于證監(jiān)會(huì)對(duì)財(cái)務(wù)造假行為的披露,然而由于造假行為的隱秘性及造假披露的時(shí)滯性,可能存在部分造假公司隱匿于正常公司中;另一方面,模型對(duì)財(cái)務(wù)造假公司識(shí)別的準(zhǔn)確率盡管有所提高,但仍未達(dá)到較高水平,以神經(jīng)網(wǎng)絡(luò)為代表的深度學(xué)習(xí)分類能力更為出眾,但由于其黑箱模型的本質(zhì)對(duì)財(cái)務(wù)造假識(shí)別缺乏解釋性。針對(duì)不足,半監(jiān)督學(xué)習(xí)可以通過少量標(biāo)簽利用大量無標(biāo)簽樣本,另外,隨著人工智能步入后深度學(xué)習(xí)時(shí)代,融合認(rèn)知和推理的雙驅(qū)動(dòng)可解釋人工智能成為研究熱點(diǎn),如何用知識(shí)增強(qiáng)數(shù)據(jù)也將是未來研究的一個(gè)重要方向。