加雪蓮,諶 頏
(1.廣州南洋理工職業(yè)學(xué)院 經(jīng)濟(jì)管理學(xué)院,廣東 廣州 510900;2.廣州科技貿(mào)易職業(yè)學(xué)院 信息工程學(xué)院,廣東 廣州 511442)
財(cái)務(wù)欺詐會(huì)造成相關(guān)企業(yè)和國(guó)家的大量經(jīng)濟(jì)損失。為審查可能的欺詐行為,需要對(duì)日記賬分錄進(jìn)行直接評(píng)估[1]。當(dāng)前,通常使用資深會(huì)計(jì)師或?qū)徲?jì)師手工制定的規(guī)則,基于已知欺詐場(chǎng)景,通過(guò)時(shí)序評(píng)估等統(tǒng)計(jì)分析技術(shù)進(jìn)行會(huì)計(jì)數(shù)據(jù)的異常檢測(cè)[2]。但這種方法無(wú)法檢測(cè)以往未見(jiàn)的新欺詐行為。此外,財(cái)務(wù)審計(jì)具有滯后性,由于財(cái)務(wù)造假人員會(huì)不停嘗試避開(kāi)檢測(cè)規(guī)則,手工規(guī)則會(huì)迅速過(guò)時(shí)[3]。
隨著企業(yè)資源規(guī)劃(Enterprise Resource Plan-ning,ERP)系統(tǒng)的普遍使用,國(guó)內(nèi)外提出了許多日記賬取證分析技術(shù),以發(fā)現(xiàn)ERP 系統(tǒng)中的異常數(shù)據(jù)。文獻(xiàn)[4]提出結(jié)合過(guò)程挖掘、模糊多數(shù)性決策制定和模糊規(guī)則學(xué)習(xí),檢測(cè)ERP 中的日記賬異常數(shù)據(jù)。文獻(xiàn)[5]分析了審計(jì)大數(shù)據(jù)挖掘與傳統(tǒng)數(shù)據(jù)分析之間的差異,并指出審計(jì)人員應(yīng)通過(guò)新的理論方法和技術(shù)工具,系統(tǒng)性挖掘數(shù)據(jù)中隱藏的舞弊規(guī)律和特征。文獻(xiàn)[6]提出利用機(jī)器學(xué)習(xí)技術(shù)檢測(cè)EPR 系統(tǒng)中的增值稅欺詐問(wèn)題,基于財(cái)務(wù)報(bào)表中相關(guān)憑證信息,利用監(jiān)督式分類(lèi)器預(yù)測(cè)納稅主體和相應(yīng)的稅率,并取得了優(yōu)于手工規(guī)則的異常數(shù)據(jù)預(yù)測(cè)性能。
近期,深度學(xué)習(xí)技術(shù)發(fā)展迅速,支持從原始數(shù)據(jù)中提取出復(fù)雜的非線(xiàn)性特征,促進(jìn)了各種領(lǐng)域的突破性進(jìn)展,并在各種異常檢測(cè)應(yīng)用中取得了優(yōu)異性能。其中,自編碼器(autoencoder,AE)是非監(jiān)督人工智能算法,取輸入數(shù)據(jù)并利用低維表征重建輸入。訓(xùn)練過(guò)程中,對(duì)數(shù)據(jù)分布的最顯著特征進(jìn)行捕捉,并基于重建誤差進(jìn)行分類(lèi)。得益于強(qiáng)大的無(wú)監(jiān)督分類(lèi)性能,AE 被廣泛用于圖像分類(lèi)[7]、機(jī)器翻譯[8]、機(jī)械故障[9]等任務(wù)中,取得了優(yōu)秀性能。文獻(xiàn)[10]提出利用堆疊AE 從用戶(hù)用電數(shù)據(jù)中提取高度抽象特征,其后利用支持向量機(jī)將特征映射為分類(lèi)標(biāo)簽。
為實(shí)施欺詐行為,相關(guān)涉事人員會(huì)偏離正常系統(tǒng)使用或記賬模式。這種偏離行為會(huì)被記錄在少數(shù)異常分錄及相應(yīng)屬性值中。針對(duì)這一點(diǎn),本文提出了基于深度自編碼器(autoencoder,AE)網(wǎng)絡(luò)的會(huì)計(jì)數(shù)據(jù)異常檢測(cè)方案,主要?jiǎng)?chuàng)新點(diǎn)包括:
(1)利用神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)分類(lèi)賬中有意義特征,基于正常賬目與異常賬目之間的差異,定義全局異常和局部異常,分別計(jì)算出個(gè)別屬性值的概率得分和重建誤差,并由此計(jì)算出分錄異常分,實(shí)現(xiàn)會(huì)計(jì)數(shù)據(jù)異常檢測(cè)結(jié)果的可解讀性。
(2)通過(guò)神經(jīng)網(wǎng)絡(luò)訓(xùn)練過(guò)程中的性能分析,確定AE 網(wǎng)絡(luò)的最優(yōu)參數(shù)和深度,在確保捕捉到異常項(xiàng)的前提下盡量降低誤警率。
當(dāng)前,會(huì)計(jì)信息系統(tǒng)(Accounting Information Systems,AIS)和ERP 極大地促進(jìn)了企業(yè)的業(yè)務(wù)流程數(shù)字化。這些系統(tǒng)采集大量細(xì)粒度電子證據(jù),特別是記錄在總分類(lèi)賬簿和明細(xì)賬目中的日記賬分錄。
SAP(System Applications and Products)是最知名的企業(yè)軟件供應(yīng)商之一,約76%的全球交易使用了SAP 出品的ERP 系統(tǒng)。圖1 給出了日記賬信息的AIS 錄入程序示例,其中記錄了不同層級(jí)的摘要信息:1)業(yè)務(wù)流程;2)核算;3)數(shù)據(jù)庫(kù)表單形式的日記賬分錄信息。數(shù)據(jù)庫(kù)表單包括會(huì)計(jì)憑證抬頭(BKPF,Accounting Document Header),其中包含日記賬分錄的元信息,例如憑證ID、類(lèi)型、日期、時(shí)間、貨幣等。會(huì)計(jì)憑證時(shí)段(BSEG,Accounting Document Segment),其中包含分錄詳情,例如記賬碼、總賬賬戶(hù)、借貸信息、金額等。
圖1 AIS 示例
AE 神經(jīng)網(wǎng)絡(luò)是特定類(lèi)型的前向多層神經(jīng)網(wǎng)絡(luò),可通過(guò)訓(xùn)練對(duì)輸入進(jìn)行重建。原始輸入和重建結(jié)果之間的差異被定義為重建誤差。圖2 給出了AE 神經(jīng)網(wǎng)絡(luò)的系統(tǒng)框架。AE 網(wǎng)絡(luò)通常由兩個(gè)非線(xiàn)性映射組成,稱(chēng)為編碼器網(wǎng)絡(luò) fθ和解碼器網(wǎng)絡(luò) gθ。通常采用對(duì)稱(chēng)的編碼器-解碼器結(jié)構(gòu),其中包含多層神經(jīng)元、非線(xiàn)性函數(shù)和共享參數(shù)θ[11]。
圖2 AE 神經(jīng)網(wǎng)絡(luò)的系統(tǒng)框架
編碼器fθ(·) 將輸入向量Xi映射為隱性空間Z中的壓縮表征Zi。其后,解碼器gθ(·) 將隱性表征Zi映射回原始輸入空間的重建向量。包含多層神經(jīng)元的AE 的非線(xiàn)性編碼器和解碼器映射可定義為:
式中,σ 和σ’為非線(xiàn)性激活函數(shù),θ 表示模型參數(shù){W,b,W’,d},W∈和W′∈為權(quán)重矩陣,b∈和b′∈為偏置向量,l 為隱藏層數(shù)。
本文使用日記賬分錄集合X={x1,x2,...,xn}訓(xùn)練自編碼器神經(jīng)網(wǎng)絡(luò),每個(gè)分錄Xi包含K 個(gè)屬性的數(shù)組xi=為第i 個(gè)分錄的第j個(gè)屬性。屬性Xj中包含分錄的特定賬目明細(xì),例如記賬類(lèi)型、記賬時(shí)間、金額、總分類(lèi)賬等。此外,令表示特定屬性值Xj(例如特定憑證類(lèi)型)的出現(xiàn)次數(shù)。
訓(xùn)練AE 網(wǎng)絡(luò)學(xué)習(xí)編碼器-解碼器的最優(yōu)模型參數(shù)集*θ,將給定分錄Xi與其重建結(jié)果=gθ(fθ(xi))之間的差異最小化,實(shí)現(xiàn)xi≈。由此,對(duì)于所有記賬分錄,AE 訓(xùn)練的優(yōu)化目標(biāo)為:
在網(wǎng)絡(luò)訓(xùn)練中,利用交叉熵?fù)p失,將損失函數(shù)Lθ定義為
式中,Xi,i=1,...,n 為n 個(gè)會(huì)計(jì)分錄的集合,為所有會(huì)計(jì)分錄屬性j=1,...,k 上的重建結(jié)果。本文將x 和作為兩個(gè)獨(dú)立的多元伯努利分布,使用二進(jìn)制編碼屬性值,通過(guò)測(cè)量?jī)烧咧g的偏差。
為檢測(cè)異常分錄,首先定義“正常”的會(huì)計(jì)數(shù)據(jù)。假定企業(yè)ERP 系統(tǒng)內(nèi)記錄的大部分分錄為正常商業(yè)行為。在進(jìn)行違反行為準(zhǔn)則的活動(dòng)時(shí),相關(guān)人員的操作會(huì)偏離正常行為。此類(lèi)異常行為會(huì)在數(shù)量極少的分錄及相應(yīng)屬性值記錄中體現(xiàn)。將表現(xiàn)出屬性值偏離的分錄稱(chēng)為賬目異常。
對(duì)大規(guī)模ERP 系統(tǒng)中記錄的會(huì)計(jì)日記賬進(jìn)行詳細(xì)審查時(shí),可觀(guān)察到兩個(gè)普遍特征:1)分錄屬性表現(xiàn)出多種不同的屬性值;2)會(huì)計(jì)分錄表現(xiàn)出特定屬性值之間的強(qiáng)相關(guān)性,如憑證類(lèi)型通常與特定總賬賬戶(hù)一同記錄。從觀(guān)察結(jié)果中可推導(dǎo)出全局異常和局部異常這兩種不同的異常分錄類(lèi)型。
全局異常:表現(xiàn)出不常見(jiàn)的個(gè)別屬性值的日記賬分錄。此類(lèi)異常中,屬性偏離正態(tài),如極少使用的分類(lèi)賬或不尋常的記錄時(shí)間。傳統(tǒng)的人工審計(jì)程序通過(guò)紅旗(red-flag)分析捕捉此類(lèi)異常,但由于沖銷(xiāo)記賬和年終調(diào)整等事件的欺詐風(fēng)險(xiǎn)通常很低,這種分析方法會(huì)產(chǎn)生大量誤警數(shù)。由人工審計(jì)的經(jīng)驗(yàn)可得出,全局異常通常會(huì)檢測(cè)出更多的“錯(cuò)誤”而非“欺詐”。
局部異常:日記賬分錄表現(xiàn)出不尋?;蛏僖?jiàn)的屬性值組合,同時(shí)個(gè)別屬性值的錄入頻率較高,例如不常見(jiàn)的會(huì)計(jì)賬簿,總分類(lèi)賬戶(hù)的不合規(guī)組合,多個(gè)會(huì)計(jì)部門(mén)使用同一個(gè)用戶(hù)賬戶(hù)等。局部異常的檢測(cè)難度很大,因?yàn)槲璞兹藛T通過(guò)模仿常規(guī)活動(dòng)模式來(lái)掩飾欺詐行為。因此,此類(lèi)異常有著較高的欺詐風(fēng)險(xiǎn),相關(guān)處理程序和行為不符合企業(yè)標(biāo)準(zhǔn)。
傳統(tǒng)審計(jì)方法中,會(huì)計(jì)師嘗試發(fā)現(xiàn)可疑程度較高的日記賬分錄,并做進(jìn)一步詳細(xì)審查?;诖?,將檢查理念轉(zhuǎn)換為:1)任何不尋常的個(gè)別屬性值;2)任何不尋常的屬性值組合。
基于上文分析,提出新的異常評(píng)分機(jī)制,檢查實(shí)際會(huì)計(jì)數(shù)據(jù)集中的全局和局部異常。所提評(píng)分機(jī)制考慮到了兩個(gè)觀(guān)察特性:1)任何不常見(jiàn)的屬性值記錄,對(duì)應(yīng)于全局異常;2)任何不常見(jiàn)的屬性值共現(xiàn)記錄,對(duì)應(yīng)于局部異常。
異常屬性值的發(fā)生特征:為從觀(guān)察結(jié)果中挖掘出不常見(jiàn)屬性值,首先將每個(gè)數(shù)值Xj在所有分類(lèi)賬中的出現(xiàn)概率定義為/N,N 為日記賬分錄總數(shù),例如特定記賬碼在X 中的錄入概率。此外,計(jì)算每個(gè)分錄Xi的所有j 個(gè)屬性上的個(gè)別屬性值對(duì)數(shù)概率和:
最后,計(jì)算出屬性值的歸一化概率得分AP:
異常屬性值組合發(fā)生特征:為在觀(guān)察結(jié)果中挖掘異常發(fā)生的屬性值組合并定位局部異常,如在所有日記賬分錄X 內(nèi)特定的總分類(lèi)賬戶(hù)與特定過(guò)賬類(lèi)型的組合概率,通過(guò)訓(xùn)練深度AE 神經(jīng)網(wǎng)絡(luò)推導(dǎo)出日記賬分錄的重建誤差。異常共現(xiàn)的發(fā)現(xiàn)難度很大,因此難以在低維隱性表征中進(jìn)行有效重建,且會(huì)造成較高的重建誤差。為此,對(duì)于日記賬分錄 Xi和相應(yīng)重建結(jié)果,將最優(yōu)模型參數(shù)θ*下的訓(xùn)練的AE 網(wǎng)絡(luò)的重建誤差E 導(dǎo)出為:
最后,將歸一化重建誤差RE 計(jì)算為:
式中,Emin和Emax分別表示通過(guò)得出的重建誤差的最小值和最大值。
會(huì)計(jì)數(shù)據(jù)異常評(píng)分:根據(jù)單個(gè)分錄中的屬性值發(fā)生特征和組合發(fā)生特征,可推斷出該分錄是否異常,以及創(chuàng)建該分錄是否源自正常業(yè)務(wù)活動(dòng)。為檢測(cè)出實(shí)踐統(tǒng)計(jì)任務(wù)中的全局和局部會(huì)計(jì)異常數(shù)據(jù),對(duì)于每個(gè)分錄Xi,使用最優(yōu)模型參數(shù)θ*,基于歸一化屬性概率AP 和重建誤差RE,計(jì)算Xi的得分AS:
式中,α 為平衡因子,以平衡屬性值的發(fā)生特征和組合發(fā)生特征。
基于異常評(píng)分,定義閾值參數(shù)β,對(duì)于最優(yōu)模型參數(shù)θ*下的每個(gè)分錄Xi,若異常評(píng)分AS超過(guò)閾值β,將該日記賬分錄標(biāo)記為異常。
針對(duì)江蘇省某貿(mào)易公司,從SAP ERP 實(shí)例中提取出實(shí)驗(yàn)數(shù)據(jù)集,其中包含單個(gè)會(huì)計(jì)年度的全部日記賬分錄?;趪?yán)格數(shù)據(jù)隱私性規(guī)定,在提取過(guò)程中使用不可逆單向哈希函數(shù)將所有分錄屬性匿名化。并將提取數(shù)據(jù)與SAP ERP 系統(tǒng)的試算表進(jìn)行核對(duì),確保數(shù)據(jù)集完整性。從BKPF 和BSEG 表單中提取出6 個(gè)最具區(qū)分性的屬性子集。
ERP 系統(tǒng)中例如的屬性大部分對(duì)應(yīng)于類(lèi)別(離散)變量,例如記賬日期、賬戶(hù)、記賬類(lèi)型、貨幣等。在訓(xùn)練AE 神經(jīng)網(wǎng)絡(luò)時(shí),對(duì)類(lèi)別分錄屬性進(jìn)行預(yù)處理,得到每個(gè)分錄以獨(dú)熱編碼的二進(jìn)制表征,由此,實(shí)驗(yàn)數(shù)據(jù)集的編碼維度為385 維。
參照現(xiàn)實(shí)審計(jì)場(chǎng)景,向數(shù)據(jù)集注入少量全局異常和局部異常,得到高度不平衡類(lèi)分布數(shù)據(jù)。注入數(shù)據(jù)中,全局異常包含與原數(shù)據(jù)集不相似的屬性值,局部異常則包含未出現(xiàn)在原始數(shù)據(jù)中的屬性值組合。為數(shù)據(jù)集添加真實(shí)標(biāo)簽,將每個(gè)記賬分錄標(biāo)記為全局異常、局部異?;蛘7咒?。由此得到6 個(gè)屬性類(lèi)別的312,281 個(gè)分錄行項(xiàng)目的實(shí)驗(yàn)數(shù)據(jù)集,其中包含90 個(gè)異常分錄,全局異常和局部異常分錄數(shù)分別為50 個(gè)和40 個(gè)。按8:2將實(shí)驗(yàn)數(shù)據(jù)集分為訓(xùn)練集和測(cè)試集。
年度審計(jì)任務(wù)旨在盡量減少需要詳細(xì)審查的日記賬分錄數(shù)量,并確保不會(huì)遺漏欺詐相關(guān)分錄。為此,確定AE 網(wǎng)絡(luò)的訓(xùn)練目標(biāo):(1)AE 整體重建誤差最小化;(2)模型針對(duì)異常分錄實(shí)現(xiàn)100%召回率;(3)最大化檢測(cè)精度并降低誤警數(shù)。
為此,訓(xùn)練從AE 1 到AE 9 的不同深度的AE架構(gòu)。表1 給出了不同深度架構(gòu)詳情,其中AE1[385;452]-3-[385;452]表示由3 個(gè)全連接層組成的架構(gòu),輸入層包含385 或553 個(gè)神經(jīng)元(由數(shù)據(jù)集編碼維度決定),隱藏層包含3 個(gè)神經(jīng)元且層數(shù)為1,輸出層包含385 或553 個(gè)神經(jīng)元。通過(guò)逐步添加全連接隱藏層來(lái)提高架構(gòu)深度。為防止非線(xiàn)性過(guò)飽和,選擇帶泄露整流(Leaky-ReLU)激活函數(shù)[12],并設(shè)比例因子α=0.4。
表1 評(píng)估架構(gòu)詳情
在每種架構(gòu)的訓(xùn)練中,學(xué)習(xí)率均設(shè)為10-4,小批數(shù)量為128 個(gè)分錄,使用自適應(yīng)動(dòng)量估計(jì),并初始化每個(gè)網(wǎng)絡(luò)層權(quán)重。訓(xùn)練中采用標(biāo)準(zhǔn)反向傳播,最大訓(xùn)練代數(shù)為2000 代。圖3 給出了不同AE 架構(gòu)的訓(xùn)練性能,召回率為100%。從中可發(fā)現(xiàn),增加隱藏單元數(shù)量能夠加快誤差收斂速度,并減少檢測(cè)到的異常數(shù)。結(jié)果表明,網(wǎng)絡(luò)深度與異常檢測(cè)性能呈正相關(guān)。在確保100%召回率的前提下,包含17 個(gè)隱藏層的AE9 架構(gòu)檢測(cè)到的異常分錄明細(xì)數(shù)量在總行項(xiàng)目數(shù)量中占比最低,即最大限度降低了誤警率。
圖3 不同深度架構(gòu)的訓(xùn)練性能
訓(xùn)練收斂后,利用訓(xùn)練后的AE9 模型得到每個(gè)分錄的重建誤差。圖4 給出了100 代和400 代訓(xùn)練后,實(shí)驗(yàn)數(shù)據(jù)集的312 281 個(gè)分錄明細(xì)的重建誤差,圖中藍(lán)色表示原始會(huì)計(jì)分錄,橙色和紅色分別表示AE9 檢測(cè)到的全局異常和局部異常。將異常檢測(cè)閾值設(shè)為β=0.01,若分錄屬性未被正確重建或極不常見(jiàn),則將被標(biāo)記為異常。
圖4 日記賬分錄重建誤差
為評(píng)估所提方法的分類(lèi)性能,使用精度(P)、F1 得分(F1)和top-k 準(zhǔn)確度作為性能指標(biāo),精度計(jì)算為:
F1 得分為召回率R 和精度P 的調(diào)和平均值,約接近1 代表性能越好,計(jì)算為:
式中,TP 表示實(shí)際為異常分錄且正確分入異常分錄的樣本數(shù),F(xiàn)P 表示實(shí)際為正常分錄但被錯(cuò)誤分入異常分錄的樣本數(shù),F(xiàn)N 為實(shí)際屬于為異常分錄但被錯(cuò)誤分入正常分錄的樣本數(shù)。
由于會(huì)計(jì)分錄中數(shù)據(jù)規(guī)模較大,引入top-k精度指標(biāo),在異常檢測(cè)中,選取概率最大的k 個(gè)標(biāo)簽,若其中存在真實(shí)標(biāo)簽值,則視為預(yù)測(cè)正確。本文在計(jì)算top-k 精度時(shí),設(shè)k=90,對(duì)應(yīng)于實(shí)驗(yàn)數(shù)據(jù)集中人工注入的異常分錄數(shù)量。
通過(guò)訓(xùn)練確定模型最優(yōu)參數(shù)后,通過(guò)試驗(yàn)對(duì)所提方法進(jìn)行定量評(píng)估,并與其他方法進(jìn)行比較。首先,通過(guò)定量試驗(yàn),分析通過(guò)正常分錄數(shù)據(jù)的訓(xùn)練,所提方法是否能夠檢測(cè)到異常項(xiàng)。定量評(píng)估中使用精度、F1 得分和top-k 精度作為評(píng)價(jià)指標(biāo),并給出檢測(cè)到的異常分錄行項(xiàng)目數(shù)量占比。
表2 給出了使用不同深度AE 的測(cè)試結(jié)果。與訓(xùn)練性能一致,隱藏層數(shù)量的增加能夠有效減少檢測(cè)到的異常數(shù)量。確保召回率為100%的情況下,AE1 的異常占比為5.95,證明淺層AE 會(huì)產(chǎn)生大量誤警數(shù),這在實(shí)踐中會(huì)造成深入分析數(shù)據(jù)量過(guò)大,降低財(cái)務(wù)審計(jì)效率。AE 9 的異常占比僅為0.19%,結(jié)果證明,AE 的深度對(duì)異常數(shù)據(jù)捕捉性能有著顯著影響。
表2 不同深度AE 結(jié)構(gòu)的實(shí)驗(yàn)結(jié)果
將所提AE 網(wǎng)絡(luò)的性能與其他非監(jiān)督式異常檢測(cè)技術(shù)相比較,包括主成分分析法(Principal Component Analysis,PCA)[13],基于密度的帶噪數(shù)據(jù)應(yīng)用空間聚類(lèi)方法(DBSCAN)[14]和局部異常因子(Local-Outlier Factor,LOF)技術(shù)[15]相比較。表3 給出了在注入異常數(shù)據(jù)的召回率為100%情況下的比較結(jié)果。其中本文方法使用AE9 結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò)模型。從中可發(fā)現(xiàn),PCA 方法的檢測(cè)性能最差,其后因此為DBSCAN 和LOF 方法。本文方法在檢測(cè)精度、F1 得分和異常樣本數(shù)量方面的性能均取得了明顯的性能優(yōu)勢(shì),比其他方法的異常樣本百分比至少降低了0.55%。在財(cái)務(wù)審計(jì)場(chǎng)景中,這一結(jié)果代表本文方法能夠在確保不會(huì)遺漏虛假賬目的墻體下,顯著節(jié)約了需要深入分析的賬目數(shù)量,由此提高審計(jì)效率。
表3 不同方法比較結(jié)果
提出了基于深度學(xué)習(xí)的大規(guī)模會(huì)計(jì)數(shù)據(jù)中異常分錄檢測(cè)方法,并使用實(shí)際會(huì)計(jì)數(shù)據(jù)集進(jìn)行了仿真評(píng)估。結(jié)果證明,深度AE 網(wǎng)絡(luò)的重建誤差在日記賬分錄異常檢測(cè)中表現(xiàn)出高度適應(yīng)性,成功檢測(cè)到可疑度較高的分錄數(shù)據(jù)。企業(yè)年度日記賬的數(shù)據(jù)規(guī)模非常大,因此高度準(zhǔn)確的自動(dòng)化會(huì)計(jì)數(shù)據(jù)異常檢測(cè)方法能夠有效降低審計(jì)人員工作量,并減少財(cái)務(wù)報(bào)表欺詐風(fēng)險(xiǎn)。
未來(lái)將嘗試對(duì)深度AE 學(xué)習(xí)到的會(huì)計(jì)分錄隱性空間表征做進(jìn)一步分析,并嘗試使用更先進(jìn)的AE 架構(gòu),例如對(duì)抗AE 神經(jīng)網(wǎng)絡(luò),進(jìn)行會(huì)計(jì)數(shù)據(jù)異常檢測(cè)。