孫小嵐
摘要:回顧了上市公司產(chǎn)生財(cái)務(wù)舞弊的原因和識(shí)別方法,在此基礎(chǔ)上介紹了現(xiàn)階段常用的大數(shù)據(jù)挖掘方法以及研究成果,對(duì)大數(shù)據(jù)挖掘的發(fā)展前景作了一定的評(píng)述。
關(guān)鍵詞:上市公司財(cái)務(wù)舞弊;數(shù)據(jù)挖掘;神經(jīng)網(wǎng)路
根據(jù)中國《獨(dú)立審計(jì)具體準(zhǔn)則第8號(hào)》,財(cái)務(wù)舞弊被定義為會(huì)計(jì)報(bào)表不實(shí)反映公司真正經(jīng)濟(jì)業(yè)務(wù)的故意行為。財(cái)務(wù)舞弊由于收益巨大,很多上市公司無視法律,使用編造財(cái)務(wù)數(shù)據(jù),虛增利潤等一系列的財(cái)務(wù)舞弊手段給投資人帶來了巨大的損失。從銀廣廈的利潤造假到萬福生科的財(cái)務(wù)造假,各種舞弊手段隱蔽而復(fù)雜。目前審計(jì)主要依賴人工檢查的方式審核財(cái)務(wù)報(bào)表,由于審計(jì)人員的經(jīng)驗(yàn)及主觀判斷的不同,對(duì)于相同的財(cái)務(wù)報(bào)表審計(jì)結(jié)果也不同,再加上財(cái)務(wù)造假手段多樣,涉及會(huì)計(jì)科目繁多,人力成本受限,使得審計(jì)質(zhì)量不高。在“互聯(lián)網(wǎng)+”及大數(shù)據(jù)背景下,企業(yè)可以通過大數(shù)據(jù)挖掘技術(shù)分析公司海量數(shù)據(jù)和財(cái)務(wù)舞弊之間的關(guān)系,并以此識(shí)別公司的財(cái)務(wù)舞弊行為。
一、上市公司財(cái)務(wù)舞弊動(dòng)因理論
Bologna和Lindquist提出了會(huì)計(jì)領(lǐng)域內(nèi)的冰山理論,他們認(rèn)為浮在海平面之上的一部分是能被直接觀察的企業(yè)內(nèi)部管理方面的問題,比如企業(yè)目標(biāo)、組織架構(gòu)等;位于海平面之下的部分則是財(cái)務(wù)造假者蓄意掩飾的內(nèi)容,這部分內(nèi)容難以被揭示,包括管理層的主觀意愿、個(gè)人記錄等。
反舞弊專家Albrecht則提出財(cái)務(wù)造假三角理論,即產(chǎn)生財(cái)務(wù)舞弊的誘因有三個(gè),第一是財(cái)務(wù)舞弊產(chǎn)生的動(dòng)機(jī),包括不能扭虧為盈公司將終止上市,公司出現(xiàn)財(cái)務(wù)危機(jī)導(dǎo)致融資困難,或者公司現(xiàn)金流面臨枯竭等,這一系列的外因是管理層受到的外在壓力。而融資壓力是我國上市公司面臨的最大問題之一,無論公司是需要上市、增發(fā)股票還是銀行貸款,都需要達(dá)到財(cái)務(wù)上的硬性指標(biāo)。國內(nèi)的學(xué)者在此理論基礎(chǔ)上也提出了財(cái)務(wù)造假的其他成因,包括為了推進(jìn)IPO或者增發(fā)、防止被ST,和機(jī)構(gòu)聯(lián)手進(jìn)行股價(jià)操縱等。第二是由于公司內(nèi)部控制出現(xiàn)缺漏給管理層提供了舞弊的條件。當(dāng)管理層實(shí)施舞弊受到的處罰很輕,公司內(nèi)部控制存在缺陷,董事會(huì)能夠隱瞞交易等情況存在時(shí),就具備了財(cái)務(wù)造假的條件。前兩個(gè)誘因都滿足的時(shí)候,決定舞弊發(fā)生與否的要素就只剩管理層的道德標(biāo)準(zhǔn),如果管理層能夠自我說服,就會(huì)導(dǎo)致舞弊行為的產(chǎn)生,比如:“為了員工的生存”,“維護(hù)中小股東的權(quán)益”,“幫助公司度過難關(guān)”等。Albrecht的三角理論提出后,Bologan提出了“四因子理論”,此理論將財(cái)務(wù)舞弊的動(dòng)機(jī)歸為貪婪和需要;機(jī)會(huì)是指公司內(nèi)控機(jī)制的不完善帶來的條件以及造假行為被發(fā)現(xiàn)面臨的處罰。
二、財(cái)務(wù)舞弊的識(shí)別方法
上市公司財(cái)務(wù)舞弊的識(shí)別分為二個(gè)階段,第一階段是案例特征總結(jié),研究者對(duì)于上市公司公司財(cái)務(wù)造假的典型案例進(jìn)行影響因素分析,研究方法主要是定性研究。Beaver在1966年提出了財(cái)務(wù)預(yù)警的概念,然后Albrecht通過問卷調(diào)查的方式檢驗(yàn)了87個(gè)常用的財(cái)務(wù)指標(biāo),并從中篩選出有效識(shí)別公司舞弊的指標(biāo),構(gòu)成了“紅旗”指標(biāo)體系。Persons研究發(fā)現(xiàn)舞弊公司普遍具有高財(cái)務(wù)杠桿,低資本周轉(zhuǎn)率的特點(diǎn)。國外學(xué)者認(rèn)為公司治理的質(zhì)量與財(cái)務(wù)舞弊發(fā)生可行性有密切的關(guān)系,開始將董事會(huì)特征、股權(quán)結(jié)構(gòu)等非財(cái)務(wù)指標(biāo)引入財(cái)務(wù)舞弊識(shí)別體系中。Loebbecke建立了公司財(cái)務(wù)造假識(shí)別模型L/W用以分析財(cái)務(wù)造假的行為特征,提出董事會(huì)個(gè)人的不良信用記錄、違法記錄、業(yè)績下滑、控制權(quán)寡頭等可以作為識(shí)別財(cái)務(wù)舞弊的信號(hào)。在接下來的研究中,Loebbecke和Willingham使用財(cái)務(wù)舞弊公司樣本,用卡方檢驗(yàn)的方法對(duì)L/W進(jìn)行測試,研究表明該模型有88%的識(shí)別率。Bell隨后用該模型測試了包含正常公司和財(cái)務(wù)造假公司的樣本,得到了75%的造假識(shí)別率。但是這種模型對(duì)財(cái)務(wù)數(shù)據(jù)和非財(cái)務(wù)數(shù)據(jù)的要求苛刻,只適合于能夠接觸到非公開信息的監(jiān)管機(jī)構(gòu)和審計(jì)人員使用。
能夠識(shí)別財(cái)務(wù)舞弊的非財(cái)務(wù)指標(biāo)包括董事會(huì)結(jié)構(gòu)、管理層數(shù)量等。研究結(jié)論包括:審計(jì)意見類型可以作為替代審計(jì)質(zhì)量的有效指標(biāo),非標(biāo)準(zhǔn)審計(jì)意見與財(cái)務(wù)造假顯性相關(guān),提升管理層薪酬和待遇能降低公司財(cái)務(wù)造假的概率,管理層的獨(dú)立性和造假行為呈現(xiàn)顯著相關(guān)性,獨(dú)立董事占比低,任期短,獨(dú)立性差與財(cái)務(wù)造假呈負(fù)面相關(guān)關(guān)系,公司內(nèi)部審計(jì)不能顯著降低公司財(cái)務(wù)舞弊的可能性等。
第二階段是用大數(shù)據(jù)挖掘技術(shù)識(shí)別財(cái)務(wù)舞弊。數(shù)據(jù)挖掘是指從大量無序的數(shù)據(jù)中找到潛在的商業(yè)邏輯,并將結(jié)果用可視化的方式向用戶進(jìn)行展示,它包括了統(tǒng)計(jì)學(xué)中樣本檢驗(yàn)的過程,也包含了機(jī)器學(xué)習(xí)和訓(xùn)練的過程。數(shù)據(jù)挖掘作為信息提取和模式識(shí)別的手段,可以選擇違規(guī)案例中的財(cái)務(wù)和非財(cái)務(wù)信息構(gòu)建樣本數(shù)據(jù)和驗(yàn)證集數(shù)據(jù),然后用樣本數(shù)據(jù)建立模型,再用驗(yàn)證集測試精確度。數(shù)據(jù)挖掘典型方法有以下兩類。
第一是統(tǒng)計(jì)類方法,分為單變量分析和多元線性方法。傳統(tǒng)的回歸技術(shù)是用統(tǒng)計(jì)模型評(píng)估應(yīng)變量和一個(gè)或多個(gè)自變量之間的關(guān)系,主要研究數(shù)據(jù)系列的趨勢(shì)特征及數(shù)據(jù)間的相關(guān)關(guān)系。這種方法廣泛用于解釋市場占有率,消費(fèi)行為偏好、銷售趨勢(shì)預(yù)測以及開展有針對(duì)性的促銷活動(dòng)等。運(yùn)用較多的是Logistic回歸模型。相比多元線性,邏輯回歸有更好的適應(yīng)性,但邏輯回歸也存在變量的多重共線性問題,特別是在財(cái)務(wù)舞弊的識(shí)別領(lǐng)域,由于財(cái)務(wù)比率之間的勾稽關(guān)系,變量相關(guān)性高的時(shí)候,模型的泛化能力會(huì)受到很大影響。
第二類是在“互聯(lián)網(wǎng)+”的背景下的大數(shù)據(jù)挖掘技術(shù)的應(yīng)用。
分類是根據(jù)數(shù)據(jù)的共同特點(diǎn)按照模式將數(shù)據(jù)劃分為不同類,這個(gè)步驟稱為用學(xué)習(xí)訓(xùn)練集創(chuàng)建模型,分類模型的學(xué)習(xí)階段中,每個(gè)數(shù)據(jù)元已經(jīng)分好類別,有明確的類別標(biāo)記,通過學(xué)習(xí)得到目標(biāo)函數(shù), 再利用分類器將其它給定的具有相似特征的數(shù)據(jù)項(xiàng)映射到預(yù)先定義的類別標(biāo)記中,用以預(yù)測數(shù)據(jù)對(duì)象的離散類別,這種學(xué)習(xí)過程是屬于監(jiān)督式的學(xué)習(xí)。分類技術(shù)廣泛地應(yīng)用在多個(gè)領(lǐng)域,比如非財(cái)務(wù)信息:客戶分類,屬性和特征分析,滿意度分析,購買偏好,趨勢(shì)預(yù)測等。主要的分類方法有決策樹、KNN、樸素貝葉斯、支持向量機(jī)、隨機(jī)森林等。在實(shí)證研究方面,趙秀云選取了具有財(cái)務(wù)舞弊特征的18個(gè)財(cái)務(wù)和非財(cái)務(wù)指標(biāo),用決策樹構(gòu)建模型預(yù)測發(fā)生舞弊的可能性。這些研究多為單因素識(shí)別模型,除了傳統(tǒng)的回歸模型外,隨著數(shù)據(jù)挖掘技術(shù)的發(fā)展,結(jié)合機(jī)器學(xué)習(xí)以及經(jīng)典算法的應(yīng)用,可以使用神經(jīng)網(wǎng)絡(luò)、聚類等更先進(jìn)的數(shù)據(jù)挖掘技術(shù)構(gòu)建財(cái)務(wù)舞弊模型。
分類算法的缺陷在于在大數(shù)據(jù)環(huán)境下,數(shù)據(jù)源多種多樣,類別個(gè)數(shù)和種類無法確定,預(yù)處理的過程復(fù)雜且代價(jià)高昂,聚類提供了相應(yīng)的解決思路。聚類研究的是在沒有訓(xùn)練樣本的情況下劃分樣本,目的是在目標(biāo)數(shù)據(jù)庫類別未知的情況下分類使得變量在同一聚類之間最小化,不同聚類之間最大化。聚類和分類不同的地方在于分類的類別標(biāo)記是明確的,學(xué)習(xí)的類別個(gè)數(shù)已知,而聚類沒有預(yù)先定義的類別標(biāo)記,需要由學(xué)習(xí)算法自動(dòng)確認(rèn)。由于聚類沒有明確的定義, 因此存在多種聚類算法和模型,不確定性導(dǎo)致效果難以評(píng)估,不重視訓(xùn)練集,通常不涉及預(yù)測。常用的聚類算法有K-means均值聚類、DBSCAN、Canopy等。聚類的應(yīng)用范圍包括客戶背景分析、市場精分、定義客戶信用程度等。
1958年,Rosenblatt提出了雙層神經(jīng)元組成的單層神經(jīng)網(wǎng)路“感知器”,“感知器”擁有一個(gè)計(jì)算層負(fù)責(zé)輸出結(jié)果,通過訓(xùn)練得到權(quán)值,是首個(gè)可以學(xué)習(xí)的人工神經(jīng)網(wǎng)絡(luò)。但是它無法解決異或問題,只能做簡單的線性分類任務(wù)。“感知器”增加一個(gè)計(jì)算層變成兩層神經(jīng)網(wǎng)絡(luò)后,Rumelhar和Hinton于1986年提出的BP算法解決了兩層神經(jīng)網(wǎng)路的復(fù)雜計(jì)算問題,通過隱藏層對(duì)原始數(shù)據(jù)進(jìn)行空間變換,使數(shù)據(jù)從線性不可分變成線性可分,不僅解決異或問題,而且對(duì)于非線性可分?jǐn)?shù)據(jù)的預(yù)測有很高的精確度。
神經(jīng)網(wǎng)絡(luò)的構(gòu)建首先是選擇公司舞弊樣本,選擇上海和深圳證券交易所以及財(cái)政部處罰的違規(guī)的公司為樣本,其他的篩選條件包括報(bào)表類型為年度報(bào)告,對(duì)比公司選擇同行業(yè)里資產(chǎn)規(guī)模相同,同年份,沒有受過監(jiān)管機(jī)構(gòu)處罰,并剔除被ST過的A股上市公司,剔除金融行業(yè)公司。選用的指標(biāo)分為財(cái)務(wù)指標(biāo)和非財(cái)務(wù)指標(biāo),財(cái)務(wù)指標(biāo)包括營運(yùn)能力,償債能力,風(fēng)險(xiǎn)水平等,非財(cái)務(wù)指標(biāo)包括股權(quán)結(jié)構(gòu)、治理機(jī)制、股權(quán)集中度、董事會(huì)結(jié)構(gòu)、管理層人員數(shù)量等。神經(jīng)網(wǎng)絡(luò)的方法對(duì)變量之間的多重共線性很敏感,因此對(duì)于上述指標(biāo)進(jìn)行因子分析簡約變量排除多重共線性影響。然后采用不同的神經(jīng)網(wǎng)絡(luò)技術(shù)構(gòu)建財(cái)務(wù)舞弊識(shí)別模型,用篩選出來的財(cái)務(wù)舞弊樣本公司作為訓(xùn)練集,對(duì)比公司作為測試集進(jìn)行檢驗(yàn),如果訓(xùn)練結(jié)果和測試樣本的準(zhǔn)確率較高,這個(gè)模型就可以作為識(shí)別工具。
Green和Choi于1997年采用隨機(jī)樣本基于神經(jīng)網(wǎng)路構(gòu)建了財(cái)務(wù)舞弊識(shí)別模型,隨后,國內(nèi)外學(xué)者開始使用不同的挖掘技術(shù)進(jìn)行研究比較。國內(nèi)研究者張秋三,張磊使用148家上市公司,從盈利能力、償債能力、成長能力、營運(yùn)能力、資本結(jié)構(gòu)幾個(gè)方面篩選出16個(gè)財(cái)務(wù)指標(biāo),再結(jié)合非財(cái)務(wù)指標(biāo)提取的主因子作為輸入變量,是否舞弊作為輸出變量,用IBM SPSS Modeler構(gòu)建基于神經(jīng)網(wǎng)絡(luò)的財(cái)務(wù)舞弊識(shí)別模型,該模型能夠達(dá)到70%的正確率。顧寧生選用33個(gè)測試樣本,其中22個(gè)用作訓(xùn)練集,11個(gè)用于測試集,用神經(jīng)網(wǎng)絡(luò)的識(shí)別率能達(dá)到86.7%。Kirkos的研究認(rèn)為應(yīng)用BP神經(jīng)網(wǎng)絡(luò)對(duì)于財(cái)務(wù)報(bào)告真假的預(yù)測精度能夠達(dá)到90.3%,高于決策樹的73.6%,Alden發(fā)現(xiàn)遺傳算法相對(duì)于Logistic回歸模型對(duì)財(cái)務(wù)舞弊有更優(yōu)異的識(shí)別能力,Chi-chen Lin的研究根據(jù)129個(gè)舞弊樣本和447個(gè)非舞弊樣本比較不同模型識(shí)別有效性,認(rèn)為相比于Logistic模型和決策樹,人工神經(jīng)網(wǎng)絡(luò)識(shí)別效果更優(yōu)。
三、未來展望
將神經(jīng)網(wǎng)絡(luò)用于財(cái)務(wù)舞弊的識(shí)別也有不足之處。首先,樣本選取的差異性導(dǎo)致模型的實(shí)用性得不到保證。研究者無法保證選出的測試樣本沒有財(cái)務(wù)舞弊的行為產(chǎn)生,它可能參與財(cái)務(wù)舞弊,只是還未被發(fā)現(xiàn)。另外模型的輸入數(shù)據(jù)都是采用已發(fā)布的財(cái)務(wù)報(bào)表上的數(shù)據(jù),因此會(huì)受到人為因素的影響。其次,不同的研究者對(duì)于自變量和因變量的選擇邏輯不一,因變量選擇0和1衡量公司是否財(cái)務(wù)造假,無法衡量財(cái)務(wù)造假的程度。
近年來,隨著文本挖掘方法的興起,文本挖掘技術(shù)也逐漸應(yīng)用到財(cái)務(wù)舞弊識(shí)別過程中,比如研究財(cái)務(wù)報(bào)表中的表達(dá)情緒來區(qū)分有舞弊行為的財(cái)務(wù)報(bào)告和真實(shí)的財(cái)務(wù)報(bào)告等。隨著管理會(huì)計(jì)信息化體系的完善與推進(jìn),未來的大數(shù)據(jù)挖掘技術(shù)將結(jié)合文本挖掘,從財(cái)務(wù)報(bào)表、公司公告、自媒體等方面發(fā)現(xiàn)更多的財(cái)務(wù)造假特征。