章銀平,郭鳳華
(1.安徽財貿(mào)職業(yè)學(xué)院,安徽 合肥 230601;2.安徽財經(jīng)大學(xué) 會計學(xué)院,安徽 蚌埠 233030)
上市公司所披露的財務(wù)報表對使用者的決策起到很大影響,隨著科技發(fā)展和社會進步,財務(wù)舞弊手段也更加高明,依靠傳統(tǒng)財務(wù)報告分析手段完全判斷財務(wù)舞弊很有難度[1]。舞弊行為不斷披露會使得投資者喪失對于企業(yè)的信心,繼而從根本上動搖資本市場的信用根基,阻礙其發(fā)展[2]。目前常用于財務(wù)舞弊識別的機器算法主要基于分類技術(shù),主要有K 鄰近(KNN)、人工神經(jīng)網(wǎng)絡(luò)(ANN)、支持向量機(SVM)、Logistic 回歸和隨機森林(RF)等[3]。目前的眾多研究集中于以單個分類模型對財務(wù)報告舞弊行為進行識別,關(guān)于以集成學(xué)習(xí)算法構(gòu)建財務(wù)報表舞弊識別模型的研究較少[4]。因此研究提出建立基于集成機器學(xué)習(xí)算法的財務(wù)報表舞弊判斷模型,并引入機器學(xué)習(xí)算法中的SVM 模型以及KNN 模型作為對照組。
上市企業(yè)財務(wù)報表舞弊是當前市場監(jiān)管的重點內(nèi)容,但是傳統(tǒng)的舞弊監(jiān)管手段非常耗時耗力,因此利用新興技術(shù)就成為解決這個問題的主要途徑[5]。在目前的新興技術(shù)中,計算機智能算法是應(yīng)用非常廣泛的一種技術(shù),對于財務(wù)報表這種純粹的數(shù)據(jù)信息,計算機智能算法非常擅長相關(guān)的處理工作。在目前的智能算法中,隨機森林算法在樣本大、數(shù)據(jù)異常時,依然能夠保持較高準確性、精度和較快運算速度[6]。因此,研究在構(gòu)建上市企業(yè)財務(wù)報表舞弊判斷模型時,選擇隨機森林算法作為模型的核心技術(shù)?;诖耍敬窝芯窟x擇基于機器學(xué)習(xí)算法中的隨機森林算法來進行企業(yè)財務(wù)報表舞弊判斷模型的構(gòu)建[9]。
隨機算法作為一種集成算法,以決策樹為基本單元,通過集成學(xué)習(xí)的方法完成決策樹的集成。N棵樹得到N個分類結(jié)果,匯總輸出投票次數(shù)最多的一項[7-8]。在隨即將森林算法進行運算的過程中,其決策規(guī)則描述為:首先采用bootstrap 方法抽樣N個子樣本,形成新的訓(xùn)練集,作為分類數(shù),重復(fù)M次,得到M棵分類樹;將輸入傳遞到隨機森林中,由決策樹完成接收,每棵樹預(yù)測的分類設(shè)定為獨立的,并以此為標準進行投票,作為最終分類結(jié)果的判據(jù)。將M棵樹的分類結(jié)果進行集合,通過多數(shù)投票的方式得到最終的分類結(jié)果[10-11]。根據(jù)以上步驟,隨機森林的決策規(guī)則如下圖1 所示。
圖1 隨機森林決策規(guī)則
則在一個訓(xùn)練集(x,y) 中,隨機森林分類模型結(jié)果用下式表示:
在式(1)中,fi(x)表示單個決策樹分類結(jié)果;y表示輸出變量,其取值范圍[-1,1],取值為-1 表示其屬于舞弊組,否則屬于正常組;i表示決策樹數(shù)量,研究取i=100;I(x)表示示性函數(shù)。得到一組分類模型h1(x),h2(x),...,hi(x)后,則用于表示樣本分類正確與錯誤分類的平均票數(shù)之差的余量函數(shù)可表達為下式:
在式(2)中,Av(x)表示取平均數(shù)。余量函數(shù)越大則分類預(yù)測效果越好、結(jié)果越可靠[12-14]。隨著決策樹增加,分類模型hi(x)服從于強大數(shù)定律,此時泛化誤差將趨于上限值,避免算法過度擬合。其中,生成決策樹進行特征選擇時,研究選用的最優(yōu)特征選擇方式是基尼指數(shù)最小化準則。對于上述樣本,基尼指數(shù)表示為:
在式(3)中,C d是樣本中屬于第d類的樣本子集,D是類的個數(shù)。
現(xiàn)有的上市公司財務(wù)舞弊一般情況都為虛假披露盈利,但不同舞弊行為所反應(yīng)在財務(wù)報告上的數(shù)據(jù)也是不盡相同的[15]。因此研究通過對現(xiàn)有舞弊手段的分析,找出每種手段影響力較大的財務(wù)指標,基于此構(gòu)建指標體系,從而建立判斷模型。構(gòu)建的財務(wù)指標體系如圖2 所示。
圖2 財務(wù)舞弊判斷模型店財務(wù)指標體系示意圖
如圖2 所示,指標體系分為規(guī)模指標、流動性指標、營運指標、盈利指標、每股能力指標、增長指標這六大類。其中規(guī)模指標中的二級指標包括資產(chǎn)總計、所有者權(quán)益合計、固定資產(chǎn)合計、少數(shù)股東權(quán)益、營業(yè)總收入、營業(yè)外收入、營業(yè)收入以及少數(shù)股東損益;流動性指標包括負債合計、貨幣資金、短期借款、長期借款、流動負債合計、流動資產(chǎn)合計、流動比率和速動比率;營運指標下的二級財務(wù)指標最多,包括應(yīng)收款賬、其他應(yīng)收款、應(yīng)付票據(jù)、存貨、預(yù)付款項、預(yù)收款項、存貨凈額、累計折舊、營業(yè)總成本、存貨周轉(zhuǎn)率、應(yīng)收款項周轉(zhuǎn)率、流動資產(chǎn)周轉(zhuǎn)率、固定資產(chǎn)周轉(zhuǎn)率、股東權(quán)益周轉(zhuǎn)率、總資產(chǎn)周轉(zhuǎn)率和總資產(chǎn)周轉(zhuǎn)天數(shù);盈利指標下的二級指標包括營業(yè)利潤、歸屬于上市公司的凈利潤、利潤總額、凈利潤、資產(chǎn)減值損失、主營利潤、投資收益、銷售毛利率、銷售凈利率、營業(yè)利潤率、無形資產(chǎn)攤銷和長期待攤費用攤銷;每股能力指標下的二級財務(wù)指標有基本每股收益、稀釋每股收益、每股收益攤薄和每股凈資產(chǎn);增長指標包括基本每股收益同比增長、營業(yè)收入同比增長、營業(yè)利潤同比增長、利潤總額同比增長、凈利潤同比增長、凈資產(chǎn)同比增長、總資產(chǎn)同比增長、營業(yè)利潤同比增長、凈利潤增長率、總資產(chǎn)增長率和每股收益增長率這些二級指標。為保證財務(wù)指標的全面性,其來源不僅有主要財務(wù)指標,還從上市公司財務(wù)報表中覆蓋了利潤表、現(xiàn)金流量表和資產(chǎn)負債表。
作為典型的二分類問題,本次研究選取準確率(accuracy)、精確度(precision)、召回率(recall)、AUC 以及綜合計算得出的F 得分(F-score)等指標來衡量模型效果。測試集樣本根據(jù)真實類別以及預(yù)測類別的情況可以劃分為真陽(True Positive)、假陽(False Positive)、真陰(True Negative)以及假陰(False Negative)四種情況;在真實類別中,將1記為True,0 記為False;在預(yù)測類別中,將1 記為Positive,0 記為Negative。以此為基礎(chǔ)建立混淆矩陣:當真實類別與預(yù)測類別都為1 時,記為TP,即真陽;當真實類別取0,預(yù)測類別取1 時,記為FP,即假陽;當真實類別取1,預(yù)測類別取0 時,記為FN,即假陰;當真實類別與預(yù)測類別都為0時,記為TN,即真陰。則用混淆矩陣分別表示常用指標如下:
準確率即分類正確的樣本在總樣本之中的占比,表示如下:
精確率指TP樣本在預(yù)測為真樣本中的占比,表示如下:
召回率指TP樣本在實際為真樣本中的占比,表示如下:
F 得分表示如下:
其中,α表示召回率的權(quán)重相對于精準率的倍數(shù),通常取1。
研究繼而引入三個指標,真陽率(True Positive Rate)又稱敏感度,假陽率(False Positive Rate)表示預(yù)測為真而實際為假的樣本在所有實際為假的樣本中的占比,真陰率(True Negative Rate)即特異度,指預(yù)測為假并且實際為假的樣本在所有實際為假的樣本中的占比。以假陽率為橫軸,以真陽率為縱軸,就可以得到反饋模型效果的ROC 曲線。而在ROC 曲線中,曲線下方的面積定義為AUC(Area Under the Curve),則判斷模型的方法有兩種,其一,曲線越靠近左上角,表示真陽率越高、假陽率越低,則模型所顯示出的效果越好;其二,AUC 越大,模型效果越好。真陽率、真陰率以及假陽率分別用混淆矩陣表示如下。
真陽率的表達式如下:
真陰率的表達式如下:
假陽率的表達式如下:
為探索所建立的機器學(xué)習(xí)算法模型應(yīng)用于財務(wù)舞弊判斷的效果,訓(xùn)練和測試樣本選用2010—2019 年A 股上市公司年度財務(wù)報表所公布的樣本作為訓(xùn)練集,將2020 年樣本作為測試集,利用所構(gòu)建的機器算法模型對上市公司財務(wù)舞弊概率進行判斷分析。研究進行了1000次重復(fù)建模,將這些模型分別用于對測試樣本的預(yù)測,并取其平均值。得到的三種模型的效果計算如表1 所示。
表1 三種模型效果(閾值取值0.5)
從上表可以看出準確率、精確率、召回率、F1得分以及AUC 值這5 個指標的大小排序都為隨機森林模型>支持向量機模型>K 鄰近算法,支持向量機的召回率在三個模型中是最高的,說明其對于舞弊樣本的識別能力最好,而三者中對非舞弊樣本識別能力最好的是隨機森林模型,K 鄰近算法對兩類樣本的識別能力相對比較接近。綜上,支持向量機模型和隨機森林模型的效果較K鄰近算法來說更優(yōu)。圖3 繪出了不同閾值下三種模型的準確率、精確率、召回率和F1 得分曲線。
圖3 不同閾值下三種模型的準確率、精確率、召回率和F1 得分曲線
從圖3(a)中可以看出,準確率方面,三種模型的準確率都與閾值成正比,當閾值取值范圍為[0,0.5]時,KNN 算法模型的準確率高于SVM模型和RF 模型;而隨著閾值的增大,RF 模型的準確率在三者中達到最高;當閾值等于0.5 時,三種模型的準確率都高于50%。RF 模型在閾值取值范圍為[0,0.2]時,幾乎將所有樣本錯誤分類,而在閾值取值范圍為[0.7,1]時,將所有樣本正確分類。圖3(b)顯示查全率方面,三種模型的精確率都與閾值成正比,當閾值較小時,RF模型的精確率最高,KNN 算法模型和SVM 模型的查全率隨閾值的變化相對平緩;并且,RF 模型的準確率隨閾值的變化較為劇烈,且僅在閾值取值范圍為[0.3,0.8]時變化。從圖3(c)、3(d)可以看出,在閾值取值[0,0.5]時,三種模型的召回率和F1 得分差異不大。RF 模型的召回率和F1 得分在閾值取值為[0.6,0.8]時變化劇烈,其召回率在[0.7,0.8]達到最大值,F(xiàn)1 得分在[0.6,0.7]達到最大值,且明顯高于此時的SVM 模型和KNN 算法模型。
隨機森林算法模型顯示,判斷概率在[0.1596,0.1967]之間的公司可以獲得大于正盤的股票收益。為進一步驗證模型的效果,研究進一步選擇部分公司進行時間跨度為一年的股票組合回測,通過對其收益的比較來分析模型效果,如圖4 所示。
圖4 隨機森林模型下舞弊概率最小的公司股票組合一年回測收益率
從圖中可以看出,隨機森林算法模型所選出的舞弊概率最小的股票組合年化收益為1.59%,遠高于概率最大公司21.19%的年化損益,且高于基準收益。同時隨機森林模型預(yù)測股票走勢圖與真實走勢圖十份相近,說明用隨機森林算法模型選出的舞弊概率小的股票組合投資收益高、風險小,且該算法模型具有有效性和真實性。
研究建立基于隨機森林算法的財務(wù)報表舞弊判斷模型,并對其效果進行評估。結(jié)果表明RF模型準確率、精確率、召回率、F1 得分和AUC 值都高于對照組兩種算法,達到了0.681、0.031、0.712、0.048 和0.732;在閾值取值范圍為[0.7,1]時,RF 模型將所有樣本正確分類;當閾值較小時,RF 模型的精確率最高;RF 模型的召回率和F1 得分在閾值取值[0.7,0.8]達到最大值,F(xiàn)1 得分在[0.6,0.7]達到最大值,且明顯高于此時的SVM 模型和KNN 算法模型。以上研究說明所建立的基于隨機隨機森林算法的財務(wù)報表舞弊判斷模型可用于財務(wù)舞弊的判斷,證明了機器學(xué)習(xí)算法在財務(wù)舞弊判斷研究領(lǐng)域的有效性和準確性。