李星辰 王青龍 林國慶
摘 要:當前我國上市公司信息披露仍存在著許多不規(guī)范的現(xiàn)象,個別上市公司在面臨財務(wù)危機時,粉飾其財務(wù)風險,進行財務(wù)造假。本文利用上市超過3年的A股共3002家上市公司的財務(wù)數(shù)據(jù),通過對ST、*ST和10家2019年退市的公司樣本分析,根據(jù)不同的時間窗口,構(gòu)建了財務(wù)預(yù)警因子庫,共96個因子。分別采用機器學習中的邏輯斯蒂回歸、支持向量機、決策樹模型對因子數(shù)據(jù)進行訓(xùn)練。將數(shù)據(jù)集分為訓(xùn)練集和測試集,用訓(xùn)練集訓(xùn)練模型,并將模型應(yīng)用在測試集中進行預(yù)測。結(jié)果如下:(1)三種模型均有較好的預(yù)測能力,其準確率都在94%以上;(2)決策樹模型的預(yù)測效果最佳,支持向量機模型次之,邏輯斯蒂回歸模型的預(yù)測效果最差;(3)三種模型都存在將較多的財務(wù)預(yù)警公司預(yù)測為正常公司的情況。本文通過將三種模型進行對比分析,以尋找更加優(yōu)質(zhì)的財務(wù)預(yù)警模型,來更好地幫助企業(yè)識別財務(wù)風險。
關(guān)鍵詞:財務(wù)預(yù)警;機器學習;邏輯回歸模型;支持向量機模型;決策樹模型
引言:目前,我國宏觀經(jīng)濟正面臨著下行壓力,許多企業(yè)在大形勢下都面臨著融資困難和財務(wù)風險暴露的問題,目前我國上市公司信息披露仍存在著許多不規(guī)范的現(xiàn)象,因此,識別可能進行財務(wù)造假的公司,有助于幫助投資者合理投資,更有利于維護經(jīng)濟社會的健康良性發(fā)展。
由于企業(yè)財務(wù)風險暴露是有征兆的,所以企業(yè)的財務(wù)危機是可以預(yù)測的,因此本文基于大數(shù)據(jù)和機器學習方法,構(gòu)建識別上市公司財務(wù)造假的三種不同的財務(wù)預(yù)警模型,通過對比分析得出更有價值的財務(wù)預(yù)警模型,這能幫助企業(yè)識別財務(wù)風險,有助于實現(xiàn)財務(wù)狀況的良性循環(huán),具有巨大的應(yīng)用價值。
一、數(shù)據(jù)處理與因子庫構(gòu)建
1.數(shù)據(jù)來源
本文樣本公司的相關(guān)財務(wù)數(shù)據(jù)主要來自銳思RESSET數(shù)據(jù)庫以及同花順金融數(shù)據(jù)庫。我們選取了3002家A股上市公司以及10家2019年退市的上市公司的相關(guān)數(shù)據(jù)作為樣本,考慮到上市不滿三年的公司,業(yè)績變動幅度可能相對較大且業(yè)績表現(xiàn)不夠穩(wěn)定,因此將其剔除。
2.構(gòu)造因子庫
根據(jù)國內(nèi)外已有的關(guān)于上市公司財務(wù)造假的相關(guān)研究成果,結(jié)合定性分析和定量分析,從企業(yè)的償債能力、營運能力、盈利能力以及其他能力等四方面,提取出30個相關(guān)財務(wù)指標作為可提取因子。由于對出現(xiàn)風險暴露或者已退市的上市公司來說,出現(xiàn)財務(wù)問題年度的前三年是公司財務(wù)狀況發(fā)生變化的重要轉(zhuǎn)折點,因此我們選取了最近3年-5年的上市公司年度數(shù)據(jù),將選取的財務(wù)指標進行不同年度的處理,最終形成了包含96個可提取因子的因子庫。
二、模型構(gòu)建
根據(jù)現(xiàn)有研究,國內(nèi)學者建立的財務(wù)預(yù)警模型較多,不同模型具有其自身優(yōu)缺點,其中利用邏輯斯蒂回歸、支持向量機和決策樹方法的研究受到較多關(guān)注,因此本文選擇這三種模型進行對比分析。
1.邏輯斯蒂回歸模型
(1)模型概述
邏輯斯蒂回歸(LR)是在進行數(shù)據(jù)挖掘時經(jīng)常使用的一種分類模型,該方法的基本原理為:在線性回歸的基礎(chǔ)之上,與sigmoid函數(shù)兩者相結(jié)合,利用極大似然函數(shù)估計回歸參數(shù)w和b,公式如下所示:
(2)模型的計算和結(jié)果分析
本論文通過Matlab中的機器學習工具箱求解。LR模型所得結(jié)果的準確率如下表所示:
由上表可知,LR模型在訓(xùn)練集和測試集中所得的準確率分別是94.8%和92.38%。
訓(xùn)練集和測試集的混淆矩陣如下表所示。
由上表4可知,LR模型在全樣本中的準確率為94.39%,精確度為38.58%,召回率為32.67%,F(xiàn)值為35.38%。由此可知,召回率并不高,其判斷的精確度為35.38%,相對較低。從總體結(jié)果看,無論是訓(xùn)練集還是測試集準確率都在92%以上,體現(xiàn)出較好的總體準確率,該模型對發(fā)生財務(wù)預(yù)警的公司預(yù)測結(jié)果則較差,而對未發(fā)生財務(wù)預(yù)警的公司預(yù)測較準確。
2.支持向量機模型
(1)模型概述
支持向量機(SVM)是一類按監(jiān)督學習方式對數(shù)據(jù)進行二元分類的廣義線性分類器,其決策邊界是對學習樣本求解的最大邊距超平面。支持向量機屬于有監(jiān)督學習模型可以用于數(shù)據(jù)的分析、分類、回歸以及檢測異常值。
(2)模型的計算和結(jié)果分析
SVM模型所得結(jié)果的準確率如下表所示:
由上表5可知,SVM模型在訓(xùn)練集和測試集中所得的準確率分別是95.72%和93.55%。與LR模型的準確率相近。
由表7可知,SVM模型在全樣本中的準確率為95.35%,精確度為59.26%,召回率為21.33%,F(xiàn)值為31.37%。由此可知,比LR模型召回率低11.34%,其判斷的精確度為59.26%,相對LR模型較高。
3.決策樹模型
(1)模型概述
決策樹是在進行數(shù)據(jù)挖掘時經(jīng)常使用的分類和預(yù)測方法,該方法的基本原理為:根據(jù)算法規(guī)定的分類條件對整體數(shù)據(jù)進行分類,產(chǎn)生一個決策節(jié)點,仍然按照該算法規(guī)則分類,在下一個決策節(jié)點重復(fù)上述操作,運算到無法繼續(xù)分類為止。而對于Boosted Tree算法為,每添加一次樹,即為學習一個新的目標函數(shù),在這棵樹上尋找最佳節(jié)點進行特征分裂。
(2)模型的計算和結(jié)果分析
由上表可知,Boosted Tree模型在訓(xùn)練集和測試集中所得的準確率分別是96.32%和95.51%。在三個模型中的準確率最高。
由上表可知,Boosted Tree模型在全樣本中的準確率為96.18%,精確度為68.82%,召回率為42.67%,F(xiàn)值為52.68%。
三、總結(jié)
本論文針對上市公司的財務(wù)預(yù)警問題,構(gòu)建因子庫,分別采用了機器學習中的邏輯斯蒂回歸法、支持向量機方法和決策樹方法,對訓(xùn)練集進行了分類,并用測試集進行預(yù)測,結(jié)果對比如下表所示。
由上表可知,三種模型具有較高的準確率,均在94%以上,其中Boosted Tree準確率最高;精確度則差距較大,Boosted Tree模型最高;同時Boosted Tree模型具有高達42.67%的召回率。從上表的結(jié)果對比可以看出,盡管三種模型都對財務(wù)預(yù)警問題具有相當?shù)念A(yù)測能力,但上述三種模型預(yù)測能力由優(yōu)到劣依次為:決策樹模型、支持向量機模型、邏輯斯蒂回歸模型。因此通過本文論述研究,認為決策樹模型對公司進行財務(wù)預(yù)警是較好的選擇。但是本文還有改進之處,一方面由于部分上市公司的財務(wù)數(shù)據(jù)不夠真實,另一方面可能來自數(shù)據(jù)的滯后性,致使對財務(wù)造假公司預(yù)測效果精確度有所不足,針對這一問題筆者將會進一步改進。
參考文獻:
[1]張玲玲.A股上市公司財務(wù)預(yù)警模型對比研究——基于logistic回歸和BP神經(jīng)網(wǎng)絡(luò)模型[J].環(huán)渤海經(jīng)濟瞭望,2019(09):165-166.
[2]田珅,陳文熙.房地產(chǎn)退市風險企業(yè)財務(wù)預(yù)警研究——基于主成分分析與logistic模型對比[J].沈陽建筑大學學報(社會科學版),2019,21(04):376-381.
[3]姚欣.Z模型在我國上市公司財務(wù)風險預(yù)警中的適用性研究[J].會計師,2019(13):22-23.
[4]徐碧瑩,程昔武.基于Logistic回歸模型的建筑業(yè)上市公司財務(wù)風險預(yù)警分析[J].景德鎮(zhèn)學院學報,2019,34(03):1-4.
[5]王元月,景在倫,劉偉.KMV模型在漁業(yè)上市公司財務(wù)預(yù)警中的運用——以獐子島為例[J].中國漁業(yè)經(jīng)濟,2019,37(03):56-61.
[6]鄭玉玉.“互聯(lián)網(wǎng)+”背景下ZA信息技術(shù)公司財務(wù)風險預(yù)警研究[D].東華理工大學,2019.
[7]胥光華.基于機器學習構(gòu)建的公司財務(wù)預(yù)警系統(tǒng)研究[D].廈門大學,2014.
[8]王媛媛.基于因子分析與支持向量機的上市公司財務(wù)危機預(yù)警研究[D].西安電子科技大學,2012.
[9]梁小紅.財務(wù)危機預(yù)警的SVMs模型研究——基于我國制造業(yè)上市公司經(jīng)驗數(shù)據(jù)[J].福建論壇(人文社會科學版),2011(12):37-41.
[10]劉彥文.上市公司財務(wù)危機預(yù)警模型研究[D].大連理工大學,2009.
作者簡介:李星辰(1998- ),天津科技大學本科生,主要研究方向:產(chǎn)業(yè)金融、國民經(jīng)濟;王青龍(1998- ),天津科技大學本科生,主要研究方向:計算數(shù)學與數(shù)據(jù)分析;林國慶(1997- ),天津科技大學本科生,主要研究方向:數(shù)據(jù)挖掘