陳輝遠(yuǎn),姜慜喆,馮家興
(1.武漢理工大學(xué) 安全科學(xué)與應(yīng)急管理學(xué)院,湖北 武漢 430070;2.華中科技大學(xué) 管理學(xué)院,湖北 武漢 430070)
改革開放以來,我國社會(huì)主義市場經(jīng)濟(jì)飛速發(fā)展,市場環(huán)境日新月異,各個(gè)行業(yè)的競爭日益激烈,對公司而言,決策稍有不慎就會(huì)陷入財(cái)務(wù)困境。財(cái)務(wù)困境是指企業(yè)現(xiàn)金流量不足以補(bǔ)償現(xiàn)有債務(wù)的情況,是導(dǎo)致企業(yè)出現(xiàn)生存危機(jī)的重要因素。公司財(cái)務(wù)困境不僅給公司股東與利益相關(guān)者帶來直接損失,如果大量上市公司同時(shí)出現(xiàn)財(cái)務(wù)困境,也會(huì)影響金融市場的發(fā)展,進(jìn)而整個(gè)經(jīng)濟(jì)環(huán)境會(huì)遭受巨大的沖擊。因此,在財(cái)務(wù)困境出現(xiàn)之前就對公司發(fā)出預(yù)警,使公司能夠及時(shí)應(yīng)對或者規(guī)避可能發(fā)生的財(cái)務(wù)風(fēng)險(xiǎn),對公司風(fēng)險(xiǎn)管理具有重要意義[1]。
目前的財(cái)務(wù)困境預(yù)警研究主要集中在指標(biāo)選取和模型優(yōu)化這兩個(gè)緯度,在指標(biāo)選取方面,傳統(tǒng)的判定指標(biāo)僅包含了財(cái)務(wù)指標(biāo),但近年研究表明,一些非財(cái)務(wù)因素同樣會(huì)影響公司財(cái)務(wù)的穩(wěn)定性[2]。在模型優(yōu)化方面,以往的研究通常使用統(tǒng)計(jì)學(xué)分析方法,但統(tǒng)計(jì)學(xué)方法依賴于限制性假設(shè),存在一定的局限性。隨著信息技術(shù)的發(fā)展,機(jī)器學(xué)習(xí)已成為目前財(cái)務(wù)困境模型構(gòu)建的主流方法。
在樣本選取方面,以往的大多數(shù)研究是基于平衡數(shù)據(jù)集進(jìn)行預(yù)測,即將財(cái)務(wù)困境公司和財(cái)務(wù)正常公司的比例設(shè)置為1∶1。但上市公司財(cái)務(wù)困境預(yù)警問題是一個(gè)典型的非平衡問題,因?yàn)樨?cái)務(wù)困境公司的數(shù)量要遠(yuǎn)遠(yuǎn)小于財(cái)務(wù)正常公司的數(shù)量,極可能導(dǎo)致構(gòu)建的模型不能全面地反映真實(shí)的公司財(cái)務(wù)困境情況。石曉軍等[3]研究發(fā)現(xiàn),當(dāng)選擇少數(shù)類和多數(shù)類樣本比例達(dá)到1∶3時(shí),模型泛化性能最強(qiáng)。故筆者按照1∶3的比例選取財(cái)務(wù)困境公司與財(cái)務(wù)正常公司,以提高財(cái)務(wù)困境預(yù)警結(jié)果的真實(shí)性。
目前的研究大多致力于提升不同機(jī)器學(xué)習(xí)模型的準(zhǔn)確性,較少研究不同非平衡數(shù)據(jù)集對模型預(yù)測的影響?;诖?,筆者對比分析在平衡數(shù)據(jù)集與非平衡數(shù)據(jù)集下多種單分類器模型與集成分類器模型的表現(xiàn),選出更適用于財(cái)務(wù)困境預(yù)警指標(biāo)體系的模型構(gòu)建方式,提高上市公司對財(cái)務(wù)困境的預(yù)警能力。
傳統(tǒng)的財(cái)務(wù)困境預(yù)警指標(biāo)大多使用財(cái)務(wù)指標(biāo),其可以反映企業(yè)生產(chǎn)經(jīng)營的過程和成果,主要包含償債能力指標(biāo)、運(yùn)營能力指標(biāo)、盈利能力指標(biāo)和發(fā)展能力指標(biāo)等。但由于財(cái)務(wù)指標(biāo)主要來自財(cái)務(wù)報(bào)表資料,屬于定量指標(biāo),大多數(shù)不包含影響企業(yè)長期競爭優(yōu)勢的因素,如企業(yè)內(nèi)部治理結(jié)構(gòu)等定性指標(biāo)。由于目前的會(huì)計(jì)制度采取權(quán)責(zé)發(fā)生制的基本原則,公司內(nèi)部人員可以通過這一制度虛構(gòu)某些交易事項(xiàng),實(shí)現(xiàn)對財(cái)務(wù)數(shù)據(jù)的操控,這在一定程度上影響了財(cái)務(wù)數(shù)據(jù)的真實(shí)性。因此筆者引入非財(cái)務(wù)指標(biāo)完善財(cái)務(wù)預(yù)警指標(biāo)體系,如TANG等[4]將公司管理指標(biāo)引入財(cái)務(wù)困境預(yù)警指標(biāo)體系中,綜合考慮了董事會(huì)結(jié)構(gòu)、股權(quán)結(jié)構(gòu)、內(nèi)部控制信息和審計(jì)意見等方面的信息,研究表明在財(cái)務(wù)困境指標(biāo)體系中納入管理指標(biāo)能夠提高模型的準(zhǔn)確性。
在模型優(yōu)化方面,現(xiàn)有的模型分析方法主要分為兩大門類,即統(tǒng)計(jì)學(xué)分析方法和機(jī)器學(xué)習(xí)方法。統(tǒng)計(jì)學(xué)方法主要包括判別分析(DA)、邏輯回歸(Logistic)以及因子分析(FA)等,其中運(yùn)用的最廣泛的就是Logistic回歸法,如宋鵬等[5]綜合考慮財(cái)務(wù)、現(xiàn)金流和公司治理指標(biāo),建立基于Logistic回歸的中小企業(yè)財(cái)務(wù)困境預(yù)警模型。但隨著公司規(guī)模的擴(kuò)大,傳統(tǒng)的統(tǒng)計(jì)學(xué)方法已經(jīng)不能很好地處理財(cái)務(wù)困境預(yù)警模型[6],且統(tǒng)計(jì)學(xué)模型依賴于限制性假設(shè),如需服從正態(tài)分布、具有獨(dú)立性和線性關(guān)系,這些都限制了統(tǒng)計(jì)學(xué)模型在財(cái)務(wù)困境預(yù)警方面的有效性和適用性。
隨著人工智能技術(shù)的發(fā)展,機(jī)器學(xué)習(xí)在財(cái)務(wù)困境預(yù)警模型優(yōu)化財(cái)務(wù)方面取得了很好表現(xiàn)。集成算法是一種新的機(jī)器學(xué)習(xí)范式,它將多個(gè)基分類器結(jié)合起來解決同一個(gè)問題,并使用某種特定的規(guī)則整合各個(gè)基分類器的輸出結(jié)果,往往可以獲得比單個(gè)分類器更好的學(xué)習(xí)效果,顯著地提高學(xué)習(xí)系統(tǒng)的泛化能力。2004年,謝紀(jì)剛等[7]首次將集成分類器應(yīng)用于上市公司財(cái)務(wù)困境預(yù)警研究,以決策樹和神經(jīng)網(wǎng)絡(luò)為子分類器,從實(shí)驗(yàn)上證實(shí)了集成分類器在提高財(cái)務(wù)困境預(yù)警準(zhǔn)確性方面的有效性。集成算法按照個(gè)體學(xué)習(xí)器之間的關(guān)系,可以分為Bagging、Boosting、Stacking三大類。Bagging是基于自助采樣法獲取隨機(jī)樣本集進(jìn)行訓(xùn)練的不同的基學(xué)習(xí)器,然后對不同的基學(xué)習(xí)器得到的結(jié)果投票得出最終的分類結(jié)果。CHOI等[8]提出了基于投票的集成算法,預(yù)測建筑行業(yè)承包商在預(yù)測點(diǎn)兩年前和三年前是否會(huì)發(fā)生財(cái)務(wù)困境,幫助業(yè)主避免項(xiàng)目期間因財(cái)務(wù)困境造成的損失。Boosting通過反復(fù)學(xué)習(xí)得到一系列弱分類器,以及把弱學(xué)習(xí)器組合提升為強(qiáng)學(xué)習(xí)器的過程。SUE等[9]構(gòu)建DT、LR以及SVM三個(gè)基分類器,分別使用Bagging和Boosting的方法集成這3種分類器,結(jié)果表明,Bagging-DT和Boosting-DT在財(cái)務(wù)困境預(yù)警方面具有更高的準(zhǔn)確度。Stacking是將測試集和預(yù)測集用所有訓(xùn)練好的基模型對整個(gè)測試集或者訓(xùn)練集進(jìn)行預(yù)測,最后基于新的訓(xùn)練集或測試集進(jìn)行訓(xùn)練或預(yù)測的過程。KIM等[10]利用Stacking算法集成SVM、NN和DT三個(gè)模型,調(diào)查1988年至2010年間美國酒店公司財(cái)務(wù)困境的主導(dǎo)因素,提高了預(yù)測方法的性能和準(zhǔn)確性。
因此,筆者提出基于集成算法的財(cái)務(wù)困境預(yù)警模型,結(jié)合財(cái)務(wù)指標(biāo)和非財(cái)務(wù)指標(biāo),利用合成少數(shù)類過采樣技術(shù)(SMOTE)處理非平衡數(shù)據(jù),采取遺傳算法提取有效特征,通過構(gòu)建多個(gè)單分類器和集成分類器來預(yù)測財(cái)務(wù)困境,為上市公司建立財(cái)務(wù)困境預(yù)警機(jī)制提供經(jīng)驗(yàn)。
財(cái)務(wù)困境預(yù)警模型的研究中,國外研究大多依據(jù)企業(yè)是否破產(chǎn)[11]來對財(cái)務(wù)困境進(jìn)行分類。在國內(nèi),由于破產(chǎn)或者退市上市公司數(shù)量較少,因此一般采用是否被特殊處理(ST)作為企業(yè)陷入財(cái)務(wù)困境的標(biāo)志[12]。根據(jù)中國證券上市交易規(guī)則,財(cái)務(wù)狀況和其他財(cái)務(wù)狀況異常的上市公司將被指定為ST公司,其中異常主要有兩個(gè)原因:①上市公司經(jīng)審計(jì)連續(xù)兩年的凈利潤均為負(fù)值;②近一年經(jīng)審計(jì)的每股凈資產(chǎn)低于股票面值。這意味著預(yù)測上市公司近兩年的財(cái)務(wù)困境情況意義不大,因此筆者將ST公司首次被ST年度前3~5年的數(shù)據(jù)帶入運(yùn)算,充分發(fā)揮它的預(yù)警功能。
筆者利用財(cái)務(wù)指標(biāo)以及管理指標(biāo)搭建財(cái)務(wù)困境預(yù)警指標(biāo)體系,使用7種常見的機(jī)器學(xué)習(xí)算法構(gòu)建上市公司財(cái)務(wù)困境預(yù)警模型,框架如圖1所示??傮w可分為3步:數(shù)據(jù)獲取、數(shù)據(jù)預(yù)處理和特征工程及模型構(gòu)建。從國泰安數(shù)據(jù)庫(CSMAR)和中國研究數(shù)據(jù)服務(wù)平臺(tái)(CNRDS)中獲取所需的財(cái)務(wù)指標(biāo)與管理指標(biāo),將其分別儲(chǔ)存在T-3數(shù)據(jù)集、T-4數(shù)據(jù)集和T-5數(shù)據(jù)集中。再利用SMOTE過采樣技術(shù)對非平衡數(shù)據(jù)集進(jìn)行處理,使用遺傳算法進(jìn)行特征選擇,最后通過模型評估指標(biāo)判斷模型性能。
圖1 財(cái)務(wù)困境預(yù)警研究框架
筆者選擇了271家在2012—2020年被首次列為ST的上市公司,其中2012—2020年的ST公司數(shù)量分別為20、14、26、21、26、24、28、48、64,并按照“行業(yè)相同,資產(chǎn)規(guī)模相近”的原則選擇與之相匹配的健康樣本。由于被列為ST的公司僅占中國上市公司的小部分,健康公司與ST公司在數(shù)量上具有明顯的不平衡性,故按照1∶3的比例選取了2012—2020年的813個(gè)健康公司作為對照樣本。實(shí)驗(yàn)所需的財(cái)務(wù)指標(biāo)和管理指標(biāo)分別從CSMAR和CNRDS獲得。
2.1.1 財(cái)務(wù)指標(biāo)選取
財(cái)務(wù)指標(biāo)是最能反映財(cái)務(wù)狀況和經(jīng)營成果的相對指標(biāo),但不是所有的財(cái)務(wù)指標(biāo)對財(cái)務(wù)困境預(yù)警都有用。筆者在已有研究的基礎(chǔ)上,從盈利能力、償債能力、比率結(jié)構(gòu)、營運(yùn)能力、發(fā)展能力和每股指標(biāo)6個(gè)方面通過CSMAR數(shù)據(jù)庫收集了55個(gè)財(cái)務(wù)指標(biāo),如表1所示。此外,筆者使用ST公司首次ST年度前3年、前4年和前5年的指標(biāo)來進(jìn)行財(cái)務(wù)困境預(yù)測,即如果1個(gè)公司在2020年首次成為ST公司,將獲取該公司2017年(T-3)、2016(T-4)和2015年(T-5)的所有相關(guān)指標(biāo)。獲得的數(shù)據(jù)分別存儲(chǔ)在T-3、T-4和T-5數(shù)據(jù)集中。
表1 財(cái)務(wù)指標(biāo)
2.1.2 公司管理指標(biāo)
由于我國外部企業(yè)治理尚未完善和成熟,上警方市公司的內(nèi)部治理結(jié)構(gòu)同樣也是財(cái)務(wù)困境發(fā)生的重要影響因素[13]。筆者從董事會(huì)結(jié)構(gòu)、股權(quán)結(jié)構(gòu)、內(nèi)部控制信息和審計(jì)信息4個(gè)方面收集了14個(gè)公司管理指標(biāo),如表2所示。
表2 管理指標(biāo)
首先對3個(gè)原始樣本集中的缺失值用每列數(shù)據(jù)的均值進(jìn)行填補(bǔ),并對變量進(jìn)行歸一化處理。由于采取1∶3的比例選取對照健康公司樣本,數(shù)據(jù)具有明顯的不平衡性,如果直接運(yùn)用該數(shù)據(jù)集進(jìn)行建模,預(yù)測時(shí)很可能會(huì)偏向多數(shù)類的健康公司,使模型性能大打折扣。筆者選取SMOTE算法對預(yù)處理后的三個(gè)樣本集進(jìn)行均衡化處理,SMOTE算法即合成少數(shù)類過采樣技術(shù),是基于隨機(jī)過采樣算法的一種改進(jìn)方案,其基本思想為對少數(shù)類樣本進(jìn)行分析,并將少數(shù)類樣本人工合成新樣本添加到數(shù)據(jù)集中,得到T-3 SMOTE、T-4 SMOTE和T-5 SMOTE共3個(gè)新樣本集。
近年來,許多研究表明機(jī)器學(xué)習(xí)算法的效果容易受不相關(guān)和冗余特征的負(fù)面影響,進(jìn)行特征選擇不僅可以減少訓(xùn)練時(shí)間,剔除冗余特征,同時(shí)可以增強(qiáng)模型泛化能力,防止過擬合。特征選擇方法可以被大致分為3類:filter法,wrapper法以及混合算法。LIANG等[14]通過實(shí)驗(yàn)對比了多種特征選擇方法對財(cái)務(wù)困境預(yù)警的影響,發(fā)現(xiàn)基于wrapper法的遺傳算法在處理財(cái)務(wù)困境問題時(shí)具有優(yōu)越的性能。遺傳算法具有良好的全局搜索能力,當(dāng)其用作特征選擇的搜索策略時(shí),可以在考慮分類準(zhǔn)確率的同時(shí)兼顧特征子集的目標(biāo)函數(shù),從而獲得更好的分類性能。此外,LIU等[15]通過基于遺傳算法的Bagging模型分析2005—2014年中國上市公司財(cái)務(wù)指標(biāo),為公司財(cái)務(wù)風(fēng)險(xiǎn)管理提供有效的支撐,再次驗(yàn)證了遺傳算法在財(cái)務(wù)困境預(yù)面的優(yōu)越性。綜上,筆者基于遺傳算法對T-3、T-3 SMOTE、T-4、T-4 SMOTE、T-5和T-5 SMOTE共6個(gè)樣本集進(jìn)行特征選擇。
筆者對比分析了3種單分類器以及4種集成分類器在財(cái)務(wù)困境預(yù)警方面的預(yù)測性能,3種單分類器分別是決策樹(DT)、邏輯回歸(LR)、SVM,4種集成分類器分別是隨機(jī)森林(RF)、Adaboost、BaggingSVM以及梯度提升樹(GBDT)。
2.3.1 單分類器
決策樹(DT)是一種非參數(shù)的有監(jiān)督學(xué)習(xí)方法,它能夠從一系列有特征和標(biāo)簽的數(shù)據(jù)中總結(jié)出決策規(guī)則,并用樹狀圖結(jié)構(gòu)來呈現(xiàn)這些規(guī)則,其中根節(jié)點(diǎn)和每個(gè)內(nèi)部節(jié)點(diǎn)都表示1個(gè)特征值的測試,每個(gè)葉字節(jié)點(diǎn)代表1種類別標(biāo)簽,具有模型復(fù)雜度低、可解釋性高等多種優(yōu)點(diǎn)。邏輯回歸(LR)是一種名為“回歸”的線性分類器,其本質(zhì)是由線性回歸變化而來的,被廣泛應(yīng)用于二分類問題中的廣義回歸算法,由于邏輯回歸在線性問題上表現(xiàn)良好,并且訓(xùn)練速度較快,因此被廣泛地應(yīng)用在金融領(lǐng)域。SVM模型通過在數(shù)據(jù)空間中找出一個(gè)超平面作為決策邊界來對數(shù)據(jù)進(jìn)行分類,并使分類誤差盡量小來找到全局最優(yōu)解,能夠很好地解決高維數(shù)據(jù)的非線性分類問題,使得該模型在各類研究中被廣泛利用。
2.3.2 集成分類器
筆者使用的4種集成算法分別屬于Bagging法(隨機(jī)森林、BaggingSVM)和Boosting法(Adaboost、GBDT)。Bagging法通過有放回抽樣從原始樣本集中抽取n個(gè)訓(xùn)練樣本,通過k輪抽取獲得k個(gè)相互獨(dú)立的訓(xùn)練集,按照平均或多數(shù)投票方法來組裝基分類器的分類結(jié)果。隨機(jī)森林和BaggingSVM分別以決策樹和SVM作為基分類器,集成所有的分類投票結(jié)果,將投票次數(shù)最多的類別指定為最終輸出。該方法可以降低噪聲對分類效果的影響,提高分類效果的準(zhǔn)確性。Boosting法的主要思想是將弱分類器整合成一個(gè)強(qiáng)分類器,Adaboost通過加權(quán)多數(shù)表決的方式將弱分類器進(jìn)行線性組合,在減少錯(cuò)誤率高的分類器的權(quán)重的同時(shí)增加錯(cuò)誤率小的分類器的權(quán)重。而GBDT則通過擬合殘差的方式逐步減小殘差,將每一步生成的模型組合得到最終的模型。Bagging法和Boosting法都是將弱分類器組裝成強(qiáng)分類器的算法,但由于Bagging法選取的是獨(dú)立同分布的訓(xùn)練集來訓(xùn)練基分類器,而Boosting訓(xùn)練集的每一次選擇的訓(xùn)練集都根據(jù)上一次學(xué)習(xí)的錯(cuò)誤率結(jié)果取樣,因此Boosting法的分類精度在大多數(shù)數(shù)據(jù)集中要優(yōu)于Bagging法。
選擇合適的模型評估指標(biāo)對判斷不同模型的效果具有重要的意義,在面對非平衡數(shù)據(jù)集的時(shí)候,需要尋找捕獲少數(shù)類的能力和將多數(shù)類判錯(cuò)后所付出的成本進(jìn)行平衡,因此筆者選取混淆矩陣和AUC曲線作為模型的評估指標(biāo)。
混淆矩陣中包含4個(gè)參數(shù),分別為真陽性(TP)、真陰性(TN)、假陽性(FP)以及假陰性(FN)。在財(cái)務(wù)困境預(yù)警模型中,財(cái)務(wù)困境企業(yè)被定義為陽性樣本,財(cái)務(wù)健康企業(yè)被定義為陰性樣本。筆者基于混淆矩陣選擇了4個(gè)表示類別性能的評估指標(biāo):準(zhǔn)確率、精確度、召回率和F值。
準(zhǔn)確率(Accuracy)是所有預(yù)測正確的樣本占總樣本的比重,從整體判斷模型的分配效果,如式(1)所示。
(1)
精確度(Precision)表示所有被預(yù)測為正確的樣本占全部預(yù)測為正確的樣本的比例,是多數(shù)類判錯(cuò)后所需付出成本的衡量。如式(2)所示。
(2)
召回率(Recall)表示所有預(yù)測為正確的樣本占實(shí)際的正確樣本比例。召回率越高,代表選出真正的財(cái)務(wù)困境樣本就越多。如式(3)所示。
(3)
召回率和精確度是此消彼長的,為了同時(shí)兼顧兩者,引入F值作為考量精度和召回率平衡的綜合性指標(biāo)。如式(4)所示。
(4)
AUC (Area Under Curve) 被定義為ROC曲線下的面積,ROC曲線是以假正率和假負(fù)率為軸的曲線,所以AUC表示預(yù)測為正的概率比預(yù)測為負(fù)的概率高的可能性。AUC的取值范圍一般在0.5和1之間,當(dāng)AUC大于0.9時(shí),則模型表現(xiàn)優(yōu)異。
筆者采取遺傳算法對SMOTE處理前后的T-3、T-4、T-5數(shù)據(jù)集進(jìn)行特征選擇,特征選擇結(jié)果如表3所示。在T-3、T-3 SMOTE、T-4、T-4 SMOTE、T-5和T-5 SMOTE 數(shù)據(jù)集中分別選擇了32、41、32、41、36和33個(gè)指標(biāo),其中,T-3數(shù)據(jù)集和T-4數(shù)據(jù)集在經(jīng)過均衡化處理后,選取指標(biāo)的數(shù)量有明顯提升,而T-5數(shù)據(jù)集則沒有太大變化。從指標(biāo)選取的總體情況來看,6個(gè)數(shù)據(jù)集平均選取了29.3個(gè)財(cái)務(wù)指標(biāo),占55個(gè)財(cái)務(wù)指標(biāo)的53.27%;選取了6.5個(gè)管理指標(biāo),占14個(gè)管理指標(biāo)的42.85%。財(cái)務(wù)指標(biāo)的選取比例要略高于管理指標(biāo),故財(cái)務(wù)指標(biāo)在指標(biāo)選取中具有更明顯的價(jià)值。在29.3財(cái)務(wù)指標(biāo)中,平均選取了10個(gè)盈利能力指標(biāo),4.2個(gè)償債能力指標(biāo),2.2個(gè)比率結(jié)構(gòu)指標(biāo),5.3個(gè)運(yùn)營能力指標(biāo),2.8個(gè)發(fā)展能力指標(biāo)和4.8個(gè)每股指標(biāo),在每個(gè)細(xì)分指標(biāo)總數(shù)中的占比分別為66.67%、42%、44%、48.18%、46.66%以及60%,由此可見盈利能力指標(biāo)在財(cái)務(wù)指標(biāo)中是貢獻(xiàn)最突出的指標(biāo)。同理分析管理指標(biāo),董事會(huì)結(jié)構(gòu)、股權(quán)結(jié)構(gòu)、內(nèi)部控制信息和審計(jì)意見分別選取了2.7個(gè)、1.2個(gè)、1.8個(gè)和0.8個(gè),在每個(gè)細(xì)分指標(biāo)總數(shù)中的占比為0.54、0.4、0.45和0.4,可得出董事會(huì)結(jié)構(gòu)為管理指標(biāo)中貢獻(xiàn)最突出的指標(biāo)。
表3 遺傳算法特征選擇結(jié)果
筆者根據(jù)遺傳算法特征選取結(jié)果,得出了不同模型在各個(gè)數(shù)據(jù)集上的評估指標(biāo)。如表4、表5所示。
表4 準(zhǔn)確率、AUC值評估效果
表5 精度、召回率和F值評估效果
表4是不同模型在準(zhǔn)確率和AUC曲線上的表現(xiàn),其中每個(gè)數(shù)都是十次交叉驗(yàn)證后的平均值,每個(gè)數(shù)據(jù)集下模型的最大值以粗體表示。傳統(tǒng)的模型評估中準(zhǔn)確率表現(xiàn)優(yōu)異,但在面對非平衡數(shù)據(jù)集時(shí),準(zhǔn)確率會(huì)使模型嚴(yán)重偏向占比更多的類別,無法正確地評估多數(shù)類樣本和少數(shù)類樣本的錯(cuò)分代價(jià),導(dǎo)致模型的預(yù)測效果嚴(yán)重失真。經(jīng)過SMOTE技術(shù)對非平衡數(shù)據(jù)集進(jìn)行處理后,AUC值得到了明顯提高。在非平衡數(shù)據(jù)集中,無論是僅考慮財(cái)務(wù)指標(biāo)還是綜合考慮財(cái)務(wù)指標(biāo)及管理指標(biāo),均為T-3年度表現(xiàn)最優(yōu),其中F1(T-3)為86.96%,F(xiàn)1+F2(T-3)為88.47%,然后是T-5年度和T-4年度。但在平衡數(shù)據(jù)集中,T-5年度有著最高的AUC值,F(xiàn)1(T-5 SMOTE)為94.88%,高于F1(T-3 SMOTE)和F1(T-4 SMOTE)。SMOTE在處理低維數(shù)據(jù)F2時(shí)能顯著地提升模型效果,平均提升值為15%。由此可見,進(jìn)行SMOTE處理不僅對模型性能有大幅度提升,同時(shí)能夠?qū)崿F(xiàn)在更長的時(shí)間區(qū)間上進(jìn)行財(cái)務(wù)預(yù)警。在進(jìn)行非平衡數(shù)據(jù)集處理前后的3個(gè)時(shí)間跨度中,RF和GBDT在F1和F1+F2內(nèi)都取得了優(yōu)異的性能。如果僅考慮管理指標(biāo),邏輯回歸也有著出色的表現(xiàn)。
表5比較了LR、DT、SVM、RF、Bagging SVM、Adaboost和GBDT在T-3、T-4和T-5三個(gè)時(shí)間跨度上非平衡數(shù)據(jù)集處理前后的模型的精度、召回率和F值,每個(gè)數(shù)據(jù)集下模型的最大值以粗體表示。在精度方面,無論是僅考慮財(cái)務(wù)指標(biāo)還是綜合考慮財(cái)務(wù)指標(biāo)與管理指標(biāo),集成分類器都具有更好的分類性能,如RF和GBDT。RF在F1的3個(gè)時(shí)間跨度上均擁有最好的表現(xiàn),經(jīng)過SMOTE處理后,其在F1+F2上也表現(xiàn)良好。其中F1(T-3)為76.72%,F(xiàn)1(T-4)為70.86%,F(xiàn)1(T-5)為73.47%,F(xiàn)1+F2(T-3 SMOTE)為87.64%,F(xiàn)1+F2(T-4 SMOTE)為85.80%,F(xiàn)1+F2(T-5 SMOTE)為90.47%。GBDT在F1+F2(T-3)上表現(xiàn)較好,為79.36%。但是僅考慮管理指標(biāo)時(shí),單分類器如LR和SVM的表現(xiàn)更優(yōu)。在召回率方面,非平衡數(shù)據(jù)集上表現(xiàn)最好的模型是BaggingSVM,平衡數(shù)據(jù)集上表現(xiàn)最好的模型是RF。召回率和精度是此消彼長的,如F1(T-3)中,RF模型的精度為76.72%,召回率為52.25%;但BaggingSVM模型的精度為54.98%,召回率為75.19%。經(jīng)過非平衡數(shù)據(jù)集的處理后,召回率指標(biāo)有著大幅度的提升,在F1、F2和F1+F2上分別提升了34.6%、33.6%以及30.1%,而精度指標(biāo)提升幅度較小,分別為14.5%、9.5%和14.8%。由此可見,非平衡數(shù)據(jù)對召回率的影響高于對精度的影響。
F值是考量精度和召回率平衡的綜合性指標(biāo),它被定義為精度和召回率的調(diào)和平均數(shù)。在非平衡數(shù)據(jù)集中,如果僅考慮財(cái)務(wù)指標(biāo)或者綜合考慮財(cái)務(wù)指標(biāo)和管理指標(biāo),T-3年度表現(xiàn)最優(yōu),其次是T-5年度和T-4年度,但僅考慮管理指標(biāo)時(shí),T-4年度表現(xiàn)更優(yōu),然后是T-3年度和T-5年度。在平衡數(shù)據(jù)集中,僅考慮管理指標(biāo)或綜合考慮財(cái)務(wù)指標(biāo)和管理指標(biāo)時(shí),均是T-5年度表現(xiàn)最優(yōu),再者是T-3年度T-4年度,而僅考慮財(cái)務(wù)指標(biāo)的則是T-3年度表現(xiàn)更優(yōu)。說明在數(shù)據(jù)平衡后,僅考慮財(cái)務(wù)指標(biāo)的數(shù)據(jù)在短期財(cái)務(wù)困境預(yù)警上的表現(xiàn)更好,而綜合考慮財(cái)務(wù)指標(biāo)和管理指標(biāo)的財(cái)務(wù)困境預(yù)警模型能夠?yàn)楦L時(shí)間區(qū)間上的預(yù)測效果提供支撐。
筆者構(gòu)建包含財(cái)務(wù)指標(biāo)和管理指標(biāo)的上市公司財(cái)務(wù)困境預(yù)警指標(biāo)體系,利用SMOTE過采樣技術(shù)對非平衡數(shù)據(jù)集進(jìn)行處理,運(yùn)用遺傳算法對財(cái)務(wù)指標(biāo)和管理指標(biāo)進(jìn)行特征選擇,并通過3種單分類器(DT、LR、SVM)和4種集成分類器(RF、BaggingSVM、Adaboost、GBDT)建立財(cái)務(wù)困境預(yù)警模型,采取多種評估指標(biāo)綜合評判模型性能。結(jié)論如下:
(1)選取2012—2020年被列為ST公司的271家上市公司,并使用1∶3的比例選取813家健康公司作為對照組,通過CSMAR和CNRDS數(shù)據(jù)庫獲取所需的財(cái)務(wù)指標(biāo)和管理指標(biāo),建立T-3、T-4和T-5三個(gè)時(shí)間跨度上的非平衡數(shù)據(jù)集,運(yùn)用SMOTE技術(shù)對其進(jìn)行處理得到T-3 SMOTE、T-4 SMOTE和T-5 SMOTE三個(gè)平衡數(shù)據(jù)集。實(shí)驗(yàn)證明進(jìn)行非平衡數(shù)據(jù)集處理能大幅度提高模型性能,加強(qiáng)財(cái)務(wù)困境預(yù)警的準(zhǔn)確性。
(2)根據(jù)遺傳算法進(jìn)行特征選擇可知,財(cái)務(wù)指標(biāo)的價(jià)值高于管理指標(biāo),財(cái)務(wù)指標(biāo)和管理指標(biāo)中貢獻(xiàn)值突出的指標(biāo)分別是盈利能力指標(biāo)和董事會(huì)結(jié)構(gòu)指標(biāo)。對比各個(gè)模型的評估指標(biāo)后發(fā)現(xiàn),集成分類器在財(cái)務(wù)困境預(yù)警問題上表現(xiàn)更好。
(3)后續(xù)研究可以從以下兩方面來優(yōu)化財(cái)務(wù)困境預(yù)警問題:①利用深度學(xué)習(xí)算法構(gòu)建財(cái)務(wù)困境預(yù)警模型,如DNN、RNN和BPNN等;②在財(cái)務(wù)指標(biāo)和管理指標(biāo)的基礎(chǔ)上加入文本指標(biāo)構(gòu)建財(cái)務(wù)困境預(yù)警指標(biāo)體系,進(jìn)一步為財(cái)務(wù)困境預(yù)警提供理論支撐。