余欣然 ,郭 婷
1.廈門大學(xué) 管理學(xué)院,福建 廈門 361000;2.內(nèi)蒙古工業(yè)大學(xué) 經(jīng)濟(jì)管理學(xué)院,內(nèi)蒙古 呼和浩特 010000)
近年來由于國內(nèi)外經(jīng)濟(jì)形勢的變化,企業(yè)面臨更為嚴(yán)峻的生存環(huán)境,部分企業(yè)深陷財務(wù)困境。企業(yè)的財務(wù)狀況是一個持續(xù)積累的結(jié)果,財務(wù)危機(jī)的出現(xiàn)往往是有跡可循的。為避免企業(yè)陷入財務(wù)困境,企業(yè)管理者通常需要結(jié)合實際情況對企業(yè)的財務(wù)狀況及風(fēng)險進(jìn)行評估。在評估過程中,較為常用的一種方法就是結(jié)合財務(wù)預(yù)警模型做出判斷。財務(wù)預(yù)警模型是一種通過定性和定量分析相結(jié)合的方式對企業(yè)整體的財務(wù)狀況進(jìn)行判斷的預(yù)測模型,企業(yè)管理者可以運用該模型對財務(wù)狀況進(jìn)行實時監(jiān)控,幫助改善財務(wù)活動和消除潛在的財務(wù)隱患。該模型能為企業(yè)預(yù)判和防范財務(wù)風(fēng)險提供理論依據(jù),減輕和避免危機(jī)給企業(yè)帶來的不利影響,對企業(yè)的經(jīng)營發(fā)展具有重要意義。
陳月圓[1]以A股上市公司為研究對象,運用逐步判別分析法建立了上市公司的財務(wù)預(yù)警模型,采用非配對抽樣的方法盡量剔除樣本的主觀性。但其檢驗過程并未使用交叉驗證,只選用了原始數(shù)據(jù)回代的方法來檢驗?zāi)P偷臏?zhǔn)確率,模型的預(yù)測結(jié)果缺乏穩(wěn)健性。王小燕等[2]在logistics回歸的基礎(chǔ)上考慮了財務(wù)指標(biāo)之間的關(guān)聯(lián)性,采用帶網(wǎng)絡(luò)結(jié)構(gòu)的自適應(yīng)Lasso懲罰對參數(shù)進(jìn)行平滑,模型指標(biāo)的選取更加準(zhǔn)確合理,檢驗結(jié)果表明基于Lasso的logistics回歸模型具有較好的分類效果。孫玲莉等[3]以中國A股及美股上市公司為研究對象,通過構(gòu)建基于Benford的隨機(jī)森林模型,從評價財務(wù)數(shù)據(jù)質(zhì)量的角度提升了財務(wù)預(yù)警模型的精確度,發(fā)現(xiàn)基于Benford律的隨機(jī)森林相較于單一的隨機(jī)森林預(yù)測結(jié)果更加準(zhǔn)確。顧曉安等[4]考慮了企業(yè)盈余管理導(dǎo)致的財務(wù)信息失真,研究發(fā)現(xiàn)財務(wù)危機(jī)企業(yè)與正常經(jīng)營企業(yè)的盈余管理行為存在顯著差異,并將盈余管理變量引入Logistic 回歸分析,顯著提高了模型準(zhǔn)確率。
近年來,隨著數(shù)字經(jīng)濟(jì)發(fā)展,區(qū)塊鏈技術(shù)成為熱門,掀起了產(chǎn)業(yè)變革的浪潮。該項技術(shù)應(yīng)用已延伸至金融、能源、供應(yīng)鏈管理、網(wǎng)絡(luò)安全等多個領(lǐng)域,通過與不同行業(yè)的整合實現(xiàn)了更為顯著的經(jīng)濟(jì)效應(yīng),區(qū)塊鏈行業(yè)展現(xiàn)出極大的市場潛力和發(fā)展空間。區(qū)塊鏈技術(shù)對推動產(chǎn)業(yè)升級具有重要意義,通過實現(xiàn)更透明、更高效及更低成本的信息傳輸和數(shù)據(jù)處理,可以建立更加開放、健康、安全的信息傳輸環(huán)境。未來,區(qū)塊鏈技術(shù)還將進(jìn)一步與更多產(chǎn)業(yè)實現(xiàn)深度合作和生態(tài)互聯(lián),市場規(guī)模有望達(dá)到萬億級別。
由于該行業(yè)起步較晚,目前我國有關(guān)研究區(qū)塊鏈行業(yè)財務(wù)預(yù)警模型的文獻(xiàn)并不充分,企業(yè)難以基于較少的研究結(jié)論得到準(zhǔn)確的財務(wù)風(fēng)險預(yù)測結(jié)果。值得注意的是,目前財務(wù)預(yù)警領(lǐng)域的實證研究方法大致分為兩種:一種是運用機(jī)器學(xué)習(xí)方法進(jìn)行建模,如神經(jīng)網(wǎng)絡(luò)、決策樹等;另一種是基于傳統(tǒng)的統(tǒng)計方法,如logistics回歸法等。2種方法都存在一定的優(yōu)勢和不足,僅僅依靠其中一種方法的模型是缺乏穩(wěn)健性和合理性的。本研究將在費希爾判別法的基礎(chǔ)上融合隨機(jī)森林模型變量篩選的結(jié)果,吸取兩種方法的優(yōu)點,建立兼具準(zhǔn)確性和可解釋性的區(qū)塊鏈財務(wù)預(yù)警模型。
本研究通過借鑒文獻(xiàn)[3,5-6],結(jié)合區(qū)塊鏈行業(yè)特性及實際情況,從目前較為認(rèn)可的具有代表性的4個維度,即償債能力、盈利能力、營運能力和發(fā)展能力,進(jìn)行模型指標(biāo)的選取。企業(yè)償債能力通常用來衡量企業(yè)財務(wù)狀況的好壞,反映企業(yè)的對到期債務(wù)償還的能力,能有效考察企業(yè)的持續(xù)經(jīng)營能力,本研究主要采用有形資產(chǎn)負(fù)債率X1、速動比率X2、權(quán)益乘數(shù)X3、現(xiàn)金比率X44個指標(biāo)來衡量償債能力;盈利能力是企業(yè)持續(xù)發(fā)展和生存的根本動力,體現(xiàn)了企業(yè)獲取利潤的投入產(chǎn)出比,本研究主要采用營業(yè)利潤率X5、總資產(chǎn)凈利率X6、凈資產(chǎn)收益率X7、市盈率X8、營業(yè)收入現(xiàn)金凈含量X95個指標(biāo)來衡量盈利能力;營運能力指企業(yè)占用資產(chǎn)獲取收益的能力,體現(xiàn)了資產(chǎn)使用的效率和效益,本研究采用應(yīng)收賬款周轉(zhuǎn)率X10、存貨周轉(zhuǎn)率X11、流動資產(chǎn)周轉(zhuǎn)率X123個指標(biāo)來衡量營運能力;發(fā)展能力反映了企業(yè)未來的發(fā)展?jié)摿?考察了企業(yè)未來持續(xù)增長及擴(kuò)大經(jīng)營的能力,本研究采用總資產(chǎn)同比增長率X13、營業(yè)利潤同比增長率X14、基本每股收益同比增長率X153個指標(biāo)來衡量企業(yè)的發(fā)展能力。
本研究根據(jù)2021年同花順概念股及WIND數(shù)據(jù)庫中區(qū)塊鏈板塊,按照配比原則,經(jīng)過數(shù)據(jù)清洗后篩選出26家2020年滬深A(yù)股上市公司作為研究對象,其中區(qū)塊鏈ST企業(yè)12家,非ST企業(yè)14家。
機(jī)器學(xué)習(xí)方法在模型預(yù)測效果上具有顯著的準(zhǔn)確性,同時可解釋性較低。為有效判斷區(qū)塊鏈企業(yè)未來是否可能面臨財務(wù)危機(jī),建立更加準(zhǔn)確的區(qū)塊鏈企業(yè)財務(wù)預(yù)警模型,考慮采用機(jī)器學(xué)習(xí)方法中的隨機(jī)森林算法構(gòu)建模型。隨機(jī)森林算法是一種屬于Bagging類型的決策樹集成學(xué)習(xí)方法,它可以將數(shù)據(jù)集通過訓(xùn)練歸納得到模型并實現(xiàn)更加高效準(zhǔn)確的結(jié)果預(yù)測。該方法相較于單棵決策樹模型有更高的穩(wěn)定性和精確性,并通過隨機(jī)抽樣的方式可有效解決過擬合問題。本研究采用機(jī)器學(xué)習(xí)方法中的隨機(jī)森林模型對上述財務(wù)指標(biāo)按其對模型的影響程度進(jìn)行篩選,并綜合考慮多棵決策樹的集成結(jié)果,按照少數(shù)服從多數(shù)的原則進(jìn)行特征指標(biāo)的篩選。
本研究運用Python程序?qū)﹄S機(jī)森林模型進(jìn)行訓(xùn)練和檢測。為避免偶然性對模型結(jié)果的影響,通過設(shè)置參數(shù)對1 000棵決策樹進(jìn)行訓(xùn)練,根據(jù)每棵決策樹的不同輸出結(jié)果進(jìn)行數(shù)學(xué)統(tǒng)計,按照少數(shù)服從多數(shù)原則得到模型結(jié)果??紤]到?jīng)Q策樹的過擬合情況,為保證模型的適用性及穩(wěn)健性,本研究采用Python劃分訓(xùn)練集和測試集,隨機(jī)選取數(shù)據(jù)樣本的70%作為訓(xùn)練集,剩余30%的樣本作為模型的測試集進(jìn)行檢驗。結(jié)果顯示,訓(xùn)練集正確率為87.5%,測試集正確率為100%,表明隨機(jī)森林算法對企業(yè)財務(wù)風(fēng)險的預(yù)測具有較高的準(zhǔn)確率。同時,采用提取特征指標(biāo)的方法完成指標(biāo)的篩選。隨機(jī)森林算法根據(jù)決策樹中指標(biāo)的出現(xiàn)次數(shù)及層級等因素來判斷指標(biāo)的重要程度,計算不同特征指標(biāo)對模型結(jié)果的影響??梢暬Y(jié)果顯示,上述15個指標(biāo)按照對模型結(jié)果影響程度排序前4位依次為營業(yè)利潤率X5、凈資產(chǎn)收益率X7、總資產(chǎn)凈利率X6、總資產(chǎn)同比增長率X13(圖1),本研究選取以上4個指標(biāo)進(jìn)一步構(gòu)建模型。
Feature lmportance
機(jī)器學(xué)習(xí)方法雖然準(zhǔn)確性較高,但也存在一定的缺陷。與傳統(tǒng)的統(tǒng)計模型相比,由于涉及大量的數(shù)據(jù)處理,機(jī)器學(xué)習(xí)法模型通常較為復(fù)雜且可解釋性較差,節(jié)點的判斷和形成是算法自動選擇而非人工設(shè)置的結(jié)果,其內(nèi)在原理邏輯和推導(dǎo)過程具有不可知的特征。其次,該模型屬于黑箱模型,讀者不能直觀地理解和應(yīng)用模型得出結(jié)果。而傳統(tǒng)的統(tǒng)計模型有較強(qiáng)的可解釋性但準(zhǔn)確性不高。為建立兼具可解釋性和準(zhǔn)確性的財務(wù)預(yù)警模型,本研究采用隨機(jī)森林算法提取特征指標(biāo),在此基礎(chǔ)上運用費希爾判別法構(gòu)建區(qū)塊鏈企業(yè)財務(wù)預(yù)警模型,在一定程度上吸取機(jī)器學(xué)習(xí)模型結(jié)果的同時保證模型的可解釋性,并比較其與基于原始指標(biāo)建立的模型的預(yù)測結(jié)果。
費希爾判別法是一種基于方差分析思想構(gòu)造的區(qū)分變量的線性判別法,其本質(zhì)是運用投影的方法,構(gòu)造觀測值和相對應(yīng)的投影變量,將難以區(qū)分的樣本通過投影區(qū)別開來,從而更好地將樣本分類到不同總體中。該方法通過構(gòu)造觀測值的線性組合,然后根據(jù)線性組合的值構(gòu)建判別函數(shù),判別函數(shù)中的判別系數(shù)C1,C2…Cn應(yīng)使得不同樣本點群的離散程度最大,使同一樣本點群離散程度盡量集中分布,從而達(dá)到較明顯的分類效果。該方法對樣本總體的分布無要求,是一種應(yīng)用廣泛的統(tǒng)計方法。
研究采用SPSS對模型進(jìn)行檢驗,選擇上述隨機(jī)森林法篩選出的特征值較大的4個指標(biāo)建模。檢驗結(jié)果見表2。組均值同等性檢驗是為了檢驗指標(biāo)在不同總體是否具有顯著差別。經(jīng)過T值檢驗,結(jié)果顯示4個指標(biāo)的T值均<0.05,則拒絕原假設(shè),可以認(rèn)為指標(biāo)在正常企業(yè)和出現(xiàn)財務(wù)危機(jī)企業(yè)間差別較大。Box檢驗通常為了檢驗樣本間的協(xié)方差矩陣是否齊次,經(jīng)檢驗P值接近0,顯示該協(xié)方差矩陣不是單位陣,總體間協(xié)方差存在顯著差異,判別效果較好。Wilks′ Lambda檢驗可以檢驗?zāi)P驼w的顯著性,檢驗結(jié)果顯示P值等于0.002,在α=0.01時具有統(tǒng)計學(xué)意義,表明該模型有效,能將較好地將區(qū)塊鏈財務(wù)危機(jī)企業(yè)和正常運行企業(yè)區(qū)別開來。
表1 模型檢驗結(jié)果
通過操作SPSS進(jìn)行費希爾判別,得出以下非標(biāo)準(zhǔn)化的典則判別函數(shù):
Y=0.007X5-0.013X6+0.002X7+0.040X13+0.440
(1)
區(qū)塊鏈財務(wù)危機(jī)企業(yè)和正常企業(yè)的未標(biāo)準(zhǔn)化典則判別函數(shù)的聚類中心分別為-1.146和0.982。可以看到營業(yè)利潤率、凈資產(chǎn)收益率及總資產(chǎn)同比增長率3個指標(biāo)與Y值呈正相關(guān),而總資產(chǎn)凈利率對質(zhì)心Y的影響是負(fù)向的,即該指標(biāo)越大質(zhì)心Y越小,越有可能被判別為財務(wù)危機(jī)企業(yè)。由原始數(shù)據(jù)可知財務(wù)危機(jī)企業(yè)12家中有9家該指標(biāo)為負(fù)且相較于其他指標(biāo)較大,經(jīng)驗證可得結(jié)果符合模型的判斷邏輯。
在具體運用模型時,可以取任意區(qū)塊鏈行業(yè)企業(yè)將上述4個指標(biāo)代入模型得到質(zhì)心Y,若Y值與財務(wù)危機(jī)企業(yè)質(zhì)心距離小于其與正常企業(yè)質(zhì)心的距離,則將該企業(yè)判別為財務(wù)危機(jī)企業(yè),企業(yè)應(yīng)加強(qiáng)內(nèi)部治理,改善其不利的財務(wù)狀況;反之,則判別為正常企業(yè),可以認(rèn)為企業(yè)暫時處于較正常的經(jīng)營狀態(tài),短期內(nèi)大概率沒有財務(wù)危機(jī)。例如,Y=-1.01時,該企業(yè)將被劃分為財務(wù)危機(jī)企業(yè)。值得注意的是,當(dāng)質(zhì)心離兩類聚類中心距離差距較小時,盡管該模型將企業(yè)判別為非財務(wù)危機(jī)企業(yè),也并不意味著企業(yè)不存在財務(wù)危機(jī),企業(yè)很可能存在著某些財務(wù)隱患,處于在被判別為財務(wù)危機(jī)企業(yè)邊緣狀態(tài),若未及時解決該類隱患很可能導(dǎo)致企業(yè)經(jīng)營陷入困境。
本研究在原始檢測的基礎(chǔ)上使用交叉驗證來檢驗?zāi)P偷倪m用性和穩(wěn)健性。交叉驗證指在原始數(shù)據(jù)中保留部分?jǐn)?shù)據(jù)不參與訓(xùn)練,使用訓(xùn)練集進(jìn)行模型構(gòu)建,并代入保留數(shù)據(jù)對訓(xùn)練模型進(jìn)行檢驗,這種方法可以較為客觀地反映模型的可靠性,并一定程度上保證模型對外部數(shù)據(jù)的適用程度。相比原始檢驗,交叉檢驗?zāi)P偷念A(yù)測結(jié)果更具有參考價值。由表2可知,基于隨機(jī)森林算法的費希爾判別模型原始檢驗準(zhǔn)確率為88.5%,交叉驗證準(zhǔn)確率為84.6%,準(zhǔn)確率較為可觀。為驗證指標(biāo)篩選的有效性,將使用隨機(jī)森林模型篩選特征指標(biāo)的模型與基于15個原始指標(biāo)建立的全模型比較,將原始的費希爾判別法下的數(shù)據(jù)帶入全模型判別,得到模型準(zhǔn)確率為100%,交叉驗證結(jié)果準(zhǔn)確率僅為73.1%,表明該模型建模效果不佳。同時,也反映了隨機(jī)森林指標(biāo)的篩選對模型預(yù)測效果有著顯著的改良作用,該方法的運用使模型基于更少指標(biāo)的同時預(yù)測準(zhǔn)確率得到了顯著提升。
表2 區(qū)塊鏈財務(wù)預(yù)警模型預(yù)測效果對比
本研究選取滬深A(yù)股區(qū)塊鏈板塊12家ST企業(yè)和14家非ST企業(yè),基于償債能力、盈利能力、營運能力和發(fā)展能力4個維度選取了15項財務(wù)指標(biāo)數(shù)據(jù)為樣本,首先運用隨機(jī)森林算法按照指標(biāo)對模型影響效果進(jìn)行篩選,結(jié)果顯示營業(yè)利潤率、凈資產(chǎn)收益率、總資產(chǎn)凈利率、總資產(chǎn)增長率4個指標(biāo)對模型的影響較為突出。其次,采用費希爾判別法基于以上4個指標(biāo)構(gòu)建區(qū)塊鏈財務(wù)預(yù)警模型。經(jīng)過組均值同等性檢驗、Box檢驗及Wilks′ Lambda顯著性檢驗,結(jié)果顯示各檢驗統(tǒng)計量均表現(xiàn)為顯著差異,原始檢測及交叉驗證結(jié)果表明模型分類效果良好,準(zhǔn)確率較高,能較好地反映企業(yè)的財務(wù)風(fēng)險。分析模型結(jié)果可以得到如下結(jié)論:
(1)經(jīng)統(tǒng)計分析驗證,基于隨機(jī)森林算法建立的費希爾判別財務(wù)預(yù)警模型準(zhǔn)確率較高,可以應(yīng)用于預(yù)判企業(yè)財務(wù)風(fēng)險,通過模型可以了解企業(yè)目前財務(wù)狀況及未來潛在的財務(wù)風(fēng)險。
(2)經(jīng)交叉驗證發(fā)現(xiàn),隨機(jī)森林模型的引入對于提升費希爾判別模型的擬合程度及準(zhǔn)確性具有顯著作用。
(3)營業(yè)利潤率、凈資產(chǎn)收益率、總資產(chǎn)凈利率、總資產(chǎn)增長率對財務(wù)風(fēng)險的影響較大。為進(jìn)行有效的經(jīng)營管理,避免企業(yè)陷入財務(wù)困境,企業(yè)管理者應(yīng)著重關(guān)注這4個指標(biāo)。從事前控制的角度來看,管理者應(yīng)及時進(jìn)行財務(wù)分析,找出企業(yè)經(jīng)營模式的缺陷,預(yù)防財務(wù)危機(jī)的形成。從事中控制的角度來看,應(yīng)追溯導(dǎo)致財務(wù)危機(jī)出現(xiàn)的根本原因,從根源上提升企業(yè)的盈利能力,才能避免風(fēng)險的進(jìn)一步擴(kuò)散。
分析以上結(jié)果可知,營業(yè)利潤率、總資產(chǎn)凈利率、凈資產(chǎn)收益率三者屬于盈利能力財務(wù)指標(biāo),說明區(qū)塊鏈企業(yè)盈利能力指標(biāo)對企業(yè)財務(wù)風(fēng)險的影響起關(guān)鍵作用,持續(xù)監(jiān)測區(qū)塊鏈企業(yè)的盈利能力對企業(yè)的經(jīng)營發(fā)展具有重要意義。其次,考慮到區(qū)塊鏈行業(yè)作為新興產(chǎn)業(yè),還需著重考慮企業(yè)的發(fā)展能力,未來能否有能力實現(xiàn)大規(guī)模擴(kuò)張和持續(xù)增長對該類企業(yè)尤為重要。因此,為避免陷入財務(wù)困境,應(yīng)從這2個角度出發(fā),實行企業(yè)內(nèi)部嚴(yán)格的監(jiān)督管控,企業(yè)決策者應(yīng)著重關(guān)注企業(yè)的盈利情況,及時評價企業(yè)盈利質(zhì)量,調(diào)整盈利模式及收入結(jié)構(gòu),確保企業(yè)經(jīng)營持續(xù)性及穩(wěn)定。同時,還應(yīng)考慮未來長期的戰(zhàn)略布局,制定長遠(yuǎn)的發(fā)展戰(zhàn)略,進(jìn)行科學(xué)決策,拓寬企業(yè)未來的發(fā)展前景。報表使用者在決策時則需重視此類指標(biāo),并以此為依據(jù)來判斷企業(yè)的財務(wù)現(xiàn)狀及未來發(fā)展趨勢。
但模型仍然存在一定的局限性:
(1)模型未考慮非財務(wù)指標(biāo)及外部因素對于企業(yè)財務(wù)風(fēng)險的影響,僅以財務(wù)數(shù)據(jù)為樣本進(jìn)行建模,可能忽略了某些定性因素,如宏觀政策、行業(yè)風(fēng)險、公司治理、銀企關(guān)系等,因此需建立更為完善的財務(wù)預(yù)警體系。
(2)盡管通過數(shù)據(jù)清洗剔除了樣本中的部分異常數(shù)據(jù),但財務(wù)數(shù)據(jù)仍可能存在一定的財務(wù)失真,財務(wù)信息的真實性有待進(jìn)一步檢測。
(3)為盡量保證數(shù)據(jù)的完整及真實性,本研究剔除了數(shù)據(jù)缺失樣本,只選取了數(shù)據(jù)指標(biāo)較為完備的2020年財務(wù)數(shù)據(jù)作為樣本進(jìn)行研究,樣本數(shù)量受到限制,模型精確度可能有所局限。本研究檢測了模型的可行性及預(yù)測準(zhǔn)確程度,但對模型在財務(wù)預(yù)警過程中的檢驗欠缺考慮,因此在未來樣本信息充足情況下,可以考慮進(jìn)一步使用面板數(shù)據(jù)完善模型。
(4)為避免剔除重要變量,在考慮到財務(wù)指標(biāo)的多重共線性時,本研究使用直接移除法,基于變量間的相關(guān)系數(shù),手動剔除部分指標(biāo),剔除結(jié)果可能存在一定的偏差,因此以后可以考慮使用更加精確的處理方法來解決多重共線性問題。