陳蓉蓉
(貴陽信息科技學(xué)院信息工程系,貴陽 550025)
1990年滬深交易所相繼成立,2019年7月注冊(cè)制正式落地,2020年12月退市新規(guī)正式落地,隨著資本市場(chǎng)制度的不斷完善,給投資者和企業(yè)家均帶來了良好機(jī)會(huì)和制度保障。2020年上市公司突破4000家,已經(jīng)成為全球范圍內(nèi)第二大交易所。2020年期間因連續(xù)2年虧損被實(shí)施特別處理(ST)的股票有76只,數(shù)量再創(chuàng)歷史新高。如何有效監(jiān)測(cè)上市公司信用風(fēng)險(xiǎn),保障資本市場(chǎng)平穩(wěn)運(yùn)行成為一個(gè)亟待解決的問題。2021年8月9日發(fā)布的《關(guān)于促進(jìn)債券市場(chǎng)信用評(píng)級(jí)行業(yè)健康發(fā)展的通知》指出,“信用評(píng)級(jí)機(jī)構(gòu)應(yīng)當(dāng)長期構(gòu)建以違約率為核心的評(píng)級(jí)質(zhì)量驗(yàn)證機(jī)制,制定實(shí)施方案,2022年底前建立并使用能夠?qū)崿F(xiàn)合理區(qū)分度的評(píng)級(jí)方法體系,有效提升評(píng)級(jí)質(zhì)量?!蓖ㄖ鞔_了違約概率是構(gòu)建信用評(píng)級(jí)的核心。Maltritz采用復(fù)合KMV模型,利用日交易市場(chǎng)數(shù)據(jù),基于極大似然估計(jì)法計(jì)算2007—2009年金融危機(jī)期間美國銀行業(yè)的違約概率。鄭德淵借鑒KMV和復(fù)合KMV計(jì)算違約距離的函數(shù)形式確定違約距離,并將標(biāo)準(zhǔn)正態(tài)分布函數(shù)轉(zhuǎn)換成支付違約概率。本文將基于機(jī)器學(xué)習(xí)中的Logistic回歸、Probit回歸、決策樹、AdaBoost回歸從上市公司不同維度指標(biāo)中篩選出顯著性較高指標(biāo),指標(biāo)的篩選遵循剔除冗余信息、同時(shí)保留最大違約判別能力的原則。在構(gòu)建違約概率估計(jì)模型時(shí)優(yōu)先選擇精度較高、可解釋性較強(qiáng)、模型較簡(jiǎn)潔的Logistic回歸模型,通過預(yù)測(cè)對(duì)模型進(jìn)行評(píng)估。
由于上市公司財(cái)務(wù)數(shù)據(jù)需要經(jīng)過審計(jì),數(shù)據(jù)來源更可靠,利用上市公司財(cái)務(wù)數(shù)據(jù)來構(gòu)建違約概率估計(jì)模型,相比于利用股票收益波動(dòng)率、股權(quán)市場(chǎng)價(jià)值為基礎(chǔ)或資產(chǎn)賬面價(jià)值、收入現(xiàn)金流歷史數(shù)據(jù)為基礎(chǔ)計(jì)算的違約概率更具穩(wěn)定性、可靠性。同時(shí)機(jī)器學(xué)習(xí)方法更適合運(yùn)用在特征較多的模型構(gòu)建,它能夠從海量特征中優(yōu)先篩選出最顯著的特征,這是與傳統(tǒng)統(tǒng)計(jì)學(xué)方法的不同,這一優(yōu)勢(shì)可以更好地運(yùn)用于多維度指標(biāo)體系的上市公司模型構(gòu)建。
由于商業(yè)銀行通常出于對(duì)企業(yè)信息的保密而不對(duì)外公布相關(guān)數(shù)據(jù),因此違約的數(shù)據(jù)無法直接獲得。本文將2015—2019年上海證券交易所網(wǎng)站公布的被實(shí)施特別處理(ST)的股票所對(duì)應(yīng)的上市公司作為發(fā)生違約的樣本,未被處理的上市公司作為對(duì)照樣本。這樣做主要有以下幾點(diǎn)原因:
(1)上市公司被實(shí)施特別處理(ST)通常由于兩種情況,一種情況是上市公司經(jīng)過審計(jì)連續(xù)兩個(gè)會(huì)計(jì)年度的凈利潤都是負(fù)值,另一種情況是公司最近一個(gè)會(huì)計(jì)年度每股凈資產(chǎn)低于股票面值。在這種情況下,公司支付違約風(fēng)險(xiǎn)增大,因而可被定義為違約。
(2)上市公司的財(cái)務(wù)數(shù)據(jù)通常需要經(jīng)過審計(jì),其數(shù)據(jù)信息相對(duì)于非上市公司更為可靠。
本文選取了短期貸款數(shù)量較多的制造業(yè)上市公司作為樣本進(jìn)行研究。篩選出2015—2019年59家制造業(yè)被實(shí)施特別處理(ST)的上市公司,同時(shí)隨機(jī)選取了141家制造業(yè)上市公司中財(cái)務(wù)數(shù)據(jù)正常的企業(yè)作為對(duì)照組,總計(jì)200家制造業(yè)上市公司作為測(cè)算違約概率的樣本。上市公司的財(cái)務(wù)數(shù)據(jù)來自于萬得(Wind)金融數(shù)據(jù)庫。
在估計(jì)違約概率時(shí),選擇上市公司被實(shí)施特別處理(ST)的前一年的財(cái)務(wù)數(shù)據(jù)作為模型中的解釋變量,以公司是否違約作為被解釋變量(發(fā)生違約即ST公司取值為1,未發(fā)生違約即非ST公司取值為0)來構(gòu)建模型。在選擇影響公司違約概率的因素時(shí)通常遵循體現(xiàn)公司經(jīng)營成果、償債能力,并且具有可操作性、整體性、可比性的原則最終選取了28個(gè)財(cái)務(wù)指標(biāo)作為公司經(jīng)營狀況的指標(biāo)代表,將企業(yè)財(cái)務(wù)指標(biāo)綜合分為長期償債能力、短期償債能力、現(xiàn)金流量能力、股東獲利能力、運(yùn)營能力、盈利能力以及發(fā)展能力七個(gè)維度,每個(gè)維度下的具體指標(biāo)如下:
(1)長期償債能力。資產(chǎn)負(fù)債率(ZCFZL)、流動(dòng)資產(chǎn)比率(LDZCBL)、固定資產(chǎn)比率(GDZCBL)、流動(dòng)負(fù)債比率(LDFZBL)、產(chǎn)權(quán)比率(CQBL)、已獲利息倍數(shù)(EBIT/利息費(fèi)用)(LXBS)。
(2)短期償債能力。流動(dòng)比率(LDBL)、速動(dòng)比率(SDBL)、營運(yùn)資金對(duì)總資產(chǎn)比率(YYZZCBL)。
(3)股東獲利能力。每股收益(MGSY)、每股凈資產(chǎn)(MGJZC)。
(4)現(xiàn)金流量能力。每股經(jīng)營活動(dòng)現(xiàn)金凈流量(MGXJLL)、現(xiàn)金比率(XJBL)、現(xiàn)金凈流量對(duì)流動(dòng)負(fù)債比率(XJJLDFZBL)。
(5)盈利能力。營業(yè)利潤率(YYLRL)、總資產(chǎn)凈利潤率(ZZCJLRL)、凈資產(chǎn)收益率(JZCSYL)、總資產(chǎn)報(bào)酬率(ZZCBCL)、銷售凈利率(XSJLL)。
(6)運(yùn)營能力。應(yīng)收賬款周轉(zhuǎn)率(YSZKZZL)、存貨周轉(zhuǎn)率(CHZZL)、應(yīng)付賬款周轉(zhuǎn)率(YFZKZZL)、固定資產(chǎn)周轉(zhuǎn)率(GDZCZZL)、總資產(chǎn)周轉(zhuǎn)率(ZZCZZL)。
(7)發(fā)展能力。資產(chǎn)總計(jì)(N年,增長率)(ZCLJ)、營業(yè)收入(N年,增長率)(SRLJ)、營業(yè)利潤(N年,增長率)(LRLJ)、股東權(quán)益(N年,增長率)(QYLJ)。
將所有自變量轉(zhuǎn)為數(shù)值型變量,將因變量轉(zhuǎn)為分類變量。統(tǒng)計(jì)每個(gè)變量的缺失值情況,由于數(shù)據(jù)是從萬得(Wind)金融數(shù)據(jù)庫里根據(jù)公司的財(cái)務(wù)報(bào)表整理得來,因此不考慮數(shù)據(jù)存在異常值的情況,只對(duì)數(shù)據(jù)作缺失值的填補(bǔ),缺失值填補(bǔ)利用R語言中missForest包進(jìn)行數(shù)據(jù)插補(bǔ)。missForest是基于隨機(jī)森林算法的缺失值填補(bǔ)的非參數(shù)方法,適用于任何類型的數(shù)據(jù)(連續(xù)、離散),同時(shí)填補(bǔ)效果相比于均值、中位數(shù)填補(bǔ)更接近真實(shí)值,效果更好。
采用Logistic回歸模型,自變量的篩選使用AIC準(zhǔn)則結(jié)合逐步回歸方法。AIC(赤池信息準(zhǔn)則)是衡量模型擬合優(yōu)良性和模型復(fù)雜度的一種標(biāo)準(zhǔn)。逐步回歸是一種線性回歸模型自變量選擇方法,解決了多重共線性問題的同時(shí)保留了最顯著的變量。經(jīng)過多次變量的進(jìn)入和剔除,逐步回歸得到最終模型的=127.32,這與起始的154.97相比有了較大的降低,說明模型有了明顯的優(yōu)化。分析最終的回歸結(jié)果得到,較顯著的變量有MGJZC、GDZCBL、ZZCZZL、CQBL、QYLJ,因此只將這五個(gè)變量作為自變量引入模型中,得到的Logistic回歸結(jié)果如表1所示。
表1 邏輯回歸結(jié)果
可以看到,當(dāng)只引入較顯著的GDZCBL、CQBL、MGJZC、ZZCZZL、QYLJ五個(gè)變量時(shí),ZZCZZL變量變得不再顯著,最為顯著的變量為MGJZC(每股凈資產(chǎn))。
采用Probit回歸模型,自變量的選取仍采用逐步回歸的方法,經(jīng)過多次的變量進(jìn)入和剔除,最終得到逐步回歸的結(jié)果。Probit回歸得到的結(jié)果與Logistic回歸相似,逐步回歸得到的變量較顯著的有MGJZC、GDZCBL、ZZCZZL、QYLJ和CQBL,這與Logistic回歸得到的結(jié)果一致,只引入這五個(gè)變量的結(jié)果如表2所示。從回歸結(jié)果可以看出,只引入五個(gè)變量后ZZCZZL變量也變得不再顯著,這與Logistic回歸類似。
表2 Probit回歸結(jié)果
決策樹回歸得到的結(jié)果如表3所示,從決策樹增長過程中結(jié)點(diǎn)的選擇可以看出變量MGJZC、QYLJ、ZCLJ較為顯著。其中的MGJZC(每股凈資產(chǎn))、QYLJ(股東權(quán)益(年,增長率))在Logistic回歸和Probit回歸中也是較為顯著的變量。
表3 決策樹回歸結(jié)果
表4顯示了在AdaBoost建模過程中每個(gè)變量被選為結(jié)點(diǎn)屬性的權(quán)重的比較,從而也反映了變量的重要性。AdaBoost回歸模型中較顯著的變量為MGJZC、QYLJ、ZCLJ,結(jié)果與決策樹回歸結(jié)果一致。
表4 變量重要性
表5匯總了以上模型中顯著性較高的變量。
表5 顯著性變量匯總
綜合上述四種方法,將顯著變量全部引入Logistic模型中,運(yùn)用逐步回歸的方法得到最終的模型如表6所示。
表6 回歸結(jié)果
該模型的=125.01。
最終的上市公司違約概率估計(jì)指標(biāo)由衡量股東獲利能力的每股凈資產(chǎn)、衡量運(yùn)營能力的總資產(chǎn)周轉(zhuǎn)率、衡量發(fā)展能力的資產(chǎn)總計(jì)(年,增長率)、營業(yè)收入(年,增長率)與股東權(quán)益(年,增長率)與衡量長期償債能力的固定資產(chǎn)比率組成。
Logistic回歸模型對(duì)于判斷二分類變量的關(guān)系具有良好的效果,同時(shí)該模型不需要對(duì)有關(guān)變量做限制性統(tǒng)計(jì)假設(shè),方法較為簡(jiǎn)單,所需參數(shù)較少,可操作性、可解釋性較強(qiáng),同時(shí)以極大似然法所求的估計(jì)量相比較其他模型使用的最小二乘法所得到的估計(jì)量準(zhǔn)確性更高??紤]到前提假設(shè)、變量選擇、模型構(gòu)建等各方面的因素,下文將采用Logistic回歸模型對(duì)違約概率進(jìn)行估計(jì),估計(jì)模型如下:
將模型(1)在訓(xùn)練集樣本上進(jìn)行預(yù)測(cè)的混淆矩陣如表7所示,訓(xùn)練集的誤判率為11.5%。
表7 訓(xùn)練集結(jié)果
首先選擇2020年上海證券交易所公布的被實(shí)施特別處理的36家上市公司作為違約樣本,同時(shí)隨機(jī)選擇64家運(yùn)營正常的上市公司作為對(duì)照樣本,利用模型(1)和樣本公司在發(fā)生違約前一年的財(cái)務(wù)數(shù)據(jù)對(duì)其發(fā)生違約年份的違約概率進(jìn)行估計(jì)。樣本公司的財(cái)務(wù)數(shù)據(jù)主要來自于萬得(Wind)金融數(shù)據(jù)庫中公司的年報(bào)。測(cè)試集樣本的混淆矩陣如表8所示,最終得到測(cè)試集的誤判率為12%。
表8 測(cè)試集結(jié)果
信用風(fēng)險(xiǎn)是資本市場(chǎng)各主體高度關(guān)注的一類風(fēng)險(xiǎn),它的核心是違約概率的估計(jì),本文通過機(jī)器學(xué)習(xí)方法篩選出顯著性較高的財(cái)務(wù)指標(biāo),并結(jié)合Logistic回歸構(gòu)建違約概率估計(jì)模型。上市公司的財(cái)務(wù)指標(biāo)眾多,不同維度的指標(biāo)反映了上市公司不同層面的能力,如何從眾多指標(biāo)中篩選出具有較大判別能力的指標(biāo)從而構(gòu)建違約概率估計(jì)模型是本文的重點(diǎn)。而機(jī)器學(xué)習(xí)方法克服了傳統(tǒng)統(tǒng)計(jì)學(xué)方法無法解決特征多、樣本少的問題,本文對(duì)于指標(biāo)的選擇同時(shí)綜合了多種方法,最終得出衡量股東獲利能力的每股凈資產(chǎn)、衡量運(yùn)營能力的總資產(chǎn)周轉(zhuǎn)率、衡量發(fā)展能力的資產(chǎn)總計(jì)(年,增長率)、營業(yè)收入(年,增長率)與股東權(quán)益(年,增長率)與衡量長期償債能力的固定資產(chǎn)比率指標(biāo)對(duì)于上市公司的違約風(fēng)險(xiǎn)具有較好的判別能力。將以上指標(biāo)結(jié)合Logistic回歸構(gòu)建的違約概率估計(jì)模型在訓(xùn)練集和測(cè)試集上的預(yù)測(cè)效果較好。