• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于機(jī)器學(xué)習(xí)的上市公司違約概率估計(jì)模型構(gòu)建

      2022-08-20 09:21:02陳蓉蓉
      現(xiàn)代計(jì)算機(jī) 2022年12期
      關(guān)鍵詞:財(cái)務(wù)數(shù)據(jù)比率概率

      陳蓉蓉

      (貴陽信息科技學(xué)院信息工程系,貴陽 550025)

      0 引言

      1990年滬深交易所相繼成立,2019年7月注冊(cè)制正式落地,2020年12月退市新規(guī)正式落地,隨著資本市場(chǎng)制度的不斷完善,給投資者和企業(yè)家均帶來了良好機(jī)會(huì)和制度保障。2020年上市公司突破4000家,已經(jīng)成為全球范圍內(nèi)第二大交易所。2020年期間因連續(xù)2年虧損被實(shí)施特別處理(ST)的股票有76只,數(shù)量再創(chuàng)歷史新高。如何有效監(jiān)測(cè)上市公司信用風(fēng)險(xiǎn),保障資本市場(chǎng)平穩(wěn)運(yùn)行成為一個(gè)亟待解決的問題。2021年8月9日發(fā)布的《關(guān)于促進(jìn)債券市場(chǎng)信用評(píng)級(jí)行業(yè)健康發(fā)展的通知》指出,“信用評(píng)級(jí)機(jī)構(gòu)應(yīng)當(dāng)長期構(gòu)建以違約率為核心的評(píng)級(jí)質(zhì)量驗(yàn)證機(jī)制,制定實(shí)施方案,2022年底前建立并使用能夠?qū)崿F(xiàn)合理區(qū)分度的評(píng)級(jí)方法體系,有效提升評(píng)級(jí)質(zhì)量?!蓖ㄖ鞔_了違約概率是構(gòu)建信用評(píng)級(jí)的核心。Maltritz采用復(fù)合KMV模型,利用日交易市場(chǎng)數(shù)據(jù),基于極大似然估計(jì)法計(jì)算2007—2009年金融危機(jī)期間美國銀行業(yè)的違約概率。鄭德淵借鑒KMV和復(fù)合KMV計(jì)算違約距離的函數(shù)形式確定違約距離,并將標(biāo)準(zhǔn)正態(tài)分布函數(shù)轉(zhuǎn)換成支付違約概率。本文將基于機(jī)器學(xué)習(xí)中的Logistic回歸、Probit回歸、決策樹、AdaBoost回歸從上市公司不同維度指標(biāo)中篩選出顯著性較高指標(biāo),指標(biāo)的篩選遵循剔除冗余信息、同時(shí)保留最大違約判別能力的原則。在構(gòu)建違約概率估計(jì)模型時(shí)優(yōu)先選擇精度較高、可解釋性較強(qiáng)、模型較簡(jiǎn)潔的Logistic回歸模型,通過預(yù)測(cè)對(duì)模型進(jìn)行評(píng)估。

      由于上市公司財(cái)務(wù)數(shù)據(jù)需要經(jīng)過審計(jì),數(shù)據(jù)來源更可靠,利用上市公司財(cái)務(wù)數(shù)據(jù)來構(gòu)建違約概率估計(jì)模型,相比于利用股票收益波動(dòng)率、股權(quán)市場(chǎng)價(jià)值為基礎(chǔ)或資產(chǎn)賬面價(jià)值、收入現(xiàn)金流歷史數(shù)據(jù)為基礎(chǔ)計(jì)算的違約概率更具穩(wěn)定性、可靠性。同時(shí)機(jī)器學(xué)習(xí)方法更適合運(yùn)用在特征較多的模型構(gòu)建,它能夠從海量特征中優(yōu)先篩選出最顯著的特征,這是與傳統(tǒng)統(tǒng)計(jì)學(xué)方法的不同,這一優(yōu)勢(shì)可以更好地運(yùn)用于多維度指標(biāo)體系的上市公司模型構(gòu)建。

      1 數(shù)據(jù)來源

      由于商業(yè)銀行通常出于對(duì)企業(yè)信息的保密而不對(duì)外公布相關(guān)數(shù)據(jù),因此違約的數(shù)據(jù)無法直接獲得。本文將2015—2019年上海證券交易所網(wǎng)站公布的被實(shí)施特別處理(ST)的股票所對(duì)應(yīng)的上市公司作為發(fā)生違約的樣本,未被處理的上市公司作為對(duì)照樣本。這樣做主要有以下幾點(diǎn)原因:

      (1)上市公司被實(shí)施特別處理(ST)通常由于兩種情況,一種情況是上市公司經(jīng)過審計(jì)連續(xù)兩個(gè)會(huì)計(jì)年度的凈利潤都是負(fù)值,另一種情況是公司最近一個(gè)會(huì)計(jì)年度每股凈資產(chǎn)低于股票面值。在這種情況下,公司支付違約風(fēng)險(xiǎn)增大,因而可被定義為違約。

      (2)上市公司的財(cái)務(wù)數(shù)據(jù)通常需要經(jīng)過審計(jì),其數(shù)據(jù)信息相對(duì)于非上市公司更為可靠。

      本文選取了短期貸款數(shù)量較多的制造業(yè)上市公司作為樣本進(jìn)行研究。篩選出2015—2019年59家制造業(yè)被實(shí)施特別處理(ST)的上市公司,同時(shí)隨機(jī)選取了141家制造業(yè)上市公司中財(cái)務(wù)數(shù)據(jù)正常的企業(yè)作為對(duì)照組,總計(jì)200家制造業(yè)上市公司作為測(cè)算違約概率的樣本。上市公司的財(cái)務(wù)數(shù)據(jù)來自于萬得(Wind)金融數(shù)據(jù)庫。

      2 指標(biāo)體系

      在估計(jì)違約概率時(shí),選擇上市公司被實(shí)施特別處理(ST)的前一年的財(cái)務(wù)數(shù)據(jù)作為模型中的解釋變量,以公司是否違約作為被解釋變量(發(fā)生違約即ST公司取值為1,未發(fā)生違約即非ST公司取值為0)來構(gòu)建模型。在選擇影響公司違約概率的因素時(shí)通常遵循體現(xiàn)公司經(jīng)營成果、償債能力,并且具有可操作性、整體性、可比性的原則最終選取了28個(gè)財(cái)務(wù)指標(biāo)作為公司經(jīng)營狀況的指標(biāo)代表,將企業(yè)財(cái)務(wù)指標(biāo)綜合分為長期償債能力、短期償債能力、現(xiàn)金流量能力、股東獲利能力、運(yùn)營能力、盈利能力以及發(fā)展能力七個(gè)維度,每個(gè)維度下的具體指標(biāo)如下:

      (1)長期償債能力。資產(chǎn)負(fù)債率(ZCFZL)、流動(dòng)資產(chǎn)比率(LDZCBL)、固定資產(chǎn)比率(GDZCBL)、流動(dòng)負(fù)債比率(LDFZBL)、產(chǎn)權(quán)比率(CQBL)、已獲利息倍數(shù)(EBIT/利息費(fèi)用)(LXBS)。

      (2)短期償債能力。流動(dòng)比率(LDBL)、速動(dòng)比率(SDBL)、營運(yùn)資金對(duì)總資產(chǎn)比率(YYZZCBL)。

      (3)股東獲利能力。每股收益(MGSY)、每股凈資產(chǎn)(MGJZC)。

      (4)現(xiàn)金流量能力。每股經(jīng)營活動(dòng)現(xiàn)金凈流量(MGXJLL)、現(xiàn)金比率(XJBL)、現(xiàn)金凈流量對(duì)流動(dòng)負(fù)債比率(XJJLDFZBL)。

      (5)盈利能力。營業(yè)利潤率(YYLRL)、總資產(chǎn)凈利潤率(ZZCJLRL)、凈資產(chǎn)收益率(JZCSYL)、總資產(chǎn)報(bào)酬率(ZZCBCL)、銷售凈利率(XSJLL)。

      (6)運(yùn)營能力。應(yīng)收賬款周轉(zhuǎn)率(YSZKZZL)、存貨周轉(zhuǎn)率(CHZZL)、應(yīng)付賬款周轉(zhuǎn)率(YFZKZZL)、固定資產(chǎn)周轉(zhuǎn)率(GDZCZZL)、總資產(chǎn)周轉(zhuǎn)率(ZZCZZL)。

      (7)發(fā)展能力。資產(chǎn)總計(jì)(N年,增長率)(ZCLJ)、營業(yè)收入(N年,增長率)(SRLJ)、營業(yè)利潤(N年,增長率)(LRLJ)、股東權(quán)益(N年,增長率)(QYLJ)。

      3 指標(biāo)選擇與模型構(gòu)建

      3.1 數(shù)據(jù)預(yù)處理

      將所有自變量轉(zhuǎn)為數(shù)值型變量,將因變量轉(zhuǎn)為分類變量。統(tǒng)計(jì)每個(gè)變量的缺失值情況,由于數(shù)據(jù)是從萬得(Wind)金融數(shù)據(jù)庫里根據(jù)公司的財(cái)務(wù)報(bào)表整理得來,因此不考慮數(shù)據(jù)存在異常值的情況,只對(duì)數(shù)據(jù)作缺失值的填補(bǔ),缺失值填補(bǔ)利用R語言中missForest包進(jìn)行數(shù)據(jù)插補(bǔ)。missForest是基于隨機(jī)森林算法的缺失值填補(bǔ)的非參數(shù)方法,適用于任何類型的數(shù)據(jù)(連續(xù)、離散),同時(shí)填補(bǔ)效果相比于均值、中位數(shù)填補(bǔ)更接近真實(shí)值,效果更好。

      3.2 指標(biāo)選擇

      采用Logistic回歸模型,自變量的篩選使用AIC準(zhǔn)則結(jié)合逐步回歸方法。AIC(赤池信息準(zhǔn)則)是衡量模型擬合優(yōu)良性和模型復(fù)雜度的一種標(biāo)準(zhǔn)。逐步回歸是一種線性回歸模型自變量選擇方法,解決了多重共線性問題的同時(shí)保留了最顯著的變量。經(jīng)過多次變量的進(jìn)入和剔除,逐步回歸得到最終模型的=127.32,這與起始的154.97相比有了較大的降低,說明模型有了明顯的優(yōu)化。分析最終的回歸結(jié)果得到,較顯著的變量有MGJZC、GDZCBL、ZZCZZL、CQBL、QYLJ,因此只將這五個(gè)變量作為自變量引入模型中,得到的Logistic回歸結(jié)果如表1所示。

      表1 邏輯回歸結(jié)果

      可以看到,當(dāng)只引入較顯著的GDZCBL、CQBL、MGJZC、ZZCZZL、QYLJ五個(gè)變量時(shí),ZZCZZL變量變得不再顯著,最為顯著的變量為MGJZC(每股凈資產(chǎn))。

      采用Probit回歸模型,自變量的選取仍采用逐步回歸的方法,經(jīng)過多次的變量進(jìn)入和剔除,最終得到逐步回歸的結(jié)果。Probit回歸得到的結(jié)果與Logistic回歸相似,逐步回歸得到的變量較顯著的有MGJZC、GDZCBL、ZZCZZL、QYLJ和CQBL,這與Logistic回歸得到的結(jié)果一致,只引入這五個(gè)變量的結(jié)果如表2所示。從回歸結(jié)果可以看出,只引入五個(gè)變量后ZZCZZL變量也變得不再顯著,這與Logistic回歸類似。

      表2 Probit回歸結(jié)果

      決策樹回歸得到的結(jié)果如表3所示,從決策樹增長過程中結(jié)點(diǎn)的選擇可以看出變量MGJZC、QYLJ、ZCLJ較為顯著。其中的MGJZC(每股凈資產(chǎn))、QYLJ(股東權(quán)益(年,增長率))在Logistic回歸和Probit回歸中也是較為顯著的變量。

      表3 決策樹回歸結(jié)果

      表4顯示了在AdaBoost建模過程中每個(gè)變量被選為結(jié)點(diǎn)屬性的權(quán)重的比較,從而也反映了變量的重要性。AdaBoost回歸模型中較顯著的變量為MGJZC、QYLJ、ZCLJ,結(jié)果與決策樹回歸結(jié)果一致。

      表4 變量重要性

      表5匯總了以上模型中顯著性較高的變量。

      表5 顯著性變量匯總

      綜合上述四種方法,將顯著變量全部引入Logistic模型中,運(yùn)用逐步回歸的方法得到最終的模型如表6所示。

      表6 回歸結(jié)果

      該模型的=125.01。

      最終的上市公司違約概率估計(jì)指標(biāo)由衡量股東獲利能力的每股凈資產(chǎn)、衡量運(yùn)營能力的總資產(chǎn)周轉(zhuǎn)率、衡量發(fā)展能力的資產(chǎn)總計(jì)(年,增長率)、營業(yè)收入(年,增長率)與股東權(quán)益(年,增長率)與衡量長期償債能力的固定資產(chǎn)比率組成。

      3.3 模型構(gòu)建

      Logistic回歸模型對(duì)于判斷二分類變量的關(guān)系具有良好的效果,同時(shí)該模型不需要對(duì)有關(guān)變量做限制性統(tǒng)計(jì)假設(shè),方法較為簡(jiǎn)單,所需參數(shù)較少,可操作性、可解釋性較強(qiáng),同時(shí)以極大似然法所求的估計(jì)量相比較其他模型使用的最小二乘法所得到的估計(jì)量準(zhǔn)確性更高??紤]到前提假設(shè)、變量選擇、模型構(gòu)建等各方面的因素,下文將采用Logistic回歸模型對(duì)違約概率進(jìn)行估計(jì),估計(jì)模型如下:

      4 模型預(yù)測(cè)與評(píng)估

      4.1 訓(xùn)練集

      將模型(1)在訓(xùn)練集樣本上進(jìn)行預(yù)測(cè)的混淆矩陣如表7所示,訓(xùn)練集的誤判率為11.5%。

      表7 訓(xùn)練集結(jié)果

      4.2 測(cè)試集

      首先選擇2020年上海證券交易所公布的被實(shí)施特別處理的36家上市公司作為違約樣本,同時(shí)隨機(jī)選擇64家運(yùn)營正常的上市公司作為對(duì)照樣本,利用模型(1)和樣本公司在發(fā)生違約前一年的財(cái)務(wù)數(shù)據(jù)對(duì)其發(fā)生違約年份的違約概率進(jìn)行估計(jì)。樣本公司的財(cái)務(wù)數(shù)據(jù)主要來自于萬得(Wind)金融數(shù)據(jù)庫中公司的年報(bào)。測(cè)試集樣本的混淆矩陣如表8所示,最終得到測(cè)試集的誤判率為12%。

      表8 測(cè)試集結(jié)果

      5 結(jié)語

      信用風(fēng)險(xiǎn)是資本市場(chǎng)各主體高度關(guān)注的一類風(fēng)險(xiǎn),它的核心是違約概率的估計(jì),本文通過機(jī)器學(xué)習(xí)方法篩選出顯著性較高的財(cái)務(wù)指標(biāo),并結(jié)合Logistic回歸構(gòu)建違約概率估計(jì)模型。上市公司的財(cái)務(wù)指標(biāo)眾多,不同維度的指標(biāo)反映了上市公司不同層面的能力,如何從眾多指標(biāo)中篩選出具有較大判別能力的指標(biāo)從而構(gòu)建違約概率估計(jì)模型是本文的重點(diǎn)。而機(jī)器學(xué)習(xí)方法克服了傳統(tǒng)統(tǒng)計(jì)學(xué)方法無法解決特征多、樣本少的問題,本文對(duì)于指標(biāo)的選擇同時(shí)綜合了多種方法,最終得出衡量股東獲利能力的每股凈資產(chǎn)、衡量運(yùn)營能力的總資產(chǎn)周轉(zhuǎn)率、衡量發(fā)展能力的資產(chǎn)總計(jì)(年,增長率)、營業(yè)收入(年,增長率)與股東權(quán)益(年,增長率)與衡量長期償債能力的固定資產(chǎn)比率指標(biāo)對(duì)于上市公司的違約風(fēng)險(xiǎn)具有較好的判別能力。將以上指標(biāo)結(jié)合Logistic回歸構(gòu)建的違約概率估計(jì)模型在訓(xùn)練集和測(cè)試集上的預(yù)測(cè)效果較好。

      猜你喜歡
      財(cái)務(wù)數(shù)據(jù)比率概率
      第6講 “統(tǒng)計(jì)與概率”復(fù)習(xí)精講
      一類具有時(shí)滯及反饋控制的非自治非線性比率依賴食物鏈模型
      第6講 “統(tǒng)計(jì)與概率”復(fù)習(xí)精講
      概率與統(tǒng)計(jì)(一)
      概率與統(tǒng)計(jì)(二)
      2018上市公司中報(bào)主要財(cái)務(wù)數(shù)據(jù)(8)
      2017上市公司年報(bào)主要財(cái)務(wù)數(shù)據(jù)(6)
      2017年上市公司年報(bào)主要財(cái)務(wù)數(shù)據(jù)(1)
      一種適用于微弱信號(hào)的新穎雙峰值比率捕獲策略
      2012年上市公司中報(bào)主要財(cái)務(wù)數(shù)據(jù)(6)
      全椒县| 祥云县| 朝阳市| 金门县| 祁阳县| 观塘区| 屯留县| 洛宁县| 青海省| 怀仁县| 北宁市| 永嘉县| 亳州市| 宁化县| 团风县| 中西区| 寿光市| 福清市| 武乡县| 汕尾市| 咸阳市| 华亭县| 雅安市| 华容县| 西城区| 普安县| 丰顺县| 大方县| 汝城县| 长葛市| 通许县| 闸北区| 延长县| 佛冈县| 桃源县| 新晃| 石门县| 宜昌市| 巢湖市| 石阡县| 兴业县|